OpenAI का गेम-चेंजिंग GPT-OSS: ओपन-सोर्स AI की दुनिया में एक बड़ा कदम
इस बार OpenAI ने एक ऐसा कदम उठाया है जिसने पूरे ओपन-सोर्स AI समुदाय में हलचल मचा दी है। OpenAI, जो कभी अपने नाम में “ओपन” होने के बावजूद काफी हद तक क्लोज्ड-सोर्स रहा है, उसने अब सचमुच में अपने ओपन-वेट लैंग्वेज मॉडल, GPT-OSS को जारी कर दिया है। यह GPT-OSS मॉडल शक्तिशाली रीजनिंग, एजेंटिक कार्यों और डेवलपर्स के लिए बहुमुखी उपयोगों को ध्यान में रखकर बनाया गया है। यह सिर्फ एक मॉडल नहीं, बल्कि AI के भविष्य की दिशा में एक महत्वपूर्ण मोड़ है।
GPT-OSS क्या है और यह इतना खास क्यों है?
GPT-OSS का मतलब “ओपन सोर्स” हो सकता है, हालाँकि इसे कहीं स्पष्ट रूप से मेंशन नहीं किया गया है। यह GPT-OSS मॉडल AI के क्षेत्र में पारदर्शिता और पहुँच को बढ़ावा देने के लिए डिज़ाइन किया गया है। इसकी सबसे बड़ी खासियत यह है कि यह Apache 2.0 लाइसेंस के तहत उपलब्ध है। इसका मतलब है कि आप इन मॉडलों को अपनी इच्छानुसार फाइन-ट्यून, कस्टमाइज़ और यहाँ तक कि व्यावसायिक रूप से भी उपयोग कर सकते हैं, बिना किसी रोक-टोक या रॉयल्टी के! यह उन डेवलपर्स और शोधकर्ताओं के लिए एक बड़ी राहत है जो अब तक बड़े AI मॉडलों तक सीमित पहुँच के कारण चुनौतियों का सामना कर रहे थे।
GPT-OSS-120b और GPT-OSS-20b ओपन-वेट रीजनिंग मॉडल की सीमाओं को आगे बढ़ाते हैं, कम लागत पर मजबूत वास्तविक दुनिया का प्रदर्शन प्रदान करते हैं।
दो दमदार GPT-OSS मॉडल: gpt-oss-120b और gpt-oss-20b
GPT-OSS सीरीज़ में दो मुख्य मॉडल शामिल हैं, जो विभिन्न जरूरतों को पूरा करने के लिए डिज़ाइन किए गए हैं:
GPT-OSS-120b: शक्ति और प्रदर्शन का प्रतीक
GPT-OSS-120b एक अत्यंत शक्तिशाली AI मॉडल है जो जटिल समस्याओं को हल करने और गहन विश्लेषण के लिए डिज़ाइन किया गया है। नीचे दी गई तालिका में इसकी विशेषताओं को आसान हिंदी में समझाया गया है:
विशेषता | विवरण |
---|---|
पैरामीटर्स | 117 बिलियन (11.7 करोड़) पैरामीटर्स, जिनमें 5.1 बिलियन (51 लाख) सक्रिय हैं। |
उपयोग | बड़े पैमाने के कार्यों, जटिल तर्क, और गहन विश्लेषण के लिए आदर्श। |
हार्डवेयर जरूरत | सिंगल H100 GPU या 80GB GPU पर आसानी से चलता है। |
डाउनलोड साइज़ | 65GB, जो इसे बड़े मॉडल्स में भी सुलभ बनाता है। |
प्रदर्शन | OpenAI 4O4 Mini के समकक्ष प्रदर्शन, जो इसे शीर्ष AI मॉडल्स में शामिल करता है। |
GPT-OSS-120b उन डेवलपर्स और शोधकर्ताओं के लिए शानदार है जो उच्च प्रदर्शन और शक्तिशाली AI समाधान चाहते हैं!
GPT-OSS-20b: गति और दक्षता का शानदार मेल
GPT-OSS-20b एक ऐसा AI मॉडल है जो तेज़ी और कम संसाधन खपत के साथ शानदार प्रदर्शन देता है। यह छोटे डिवाइस और सीमित संसाधनों वाले यूजर्स के लिए बनाया गया है। नीचे दी गई तालिका में इसकी खासियतें आसान हिंदी में समझाई गई हैं:
विशेषता | विवरण |
---|---|
पैरामीटर्स | 21 बिलियन (2.1 करोड़) पैरामीटर्स, जिनमें से 3.6 बिलियन (36 लाख) सक्रिय हैं। |
उपयोग | तेज़ प्रतिक्रिया और कम संसाधन खपत के लिए, जैसे चैटबॉट्स और स्थानीय कार्यों में। |
हार्डवेयर जरूरत | 16GB मेमोरी वाले सिस्टम पर चल सकता है, छोटे उपकरणों के लिए भी उपयुक्त। |
डाउनलोड साइज़ | 14GB, जो इसे आसानी से डाउनलोड करने योग्य बनाता है। |
प्रदर्शन | OpenAI 3 Mini जैसा प्रदर्शन, रोज़मर्रा के AI कार्यों के लिए भरोसेमंद। |
GPT-OSS-20b उन लोगों के लिए बेहतरीन है जो तेज़ और कुशल AI मॉडल चाहते हैं, जो कम संसाधनों में भी शानदार काम करे!
दोनों ही GPT-OSS मॉडल मिक्सचर ऑफ़ एक्सपर्ट्स (MoE) आर्किटेक्चर का उपयोग करते हैं। 120b मॉडल में 128 एक्सपर्ट्स और 20b मॉडल में 32 एक्सपर्ट्स हैं। यह तकनीक मॉडल को एक बार में सभी पैरामीटर्स का उपयोग करने के बजाय केवल आवश्यक पैरामीटर्स को सक्रिय करने की अनुमति देती है, जिससे गति बढ़ती है और कंप्यूटिंग पावर कम खपत होती है।
GPT-OSS की मुख्य विशेषताएं जो इसे खास बनाती हैं
GPT-OSS को सिर्फ शक्तिशाली बनाने के लिए ही नहीं, बल्कि उपयोगी और लचीला बनाने के लिए भी डिज़ाइन किया गया है। इसकी कुछ प्रमुख विशेषताएँ इस प्रकार हैं:
- परमिसिव Apache 2.0 लाइसेंस: यह डेवलपर्स को असीमित स्वतंत्रता देता है, जिससे वे बिना किसी कानूनी बाधा के मॉडल को संशोधित और वितरित कर सकते हैं।
- कॉन्फिगरेबल रीजनिंग एफर्ट: आप अपनी जरूरत और लेटेंसी के हिसाब से GPT-OSS मॉडल की रीजनिंग क्षमता (कम, मध्यम, उच्च) को आसानी से एडजस्ट कर सकते हैं। यह संसाधन प्रबंधन में अभूतपूर्व लचीलापन प्रदान करता है।
- फुल चेन-ऑफ-थॉट (CoT): आप GPT-OSS मॉडल की पूरी रीजनिंग प्रक्रिया देख सकते हैं, जिससे डीबगिंग आसान हो जाती है और आपको उसके आउटपुट पर अधिक भरोसा होता है। यह AI की “ब्लैक बॉक्स” समस्या को कम करता है।
- फाइन-ट्यूनेबल: आप पैरामीटर फाइन-ट्यूनिंग के जरिए GPT-OSS मॉडल को अपने विशिष्ट उपयोग के लिए पूरी तरह से कस्टमाइज़ कर सकते हैं, जिससे यह आपके डेटा और आवश्यकताओं के अनुकूल हो जाता है।
- एजेंटिक क्षमताएं: GPT-OSS मॉडल में फंक्शन कॉलिंग, वेब ब्राउज़िंग, पायथन कोड एग्जीक्यूशन और स्ट्रक्चर्ड आउटपुट की बिल्ट-इन क्षमताएं हैं। यह इसे सिर्फ एक भाषा मॉडल से कहीं अधिक एक AI एजेंट बनाता है।
- नेटिव MXFP4 क्वांटाइजेशन: GPT-OSS मॉडल को MoE लेयर के लिए MXFP4 प्रिसिजन के साथ प्रशिक्षित किया गया है। यह तकनीक मेमोरी की खपत को कम करती है, जिससे 120b एक सिंगल 80GB GPU पर और 20b 16GB मेमोरी पर चल पाता है।
- सुरक्षा: सुरक्षा OpenAI के सभी मॉडलों को जारी करने के दृष्टिकोण का एक मूलभूत हिस्सा है, और ओपन मॉडलों के लिए इसका विशेष महत्व है। व्यापक सुरक्षा प्रशिक्षण और मूल्यांकन के माध्यम से मॉडल को चलाने के अलावा, OpenAI ने अपने Preparedness Framework के तहत gpt-oss-120b के एक प्रतिकूल रूप से फाइन-ट्यून किए गए संस्करण का परीक्षण करके मूल्यांकन की एक अतिरिक्त परत भी पेश की है। GPT-OSS मॉडल आंतरिक सुरक्षा बेंचमार्क पर OpenAI के फ्रंटियर मॉडल के बराबर प्रदर्शन करते हैं, जो डेवलपर्स को OpenAI के हाल के मालिकाना मॉडलों के समान सुरक्षा मानक प्रदान करते हैं।
GPT-OSS का प्रदर्शन: बेंचमार्क में कहाँ खड़ा है?
GPT-OSS मॉडल्स ने विभिन्न बेंचमार्क पर शानदार प्रदर्शन दिखाया है, जो इन्हें AI की दुनिया में एक मजबूत दावेदार बनाता है। नीचे दी गई तालिका में इनके प्रदर्शन को आसान हिंदी में समझाया गया है:
बेंचमार्क | विवरण |
---|---|
कोडफोर्स कॉम्पिटिशन कोड | gpt-oss-120b ने 2622 का स्कोर हासिल किया, जो इसकी कोड जनरेशन और समस्या-समाधान की बेहतरीन क्षमता दर्शाता है। |
मैथ्स | gpt-oss-120b का स्कोर 96.6, जो OpenAI 3 (95.2) से बेहतर है, गणितीय तर्क में श्रेष्ठता दिखाता है। |
हेल्थ मैच और Google Proof QA | इन क्षेत्रों में GPT-OSS मॉडल्स ने शानदार प्रदर्शन किया, विश्वसनीय और सटीक परिणाम दिए। |
Tau-Bench एजेंटिक मूल्यांकन | टूल उपयोग, कुछ-शॉट फंक्शन कॉलिंग, और CoT रीजनिंग में मजबूत प्रदर्शन। |
HealthBench | OpenAI o1 और GPT-4o जैसे मालिकाना मॉडल्स को टक्कर देते हुए उत्कृष्ट प्रदर्शन। |
GPT-OSS मॉडल्स कोडिंग, गणित, और स्वास्थ्य जैसे क्षेत्रों में शीर्ष स्तर का प्रदर्शन करते हैं, हालाँकि ह्यूमैनिटीज़ जैसे कुछ क्षेत्रों में अभी सुधार की गुंजाइश है। यह मॉडल AI नवाचार में एक बड़ा कदम है!
हालाँकि, ह्यूमैनिटीज़ लास्ट एग्ज़ाम में ये ओपन-सोर्स मॉडल क्लोज्ड मॉडल्स के मुकाबले उतना अच्छा परफॉर्म नहीं करते हैं, जो दर्शाता है कि अभी भी कुछ क्षेत्रों में सुधार की गुंजाइश है। कुल मिलाकर, OpenAI ने जो यह GPT-OSS ओपन-सोर्स मॉडल जारी किया है, वह सिर्फ ऐसा-वैसा नहीं है, बल्कि काफी उच्च गुणवत्ता और क्षमता वाला है।
GPT-OSS का उपयोग कैसे करें?
GPT-OSS मॉडल्स को उपयोग करना बेहद आसान और विभिन्न प्रकार के यूजर्स के लिए सुलभ है। OpenAI और इसके पार्टनर्स ने कई तरीके और प्लेटफॉर्म प्रदान किए हैं ताकि आप इन मॉडल्स को प्रभावी ढंग से इस्तेमाल कर सकें। नीचे दिए गए तरीके और नवीनतम अपडेट्स के साथ इसे आज़माएँ:
Hugging Face से डाउनलोड: मॉडल के वेट्स को Hugging Face Hub से सीधे डाउनलोड करें। मॉडल कार्ड और गाइड्स भी उपलब्ध हैं।
कमांड: huggingface-cli download openai/gpt-oss-120b –include “original/*” –local-dir gpt-oss-120b/ pip install gpt-oss python -m gpt_oss.chat model/
Ollama के साथ: Ollama ने OpenAI के साथ साझेदारी की है। इन मॉडल्स को Ollama ऐप या टर्मिनल से चलाएँ। कमांड: ollama pull gpt-oss:120b
ollama run gpt-oss:120b
Ollama MXFP4 फॉर्मेट को सपोर्ट करता है, जो प्रदर्शन और दक्षता बढ़ाता है।
Transformers के साथ: Transformers लाइब्रेरी का उपयोग करके gpt-oss-120b और gpt-oss-20b को चलाएँ। यह स्वचालित रूप से Harmony रिस्पांस फॉर्मेट लागू करता है।
सेटअप के लिए: pip install -U transformers kernels torch उदाहरण: from transformers import pipeline import torch model_id = “openai/gpt-oss-120b” pipe = pipeline(“text-generation”, model=model_id, torch_dtype=”auto”, device_map=”auto”) messages = [{“role”: “user”, “content”: “Explain quantum mechanics clearly and concisely.”}] outputs = pipe(messages, max_new_tokens=256) print(outputs[0][“generated_text”][-1])
vLLM: vLLM के साथ OpenAI- संगत वेबसर्वर सेट करें:
uv pip install –pre vllm==0.10.1+gptoss –extra-index-url https://wheels.vllm.ai/gpt-oss/ –extra-index-url https://download.pytorch.org/whl/nightly/cu128 –index-strategy unsafe-best-match vllm serve openai/gpt-oss-120b
LM Studio: डाउनलोड के लिए: openai/gpt-oss-120b • LM Studio
ऑनलाइन प्लेग्राउंड: शक्तिशाली हार्डवेयर न होने पर GPT-OSS प्लेग्राउंड का उपयोग करें। यहाँ आप gpt-oss-120b और gpt-oss-20b को आज़मा सकते हैं, साथ ही रीजनिंग लेवल (Low, Medium, High) को नियंत्रित कर सकते हैं।

Windows के लिए खास: Microsoft जल्द ही gpt-oss-20b का GPU-ऑप्टिमाइज़्ड संस्करण लाएगा, जो ऑफ़लाइन उपयोग के लिए बिल्ट-इन होगा।
Responses API: ये मॉडल OpenAI के Responses API के साथ संगत हैं।
इकोसिस्टम पार्टनर्स: OpenAI ने Azure, Hugging Face, vLLM, Ollama, AWS, NVIDIA, AMD, Cerebras, और Groq जैसे प्लेटफॉर्म्स के साथ साझेदारी की है, जो इन्हें व्यापक रूप से सुलभ बनाते हैं।
नोट: प्लेग्राउंड में रीजनिंग को “Show reasoning” ऑप्शन के साथ देखें, और इसे High, Medium, या Low पर सेट करें। यह डेमो केवल है, इसलिए परिणाम विस्तृत, अनुमानित, या गलत हो सकते हैं—जिम्मेदारी से उपयोग करें!
GPT-OSS के साथ उपलब्ध टूल्स
GPT-OSS मॉडल को कुछ विशेष टूल्स के साथ भी प्रशिक्षित किया गया है जो इसकी क्षमताओं को बढ़ाते हैं और इसे अधिक व्यावहारिक बनाते हैं:
- ब्राउज़र टूल: यह मॉडल को वेब पर खोज (search), पेज खोलने (open), और किसी पेज पर सामग्री खोजने (find) की अनुमति देता है। यह AI एजेंटों के लिए वेब-आधारित जानकारी तक पहुँचने के लिए महत्वपूर्ण है।
- पायथन टूल: यह मॉडल को गणना करने और अन्य कार्य करने के लिए पायथन कोड चलाने की क्षमता देता है। यह जटिल डेटा विश्लेषण और स्क्रिप्टिंग कार्यों के लिए उपयोगी है।
- अप्लाई पैच टूल: इसका उपयोग स्थानीय फ़ाइलों को बनाने, अपडेट करने या हटाने के लिए किया जा सकता है। यह AI को सिस्टम स्तर पर इंटरैक्ट करने की अनुमति देता है।
निष्कर्ष
OpenAI का GPT-OSS AI समुदाय के लिए एक गेम-चेंजर साबित हो सकता है। इसकी उन्नत रीजनिंग क्षमताएं, एजेंटिक कार्य, और परमिसिव लाइसेंसिंग इसे डेवलपर्स और शोधकर्ताओं के लिए एक शक्तिशाली उपकरण बनाते हैं। यह निश्चित रूप से AI एजेंट्स बनाने के लिए एक शानदार विकल्प है, जो भविष्य में कई उद्योगों में क्रांति ला सकते हैं।
ये GPT-OSS ओपन मॉडल उभरते बाजारों, सीमित संसाधनों वाले क्षेत्रों और छोटे संगठनों के लिए बाधाओं को कम करते हैं जिनके पास मालिकाना मॉडल अपनाने के लिए बजट या लचीलापन नहीं हो सकता है। शक्तिशाली, सुलभ उपकरणों के साथ, दुनिया भर के लोग अपने और दूसरों के लिए नए अवसर बना सकते हैं, नवाचार कर सकते हैं और बना सकते हैं।
यह एक बहुत ही रोमांचक विकास है, और हमें इंतजार करना चाहिए कि यह ओपन-सोर्स AI की दुनिया को कैसे आकार देता है! क्या आप इन मॉडलों को आज़माने के लिए उत्साहित हैं? अपने विचार नीचे कमेंट्स में साझा करें!