ओपनएआयचे o3 मॉडेल बेंचमार्कवर मानवी-स्तरीय बुद्धिमत्तेचा दावा करते, परंतु ते इतके स्मार्ट असू शकत नाही

January 3, 2025

102

OpenAI ने मागील महिन्यात कृत्रिम बुद्धिमत्ता (AI) मॉडेल्सच्या तर्क-केंद्रित o3 मालिकेचे अनावरण केले. थेट प्रवाहादरम्यान, कंपनीने अंतर्गत चाचणीवर आधारित मॉडेलचे बेंचमार्क स्कोअर शेअर केले. सर्व सामायिक स्कोअर प्रभावी होते आणि o1 च्या उत्तराधिकाऱ्यांच्या सुधारित क्षमतांवर प्रकाश टाकत असताना, एक बेंचमार्क स्कोअर उभा राहिला. ARC-AGI बेंचमार्कवर, लार्ज लँग्वेज मॉडेल (LLM) ने 85 टक्के गुण मिळवले, 30 टक्के फरकाने मागील सर्वोत्तम गुणांना मागे टाकले. विशेष म्हणजे, हा स्कोअर देखील चाचणीत सरासरी माणसाने मिळवलेल्या गुणांच्या बरोबरीचा आहे.

OpenAI ने ARC-AGI बेंचमार्कवर 85 टक्के स्कोअर केले

तथापि, केवळ o3 ने चाचणीत इतके उच्च गुण मिळवले, याचा अर्थ त्याची बुद्धिमत्ता सरासरी माणसाइतकी आहे का? एआय मॉडेल सार्वजनिक डोमेनमध्ये रिलीझ केले असल्यास आणि आम्ही त्याची चाचणी करू शकलो तर याचे उत्तर देणे सोपे होईल. OpenAI ने मॉडेलच्या आर्किटेक्चर, प्रशिक्षण तंत्र किंवा डेटासेटबद्दल काहीही उघड केले नसल्यामुळे, निर्णायकपणे काहीही दावा करणे कठीण आहे.

AI फर्मच्या तर्क-केंद्रित मॉडेल्सबद्दल आम्हाला काही गोष्टी माहित आहेत ज्या आम्हाला OpenAI च्या आगामी LLM कडून काय अपेक्षा करावी हे समजण्यास मदत करू शकतात. प्रथम, आतापर्यंत, ओ-सिरीज मॉडेल्समध्ये त्यांच्या आर्किटेक्चर किंवा फ्रेमवर्कमध्ये मोठे फेरबदल केलेले नाहीत परंतु वर्धित क्षमता प्रदर्शित करण्यासाठी ते उत्तम प्रकारे तयार केलेले आहेत.

उदाहरणार्थ, विकसकांनी टेस्ट-टाइम कंप्यूट नावाच्या AI मॉडेल्सच्या o1 मालिकेसह एक तंत्र वापरले. यासह, एआय मॉडेल्सना प्रश्नावर खर्च करण्यासाठी अतिरिक्त प्रक्रिया वेळ आणि सिद्धांतांची चाचणी घेण्यासाठी आणि कोणत्याही चुका सुधारण्यासाठी कार्यक्षेत्र देण्यात आले. त्याचप्रमाणे, GPT-4o मॉडेल ही GPT-4 ची फक्त एक उत्कृष्ट आवृत्ती होती.

कंपनीने o3 मॉडेलसह आर्किटेक्चरमध्ये मोठे बदल केले असण्याची शक्यता नाही, कारण ते GPT-5 AI मॉडेलवर देखील काम करत असल्याची अफवा आहे, जी या वर्षाच्या शेवटी लॉन्च केली जाऊ शकते.

ARC-AGI (ॲबस्ट्रॅक्ट रिझनिंग कॉर्पस – आर्टिफिशियल जनरल इंटेलिजेंस) बेंचमार्कवर येत आहे, यात ग्रिड-आधारित पॅटर्न ओळख प्रश्नांची मालिका आहे ज्यांचे निराकरण करण्यासाठी तर्क आणि अवकाशीय समज क्षमता आवश्यक आहे. तर्क आणि योग्यता-आधारित तर्कावर लक्ष केंद्रित करणाऱ्या उच्च-गुणवत्तेच्या डेटाच्या मोठ्या डेटासेटसह हे केले जाऊ शकते.

तथापि, जर हे इतके सोपे असते, तर जुन्या AI मॉडेलने चाचणीतही उच्च गुण मिळवले असते. उल्लेखनीय म्हणजे, o3 च्या 85 टक्के स्कोअरच्या विरूद्ध मागील सर्वोच्च स्कोअर 55 टक्के होता. हे हायलाइट करते की डेव्हलपरने मॉडेलची तर्क क्षमता वाढविण्यासाठी नवीन परिष्करण तंत्र आणि अल्गोरिदम जोडले आहेत. OpenAI अधिकृतपणे तांत्रिक तपशील उघड करेपर्यंत त्याची संपूर्ण व्याप्ती सांगता येणार नाही.

असे म्हटले जात आहे की, o3 AI मॉडेल AGI किंवा मानवी स्तरावरील बुद्धिमत्तेपर्यंत पोहोचले असण्याची शक्यता नाही. प्रथम, जर असे झाले असेल तर, कंपनीची Microsoft सह भागीदारी संपुष्टात येईल, जी OpenAI मॉडेल्सने AGI दर्जा प्राप्त केल्यानंतर समाप्त होणार आहे. दुसरे, AI चे गॉडफादर जेफ्री हिंटन यांच्यासह अनेक AI तज्ञांनी वारंवार अधोरेखित केले आहे की आम्ही AGI पर्यंत पोहोचण्यापासून अनेक वर्षे दूर आहोत.

शेवटी, AGI ही एक मोठी उपलब्धी आहे की जर OpenAI ने तो टप्पा गाठला, तर त्याबद्दल सूक्ष्म सूचना शेअर करण्याऐवजी ते लोकांना स्पष्टपणे कळवेल. येथे अधिक शक्यता काय आहे की o3 AI मॉडेलने मॉडेलच्या पॅटर्न-आधारित तर्क क्षमता सुधारण्याचा मार्ग शोधला आहे (एकतर पुरेसा नमुना डेटा जोडून किंवा प्रशिक्षण पद्धती बदलून), PTI मध्ये देखील ठळक केले आहे. अहवाल.

तथापि, ही सुधारणा कदाचित खूप वेगळी आहे आणि याचा अर्थ मॉडेलच्या एकूण बुद्धिमत्तेच्या पातळीत वाढ होत नाही.

Source link

SARTS news

मुख्य संपादक : श्री: सुभाष शिंदे