नोव्हेंबर २०२२च्या अखेरीस ओपन एआयचे ‘चॅट जीपीटी-३’ आंतरजालावर अवतरले आणि कृत्रिम बुद्धिमत्तेच्या जगतात खळबळ उडाली. यापूर्वी विशेषज्ञ चॅटबॉट्स नव्हते असे नाही; परंतु ‘चॅट जीपीटी-३’चे वेगळेपण दोन कारणांमुळे होते : एक म्हणजे अतिशय मोठय़ा माहितीसंचावर झालेले प्रशिक्षण आणि दुसरे म्हणजे जनरेटव्ह प्री-ट्रेन्ड परिवर्तक (ट्रान्सफॉर्मर्स) नावाच्या नव्या तंत्रज्ञानाचा उपयोग. असे परिवर्तक, दिलेल्या मजकुरातील जवळच्या आणि दूरच्याही घटकांचे एकत्र विश्लेषण करतात. ही पद्धत विविध आणि विस्तृत मजकुरातील वाक्यांमधले शब्द आणि घटकांच्या संबंधांचे बांध ओळखून तशाच प्रकारची नवी वाक्ये रचायला शिकते. यामुळे दिलेल्या शब्दांनंतर कोणता शब्द येईल, त्याहीनंतर कोणता येईल असे एकामागून एक सांगता येते. गंमत म्हणजे वाक्यातील गहाळ भागसुद्धा अशा प्रकारे पूर्ण करता येतो.

या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा
Skip
या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा

‘जीपीटी’ हे एक भाषेसाठीचे पायाभूत मशीन लर्निग प्रारूप (मॉडेल) आहे. भाषेतील विविध आकृतीबंधांचे गुंतागुंतीचे जाळे साठवण्यासाठी हे प्रारूप बरेच मोठे असते. यामुळेच अशा प्रारूपांना लार्ज लँग्वेज मॉडेल (एलएलएम) म्हणतात. चॅट जीपीटीशिवाय अनेक मॉडेल्स आता उपलब्ध आहेत. उदाहरणार्थ, बर्ट, क्लॉड, ल्लामा. या प्रारूपांना प्रशिक्षणादरम्यान आत्मसात केलेल्या कोणत्याही संकल्पनेची खऱ्या अर्थाने जाणीव नसते. मात्र, त्यांची भाषेचे आकृतीबंध ओळखण्याची हातोटी विलक्षण आहे.

काहींच्या मते या प्रारूपांमधील घटकांच्या आपापसातील गुंतागुंतीच्या आंर्तसबंधांमुळे अशी प्रारूपे सर्जनशील असतात. इतरांच्या मते याच कारणामुळे ती स्वप्नरंजन करतात, शेखचिल्ली बनतात, चुकीची उत्तरे ठोकून देतात. अशामुळे अनेकदा त्यांची उत्तरे व्याकरणदृष्टय़ा अचूक आणि वरवर योग्य दिसत असूनही भरकटलेली आणि भरकटवणारी असतात.

मशीन लर्निगमध्ये अशा मॉडेल्सचे वर्तन काही कळा फिरवून बदलता येते. ‘तापमान’ ही अशीच एक कळ. कमी तापमान असले की सुनिश्चित उत्तरे मिळतात. पण ती पुनरुक्ती असलेली, साचेबद्ध असतात. याउलट तापमान वाढले की मॉडेलच्या उत्तरांमध्ये सृजनशीलता आणि विविधता दिसते. अर्थात अशा सृजनशीलतेमुळे चुकाही संभवतात. अनेकदा तापमान बदलणे ग्राहकाच्या हाती नसते. त्यामुळे अशा मॉडेल्सवर डोळे बंद ठेवून विसंबून राहणे योग्य नाही. मात्र योग्य प्रकारे वापरल्यास शिक्षण आणि वैद्यकीय क्षेत्रात यांच्यामुळे क्रांती घडू शकते.

अनेक संसाधनांमध्ये आता भाषेची मोठी प्रारूपे अंतर्भूत होऊ लागली आहेत. इतर प्रारूपांच्या मदतीने त्यांचे रूपांतर दृकश्राव्य माध्यमातही होऊ लागले आहे. त्यामुळे यापुढे सर्वानीच, ऐकीव आणि वाचीव माहितीवर विश्वास ठेवण्यापूर्वी स्रोताचा पडताळा करायला हवा.- आशीष महाबळ, मराठी विज्ञान परिषद

‘जीपीटी’ हे एक भाषेसाठीचे पायाभूत मशीन लर्निग प्रारूप (मॉडेल) आहे. भाषेतील विविध आकृतीबंधांचे गुंतागुंतीचे जाळे साठवण्यासाठी हे प्रारूप बरेच मोठे असते. यामुळेच अशा प्रारूपांना लार्ज लँग्वेज मॉडेल (एलएलएम) म्हणतात. चॅट जीपीटीशिवाय अनेक मॉडेल्स आता उपलब्ध आहेत. उदाहरणार्थ, बर्ट, क्लॉड, ल्लामा. या प्रारूपांना प्रशिक्षणादरम्यान आत्मसात केलेल्या कोणत्याही संकल्पनेची खऱ्या अर्थाने जाणीव नसते. मात्र, त्यांची भाषेचे आकृतीबंध ओळखण्याची हातोटी विलक्षण आहे.

काहींच्या मते या प्रारूपांमधील घटकांच्या आपापसातील गुंतागुंतीच्या आंर्तसबंधांमुळे अशी प्रारूपे सर्जनशील असतात. इतरांच्या मते याच कारणामुळे ती स्वप्नरंजन करतात, शेखचिल्ली बनतात, चुकीची उत्तरे ठोकून देतात. अशामुळे अनेकदा त्यांची उत्तरे व्याकरणदृष्टय़ा अचूक आणि वरवर योग्य दिसत असूनही भरकटलेली आणि भरकटवणारी असतात.

मशीन लर्निगमध्ये अशा मॉडेल्सचे वर्तन काही कळा फिरवून बदलता येते. ‘तापमान’ ही अशीच एक कळ. कमी तापमान असले की सुनिश्चित उत्तरे मिळतात. पण ती पुनरुक्ती असलेली, साचेबद्ध असतात. याउलट तापमान वाढले की मॉडेलच्या उत्तरांमध्ये सृजनशीलता आणि विविधता दिसते. अर्थात अशा सृजनशीलतेमुळे चुकाही संभवतात. अनेकदा तापमान बदलणे ग्राहकाच्या हाती नसते. त्यामुळे अशा मॉडेल्सवर डोळे बंद ठेवून विसंबून राहणे योग्य नाही. मात्र योग्य प्रकारे वापरल्यास शिक्षण आणि वैद्यकीय क्षेत्रात यांच्यामुळे क्रांती घडू शकते.

अनेक संसाधनांमध्ये आता भाषेची मोठी प्रारूपे अंतर्भूत होऊ लागली आहेत. इतर प्रारूपांच्या मदतीने त्यांचे रूपांतर दृकश्राव्य माध्यमातही होऊ लागले आहे. त्यामुळे यापुढे सर्वानीच, ऐकीव आणि वाचीव माहितीवर विश्वास ठेवण्यापूर्वी स्रोताचा पडताळा करायला हवा.- आशीष महाबळ, मराठी विज्ञान परिषद