आसिफ बागवान
चॅटजीपीटीच्या संशोधनानंतर आर्टिफिशियल इंटिलिजन्सवर आधारित यंत्रणा विकसित करण्यासाठी मोठमोठ्या कंपन्यांमध्ये स्पर्धा सुरू झाली आहे. त्यातील काही कंपन्यांनी चॅटजीपीटीचीच नक्कल करून आपले वेगळे अस्तित्व निर्माण केले तर, काही कंपन्या वेगळेपण दाखवण्याच्या प्रयत्नात फसल्याचेही दिसून आले. मात्र, आता ॲपलने नवीन ‘एआय’ तंत्रज्ञान विकसित केले असून ते चॅटजीपीटीपेक्षाही अधिक सक्षम आहे, असा दावा केला आहे. ते कसे याचा हा वेध…

या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा
Skip
या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा

ॲपल ‘एआय’ची पार्श्वभूमी…

चॅटजीपीटीचा उगम झाल्यापासून ॲपलने स्वत:च्या उत्पादनासाठी कृत्रिम प्रज्ञेवर (एआय) आधारित तंत्रज्ञान विकसित करण्याचे प्रयत्न चालवले होते. त्यासाठी त्यांनी सुरुवातीला चॅटजीपीटी बनवणाऱ्या ओपनएआयशी सहकार्य करार केले, गुगलबरोबर संशोधन भागीदारी केली आणि अन्य काही छोट्या कंपन्यांनाही हाताशी धरले. मात्र, आता ॲपलने स्वत:चे असे नवीन ‘एआय’ मॉडेल तयार केले असून त्यासंबंधीची संशोधन पत्रिका कंपनीच्या संकेतस्थळावरून नुकतीच प्रकाशित करण्यात आली आहे. ‘रेफरन्स रिझोल्युशन ॲज लँग्वेज मॉडेलिंग’ (री-एएलएम) असे या तंत्रज्ञानाचे प्राथमिक नाव आहे.

हेही वाचा >>>पोस्टाच्या तिकिटाएवढी दिसणारी सेमीकंडक्टर चिप नक्की कशी तयार होते?

‘री-एएलएम’चा पाया काय?

मानवी संवादात अस्पष्ट संदर्भांचा वापर मोठ्या प्रमाणात असतो. माणूस संवाद करताना केवळ भाषेचा वापर न करता हातवारे, चेहऱ्यावरचे हावभाव यांचाही वापर करत असतो. ‘हे’ ,‘ते’, ‘तो’,‘ती’ अशा दर्शक सर्वनामांचा किंवा विशेषणांचा वापर मानवी संभाषणात मोठ्या प्रमाणात असतो. या शब्दांना संगणकीय परिभाषेत वेगळे अर्थ नाहीत. परिणामी ‘हे काय आहे’ किंवा ‘तो कोण आहे’ अशा प्रकारचे प्रश्न चॅटजीपीटी किंवा अन्य कुठल्याही ‘एआय’ला विचारल्यास ती यंत्रणा संभ्रमात पडते आणि वापरकर्त्याला अपेक्षित उत्तर देऊ शकत नाही. ही उणीव भरून काढणे हा ‘री-एएलम’च्या संशोधनाचा पाया आहे.

‘री-एएलएम’ कसे उपयुक्त?

‘री-एएलएम’ हे तंत्रज्ञान ॲपलच्या ‘सिरी’ एआय असिस्टंटचा वापरकर्त्याशी असलेला संवाद स्पष्ट करण्यात मदत करते. आयफोन किंवा मॅकच्या स्क्रीनवर दर्शवण्यात येत असलेला मजकूर आणि त्याक्षणी त्या उपकरणावर कार्यरत असलेले इतर ॲप किंवा टास्क यांना विचारात घेऊन वापरकर्त्याला काय अपेक्षित आहे, याबाबत हे तंत्रज्ञाना ‘सिरी’ला सूचना देते. त्यामुळे आयफोनच्या स्क्रीनवर सुरू असलेल्या एखाद्या व्हिडिओमध्ये दिसणाऱ्या कलाकाराचे नाव काय आहे किंवा एखाद्या चित्रातील ठिकाण कोणते आहे, याबाबत केवळ सूचक प्रश्न विचारूनही वापरकर्ता त्याबद्दलची माहिती ‘सिरी’कडून मिळवू शकतो. त्यासाठी त्याला त्या चित्राचे वर्णन करण्याची गरज भासत नाही. याशिवाय स्क्रीनवर दिसत असलेल्या वेबसाइटवर दिसणाऱ्या मोबाइल क्रमांक डायल करण्यासाठी केवळ ‘कॉल हिम/हर’ असे सांगताच ‘सिरी’ त्या क्रमांकाशी संपर्क साधून देऊ शकते.

हेही वाचा >>>लग्नात कन्यादान आणि सप्तपदीचे महत्त्व काय? हे विधी केल्यानंतरच लग्न वैध ठरते? कायदा काय सांगतो?

हे तंत्रज्ञान काम कसे करते?

‘री-एएलएम’ तंत्रज्ञान फोनच्या किंवा संगणकाच्या स्क्रीनचे छोटेछोटे कप्पे करून त्यातील चित्रे, चिन्हे किंवा मजकूर यांचे वर्गीकरण करून त्यांचे एका शाब्दिक स्वरूपात पृथःकरण करते. त्यामुळे जेव्हा वापरकर्ता ‘हे काय आहे’ किंवा ‘याचा अर्थ काय’ अशा स्वरूपाच्या दर्शक विचारणा करतो, तेव्हा हे तंत्रज्ञान गोळा केलेल्या माहितीतून अचूक तपशील ‘सिरी’ला पुरवते. त्यामुळे वापरकर्त्याला नेमके काय हवे आहे, हे ‘सिरी’ला त्वरित जाणता येते.

चॅटजीपीटीपेक्षा अधिक उपयुक्त?

‘री-एएलएम’ चे मॉड्युल दृश्य पद्धतीने काम करते. त्यामुळे वापरकर्त्याकडून सूचना प्राप्त झाल्यानंतर ते त्वरित आणि अचूक पद्धतीने त्याचे परिणाम सादर करते. वापरकर्त्याच्या अस्पष्ट सूचनांचाही अंदाज घेऊन त्याआधारे योग्य क्रिया करण्याची क्षमता या तंत्रज्ञानामध्ये आहे. याबाबतीत चॅटजीपीटी मागे पडत असल्याचा ॲपलचा दावा आहे. शिवाय चॅटजीपीटीपेक्षा या तंत्रज्ञानाचा उत्तर देण्याचा वेग अधिक असल्याचेही ॲपलचे म्हणणे आहे.

नवीन तंत्रज्ञान कधीपासून?

ॲपलने ‘री-एएलएम’बाबत सध्या केवळ संशोधन पत्रिका प्रसिद्ध केली असली तरी, त्याच्या निर्मितीचे कामही पूर्ण झाल्याचे सांगण्यात येते. या तंत्रज्ञानाचा वापर ॲपलच्या नव्या ‘आयओएस’ प्रणालीमध्ये करण्यात येणार आहे. येत्या जूनमध्ये ही प्रणाली कार्यान्वित होईल, अशीही माहिती आहे. त्यानंतर ॲपलच्या विद्यमान कार्यप्रणालींमध्येही हे तंत्रज्ञान समाविष्ट करण्यात येण्याची शक्यता आहे.

ॲपल ‘एआय’ची पार्श्वभूमी…

चॅटजीपीटीचा उगम झाल्यापासून ॲपलने स्वत:च्या उत्पादनासाठी कृत्रिम प्रज्ञेवर (एआय) आधारित तंत्रज्ञान विकसित करण्याचे प्रयत्न चालवले होते. त्यासाठी त्यांनी सुरुवातीला चॅटजीपीटी बनवणाऱ्या ओपनएआयशी सहकार्य करार केले, गुगलबरोबर संशोधन भागीदारी केली आणि अन्य काही छोट्या कंपन्यांनाही हाताशी धरले. मात्र, आता ॲपलने स्वत:चे असे नवीन ‘एआय’ मॉडेल तयार केले असून त्यासंबंधीची संशोधन पत्रिका कंपनीच्या संकेतस्थळावरून नुकतीच प्रकाशित करण्यात आली आहे. ‘रेफरन्स रिझोल्युशन ॲज लँग्वेज मॉडेलिंग’ (री-एएलएम) असे या तंत्रज्ञानाचे प्राथमिक नाव आहे.

हेही वाचा >>>पोस्टाच्या तिकिटाएवढी दिसणारी सेमीकंडक्टर चिप नक्की कशी तयार होते?

‘री-एएलएम’चा पाया काय?

मानवी संवादात अस्पष्ट संदर्भांचा वापर मोठ्या प्रमाणात असतो. माणूस संवाद करताना केवळ भाषेचा वापर न करता हातवारे, चेहऱ्यावरचे हावभाव यांचाही वापर करत असतो. ‘हे’ ,‘ते’, ‘तो’,‘ती’ अशा दर्शक सर्वनामांचा किंवा विशेषणांचा वापर मानवी संभाषणात मोठ्या प्रमाणात असतो. या शब्दांना संगणकीय परिभाषेत वेगळे अर्थ नाहीत. परिणामी ‘हे काय आहे’ किंवा ‘तो कोण आहे’ अशा प्रकारचे प्रश्न चॅटजीपीटी किंवा अन्य कुठल्याही ‘एआय’ला विचारल्यास ती यंत्रणा संभ्रमात पडते आणि वापरकर्त्याला अपेक्षित उत्तर देऊ शकत नाही. ही उणीव भरून काढणे हा ‘री-एएलम’च्या संशोधनाचा पाया आहे.

‘री-एएलएम’ कसे उपयुक्त?

‘री-एएलएम’ हे तंत्रज्ञान ॲपलच्या ‘सिरी’ एआय असिस्टंटचा वापरकर्त्याशी असलेला संवाद स्पष्ट करण्यात मदत करते. आयफोन किंवा मॅकच्या स्क्रीनवर दर्शवण्यात येत असलेला मजकूर आणि त्याक्षणी त्या उपकरणावर कार्यरत असलेले इतर ॲप किंवा टास्क यांना विचारात घेऊन वापरकर्त्याला काय अपेक्षित आहे, याबाबत हे तंत्रज्ञाना ‘सिरी’ला सूचना देते. त्यामुळे आयफोनच्या स्क्रीनवर सुरू असलेल्या एखाद्या व्हिडिओमध्ये दिसणाऱ्या कलाकाराचे नाव काय आहे किंवा एखाद्या चित्रातील ठिकाण कोणते आहे, याबाबत केवळ सूचक प्रश्न विचारूनही वापरकर्ता त्याबद्दलची माहिती ‘सिरी’कडून मिळवू शकतो. त्यासाठी त्याला त्या चित्राचे वर्णन करण्याची गरज भासत नाही. याशिवाय स्क्रीनवर दिसत असलेल्या वेबसाइटवर दिसणाऱ्या मोबाइल क्रमांक डायल करण्यासाठी केवळ ‘कॉल हिम/हर’ असे सांगताच ‘सिरी’ त्या क्रमांकाशी संपर्क साधून देऊ शकते.

हेही वाचा >>>लग्नात कन्यादान आणि सप्तपदीचे महत्त्व काय? हे विधी केल्यानंतरच लग्न वैध ठरते? कायदा काय सांगतो?

हे तंत्रज्ञान काम कसे करते?

‘री-एएलएम’ तंत्रज्ञान फोनच्या किंवा संगणकाच्या स्क्रीनचे छोटेछोटे कप्पे करून त्यातील चित्रे, चिन्हे किंवा मजकूर यांचे वर्गीकरण करून त्यांचे एका शाब्दिक स्वरूपात पृथःकरण करते. त्यामुळे जेव्हा वापरकर्ता ‘हे काय आहे’ किंवा ‘याचा अर्थ काय’ अशा स्वरूपाच्या दर्शक विचारणा करतो, तेव्हा हे तंत्रज्ञान गोळा केलेल्या माहितीतून अचूक तपशील ‘सिरी’ला पुरवते. त्यामुळे वापरकर्त्याला नेमके काय हवे आहे, हे ‘सिरी’ला त्वरित जाणता येते.

चॅटजीपीटीपेक्षा अधिक उपयुक्त?

‘री-एएलएम’ चे मॉड्युल दृश्य पद्धतीने काम करते. त्यामुळे वापरकर्त्याकडून सूचना प्राप्त झाल्यानंतर ते त्वरित आणि अचूक पद्धतीने त्याचे परिणाम सादर करते. वापरकर्त्याच्या अस्पष्ट सूचनांचाही अंदाज घेऊन त्याआधारे योग्य क्रिया करण्याची क्षमता या तंत्रज्ञानामध्ये आहे. याबाबतीत चॅटजीपीटी मागे पडत असल्याचा ॲपलचा दावा आहे. शिवाय चॅटजीपीटीपेक्षा या तंत्रज्ञानाचा उत्तर देण्याचा वेग अधिक असल्याचेही ॲपलचे म्हणणे आहे.

नवीन तंत्रज्ञान कधीपासून?

ॲपलने ‘री-एएलएम’बाबत सध्या केवळ संशोधन पत्रिका प्रसिद्ध केली असली तरी, त्याच्या निर्मितीचे कामही पूर्ण झाल्याचे सांगण्यात येते. या तंत्रज्ञानाचा वापर ॲपलच्या नव्या ‘आयओएस’ प्रणालीमध्ये करण्यात येणार आहे. येत्या जूनमध्ये ही प्रणाली कार्यान्वित होईल, अशीही माहिती आहे. त्यानंतर ॲपलच्या विद्यमान कार्यप्रणालींमध्येही हे तंत्रज्ञान समाविष्ट करण्यात येण्याची शक्यता आहे.