कृत्रिम बुद्धिमत्तेचा वापर करून हस्ताक्षर ओळखण्यामध्ये किंवा मजकुराचा अर्थ लावण्यात अनेक अडचणी असतात. मुळात प्रत्येक माणसाचे हस्ताक्षर वेगवेगळे असते. तसेच प्रत्येकाची लिहिण्याची पद्धतही भिन्न असते. साहजिकच अचूकपणे अक्षरांचा अर्थ लावणे अजिबात सोपे नसते. आपण अक्षरे सुटी लिहिली तर मजकुराचा अर्थ लावण्याचे काम तुलनेने सोपे होते; पण जर आपण अक्षरे एकमेकांमध्ये मिसळत गेलो तर अशा मजकुराचा अर्थ लावण्याचे काम कसरतीचे ठरते. उदाहरणार्थ इंग्रजीमध्ये रेखीव शैलीसाठी प्रसिद्ध असलेल्या ‘कर्सिव्ह’ लिखाणाच्या बाबतीत कृत्रिम बुद्धिमत्तेच्या तंत्रज्ञानाला ही अडचण खास करून येते. याशिवाय तिरकी अक्षरे, सगळे लिखाण एकसारखे नसणे या अडचणीही येतातच. यामुळे कृत्रिम बुद्धिमत्तेच्या तंत्रज्ञानाला ‘शिकवण्यासाठी’ आधी खूप मोठ्या प्रमाणावर लिखित मजकूर उपलब्ध करून द्यावा लागतो. त्यातही निरनिराळ्या प्रकारच्या तसेच विविध व्यक्तींच्या लिखाणांचा समावेश असावा लागतो. यातून हे तंत्रज्ञान मानवी लिखाणातील समानता, त्यातील फरक, त्यामधली वैशिष्ट्ये या गोष्टी आत्मसात करू शकते.

या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा
Skip
या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा

हेही वाचा >>> कुतूहल : हस्ताक्षर ओळखणारे तंत्रज्ञान

कृत्रिम बुद्धिमत्तेच्या साहाय्याने हस्ताक्षर ओळखण्याच्या तंत्रज्ञानाला ‘इंटेलिजंट कॅरॅक्टर रेकग्निशन (आयसीआर)’ असे म्हणतात. माणूस जसा मजकूर वाचतो त्याच प्रकारे काम करण्याचा प्रयत्न हे तंत्रज्ञान करत असल्यामुळे त्याची अचूकता आधीच्या ‘ओसीआर’ तंत्रज्ञानापेक्षा जास्त असते. तसेच याच्या मुळाशी वापरल्या जाणाऱ्या संकल्पनांमध्ये नवनवा मजकूर हाती आल्यावर सुधारणा करत राहण्याची आणि आपली क्षमता वाढवण्याची सोय असल्यामुळे आपण ते जितके वापरत राहू तितके त्याचे काम अधिकाधिक सुधारत जाते.

यामध्ये असलेला महत्त्वाचा घटक म्हणजे ‘लार्ज लँग्वेज मॉडेल’ (एलएलएम). याचा सोपा अर्थ म्हणजे मानवी बोलणे किंवा लिखाण यामध्ये आधीच्या मजकुरावरून पुढचा मजकूर काय असू शकेल यासंबंधीचा अंदाज जसा आपण बांधू शकतो तसाच अंदाज हे तंत्रज्ञान बांधू शकते. म्हणजेच फक्त कृत्रिमपणे अक्षरांचा अर्थ लावण्यापलीकडे जाऊन मजकुराचा अर्थ लावण्याचा प्रयत्न ते करते. स्वाभाविकपणे त्याची अचूकता कैक पटींनी वाढते.

हस्ताक्षराचा अर्थ लावणे अर्थातच सुरुवातीला फक्त इंग्रजी भाषेपुरते मर्यादित होते. आता मात्र अक्षराधारित भाषांबरोबरच चित्रे/ चिन्हे यांचा अक्षरांसारखा वापर करणाऱ्या भाषांमधील मजकूर ओळखण्याची क्षमतासुद्धा कृत्रिम बुद्धिमत्तेच्या तंत्रज्ञानामध्ये आलेली आहे. तसेच त्याला या बहुविध भाषांमधील अधिकाधिक मजकूर जसजसा पुरवला जाईल तसतशी त्याची हस्ताक्षराबरोबरच संपूर्ण मजकुराचा अर्थ लावण्याची क्षमता वेगाने विकसित होत जाईल; असे आपण खात्रीलायकरीत्या म्हणू शकतो.

अतुल कहाते   

मराठी विज्ञान परिषद

ई-मेल : office@mavipa.org

संकेतस्थळ : http://www.mavipa.org

हेही वाचा >>> कुतूहल : हस्ताक्षर ओळखणारे तंत्रज्ञान

कृत्रिम बुद्धिमत्तेच्या साहाय्याने हस्ताक्षर ओळखण्याच्या तंत्रज्ञानाला ‘इंटेलिजंट कॅरॅक्टर रेकग्निशन (आयसीआर)’ असे म्हणतात. माणूस जसा मजकूर वाचतो त्याच प्रकारे काम करण्याचा प्रयत्न हे तंत्रज्ञान करत असल्यामुळे त्याची अचूकता आधीच्या ‘ओसीआर’ तंत्रज्ञानापेक्षा जास्त असते. तसेच याच्या मुळाशी वापरल्या जाणाऱ्या संकल्पनांमध्ये नवनवा मजकूर हाती आल्यावर सुधारणा करत राहण्याची आणि आपली क्षमता वाढवण्याची सोय असल्यामुळे आपण ते जितके वापरत राहू तितके त्याचे काम अधिकाधिक सुधारत जाते.

यामध्ये असलेला महत्त्वाचा घटक म्हणजे ‘लार्ज लँग्वेज मॉडेल’ (एलएलएम). याचा सोपा अर्थ म्हणजे मानवी बोलणे किंवा लिखाण यामध्ये आधीच्या मजकुरावरून पुढचा मजकूर काय असू शकेल यासंबंधीचा अंदाज जसा आपण बांधू शकतो तसाच अंदाज हे तंत्रज्ञान बांधू शकते. म्हणजेच फक्त कृत्रिमपणे अक्षरांचा अर्थ लावण्यापलीकडे जाऊन मजकुराचा अर्थ लावण्याचा प्रयत्न ते करते. स्वाभाविकपणे त्याची अचूकता कैक पटींनी वाढते.

हस्ताक्षराचा अर्थ लावणे अर्थातच सुरुवातीला फक्त इंग्रजी भाषेपुरते मर्यादित होते. आता मात्र अक्षराधारित भाषांबरोबरच चित्रे/ चिन्हे यांचा अक्षरांसारखा वापर करणाऱ्या भाषांमधील मजकूर ओळखण्याची क्षमतासुद्धा कृत्रिम बुद्धिमत्तेच्या तंत्रज्ञानामध्ये आलेली आहे. तसेच त्याला या बहुविध भाषांमधील अधिकाधिक मजकूर जसजसा पुरवला जाईल तसतशी त्याची हस्ताक्षराबरोबरच संपूर्ण मजकुराचा अर्थ लावण्याची क्षमता वेगाने विकसित होत जाईल; असे आपण खात्रीलायकरीत्या म्हणू शकतो.

अतुल कहाते   

मराठी विज्ञान परिषद

ई-मेल : office@mavipa.org

संकेतस्थळ : http://www.mavipa.org