एआयला आपण प्रशिक्षित करतो, म्हणजेच शिकवतो ते नेमकं कसं? अर्थातच यासाठी आपल्याला पायथनसारख्या भाषेत प्रोग्रॅम लिहावा लागतो. या प्रोग्रॅममध्ये नेमकं काय असतं? आपण या प्रोग्रॅममध्ये एआयला ‘मी देत असलेली माहिती वाच, त्या माहितीचा अर्थ कसा लावायचा हेसुद्धा समजून घे आणि त्यानुसार तुझं प्रशिक्षण पूर्ण कर’ असं जणू सांगतो. उदाहरणार्थ आपण एआयला चित्रांचा मोठा साठा खाद्या म्हणून पुरवू शकतो आणि या चित्रांमध्ये नेमक्या कोणत्या वस्तू किंवा गोष्टी आहेत हेसुद्धा सांगू शकतो. त्यानुसार चित्रांचा अर्थ लावण्याची क्षमता एआयमध्ये येते. हे नेमकं कसं घडतं हे समजून घेण्यासाठी एक उदाहरण घेऊ.
इंटरनेटवर ‘एम्निस्ट’ ( MNIST) नावाचा चित्रांचा एक विशाल साठा (डेटाबेस) आहे. त्याचं पूर्ण नाव ‘मॉडिफाइड नॅशनल इन्स्टिट्यूट ऑफ स्टँडर्ड्स अँड टेक्नॉलॉजी’ असं आहे. एआयमध्ये हे एम्निस्ट खूपच लोकप्रिय आहे. एआयला प्रशिक्षित करण्यासाठी त्याचा मोठ्या प्रमाणावर वापर केला जातो. तो कसा? तर या चित्रांच्या साठ्यामध्ये हातानं लिहिलेला अंक आणि प्रत्यक्षात तो अंक कुठला आहे, अशी माहिती खूप मोठ्या प्रमाणावर भरलेली आहे. याचे काही नमुने खाली दिलेले आहेत.
शून्य, एक, दोन, असं करत करत नऊ असे इंग्रजीमधले सगळे दहा अंक असंख्य निरनिराळ्या प्रकारे लिहिल्याचे असे नमुने या डेटाबेसमध्ये चित्राच्या रूपानं आहेत. म्हणजेच शून्य हा आकडा असंख्य वेगवेगळ्या प्रकारे लिहिल्यावर कसा दिसू शकेल, एक हा आकडा असंख्य वेगवेगळ्या प्रकारे लिहिल्यावर कसा दिसू शकेल, वगैरे. इथे तर याचे फक्त थोडेच नमुने दिलेले आहेत. प्रत्यक्षात एम्निस्टमध्ये प्रत्येक अंकासाठी असे हजारो नमुने आहेत. म्हणजेच शून्य या अंकासाठी ५,९२२ नमुने, एक या अंकासाठी ६,७४२ नमुने, वगैरे. शिवाय अशा प्रत्येक आकड्याच्या चित्राला त्या आकड्याचं ‘लेबल’ लावलेलं आहे. म्हणजेच शून्यासाठीच्या प्रत्येक चित्राला 0 असं लेबल लावलेलं आहे, एकच्या प्रत्येक चित्राला 1 असं लेबल लावलेलं आहे, वगैरे. हे सोबतच्या चित्रामध्ये दाखवलेलं नाही. हे वापरून एआय कसं शिकतं? तर दर वेळी एक चित्र एआयला दाखवायचं आणि त्यासाठीचं लेबल (म्हणजे 0 की 1 की 2, … की 9) काय आहे हेसुद्धा त्याला सांगायचं. म्हणजेच 0 लिहिण्याचे शेकडो प्रकार बघून हे सगळे शून्यच आहेत हे एआयला समजतं. तसंच इतरही अंकांच्या बाबतीतसुद्धा घडतं. अशा प्रकारे एआय प्रत्येक लिखित स्वरूपातला अंक म्हणजे नेमका कुठला अंक हे ‘शिकतो’. याला ‘डीप लर्निंग’चं ‘ट्रेनिंग’ म्हणतात. त्यानंतर आपण त्याला नव्यानंच लिहिलेला 0 हा अंक दाखवला तर तो आधी आपण दिलेल्या प्रशिक्षणाचा वापर करून हा अंक नेमका कुठल्या अंकाशी जुळतो आहे, हे तपासतो आणि आपल्याला हा अंक शून्य असल्याचं सांगतो.
एआयची जादू अशा प्रकारे काम करते. आता एआयला आपण अंकांची चित्र ‘दाखवतो’ कशी? त्यासाठी पायथनसारख्या संगणकीय भाषेत तरतुदी असतात. म्हणजेच ‘एम्निस्ट डेटाबेसमधलं एक चित्र घे आणि ते बघ आणि समजून घे’ असं आपण एआयला सांगू शकतो. त्यानुसार एआय या डेटाबेसमधलं चित्र बघतं. ते बघून झाल्यावर आपण एआयला सांगतो ‘हे चित्र म्हणजे 0 हा अंक’. असं सगळ्या शून्य, एक, दोन, … अशा अंकांसाठी आपण करतो. साहजिकच एआयला अशी हजारो चित्रं आणि त्या चित्रांमधला अंक म्हणजे नेमका कुठला अंक, हे समजतं.
आता एम्निस्ट डेटाबेसऐवजी इतर कुठल्याही चित्रांचा आपण विचार केला तरी तिथली प्रक्रिया अशीच असते. म्हणूनच एआय शिकू शकतं आणि शिकून आपल्या प्रशिक्षणासाठीचं ‘मॉडेल’ तयार करू शकतं. नंतर याच ‘मॉडेल’चा वापर करून ते आपण विचारलेल्या प्रश्नाचं उत्तर देऊ शकतं. उदाहरणार्थ ‘चित्रातला अंक कोणता आहे हे सांग’ किंवा ‘चित्रात मांजर दाखवलेलं आहे का कुत्रा हे सांग’!
akahate@gmail.com