माणूस ज्या पद्धतीने विचार करतो त्या पद्धतीने विचार करून ‘अल्फागो’ने ‘गो’सारख्या किचकट खेळात जगज्जेत्या मानवी खेळाडूवर मात केली. इतकंच नव्हे तर त्या खेळात ‘गो’च्या चार हजार वर्षांच्या इतिहासात तोवर न खेळली गेलेली खेळी खेळून कृत्रिम बुद्धिमत्तेच्या सर्जनशीलतेचे उत्तम उदाहरणही दिले.
हजारपेक्षा जास्त प्रीमियम लेखांचा आस्वाद घ्या ई-पेपर अर्काइव्हचा पूर्ण अॅक्सेस कार्यक्रमांमध्ये निवडक सदस्यांना सहभागी होण्याची संधी ई-पेपर डाउनलोड करण्याची सुविधा
२०१७च्या मे महिन्यात ‘अल्फागो’च्या त्यापुढच्या ‘मास्टर’ आवृत्तीने को जिये या जागतिक क्रमवारीत पहिल्या क्रमांकावर असलेल्या ‘गो’ खेळाडूचा तीन सामन्यांच्या मालिकेत ३-० असा सपशेल पराभव केला आणि ‘डीप माइंड’ने ‘अल्फागो’ची निवृत्ती जाहीर केली.
२०१७ सालीच ‘अल्फागो झिरो’ ही अल्फागोची नवी आवृत्ती जगासमोर आली. ‘अल्फागो झिरो’ला शिकवताना कोणतीही मानवी विदा वापरली गेली नव्हती. गूगलच्या सुपर संगणकाच्या मदतीने स्वत:शीच खेळून तो ‘गो’ खेळात कोणत्याही मनुष्यप्राण्यापेक्षा तरबेज झाला. तीन दिवसांच्या सखोल शिक्षणानंतर तो ‘अल्फागो’च्या ली सिडोलला धूळ चारणाऱ्या आवृत्तीबरोबर शंभर सामने खेळला आणि सर्वच्या सर्व सामने जिंकला. एकवीस दिवसांच्या सखोल शिक्षणानंतर तो ‘अल्फागो’च्या ‘मास्टर’ आवृत्तीच्या दर्जाला पोहोचला आणि ४० दिवसांच्या सखोल शिक्षणानंतर ‘अल्फागो’च्या आजवरच्या सर्व आवृत्त्यांपेक्षा श्रेष्ठ बनला.
हेही वाचा >>> कुतूहल : गो मॅन गो
‘अल्फागो झिरो’च्या अल्गोरिदमचा वापर करून ‘अल्फाझिरो’ नावाची प्रणाली बनवली गेली आहे, जी केवळ ‘गो’च नाही तर बुद्धिबळही उत्तमपणे खेळू शकते.
डिसेंबर २०१७मध्ये, ‘अल्फाझिरो’ ‘स्टॉकफिश ८’ या बुद्धिबळ खेळणाऱ्या प्रणालीशी खेळला. ही प्रणाली तेव्हा तेव्हा बुद्धिबळ खेळणाऱ्या प्रणालीत सर्वोत्तम समजली जात होती. या दोन्ही प्रणालींच्या हार्डवेअर आणि सॉफ्टवेअरमध्ये मोठा फरक होता.
‘अल्फाझिरो’ला एकूण नऊ तास स्वत:शीच खेळून प्रशिक्षण देण्यात आले आणि अवघ्या चार तासांच्या प्रशिक्षणानंतर तो ‘स्टॉकफिश’च्या पातळीवर पोहोचला. ‘अल्फाझिरो’ने ‘स्टॉकफिश’विरुद्ध प्रत्येकी १०० सामन्यांच्या १२ स्पर्धांत भाग घेतला, ज्यात अल्फाझिरो २९० वेळा जिंकला, २४ वेळा हरला आणि ८८६ वेळा सामने अनिर्णीत राहिले. ‘अल्फाझिरो’चा हा निर्विवाद विजय अत्यंत महत्त्वाचा होता. कारण ही न्यूरल नेटवर्कच्या माध्यमातून मिळवलेल्या कृत्रिम बुद्धिमत्तेची इतर पद्धतीने मिळवलेल्या बुद्धिमत्तेवर मात होती. या सामन्यांत ‘स्टॉकफिश’ प्रत्येक सेकंदाला सात कोटी परिस्थितींचा विचार करत होता तर ‘अल्फाझिरो’ अतियोग्य अशा फक्त ८० हजार परिस्थितींचा. हे केवळ न्यूरल नेटवर्कच्या माध्यमातून मिळवलेल्या कृत्रिम बुद्धिमत्तेमुळे शक्य झाले होते. यानंतर स्टॉकफिशच्या पुढील आवृत्तीतही न्यूरल नेटवर्कचा वापर करून त्याला अधिक सबळ करण्यात आले.
२०१७च्या मे महिन्यात ‘अल्फागो’च्या त्यापुढच्या ‘मास्टर’ आवृत्तीने को जिये या जागतिक क्रमवारीत पहिल्या क्रमांकावर असलेल्या ‘गो’ खेळाडूचा तीन सामन्यांच्या मालिकेत ३-० असा सपशेल पराभव केला आणि ‘डीप माइंड’ने ‘अल्फागो’ची निवृत्ती जाहीर केली.
२०१७ सालीच ‘अल्फागो झिरो’ ही अल्फागोची नवी आवृत्ती जगासमोर आली. ‘अल्फागो झिरो’ला शिकवताना कोणतीही मानवी विदा वापरली गेली नव्हती. गूगलच्या सुपर संगणकाच्या मदतीने स्वत:शीच खेळून तो ‘गो’ खेळात कोणत्याही मनुष्यप्राण्यापेक्षा तरबेज झाला. तीन दिवसांच्या सखोल शिक्षणानंतर तो ‘अल्फागो’च्या ली सिडोलला धूळ चारणाऱ्या आवृत्तीबरोबर शंभर सामने खेळला आणि सर्वच्या सर्व सामने जिंकला. एकवीस दिवसांच्या सखोल शिक्षणानंतर तो ‘अल्फागो’च्या ‘मास्टर’ आवृत्तीच्या दर्जाला पोहोचला आणि ४० दिवसांच्या सखोल शिक्षणानंतर ‘अल्फागो’च्या आजवरच्या सर्व आवृत्त्यांपेक्षा श्रेष्ठ बनला.
हेही वाचा >>> कुतूहल : गो मॅन गो
‘अल्फागो झिरो’च्या अल्गोरिदमचा वापर करून ‘अल्फाझिरो’ नावाची प्रणाली बनवली गेली आहे, जी केवळ ‘गो’च नाही तर बुद्धिबळही उत्तमपणे खेळू शकते.
डिसेंबर २०१७मध्ये, ‘अल्फाझिरो’ ‘स्टॉकफिश ८’ या बुद्धिबळ खेळणाऱ्या प्रणालीशी खेळला. ही प्रणाली तेव्हा तेव्हा बुद्धिबळ खेळणाऱ्या प्रणालीत सर्वोत्तम समजली जात होती. या दोन्ही प्रणालींच्या हार्डवेअर आणि सॉफ्टवेअरमध्ये मोठा फरक होता.
‘अल्फाझिरो’ला एकूण नऊ तास स्वत:शीच खेळून प्रशिक्षण देण्यात आले आणि अवघ्या चार तासांच्या प्रशिक्षणानंतर तो ‘स्टॉकफिश’च्या पातळीवर पोहोचला. ‘अल्फाझिरो’ने ‘स्टॉकफिश’विरुद्ध प्रत्येकी १०० सामन्यांच्या १२ स्पर्धांत भाग घेतला, ज्यात अल्फाझिरो २९० वेळा जिंकला, २४ वेळा हरला आणि ८८६ वेळा सामने अनिर्णीत राहिले. ‘अल्फाझिरो’चा हा निर्विवाद विजय अत्यंत महत्त्वाचा होता. कारण ही न्यूरल नेटवर्कच्या माध्यमातून मिळवलेल्या कृत्रिम बुद्धिमत्तेची इतर पद्धतीने मिळवलेल्या बुद्धिमत्तेवर मात होती. या सामन्यांत ‘स्टॉकफिश’ प्रत्येक सेकंदाला सात कोटी परिस्थितींचा विचार करत होता तर ‘अल्फाझिरो’ अतियोग्य अशा फक्त ८० हजार परिस्थितींचा. हे केवळ न्यूरल नेटवर्कच्या माध्यमातून मिळवलेल्या कृत्रिम बुद्धिमत्तेमुळे शक्य झाले होते. यानंतर स्टॉकफिशच्या पुढील आवृत्तीतही न्यूरल नेटवर्कचा वापर करून त्याला अधिक सबळ करण्यात आले.