|| हृषिकेश दत्ताराम शेर्लेकर
फेब्रुवारी २००५ पासून अस्तित्वात आलेल्या गुगल मॅपचा जगभरात वापर केला जातो. त्या विषयी..
‘ए, जरा मॅप चेक कर’.. हल्ली जास्तीत जास्त वापराचे एआय साधन कुठले तर ‘गुगल मॅप्स’ (आणि अर्थातच अॅपल, मायक्रोसॉफ्ट बिंग, इत्यादी). आकडय़ात बोलायचे झाल्यास ७.५ अब्ज जागतिक लोकसंख्येमधून दररोज २ अब्ज लोक कुठल्या न कुठल्या डिजिटल मॅप्सचा वापर करतात. तेव्हा आजचे सदर नकाशापुराणावर.
सहाव्या शतकात ग्रीसमधील अनॅक्सिमंडरने जगातला पहिला नकाशा बनविला. तेव्हापासून नकाशे राजकारण, युद्ध, व्यापार, भूविस्तार यामध्ये महत्त्वाची भूमिका निभावू लागले. चामडे, कागद, डिजिटल स्क्रीन, फक्त महत्त्वाच्या लोकांची मालकी ते प्रत्येकाच्या हातात, टूडी ते थ्रीडी असा रंजक प्रवास केला गेला मागील चौदा शतकांत. १९६० मध्ये अमेरिकेने सर्वप्रथम उपग्रह छायाचित्रण प्रयोग केला. उपग्रहात फोटोफिल्म लोड करून ती अवकाशात पाठवली जायची, उपग्रहामार्फत स्वयंचलित छायाचित्रण करून मग त्या फिल्म्स पॅराशूटद्वारा पृथ्वीवर सोडल्या जायच्या. त्या चुकीच्या हाती सापडू नयेत म्हणून त्यांच्या आर्मी, नेव्हीला प्रयत्नांची पराकाष्ठा करावी लागे. मजेशीर आहे ना इतिहास. डिजिटल छायाचित्रण व इंटरनेट आल्यापासून हे पॅराशूट वगैरे प्रकार नक्कीच थांबले असावेत. तरीही पृथ्वीच्या संवेदनशील जागेच्या मिळवलेल्या प्रतिमा केवळ गुप्तचर, सरकारी खाते अशा निवडक गोष्टींसाठी उपलब्ध होत. पण इथपर्यंत नकाशे स्थिर होते, रियल टाइम अपडेट फीचर्स वगैरे नव्हते.
२००४ मध्ये गुगलने अमेरिकी उपग्रह छायाचित्रण कंपनी ‘की-होल’ विकत घेऊन डिजिटल नकाशे सर्वसामान्यांच्या हाती आणून ठेवले व इंडस्ट्री ४.० मधील एक महत्त्वाचा टप्पा गाठला गेला. ८ फेब्रुवारी २००५ रोजी जन्मलेल्या गुगल मॅप्स्ने स्वत:मध्ये बऱ्याच सुधारणा केल्या आहेत. आजच्या घडीला ते उपग्रह प्रतिमा, रस्त्यांचे नकाशे, रस्त्यांवरील पॅनोरामिक दृश्ये (स्ट्रीट व्ह्य़ू), रिअल टाइम ट्रॅफिक आणि फूट, कार, सायकल, सार्वजनिक वाहतुकीद्वारे प्रवास करण्यासाठी मार्ग नियोजन अशा सेवा मोफत पुरविते. अनेक प्रकारचे एआय व इतर डिजिटल तंत्रज्ञान मिळून गुगल मॅप्स आपल्यापर्यंत हाताच्या बोटांवर मोबाइलद्वारा कसे पोहोचते. ते पुढे. गुगल खाली नमूद केलेल्या स्रोतांतून विविध माहिती मिळवते.
१) बेस मॅप पार्टनर प्रोग्राम – विविध शासकीय व खासगी संस्थांकडून मिळवलेले नकाशे, जसे जिओलॉजिकल सव्र्हे, वन विभाग, नगरपालिका इत्यादी.
२) उपग्रहांनी काढलेली पृथ्वीची छायाचित्रे- झूम क्षमता काही सेंटिमीटपर्यंत, म्हणजेच आपल्या हातात काय वस्तू आहे, हेही दिसू शकेल एवढी.
३) हवाई छायाचित्रण – कमी उंचीवरून उडणाऱ्या विमानातून केलेले छायाचित्रण, प्रमुख शहरे अशा ठिकाणी अधिकाधिक तपशिलासाठी, विशेषत: त्रिमिती दृश्यासाठी.
४) स्ट्रीट व्ह्य़ू – गाडी व त्यावर लावलेला ३६० डिग्री कॅमेरा व रस्ते, त्यावरील खाणाखुणा, पाटय़ा व बाजूकडील दुकाने, इमारती, स्थळे यांचे छायाचित्रण.
५) लोकेशन सव्र्हिसेस – विविध शासकीय व खासगी संस्थांनी जागोजागी लावलेले सेन्सर्स आणि तुमच्या आमच्या मोबाइलमधील जीपीएस, लोकेशन फीचर
६) गुगल मॅपमेकर – आपल्याकडून जेव्हा मॅपमध्ये सुधारणा केली जाते, चूक दाखवून दिली जाते, ज्याला क्राऊड-सोर्सिग म्हणतात.
७) लोकल गाइड्स – जगभरातील लाखो लोकांनी स्थानिक गोष्टींबद्दल केलेल्या समीक्षा जसे प्रसिद्ध हॉटेलबद्दल प्रतिकिया, प्रेक्षणीय स्थळांबद्दल उपयुक्त माहिती.
अनेक मसाले एकत्र कुटून जसे एकजीव मिश्रण बनवितात, तसेच अनेक डिजिटल तंत्रज्ञान वापरून वरील सर्व माहिती एकसंध करून, आपल्यासमोर वापरण्यायोग्य स्वरूपात आणली जाते.
नकाशानिर्मिती – बेस मॅप पार्टनरकडून प्राथमिक कच्चा नकाशा प्राप्त होतो. एक शहर, पालिका इत्यादी. गुगल उपग्रह, विमान व स्ट्रीट व्ह्य़ू म्हणजे प्रत्यक्ष रस्त्यावरून धावण्याऱ्या गाडय़ांनी केलेल्या छायाचित्रणामार्फत रस्त्यांच्या प्रतिमा वरील कच्च्या नकाशात मिळवल्या जातात. थरांवर थर रचल्याप्रमाणे. ऐंशी देशांच्या अब्जावधी प्रतिमा आजवर त्यांनी गोळा केल्या असून दर १ ते ३ वर्षांनी या प्रतिमा नव्याने घेतल्या जातात. गुगल मॅपमेकर, लोकल गाइड्सची अतिरिक्त माहिती यात मिळवून शेवटी अंतिम मॅप बनतो. सरकारी नियमांनुसार संवेदनशील स्थळे ‘ब्लर’ म्हणजे जाणूनबुजून अस्पष्ट केली जातात आणि अर्थातच काही देशांमध्ये सरसकट बंदी आहे. चीन, उ. कोरिया, सीरिया, इराण आदी यात आहेत.
मिळवलेल्या अब्जावधी प्रतिमा माणसांनी हाताळणे केवळ अशक्य नाही का? इथेच गुगल एआयची किमया वापरते. कम्प्युटर व्हिजनचे मशीन लर्निग अलोगोरिथम्स म्हणजे एका प्रकारची एआय संगणक आज्ञावली. पूर्णपणे स्वयंचलित पद्धतीने फक्त वरील मिश्रणच नाही तर रस्त्यांलगत सिग्नल, चिन्ह, पाटय़ा, त्यावरील शब्द आणि प्रत्यक्ष रस्त्यांवरील खाणाखुणा अचूकपणे वाचून ‘रोड डायरेक्शन’ म्हणजे रस्ते मार्गदर्शन निर्माण करते. नाही तर प्रवेश नाही, एकदिशा मार्ग, मार्ग संपला, जवळपासची दुकाने, प्रेक्षणीय स्थळे वगैरे कसे कळतील? हे झाले रस्ते मार्गदर्शन. इमारती, दुकाने, घरे, शेते, नैसर्गिक स्थळे यांची नावे व स्थाननिश्चिती, क्षेत्रफळ हे सर्व गोळा करून वेगळे अलोगोरिथम्स त्रिमिती नकाशे बनतात. त्यानंतर पूर्ण क्षेत्राचा एकसंध असा त्रिमिती नकाशा बनतो. हा सेमी-फायनल नकाशा मात्र शेवटच्या टप्प्याला स्वहस्ते तपासण्यासाठी आणि बारीकसारीक दुरुस्ती करण्यासाठी मानवी ऑपरेटर्स अॅटलस नावाच्या प्रोग्रामचा वापर करतात. आपण जेव्हा गुगलला चुका कळवतो तेव्हा हीच टीम सुधारणा करते.
रिअल-टाइम ट्रॅफिक व मार्ग नियोजन – गुगल इथे दोन प्रकारची माहिती वापरते. १) पूर्वेतिहास म्हणजे गेल्या ६ ते १२ महिन्यांतील सरासरी वेळ. २) प्रत्यक्ष वेळी प्रवासाला लागत असलेला वेळ- रिअल टाइम. इथे गुगलला दोन प्रकारे माहिती मिळते. एक ट्रॅफिक सेन्सर्स, सिग्नल्सद्वारा, जे शहरात जागोजागी लागलेले असतात. दुसरे आपल्या स्मार्टफोनमधील जीपीएस लोकेशनद्वारा. एआय मशीन लर्निग अलोगोरिथम्स या उपलब्ध माहितीचे रिअल टाइम विश्लेषण करून एका ठिकाणावरून दुसऱ्या ठिकाणापर्यंत जायला लागणाऱ्या वेळाचे भाकीत सांगतात व निष्पत्ती म्हणून आपण बघतो ते मोबाइलवर लाल, निळ्या, हिरव्या रंगांनी भरलेले रस्ते. कधी कधी राखाडी आणि ईटीए. जेव्हा गुगलला वरील माहिती उपलब्ध होत नाही तेव्हा ती प्रणाली वेळेचे भाकीत करू शकत नाही. अशा वेळी राखाडी रस्ता दाखवला जातो. उदाहरण गावाकडील रस्ते.
‘अरे मुंबईहून पुण्याला किती वेळ लागेल,’ आपला पुढचा प्रश्न असतो, कधी, कसा, कोणाबरोबर, अचूक पत्ता, वगैरे. काही सेकंदांत आपण, ‘लागतील साडेतीन तास. पण १०० टक्के हमी नाही हां. कदाचित पावणेचार तासपण लागू शकतात.’ आपल्या मेंदूला हा प्रश्न सोडवायला तीनच गोष्टी पुरे झाल्या. एक पूर्वानुभव, दोन सद्य:परिस्थितीबद्दल अचूक माहिती. तीन कुठल्या माहितीला किती वजन, महत्त्व द्यायचे. उदाहरणार्थ, किती वाजता प्रवास होणार, विरुद्ध दिशेने कुठल्या दिवशी होणार याचे ज्ञान. अगदी अशिक्षित व्यक्तीही अशा प्रश्नांची उत्तरे फारसा वेळ न लावता देतील. पण हाच प्रश्न मशीन लर्निग वगैरे जाऊ दे, आपल्याला केवळ गणितात मांडायचा झाला तर? म्हणजे एक गणिती सूत्र प्रवास वेळ
= (W1*x1 + w2*x2 + .. + ६n*xn) असे काही तरी, प्रयत्न करून बघा. अजून क्लिष्ट आव्हाने, उदाहरणार्थ प्रतिमा विश्लेषण, त्यावरील टंकलिखित किंवा हस्तलिखित मजकूर वाचणे, मानवी हावभाव ओळखणे.. अशी एआय सूत्रे मशीन्स कशी बनवत असावीत?
पण संगणकाला प्रवास वेळेचे भाकीत करायचे म्हटल्यास गणिती सूत्र तर हवेच. कारण त्या बिचाऱ्याला फक्त शून्य व एक अशी दुहेरी भाषाच कळते. हे भाकीत करताना आर्टिफिशियल नुएरल नेट्स (एएनएन) नावाची मशीन लर्निग प्रणाली वापरली जाते. एएनएन ही मानवी मेंदूच्या कार्यपद्धतीवर अवलंबलेली आहे व एआय, मशीन लर्निग इत्यादी सर्व विज्ञान प्रामुख्याने संख्यागणितावर आधारित आहे. गुगल मॅप्सचा पुढचा टप्पा काय असेल, व्हिज्युअल पोजिशनिंग सिस्टीम (व्हीपीएस)सारखी सेवा ज्यामध्ये रिअल-वर्ल्ड स्ट्रीट व्ह्य़ू, आपल्या डोळ्यांना प्रत्यक्ष दिसते तसे दृश्य चालताना, गाडी चालवताना मॅप्सवर दिसू लागेल. आता आपल्याला केवळ रस्त्याची हिरवी, लाल रंग भरलेली रेखा दिसते नाही का, त्यात गुगल असिस्टंट दिमतीला. आपल्याशी मानवी भाषेत संवाद साधायला. सध्या फक्त एकतर्फी मार्गदर्शन असते. त्याचबरोबर गुगल लेन्स ज्यामुळे मॅपवर एखादी जागा, शहर पाहताना पॉप-अप येतील. खाणे-पिणे, स्थानिक कार्यक्रम, शॉपिंग, अत्यावश्यक, इतर सेवा व कदाचित भविष्यात फोन लिस्टमधील लोकांचे पत्ते. हे सगळे फक्त मोबाइलवर तर असेलच, पण गुगल ग्लाससारख्या चष्म्यावरदेखील. यालाच ऑग्मेंटेड / व्हच्र्युअल रियालिटी (एआर/व्हीआर) म्हणतात.
आजचे EIY – यूटय़ूब व्हिडीओ पाहा
https://www.youtube.com/watch?v=nPUUYlNvOI0, https://www.youtube.com/watch?v=H6wqhtxS1tQ, s://www.youtube.com/watch?v=yEbMlXNqOQY
लेखक टाटा कन्सल्टन्सी सव्र्हिसेसमध्ये साहाय्यक उपाध्यक्ष आणि सध्या अॅनालिटिक्स आणि इनसाइट्सच्या यूएसए सेंटरचे प्रमुख म्हणून कार्यरत आहेत.
hrishikesh.sherlekar@gmail.com