|| हृषिकेश दत्ताराम शेर्लेकर

डेटा अ‍ॅनालिटिक्स किंवा विदा-विश्लेषण हा आजच्या काळातील ‘निर्णय-प्रक्रिये’चा अविभाज्य भाग ठरतो आहे..

loksatta kutuhal artificial intelligence and research in mathematics
कुतूहल : कृत्रिम बुद्धिमत्ता आणि गणितातील संशोधन
Manoj Jarange Patil on Kalicharan
‘हिंदुत्व तोडणारा राक्षस’, कालीचरण यांच्या विधानानंतर मनोज जरांगे…
loksatta kutuhal artificial intelligence in decision making
कुतूहल : कृत्रिम बुद्धिमत्तेच्या साहाय्याने निर्णयांची अंमलबजावणी
loksatta kutuhal artificial intelligence for good governance
कुतूहल : उत्तम प्रशासनासाठी कृत्रिम बुद्धिमत्ता
article about upsc exam preparation guidance upsc exam preparation tips in marathi
UPSC ची तयारी : नीतिशास्त्र, सचोटी  आणि नैसर्गिक क्षमता
artificial intelligence to develop ability to create substances with specific qualities
कुतूहल : कृत्रिम बुद्धिमत्तेतून हव्या त्या गुणधर्मांचा पदार्थ
loksatta kutuhal artificial intelligence for scientific data analysis
कुतूहल – शास्त्रीय संशोधन : विश्लेषणासाठी कृत्रिम बुद्धिमत्ता
TET, AI Technology TET, TET candidates,
टीईटी परीक्षेत एआय तंत्रज्ञान वापरल्याचा परिणाम काय? किती उमेदवारांनी दिली परीक्षा?

डिजिटल तंत्रज्ञानातील एक महत्त्वाचा खांब म्हणजे ‘अ‍ॅनालिटिक्स’ (विश्लेषण)! यालाच बरेचदा ‘बिझनेस अ‍ॅनालिटिक्स’, ‘अ‍ॅनालिटिक्स अ‍ॅण्ड इनसाइट्स’, ‘डेटा अ‍ॅनालिटिक्स’देखील संबोधले जाते. आजच्या लेखापासून अ‍ॅनालिटिक्सच्या विश्वात..

जगातील बहुतेक माणसे आणि उद्योगसुद्धा निर्णय घेतेवेळी फक्त पूर्वानुभव, अंदाज आणि ‘आतला आवाज’ किंवा अंत:स्फूर्ती यांचा वापर करतात. साहजिकच ते कधी कधी नशीबवान ठरतात, तर बरेचदा चूक! त्याऐवजी ‘डेटा अ‍ॅनालिटिक्स’चा वापर केला, तर चुका कमी होऊ शकतात. या विषयाची महती आणि व्याप्ती लक्षात येण्यासाठी सर्वप्रथम डेटा व अ‍ॅनालिटिक्सबद्दल काही दिग्गजांची गाजलेली सुंदर वक्तव्ये पाहू :

(१) पीटर सोंदरगार्ड म्हणतो, ‘डेटा इज द न्यू ऑइल अ‍ॅण्ड अ‍ॅनालिटिक्स इज द इंजिन.’  सर्वोत्तम उत्पन्नाचे साधन म्हणून विसाव्या शतकातील खनिज तेलाची जागा एकविसाव्या शतकात डेटाने हिसकावून घेतली आहे आणि डेटा (विदा)- विश्लेषण हे त्या इंधनातून शक्ती निर्माण करणारे इंजिन आहे. ज्याच्याकडे सर्वाधिक डेटा (आणि तो कसा वापरायचा याचे ज्ञान) तो सर्वात सधन. सर्वोत्तम उदाहरण गूगल, फेसबुक.

(२) ‘टाटा समूहा’चे अध्यक्ष म्हणाले होते, ‘तुमच्या उद्योगांची अंतर्गत प्रक्रिया परिपक्वता (प्रोसेस-मॅच्युरिटी) एव्हाना तुम्ही कधीच सुरळीत केलेली असावी आणि आता पुढची वाटचाल तुमच्या उद्योगांची डेटा-मॅच्युरिटी- म्हणजेच उपलब्ध विदेचा योग्य प्रकारे वापर करून त्याआधारे महसूल, गुणवत्ता व ग्राहक-समाधान आणि एकंदरीत उद्योगाचे मूल्य वाढवणे अशी असेल. त्यासाठी हवा मूलभूत, उपलब्ध आणि क्षणोक्षणी बदलूनही विश्लेषण होऊ शकणारा (रीअल-टाइम) डेटा.’

(३) एडवर्ड्स डेमिंग म्हणतात, ‘इन गॉड वी ट्रस्ट, ऑल अदर्स मस्ट ब्रिंग डेटा.’ देवावर विश्वास आहे आमचा, पण मनुष्याने कुठलीही गोष्ट सिद्ध करण्यासाठी विदा (माहिती) आणायलाच हवी.

(४) संगणकयुगाच्या आधी डीन श्लिक्टर म्हणाले होते, ‘कुठल्याही गोष्टीच्या अगदी खोलवर मुळापर्यंत गेल्यास तुम्हाला त्यातील ‘गणित’ नक्कीच सापडेल.’

(५) अमेरिकी शैक्षणिक तज्ज्ञ थॉमस डॅव्हेनपोर्ट म्हणतात, ‘प्रत्येक उद्योगाचे पुढे जाऊन शेवटी ‘डेटावर आधारित’ उद्योगामध्ये परिवर्तन होईल, इतर गुंडाळले जातील.’

(६) अमेरिकेतील ‘एमआयटी’च्या डिजिटल अर्थव्यवस्था पुढाकाराचे प्रमुख अँड्रय़ू मॅक्अ‍ॅफी म्हणतात, ‘हे जगच एक मोठा बिग डेटा कोड आहे.’

(७) संगणकविज्ञान कथालेखक डॅनिएल मोरान म्हणतात, ‘डेटा माहितीशिवाय असू शकतो, पण डेटाशिवाय माहिती (ज्ञान) असूच शकत नाही.’

(८) आणि शेवटी भगवद्गीता : ‘ज्ञानाचे दान हे यज्ञ, त्याग वा आहुती तसेच कुठल्याही इतर दानापेक्षा सरस ठरते.’

‘डेटा’ या शब्दाला आज ‘संगणकीय विदा’ हा अर्थ आहे. रोजच्या जीवनात आपण कल्पनादेखील केली नसेल, इतका डेटा आपण प्रत्येक जण स्वत: वापरतोय, नवीन बनवतो व इतरांना पाठवतो; पण ‘डिलीट’ मात्र काहीच करत नाही!

(अ) फक्त गेल्या दोन वर्षांत अख्ख्या जगातील ९० टक्के डेटा तुम्ही-आम्ही (लोकांनीच) निर्माण केला. पैकी ८० टक्के डेटा हा पारंपरिक संगणक प्रणालीला उपयोगाचा नाही (म्हणजे तो ध्वनिमुद्रण, दृक्मुद्रण, छायाचित्रे, नैसर्गिक भाषेतील लेखन किंवा मजकूर या स्वरूपात आहे), असे मायक्रोसॉफ्टने केलेल्या संशोधनात आढळले.

(आ) एका दिवसात आपण जगात २.५ क्विन्टिलियन बाइट्स डेटा बनवतो, म्हणजे २.५ गुणिले एकावर अठरा शून्ये!

(इ) गूगलवर सहजच ‘वन इंटरनेट मिनिट’ असे सर्च करून बघा.. अवघ्या साठ सेकंदांत काय काय घडते, याबद्दल माहिती मिळेल.

(ई) एक एमबी डेटा साठवण्यासाठी १९८० मध्ये तीन ते चार कोटी रुपये लागत, हल्ली काही पैसे! विदासाठवण (डेटा स्टोरेज) जवळपास मोफतच झाले आहे. तोच डेटा वापरायला टेलिकॉमचा खर्चदेखील (मोबाइल डेटा-पॅक, वायफाय इत्यादी) आपल्या देशात अवघा पाच रुपये प्रति दिवस प्रति जीबीपर्यंत आला आहे. डेटानिर्मितीचे तर विचारूच नका; प्रत्येकाकडे संगणक व स्मार्टफोन जोडीला मोफत इंटरनेट व समाजमाध्यमे आणि आता वस्तुजाल वा ‘आयओटी’ उपकरणे. थोडक्यात, डेटाचा महापूर येतो आहे अशी स्थिती.

(उ) ‘अवरवर्ल्डइनडेटा.ऑर्ग’ या संकेतस्थळावर, जगातील उपयुक्त गोष्टींबद्दल मोफत डेटा उपलब्ध केला आहे. या संकेतस्थळाचा आजवरचा पसारा २,७४६ आलेख, २९७ विषय इतका आहे.

आता मुख्य विषयाकडे वळू या.. डेटा-अ‍ॅनालिटिक्स सर्वाना सहजच समजावे म्हणून एक रोजचेच उदाहरण घेऊ या. आमच्या शेजारचे कुलकर्णी काका उवाच, ‘‘अरे, काय सांगू बाबा, काही केल्या वजन काय कमी होत नाहीये रे माझे. बरेच प्रयत्न करून झाले, पण हा वजनकाटा एका किलोनेदेखील मागे जाईल तर नशीब! कोण कोण काय काय सांगेल ते सगळे उपाय करून झाले, पण सगळं मुसळ केरातच..’’

इथे काकांना समस्या भेडसावते आहे वजन वाढल्याची आणि निर्णय घ्यायचा आहे वजन कसे कमी करता येईल, याचा. परंतु त्यांच्याकडे कुठलाच मूलभूत डेटा, माहिती, ज्ञान नाही (त्यांच्या वजनाशिवाय अर्थात) आणि कदाचित म्हणूनच त्यांना योग्य मार्ग/यश मिळत नसणार.

समजा, त्यांनी वजन कमी करण्यासाठी कुठला कुठला डेटा लागेल, त्याचा अभ्यास केला आणि स्वत:चाच पूर्व-इतिहास एका आलेखात मांडला.. म्हणजे मागील १०-१५ वर्षांतील वजनातील चढ-उतार, प्रत्येक वर्षांतली छायाचित्रे, वजन, सवयी, खाणे-पिणे (किती/ कसे/ केव्हा), व्यायाम (हो/ नाही/ किती), रक्तचाचण्यांचे अहवाल, मानसिक परिस्थिती, इत्यादी.. तर त्यांना स्वत:लाच किती तरी कल, संदर्भ समजू शकतील; नाही का? अशा माहिती मांडण्याला ‘डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’ म्हणू शकू आणि त्यातून मिळणाऱ्या कल, संदर्भाना ‘इनसाइट्स’! रूढार्थाने ‘वर्णनपर’ असे भाषांतर असलेला ‘डिस्क्रिप्टिव्ह’ शब्द इथे वापरात येतो, कारण विश्लेषण फक्त भूतकाळापर्यंत सीमित आहे म्हणून.

समजा, काकांनी त्यापुढे असेच, पण मोठे आलेख त्यांच्या वयोगटाच्या आणखी १०० लोकांचे (समान वय, काही समान व्यवसाय, काही समान कौटुंबिक मुळं, काही समान सवयी, आजार.. आणि वजन!) डेटा मिसळून बनविले; तर आपण स्वत: कुठे आहोत आणि एकंदर सरासरी, सर्वोत्तम शक्यता, सर्वात वाईट परिस्थिती असले सगळे कल (पॅटर्न) हे सारे काकांना मिळू शकतील. यालाच ‘क्लस्टिरग अ‍ॅनालिटिक्स’ म्हणतात.

आता त्यांनी हाच डेटा/ आलेख वापरून पूर्वीच्या चढ-उतारांवरून भविष्यात काय घडू शकेल, याचे अंदाज मांडले (उदा. महिन्याला ठरावीक वजन कमी व्हायचे असेल, तर इतके कॅलरी, इतका व्यायाम, इ.) तर त्याला ‘प्रेडिक्टिव्ह अ‍ॅनालिटिक्स’ म्हणू शकू. इथे भविष्यातले अंदाज हा सर्वात महत्त्वाचा पैलू असतो. पण इथे जसेजसे प्रश्न क्लिष्ट होत जातात तशी उत्तरेदेखील फारच विविध- म्हणजे अनेक पर्याय दिसू लागतात आणि कुठला पर्याय निवडायचा हेच मानवी बुद्धीसाठी कठीण कार्य बनते. वरील उदाहरणात १० किलो कमी करण्यासाठी ‘१५०० कॅलरी खाणे अधिक ५०० कॅलरीचा खडतर व्यायाम’ विरुद्ध ‘१२०० कॅलरी खाणे अधिक २०० कॅलरीचा माफक व्यायाम’ असे आणखी चार-पाच पर्याय समजा मिळाले; तर काकांना यशाची खात्री देणारा सर्वोत्तम पर्याय कुठला, ते कसे ठरवावे?

त्यापुढील पायरी म्हणजे ‘प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स’. इथे अ‍ॅनालिटिक्सची सांगड व्यवहारकेंद्री संशोधनाशी (ऑपरेशनल रीसर्चशी) घालून अ‍ॅनालिटिक्सद्वारे मिळवलेल्या विविध पर्यायांपैकी सर्वोत्तम पर्याय निवडला जातो. म्हणजे वरील चार-पाच पर्यायांमधून सर्वोत्तम पर्याय फक्त ‘मला वाटलं म्हणून’ किंवा ‘कोणी तरी म्हणतं म्हणून’ न निवडता गणिती शास्त्र वापरून निवडणे.

या तत्त्वांना म्हणतात ‘डेटासेंट्रिक डिसिजन मेकिंग’- म्हणजेच माहितीच्या आधारावरच निर्णय घेणे! थोडक्यात,

(क) डिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स – पूर्वी काय झाले होते?

(ख) प्रेडिक्टिव्ह अ‍ॅनालिटिक्स – पुढे काय होऊ  शकेल?

(ग) प्रिस्क्रिप्टिव्ह अ‍ॅनालिटिक्स – कुठली क्रिया म्हणजे सर्वोत्तम निर्णय?

आता आजचा प्रश्न : तुमच्या रोजच्या दैनंदिन जीवनातील एखादा प्रश्न, अडचण किंवा इच्छा, स्वप्न.. आणि त्या विषयाबद्दल कुठला कुठला डेटा तुम्ही वापरू शकाल, त्याबद्दल कळवा.

लेखक टाटा कन्सल्टन्सी सव्‍‌र्हिसेसमध्ये साहाय्यक उपाध्यक्ष आणि सध्या अ‍ॅनालिटिक्स आणि इनसाइट्सच्या यूएसए सेंटरचे प्रमुख म्हणून कार्यरत आहेत.

hrishikesh.sherlekar@gmail.com