अतुल कहाते
सर्वसामान्य लोकांची डेटा अॅनॅलिसिस आणि डेटा अॅनॅलिटिक्स या संज्ञांमुळे गल्लत होऊ शकते. अॅनॅलिसिस ही माहितीच्या आधारे निर्णय घेण्यासंबंधीची सगळ्यात पहिली पायरी असते. अॅनॅलिसिसकडून अॅनॅलिटिक्सकडे जाताना मात्र काठीण्य पातळी वाढते…

या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा
Skip
या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा

डेटा सायन्सच्या जोडीनं अनेकदा वापरली जाणारी संज्ञा म्हणजे डेटा अॅनॅलिटिक्स. बरेचदा लोक डेटा सायन्स आणि डेटा अॅनॅलिटिक्स या संज्ञा एकाच अर्थानं वापरतात. काही प्रमाणात हे योग्यसुद्धा आहे; पण काही वेळा मात्र या दोन शाखांमध्ये फरक करणं गरजेचं ठरतं. खास करून डेटा अॅनॅलिटिक्सचा वापर उपलब्ध माहितीचं विश्लेषण करणं आणि त्यातून सुयोग्य निष्कर्ष काढणं यासाठी केला जातो, तर डेटा सायन्सचा वापर मुख्यत्वे भविष्यात घेतले जाणारे निर्णय, त्यांची कारणमीमांसा अशा गोष्टींसाठी केला जातो. याचं अगदी सोपं उदाहरण घ्यायचं झालं तर गेल्या दोन वर्षांमध्ये एखाद्या मोठ्या दुकानामध्ये झालेल्या खरेदीचं अनेक प्रकारे विश्लेषण करण्याला आपण डेटा अॅनॅलिटिक्स म्हणू; तर याच दुकानाची भविष्यात कशी कामगिरी होईल, तिची नेमकी कोणती उत्पादनं जास्त खपतील, कोणत्या महिन्यात तिला जास्त ग्राहक मिळतील अशा प्रकारचे अंदाज बांधण्याला आपण डेटा सायन्स म्हणू. अगदी ढोबळपणे सांगायचं तर डॉक्टरांच्या भाषेत रोगाचं निदान करण्याला आपण डेटा अॅनॅलिटिक्स म्हणू; तर रोगावर मात करून रुग्ण बरा होण्यासाठीच्या प्रयत्नांना आपण डेटा सायन्स म्हणू.

अनेकदा लोक अॅनॅलिसिस आणि अॅनॅलिटिक्स या शब्दांमध्येही घोळ घालतात. यामुळे सर्वसामान्य लोकांची डेटा अॅनॅलिसिस आणि डेटा अॅनॅलिटिक्स या संज्ञांमुळे गल्लत होऊ शकते. अॅनॅलिसिस ही माहितीच्या आधारे निर्णय घेण्यासंबंधीची सगळ्यात पहिली पायरी असते. यात उपलब्ध माहिती बघणं, तपासणं, त्यामध्ये काही चुका आहेत का याचा शोध घेऊन त्या दुरुस्त करणं अशा जुजबी गोष्टी असतात. हे काम करण्यासाठी खूप जास्त कौशल्य लागत नाही. साधारणपणे वाणिज्य शाखेचं शिक्षण घेतलेला पदवीच्या पातळीवरचा विद्यार्थी हे काम करू शकतो. अॅनॅलिसिसकडून अॅनॅलिटिक्सकडे जाताना मात्र काठीण्यपातळी वाढते. आता नुसतं माहितीकडे बघून काम भागत नाही, तर माहितीचा अर्थ लावणं, तिच्याद्वारे आत्तापर्यंत काय घडलेलं आहे हे तपासणं अशा गोष्टी येऊ शकतात. याचं सोपं उदाहरण म्हणजे अॅनॅलिसिस करताना आपण वर उल्लेख केलेल्या दुकानाच्या विक्रीचे तपशील बघणं, सगळी माहिती नीटपणे उपलब्ध आहे का हे बघणं, उत्पादनानुसार सरासरी विक्री किती झाली किंवा कुठल्या महिन्यात किती विक्री झाली वगैरे माहिती मिळवण्याचा प्रयत्न करू. अॅनॅलिटिक्समध्ये मात्र आपण नुसती ही माहिती मिळवून थांबणार नाही, तर अनेकदा ‘का?’ किंवा ‘कशामुळे?’ असे प्रश्न विचारून त्यांची उत्तरं मिळवण्याचा प्रयत्न करू. उदाहरणार्थ जानेवारी महिन्याची विक्री डिसेंबरच्या तुलनेत सलग दोन वर्षं कमी झालेली असेल तर अॅनॅलिसिसमध्ये आपल्याला फक्त एवढंच समजलेलं असेल; पण अॅनॅलिटिक्समध्ये मात्र आपण हे नेमकं का झालं; याचा शोध घेण्याचा प्रयत्न करू.

म्हणूनच डेटा अॅनॅलिटिक्ससाठी आपल्याला पायथन, संख्याशास्त्र वगैरे गोष्टींची गरज भासते. आधी उल्लेख केल्याप्रमाणे डेटा अॅनॅलिटिक्स आणि डेटा सायन्स यांच्यामधली सीमारेषा काहीशी धूसर असली तरी डेटा सायन्सचा जवळपास सगळा भर भविष्यावर असतो. आत्तापर्यंत काय झालं ते महत्त्वाचं होतंच; पण ते आपल्याला अॅनॅलिटक्सनं सांगितलेलं आहे असं गृहीत धरून ‘आता पुढे काय?’ असा प्रश्न डेटा सायन्स विचारतं आणि त्याचं उत्तरही शोधतं. उदाहरणार्थ डिसेंबरच्या तुलनेत जानेवारीची विक्री कमी का झाली हे आपल्याला डेटा अॅनॅलिटिक्समधून कदाचित समजेल; पण भविष्यात असं होऊ न देण्यासाठी काय केलं पाहिजे हे आपल्याला डेटा सायन्स सांगेल. म्हणजेच जसं आपली नाडी, आपला रक्तदाब वगैरे डॉक्टर आधी तपासतात तसं डेटा अॅनॅलिसिस. त्यानंतर योग्य निदान करून हे नेमकं कशामुळे झालं आहे हे ठरवणं म्हणजे डेटा अॅनॅलिटिक्स. शेवटी यातून बरं होण्यासाठी तसंच भविष्यात असं घडू नये यासाठी काय केलं पाहिजे हे सांगणं म्हणजे डेटा सायन्स.

अर्थात हे झालं पाठ्यपुस्तकी वर्णन. प्रत्यक्षात अनेक कंपन्यांना अशा प्रकारे तीन वेगवेगळी कामं करण्यासाठी तीन लोक (किंवा अनेक लोक असलेल्या तीन टीम्स) नेमणं शक्य नसतं. अशा वेळी ही सगळी कामं एकाच माणसाला (किंवा टीमला) करावी लागतात. या क्षेत्रात प्रवेश करू इच्छित असलेल्यांसाठी ही सुसंधी ठरू शकते; कारण यासाठी आवश्यक असलेल्या कौशल्यांपैकी थोड्या कौशल्यांच्या जोरावरसुद्धा काही कंपन्यांमध्ये शिरकाव करता येतो आणि नेटानं प्रयत्न करून त्यासाठीची इतर कौशल्यं काही काळातच आत्मसात करता येतात.

यासाठी नेमके कोणते अभ्यासक्रम असतात याविषयी पुढच्या वेळी.

akahate@gmail.com