अतुल कहाते
सर्वसामान्य लोकांची डेटा अॅनॅलिसिस आणि डेटा अॅनॅलिटिक्स या संज्ञांमुळे गल्लत होऊ शकते. अॅनॅलिसिस ही माहितीच्या आधारे निर्णय घेण्यासंबंधीची सगळ्यात पहिली पायरी असते. अॅनॅलिसिसकडून अॅनॅलिटिक्सकडे जाताना मात्र काठीण्य पातळी वाढते…

डेटा सायन्सच्या जोडीनं अनेकदा वापरली जाणारी संज्ञा म्हणजे डेटा अॅनॅलिटिक्स. बरेचदा लोक डेटा सायन्स आणि डेटा अॅनॅलिटिक्स या संज्ञा एकाच अर्थानं वापरतात. काही प्रमाणात हे योग्यसुद्धा आहे; पण काही वेळा मात्र या दोन शाखांमध्ये फरक करणं गरजेचं ठरतं. खास करून डेटा अॅनॅलिटिक्सचा वापर उपलब्ध माहितीचं विश्लेषण करणं आणि त्यातून सुयोग्य निष्कर्ष काढणं यासाठी केला जातो, तर डेटा सायन्सचा वापर मुख्यत्वे भविष्यात घेतले जाणारे निर्णय, त्यांची कारणमीमांसा अशा गोष्टींसाठी केला जातो. याचं अगदी सोपं उदाहरण घ्यायचं झालं तर गेल्या दोन वर्षांमध्ये एखाद्या मोठ्या दुकानामध्ये झालेल्या खरेदीचं अनेक प्रकारे विश्लेषण करण्याला आपण डेटा अॅनॅलिटिक्स म्हणू; तर याच दुकानाची भविष्यात कशी कामगिरी होईल, तिची नेमकी कोणती उत्पादनं जास्त खपतील, कोणत्या महिन्यात तिला जास्त ग्राहक मिळतील अशा प्रकारचे अंदाज बांधण्याला आपण डेटा सायन्स म्हणू. अगदी ढोबळपणे सांगायचं तर डॉक्टरांच्या भाषेत रोगाचं निदान करण्याला आपण डेटा अॅनॅलिटिक्स म्हणू; तर रोगावर मात करून रुग्ण बरा होण्यासाठीच्या प्रयत्नांना आपण डेटा सायन्स म्हणू.

How to Check EPF Balance Using the UMANG App
तुमच्या EPF खात्यात पैसे जमा होतायत की नाही कसे ओळखाल? तर ‘या’ चार पद्धती ठरतील तुमच्यासाठी खूपच कामाच्या
Mulund renamed new Dharavi Dharavi redevelopment rehabilitation Mulund residents agitated boards
‘मुलुंडचे लवकरच नवीन धारावी नामांतर’, संतप्त मुलुंडवासियांकडून मुलुंडमध्ये…
Changes in the format of the NEET question paper
‘नीट’च्या प्रश्नपत्रिकेच्या स्वरुपात बदल
Artificial Intelligence Might Enable Communication with Animals
‘जंगल मंगल विद्यापीठा’त कृत्रिम बुद्धिमत्ता परिषद भरते तेव्हा…
What causes the rare disorder Guillain Barre Syndrome to occur in Pune news
पुण्यात दुर्मीळ ‘गुइलेन बॅरे सिंड्रोम’ विकाराची बाधा कशामुळे? रुग्णांच्या तपासणीतून कारण आलं समोर…
data scientist
कृत्रिम प्रज्ञेच्या प्रांगणात : डेटा सायन्टिस्ट कसं व्हायचं?
disability certificate, disabled, taluka level,
अपंगांसाठी सरकारचा मोठा निर्णय! आता तालुका स्तरावरही मिळणार अपंग प्रमाणपत्र
tarkteerth lakshmanshastri joshi
तर्कतीर्थ विचार : जंगल सत्याग्रहाचे नेतृत्व

अनेकदा लोक अॅनॅलिसिस आणि अॅनॅलिटिक्स या शब्दांमध्येही घोळ घालतात. यामुळे सर्वसामान्य लोकांची डेटा अॅनॅलिसिस आणि डेटा अॅनॅलिटिक्स या संज्ञांमुळे गल्लत होऊ शकते. अॅनॅलिसिस ही माहितीच्या आधारे निर्णय घेण्यासंबंधीची सगळ्यात पहिली पायरी असते. यात उपलब्ध माहिती बघणं, तपासणं, त्यामध्ये काही चुका आहेत का याचा शोध घेऊन त्या दुरुस्त करणं अशा जुजबी गोष्टी असतात. हे काम करण्यासाठी खूप जास्त कौशल्य लागत नाही. साधारणपणे वाणिज्य शाखेचं शिक्षण घेतलेला पदवीच्या पातळीवरचा विद्यार्थी हे काम करू शकतो. अॅनॅलिसिसकडून अॅनॅलिटिक्सकडे जाताना मात्र काठीण्यपातळी वाढते. आता नुसतं माहितीकडे बघून काम भागत नाही, तर माहितीचा अर्थ लावणं, तिच्याद्वारे आत्तापर्यंत काय घडलेलं आहे हे तपासणं अशा गोष्टी येऊ शकतात. याचं सोपं उदाहरण म्हणजे अॅनॅलिसिस करताना आपण वर उल्लेख केलेल्या दुकानाच्या विक्रीचे तपशील बघणं, सगळी माहिती नीटपणे उपलब्ध आहे का हे बघणं, उत्पादनानुसार सरासरी विक्री किती झाली किंवा कुठल्या महिन्यात किती विक्री झाली वगैरे माहिती मिळवण्याचा प्रयत्न करू. अॅनॅलिटिक्समध्ये मात्र आपण नुसती ही माहिती मिळवून थांबणार नाही, तर अनेकदा ‘का?’ किंवा ‘कशामुळे?’ असे प्रश्न विचारून त्यांची उत्तरं मिळवण्याचा प्रयत्न करू. उदाहरणार्थ जानेवारी महिन्याची विक्री डिसेंबरच्या तुलनेत सलग दोन वर्षं कमी झालेली असेल तर अॅनॅलिसिसमध्ये आपल्याला फक्त एवढंच समजलेलं असेल; पण अॅनॅलिटिक्समध्ये मात्र आपण हे नेमकं का झालं; याचा शोध घेण्याचा प्रयत्न करू.

म्हणूनच डेटा अॅनॅलिटिक्ससाठी आपल्याला पायथन, संख्याशास्त्र वगैरे गोष्टींची गरज भासते. आधी उल्लेख केल्याप्रमाणे डेटा अॅनॅलिटिक्स आणि डेटा सायन्स यांच्यामधली सीमारेषा काहीशी धूसर असली तरी डेटा सायन्सचा जवळपास सगळा भर भविष्यावर असतो. आत्तापर्यंत काय झालं ते महत्त्वाचं होतंच; पण ते आपल्याला अॅनॅलिटक्सनं सांगितलेलं आहे असं गृहीत धरून ‘आता पुढे काय?’ असा प्रश्न डेटा सायन्स विचारतं आणि त्याचं उत्तरही शोधतं. उदाहरणार्थ डिसेंबरच्या तुलनेत जानेवारीची विक्री कमी का झाली हे आपल्याला डेटा अॅनॅलिटिक्समधून कदाचित समजेल; पण भविष्यात असं होऊ न देण्यासाठी काय केलं पाहिजे हे आपल्याला डेटा सायन्स सांगेल. म्हणजेच जसं आपली नाडी, आपला रक्तदाब वगैरे डॉक्टर आधी तपासतात तसं डेटा अॅनॅलिसिस. त्यानंतर योग्य निदान करून हे नेमकं कशामुळे झालं आहे हे ठरवणं म्हणजे डेटा अॅनॅलिटिक्स. शेवटी यातून बरं होण्यासाठी तसंच भविष्यात असं घडू नये यासाठी काय केलं पाहिजे हे सांगणं म्हणजे डेटा सायन्स.

अर्थात हे झालं पाठ्यपुस्तकी वर्णन. प्रत्यक्षात अनेक कंपन्यांना अशा प्रकारे तीन वेगवेगळी कामं करण्यासाठी तीन लोक (किंवा अनेक लोक असलेल्या तीन टीम्स) नेमणं शक्य नसतं. अशा वेळी ही सगळी कामं एकाच माणसाला (किंवा टीमला) करावी लागतात. या क्षेत्रात प्रवेश करू इच्छित असलेल्यांसाठी ही सुसंधी ठरू शकते; कारण यासाठी आवश्यक असलेल्या कौशल्यांपैकी थोड्या कौशल्यांच्या जोरावरसुद्धा काही कंपन्यांमध्ये शिरकाव करता येतो आणि नेटानं प्रयत्न करून त्यासाठीची इतर कौशल्यं काही काळातच आत्मसात करता येतात.

यासाठी नेमके कोणते अभ्यासक्रम असतात याविषयी पुढच्या वेळी.

akahate@gmail.com

Story img Loader