देवनागरी हस्तलिखिताची संगणकीय प्रत

या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा
Skip
या बातमीसह सर्व प्रीमियम कंटेंट वाचण्यासाठी साइन-इन करा

इंग्रजी मजकूर असलेल्या कागदाचे छायाचित्र काढून त्याचे संगणकीय प्रतीमध्ये रूपांतर करण्याचे तंत्र बाजारात आहे. मात्र देवनागरीसाठी अशा प्रकारचे रूपांतर करणे म्हणजे संगणकीय सांकेतांकांची तारेवरची कसरत करण्यासारखे आहे. हे आव्हान आता मुंबईतील टाटा मूलभूत विज्ञान संशोधन संस्थेने स्वीकारले असून अल्पावधीतच ते पूर्ण होणार आहे.

एखाद्या छापील कागदाचे छायाचित्र काढून त्याचे रूपांतर संगणकीय प्रतीमध्ये करण्याचे विविध सॉफ्टवेअर्स बाजारात उपलब्ध आहेत. या सॉफ्टवेअर्सच्या माध्यमातून संगणकामध्ये त्या मजकुराची सॉफ्ट कॉपी तयार होते आणि ती आपण संपादितही करू शकतो. पण हे सर्व इंग्रजी आणि इतर परदेशी भाषांपुरतेच मर्यादित आहेत. याचबरोबर ही सुविधा उपलब्ध करून देणाऱ्या सर्व परदेशी कंपन्या आहेत. या कंपन्यांना लाखो रुपये देण्यापेक्षा हे तंत्र देशातच विकसित करून देशाची मूळ गरज ओळखून त्यात काम होणे आवश्यक आहे. या उद्देशाने टाटा मूलभूत विज्ञान संशोधन संस्थेतील प्रा. शशिकांत दुगड यांनी हा प्रकल्प हाती घेतला आहे. हा प्रकल्प करण्यासाठी खर्च फारच कमी आहे. तसेच याचे संगणकीय भाषेत कोडिंग करण्याचे काम त्यांनी विविध अभियांत्रिकी महाविद्यालयांच्या विद्यार्थ्यांवर सोपविले आहे. यामुळे या कामाला गतीही मिळत आहे. प्रा. दुगड हे ‘सर्न’ येथील प्रयोगशाळोत सुरू असलेल्या ‘देवकणा’(हिग्ज बोसॉन)चा शोध घेणाऱ्या प्रकल्पात काही विभागांमध्ये काम करत होते. या प्रयोगादरम्यान अनेक कोड्सचे रूपांतर ‘सर्न’च्या कोडमध्ये करण्यासाठी एक तंत्रज्ञान वापरण्यात आले होते. या तंत्रज्ञानाचाच वापर आपण छापील कागदाचे संगणकीय रूपांतरण करण्यासाठी का करू नये, असा प्रश्न त्यांना पडला आणि त्यांनी त्यावर काम करण्यास सुरुवात केली. या कामात त्यांना काहीसे यशही आले आहे.

आम्ही तयार केलेले संगणकीय कोडिंग इंग्रजीवर काम करू लागले आहे. आता आम्ही भारतीय भाषांवर काम करण्यास सुरुवात केली आहे. याची सुरुवात गुजराती आणि इतर दक्षिण भारतीय भाषांपासून करण्यात येणार आहे. यानंतर मराठी व इतर भाषांसाठी आम्ही हे करणार असल्याचे प्रा. दुगड यांनी सांगितले. या प्रकल्पाचा मुख्य उद्देश हा आपल्याकडे उपलब्ध असलेली जुनी कागदपत्रे आणि संरक्षण खात्याशी संबंधित कागदपत्रांचे संपादित करता येणाऱ्या संगणकीय प्रतीत रूपांतर करण्याचा आहे. यामुळे सुरुवातीला छापील कागदाच्या छायाचित्राचे संगणकीय प्रतीत रूपांतर करण्यावर आम्ही भर देत आहोत. यानंतर हस्तलिखितांसाठीही हा प्रयोग केला जाणार आहे.

इतकेच नव्हे तर हे सर्व यशस्वी झाल्यानंतर पुरातन अशा मोडी लिपीसाठीही अशा प्रकारची सुविधा उपलब्ध करून देण्याचा आमचा मानस असल्याचे प्रा. दुगड यांनी सांगितले. या कामासाठी आम्ही महाविद्यालयीन विद्यार्थ्यांना प्रशिक्षित करत असून त्यांना प्रकल्प स्वरूपात हे काम दिले जात आहे. यासाठी मुंबई व पुण्यातील महाविद्यालयांतील मुले सहभागी झाल्याचेही ते म्हणाले.

सध्या बाजारात छापील कागदावरील मजकुराचे संगणकावर संपादन करता येणाऱ्या फाइलमध्ये रूपांतर करण्याची सुविधा आहे. ही सुविधा इंग्रजी आणि इतर परदेशी भाषांमध्ये आहे. भारतीय भाषांमध्ये अजून ती उपलब्ध नाही. यामुळे ती सुविधा भारतीय भाषांमध्ये उपलब्ध करून देण्यासाठी आम्ही हे प्रयत्न सुरू केले आहेत.   – प्रा. शशिकांत दुगड, टाटा मूलभूत विज्ञान संशोधन संस्था

इंग्रजी मजकूर असलेल्या कागदाचे छायाचित्र काढून त्याचे संगणकीय प्रतीमध्ये रूपांतर करण्याचे तंत्र बाजारात आहे. मात्र देवनागरीसाठी अशा प्रकारचे रूपांतर करणे म्हणजे संगणकीय सांकेतांकांची तारेवरची कसरत करण्यासारखे आहे. हे आव्हान आता मुंबईतील टाटा मूलभूत विज्ञान संशोधन संस्थेने स्वीकारले असून अल्पावधीतच ते पूर्ण होणार आहे.

एखाद्या छापील कागदाचे छायाचित्र काढून त्याचे रूपांतर संगणकीय प्रतीमध्ये करण्याचे विविध सॉफ्टवेअर्स बाजारात उपलब्ध आहेत. या सॉफ्टवेअर्सच्या माध्यमातून संगणकामध्ये त्या मजकुराची सॉफ्ट कॉपी तयार होते आणि ती आपण संपादितही करू शकतो. पण हे सर्व इंग्रजी आणि इतर परदेशी भाषांपुरतेच मर्यादित आहेत. याचबरोबर ही सुविधा उपलब्ध करून देणाऱ्या सर्व परदेशी कंपन्या आहेत. या कंपन्यांना लाखो रुपये देण्यापेक्षा हे तंत्र देशातच विकसित करून देशाची मूळ गरज ओळखून त्यात काम होणे आवश्यक आहे. या उद्देशाने टाटा मूलभूत विज्ञान संशोधन संस्थेतील प्रा. शशिकांत दुगड यांनी हा प्रकल्प हाती घेतला आहे. हा प्रकल्प करण्यासाठी खर्च फारच कमी आहे. तसेच याचे संगणकीय भाषेत कोडिंग करण्याचे काम त्यांनी विविध अभियांत्रिकी महाविद्यालयांच्या विद्यार्थ्यांवर सोपविले आहे. यामुळे या कामाला गतीही मिळत आहे. प्रा. दुगड हे ‘सर्न’ येथील प्रयोगशाळोत सुरू असलेल्या ‘देवकणा’(हिग्ज बोसॉन)चा शोध घेणाऱ्या प्रकल्पात काही विभागांमध्ये काम करत होते. या प्रयोगादरम्यान अनेक कोड्सचे रूपांतर ‘सर्न’च्या कोडमध्ये करण्यासाठी एक तंत्रज्ञान वापरण्यात आले होते. या तंत्रज्ञानाचाच वापर आपण छापील कागदाचे संगणकीय रूपांतरण करण्यासाठी का करू नये, असा प्रश्न त्यांना पडला आणि त्यांनी त्यावर काम करण्यास सुरुवात केली. या कामात त्यांना काहीसे यशही आले आहे.

आम्ही तयार केलेले संगणकीय कोडिंग इंग्रजीवर काम करू लागले आहे. आता आम्ही भारतीय भाषांवर काम करण्यास सुरुवात केली आहे. याची सुरुवात गुजराती आणि इतर दक्षिण भारतीय भाषांपासून करण्यात येणार आहे. यानंतर मराठी व इतर भाषांसाठी आम्ही हे करणार असल्याचे प्रा. दुगड यांनी सांगितले. या प्रकल्पाचा मुख्य उद्देश हा आपल्याकडे उपलब्ध असलेली जुनी कागदपत्रे आणि संरक्षण खात्याशी संबंधित कागदपत्रांचे संपादित करता येणाऱ्या संगणकीय प्रतीत रूपांतर करण्याचा आहे. यामुळे सुरुवातीला छापील कागदाच्या छायाचित्राचे संगणकीय प्रतीत रूपांतर करण्यावर आम्ही भर देत आहोत. यानंतर हस्तलिखितांसाठीही हा प्रयोग केला जाणार आहे.

इतकेच नव्हे तर हे सर्व यशस्वी झाल्यानंतर पुरातन अशा मोडी लिपीसाठीही अशा प्रकारची सुविधा उपलब्ध करून देण्याचा आमचा मानस असल्याचे प्रा. दुगड यांनी सांगितले. या कामासाठी आम्ही महाविद्यालयीन विद्यार्थ्यांना प्रशिक्षित करत असून त्यांना प्रकल्प स्वरूपात हे काम दिले जात आहे. यासाठी मुंबई व पुण्यातील महाविद्यालयांतील मुले सहभागी झाल्याचेही ते म्हणाले.

सध्या बाजारात छापील कागदावरील मजकुराचे संगणकावर संपादन करता येणाऱ्या फाइलमध्ये रूपांतर करण्याची सुविधा आहे. ही सुविधा इंग्रजी आणि इतर परदेशी भाषांमध्ये आहे. भारतीय भाषांमध्ये अजून ती उपलब्ध नाही. यामुळे ती सुविधा भारतीय भाषांमध्ये उपलब्ध करून देण्यासाठी आम्ही हे प्रयत्न सुरू केले आहेत.   – प्रा. शशिकांत दुगड, टाटा मूलभूत विज्ञान संशोधन संस्था