देशभाषा की उन्नति से ही देशोन्नति होती है। - सुधाकर द्विवेदी।
ऑलिवर हेलविग से साक्षात्कार (विविध)  Click to print this content  
Author:रोहित कुमार 'हैप्पी'

ओसीआर (ऑपटिक्ल करेक्टर रिकोग्निशन) एक ऐसी तकनीक है जिसमें किसी इमेज़ में से टैक्स्ट को पहचान कर उसे सम्पादन योग्य टैक्स्ट में परिवर्तित किया जा सकता है। ओसीआर मुद्रित हिन्दी सामग्री के डिजिटलीकरण के लिये एक महत्वपूर्ण औज़ार है। हिन्दी में सही परिणाम देने वाला केवल हिन्दी ओसीआर नामक एक ही औज़ार उपलब्ध है और यह भी कम आश्चर्यचकित करने वाला नहीं कि इसे एक हिंदी प्रेमी जर्मन ने विकसित किया है।

18.11.1971 को जन्मे डा ऑलिवर हेलविग संस्कृत के एक विद्वान हैं। आपने "योगकारा बौद्ध धर्म में चमत्कार" पर 1998 में मास्टर की थीसिस की और 2002 में "संस्कृत और कंप्यूटर" पर शोध प्रबंध किया।

1998 के पश्चात बर्लिन विश्वविद्यालय में एक व्याख्याता के रूप में नियमित रूप से गतिविधियों में सम्मिलित हैं। आप निम्नलिखित विषयों पर नियमित व्याख्यान देते हैं:

  • आयुर्वेदिक साहित्य का परिचय
  • योग साहित्य
  • हिंदू धर्म परिचय


आप एक जर्मन हैं तथापि आपने देवनागरी और संस्कृत का ओसीआर सॉफ्टवेयर तैयार किया है! इसके बारे में बताएँ कि इसकी आवश्यकता कैसे पड़ी और इसकी शुरुआत कैसे हुई?

मैं एक संस्कृत का विद्वान हूँ और मैंने संस्कृत स्कूल में पढ़नी Dr Oliver Hellwig Dr Oliver Hellwig who produced Hindi OCRwho produced Hindi OCRआरम्भ की थी। यह काफी समय पहले की बात है। उसके बाद जब मैं पीएचडी कर रहा था और मुझे अपनी थीसीस लिखनी थी उसके लिए मुझे बहुत संस्कृत शोध करना था और संस्कृत लिखनी भी थी। इस काम में बहुत समय लग रहा था। अंतत: मुझे एक संस्कृत ओसीआर की आवश्यकता महसूस हुई। यही से इस ओसीआर की कहानी आरंभ होती है। सो आप कह सकते है कि इसका शुरुआत मेरे निजी कार्य हेतु हुई क्योंकि मुझे संस्कृत में अपनी थीसीस लिखनी थी।


आपने कहा कि आपने संस्कृत स्कूल में पढ़ी तो क्या जर्मन में स्कूलों में संस्कृत पढ़ाई जाती है?

नहीं, वहाँ संस्कृत नहीं पढ़ाई जाती। यह व्यक्तिगत प्रयास था।


आपको संस्कृत का अध्ययन करने की प्रेरणा किससे मिली? क्या आपकी अपनी रुचि थी या आपके माता-पिता ने आपको प्रेरित किया?

हाँ, यह मेरी अपनी रुचि थी। मैं हमेशा से भारत और भारतीय दर्शन में रुचि रखता था। मेरी रुचि स्कूल से ही आरम्भ हो गई थी।


आपका यह ओसीआर - क्या यह आपने स्वयं किया या यह एक टीम वर्क है? कैसे विकसित किया?

इसका विकास मैंने स्वयं आरंभ किया था किंतु बाद में समय-समय पर छोटे-मोटे कामों के लिए अन्य डिवेल्पर्स की सहायता भी ली किंतु अधिकतर मैंने स्वयं ही किया है।


जिस काम को भारत सरकार की बड़ी-बड़ी सरकारी व ग़ैर सरकारी संस्थाएँ नहीं कर पाई वह कार्य आपने अकेले कर दिखाया। निःसंदेह आप बधाई के पात्र हैं। क्या इसके लिए भारत से या विदेशों से अन्य संस्थाओं ने आपसे सम्पर्क किया?

यह ओसीआर विकसित करना एक काम था और इसका परिचय करवाना अन्य काम है। धीरे-धीरे भारतीय बाज़ार में इसको पहचान मिल रही है और हम अन्य संस्थाओं को भी इसकी जानकारी दे रहे हैं पर लगता है कि हमें अभी धैर्य रखना होगा। मैं पूर्णतया संतुष्ट हूँ।


क्या आप इसके दोनों संस्करणों (वर्सनस) सामान्य और व्यवसायिक (प्रोफेशनल) पर भी कुछ प्रकाश डालेंगे कि वे किस प्रकार भिन्न हैं और तुलनात्मक उनकी क्या विशेषताएं हैं?

प्रोफेशनल वर्सन में बैच प्रोसेसिंग की सुविधा है। आप एक साथ कई पृष्ठों के ओसीआर कर सकते है। सामान्य वर्सन में आपको एक-एक पृष्ठ को प्रोसेस करना होगा।

आपको इसका कैसा रिसपोंस मिला है?

यह काफी रुचिकर है। जैसा की आप जानते हैं कि हमने अभी बहुत मार्कटिंग नहीं की है लेकिन फिर भी हम रिसपोंस से प्रसन्न और संतुष्ट हैं।


क्या आप मोबाइल ऐप्स भी विकसित करने की सोच रहे हैं?

हाँ, यह काफी महत्वपूर्ण है। सबसे पहले हम एपीआई विकसित करना चाह रहे हैं ताकि कम्पनियां अपने वर्कफ्लो में इसे इंटिग्रेट कर सकें। इस वर्ष या अगले साल हम हिंदी ओसीआर मोबाइल ऐप्स विकसित करने पर विचार कर रहे हैं।


हिंदी ओसीआर के हिंदी शब्दकोश में कितने शब्द समाहित हैं?

यह बड़ा रोचक प्रश्न है। मेरे ख्याल से एक लाख या इससे अधिक शब्द शामिल हैं।


पहले आपने संस्कृत ओसीआर विकसित किया तत्पश्चात् देवनागरी! क्या ऐसा करना सरल था?

संस्कृत से हिंदी में परिवर्तित करना बहुत कठिन नहीं था। क्योंकि हिंदी और संस्कृत का आधारभूत समान था और विकसित करने में आने वाली बाधाएं भी समान थी। संस्क्रत से हिंदी में शब्द और नुक्ता परिवर्तित करने भी बहुत कठिन नहीं थे क्योंकि हम पहले संस्कृत ओसीआर विकसित कर चुके थे। जैसा कि आप जानते है - संस्कृत भारत की सबसे कठिन भाषाओं में से थी जिसमें लन्बे वर्ब, काम्पलीकेटिड कंपाउंड थे।


एक विदेशी होते हुए आपने एक ऐसा काम कर दिखाया जो भारतीय संस्थाएं भी नहीं कर पाई?

धन्यवाद!

#

डॉ. आलिवर हेलविग से आप उनकी ई-मेल (oliver.hellwig@indsenz.com) या वेबसाइट (http://www.indsenz.com/int/index.php) के माध्यम से सम्पर्क कर सकते हैं।
Interview with Dr Oliver Hellwig who produced Hindi OCR

#

'हिंदी सॉफ्टवेयर' से संबंधित अन्य रूचिकर सामग्री:

रविरतलामी का आलेख - हिंदी स्पीच टू टैक्स्ट प्रोग्राम श्रुतलेखन [साभार-छींटे और बौछारें]

Posted By रामेश्वर काम्बोज 'हिमांशु'   on Sunday, 06-Oct-2013-05:33
 
इसके लिए मैं कई लोगों से भारत में बात कर चुका था । यह विश्व का हिन्दी का सर्वोच्च कार्य कहा जाएगा।
 
 
Posted By कविता वाचक्नवी   on Thursday, 26-Sep-2013-22:47
 
महत्वपूर्ण व ऐतिहासिक जानकारियों वाला उल्लेखनीय साक्षात्कार. हेलविग के प्रयास और योगदान निस्संदेह मील का पत्थर है और अनूठे भी. उन्हें बधाई व शत-शत अभिनन्दन.
 
 
Posted By vashini   on Thursday, 26-Sep-2013-05:55
 
एक पठनीय और संग्रहणीय साक्षात्कार !
 
 
Previous Page  |   Next Page
 
 
Post Comment
 
 
 

सब्स्क्रिप्शन

इस अंक में

 

इस अंक की समग्र सामग्री पढ़ें

 

 

सम्पर्क करें