तामाङ भाषाको त्रैभाषिक यान्त्रिक अनुवाद सार्वजनिक

एआई प्रविधिमा आधारित त्रैभाषिक अनुवाद प्रणालीले तामाङ समुदायलाई इन्टरनेटको ज्ञान भण्डारमा पहुँच पुर्‍याउने विश्वास गरिएको छ ।

असार २, २०८३

सजना बराल

Trilingual machine translation of Tamang language made public

What you should know

काठमाडौँ — काठमाडौं विश्वविद्यालयले नेपाली, तामाङ र अंग्रेजी भाषामा आधारित त्रैभाषिक यान्त्रिक अनुवाद (मसिन ट्रान्सलेसन) प्रणाली विकास गरेको छ । गुगल एकेडेमिक रिसर्च अवार्डको सहयोगमा विश्वविद्यालयको सूचना तथा भाषा प्रशोधन अनुसन्धान प्रयोगशालाले यो प्रविधि तयार पारेको हो । 

यो प्रणालीले इन्टरनेटमा रहेको विवरणलाई तामाङ भाषामा अनुवाद गर्न सघाउने विश्वविद्यालयका प्राध्यापक एवं प्रयोगशलाका प्रमुख अनुसन्धानकर्ता बालकृष्ण बलले बताए । यसका लागि नेपाली, तामाङ र अंग्रेजी भाषाका एक लाखभन्दा बढी समानान्तर वाक्यहरू संकलन गरी प्रणाली तयार गरिएको उनले जानकारी दिए । 

अनुवाद प्रणालीमा हाल कृषि, स्वास्थ्य, शिक्षा, पर्यटन र आम सञ्चारका सामग्रीमा मोडललाई ट्रेनिङ गराइएको छ । क्रमश: कानुनी र अन्य डोमेनमा पनि गराउने प्रयोगशालाले जनाएको छ । यसले सरकारी सेवा र समुदायबीचको सञ्चारमा पनि सेतुको काम गर्ने विश्वाश लिइएको छ । 

Trilingual machine translation of Tamang language made public

परियोजनामा तामाङ राष्ट्रिय पुस्तकालय र त्रिभुवन विश्वविद्यालयको भाषा विज्ञान विभागले सहकार्य गरेका छन् । यसलाई प्रयोगशालामा मात्र सिमित नराखेर समुदायस्तरमा पुर्‍याउने र उपयोगी टुल बनाउने लक्ष्य लिइएको प्राध्यापक बलको भनाइ छ । हाल यो प्रणाली क्रोम र फायरफक्स ब्राउजरमार्फत चलाउन सकिन्छ । 

‘तामाङ भाषा बोल्ने १४ लाखभन्दा बढी जनसंख्या भए पनि इन्टरनेटमा उपलब्ध अधिकांश ज्ञान अंग्रेजी वा नेपालीमा मात्र सिमित छ,’ प्राध्यापक बलले भने, ‘तामाङ समुदायलाई त्यो ज्ञानको भण्डारसम्म पहुँच पुऱ्याउन र उनीहरूको मौलिक संस्कृति तथा परम्परालाई अन्य भाषामा फैलाउन यो प्रणालीले सहयोग गर्नेछ ।’

यो प्रणाली निर्माणमा आधुनिक आर्टिफिसियल इन्टेलिजेन्स प्रविधिको प्रयोग गरिएको छ । यसका लागि मेटा एआईको ‘एनएलएलबी-२००’ मोडललाई नेपाली र तामाङ डेटामा तालिम दिइएको छ । तामाङ भाषालाई निकट भविष्यमै गुगल ट्रान्सलेटमा समेत समावेश गराउने पहल भइरहेको प्राध्यापक बलले जानकारी दिए । ब्राउजर एक्स्टेन्सनमार्फत इन्टरनेटका वेबसाइटलाई तामाङ भाषामा पढ्न सकिने सुविधा यसमा छ ।

तामाङ भाषा एवं साहित्य विज्ञ अमृत योञ्जनले तामाङ भाषा डिजिटाइज हुनु नेपाली मातृभाषाहरूका लागि खुसीको कुरा भएको उल्लेख गरे । ‘सर्वसाधारणले अब कानुनी मिसिलजस्ता जटिल सामग्री पनि आफ्नै भाषामा अनुवाद गरेर बुझ्न सक्छन्,’ उनले भने, ‘यस परियोजनाका लागि हाम्रा प्राविधिक र तामाङ भाषा पुस्तकालयको टोलीले ११ महिनासम्म निरन्तर सक्रिय रहेर काम गरेका थियौँ ।’ 

काठमाडौं विश्वविद्यायका प्राध्यापक मनिष भट्टराईले यो परियोजना अनुवाद प्रणालीको विकासमा मात्रै सिमित नरहेर यसले सम्पूर्ण समुदाय र देशलाई नै सकारात्मक सन्देश दिएको धारणा राखे ।

‘हामी अक्सर विदेशी विश्वविद्यालयसँग सहकार्य गर्न पाउँदा गर्व गर्छौँ तर नेपालभित्रकै विश्वविद्यालयहरूबीच सहकार्य गरेर पनि देश र समुदायका लागि यति ठूलो योगदान गर्न सकिन्छ भन्ने कुरा यसले देखाएको छ,’ उनले भने, ‘रिसर्चमा समुदायको भूमिका कति महत्त्वपूर्ण हुन्छ भन्ने पनि यसबाट बुझ्न सकिन्छ ।’ 

सजना बराल कान्तिपुरमा कार्यरत पत्रकार हुन् । उनी सञ्चार,सूचना प्रविधि बिटमा कलम चलाउँछिन् ।

Link copied successfully