ভার্চুয়াল দুনিয়ায় বাংলার জয়

ভাষা—অভিব্যক্তি প্রকাশের অনন্য এই মাধ্যমটি প্রকৃতির মতোই বৈচিত্র্যময়। শুধু কি প্রাণী, ভাষা আছে যন্ত্রেরও। কম্পিউটার প্রযুক্তিতে যন্ত্ররাও আজ বুঝতে পারে মানব ভাষা। আবার জাতি হিসেবে আমাদের পরিচয়সূত্রও ভাষা। তাই বাংলা আর বাংলাদেশ পৃথিবীর বুকে একটি অভিন্ন স্বত্তার স্মারক। আর এই অর্জন ছিল আমাদের নিজ ভূখণ্ডে নিজেদের অধিকার প্রতিষ্ঠার। প্রযুক্তির যুগে সেই প্রাণের ভাষাকে বিশ্বময় ছড়িয়ে দিতে ‘ভাষা হোক উন্মুক্ত’ প্রত্যয়ে যে যুদ্ধের সূচনা হয়েছিল, এ বছর তা রূপ নিয়েছে বিশ্বজয়ের অভিযানে। নতুন এক মুক্তিযুদ্ধের সূচনা করেছে বর্তমান প্রজন্ম। ‘সীমানা ছাড়িয়ে বাংলা’ স্লোগানে এই অভিযানে গঠিত হয়েছে নতুন মুক্তিবাহিনী—গুগল ডেভেলপমেন্ট গ্রুপ বাংলা (জিডিজি বাংলা)। ১৯৭১ সালের মতো এই ২০১৫ সালেও এই অভিযানে নেতৃত্ব দিচ্ছে ছাত্র-সমাজ। স্বাধীনতা দিবসে ভার্চুয়াল দুনিয়ার রাজার রাজত্বেও বাংলা ভাষাকে সমৃদ্ধির মিশনে গড়েছে নতুন রেকর্ড। গুগল অনুবাদে লক্ষ্যের প্রায় দ্বিগুণ বাংলা শব্দ/বাক্যাংশ অন্তর্ভুক্ত করে গড়েছে। যুক্ত করেছে প্রায় সাত লাখ বাংলা অনুবাদ।

কেন এই অভিযান

ইন্টারনেট পৃথিবীর দূরত্ব ঘুচলেও আজও আমরা ভাষার দূরত্বে পিছিয়ে। মাতৃভাষার পর ইংরেজি ভাষা ছাড়া কয়টি ভাষা শেখা আছে আমাদের। তিনটির অধিক ভাষা জানেন এমন মানুষের সংখ্যা হাতে গোনা। অথচ পৃথিবীতে মোট ভাষার সংখ্যা ৭ হাজারের মতো। জাতিসংঘ প্রতিবেদন অনুযায়ী, এর মধ্যে জীবিত ভাষার সংখ্যা ৬৯১২টি। এর মধ্যে আবার বাংলা ভাষাভাষীদের সংখ্যা পৃথিবীর মধ্যে সপ্তম। অথচ ইন্টারনেট অব থিংসের এই যুগে ইন্টারনটে  আমাদের অবস্থান ৬৫তম! এটা কি ভাবা যায়! প্রযুক্তির এই জয়যাত্রাতেও কেন আমরা ভাষার দিক দিয়ে পিছিয়ে থাকব? কেনইবা ভাষাজ্ঞান-সীমাবদ্ধতা পিছিয়ে থাকব? এই বাংলা ভাষার কোনো বিষয় জানতে হলে কেন বেগ পেতে হবে ভিন-ভাষীদের? আগামীতে প্রতিটি ডিভাইস যখন ইন্টারনেটে যুক্ত হয়ে যাবে, তখন কী হারিয়ে যাবে রক্তের দামে কেনা আমাদের মাতৃভাষা বাংলা? না, সেটা কিছুতেই হতে পারে না; হওয়ার নয়ও।

জিডিজি বাংলা

অনলাইনে বাংলা ভাষার এমন পরিস্থিতি মাথায় রেখে অদম্য স্পৃহা নিয়ে চিরতরুণ নেটিজেনদের যারা এতদিন একাকিই গুগল অনুবাদে বাংলা শব্দ যুক্ত করে যাচ্ছিলেন, তারা যুথবদ্ধ হন। গত বছর ডিসেম্বরের তৃতীয় সপ্তাহে গড়ে উঠতে শুরু করে গুগলের ভাষাভিত্তিক প্রথম স্বেচ্ছাসেবী কমিউনিটি গুগল ডেভেলপার গ্রুপ বাংলা (জিডিজি বাংলা)। এর মাধ্যমে এই প্রথমবারের মতো ভাষার ওপর ভিত্তি করে কোসো জিডিজি গড়ে ওঠে। এর আগে জিডিজিগুলো গড়ে উঠত স্থানকে ভিত্তি করে। গত ফেব্রুয়ারিতে জিডিজি বাংলার কমিউনিটি ব্যবস্থাপক নির্বাচিত হন জাবেদ মোর্শেদ ও জাবেদ সুলতান পিয়াস। এর আগে জানুয়ারিতে এই স্বেচ্ছাসেবক দলের সঙ্গে যোগাযোগ করে গুগল। হ্যাং আউটে চলে সাক্ষাত্কার পর্ব। এসময় প্রাথমিক অভিজ্ঞতায় আবিষ্কৃত হয়, গুগলে বাংলায় মৌলিক ১ লাখ ৪০ হাজার শব্দ যুক্ত হলেও অনুবাদের অবস্থা একেবারেই নাজুক; কিছু কিছু ক্ষেত্রে হাস্যকর এবং সাংঘর্ষিকও। ঢাকা বিশ্ববিদ্যালয়ের ভাষাবিজ্ঞান বিভাগের তথ্য অনুযায়ী, দৈনন্দিন ব্যবহূত ১০ হাজার বাংলা শব্দ/শব্দাংশের ব্যবহূত হলেও ইন্টারনেটে যথেষ্ট পরিমাণ বাংলা কনটেন্ট না থাকায় গুগল অনুবাদে ভুল হচ্ছে। বাংলা বাক্যগঠন সঠিকভাবে বুঝতে পারছে না মেশিন ল্যাংগুয়েজটি। এমন পরিস্থিতি পাল্টাতে শুরু হয় গুগল অনুবাদে ইংরেজি শব্দ ও বাক্যের লাগসই বাংলা শব্দ/শব্দাংশ ও বাক্য/বাক্যাংশ অনুবাদের কাজ। ভাষার মাস ফেব্রুয়ারিকে ঘোষণা করা হয় ‘অনুবাদ মাস’ হিসেবে। মাস জুড়ে ২ লাখ ইংরেজির বাংলা-শব্দ সংযুক্তের লক্ষ্য নির্ধারণ করে। এই অভিযাত্রায় ১১ ফেব্রুয়ারি দেশের ১৫টি বিশ্ববিদ্যালয়ে ‘গুগল ট্রান্সলেশন আ-থন’ শুরু করে গুগল ডেভেলপার গ্রুপ বাংলা (জিডিজি বাংলা)। এই উদ্যোগ বাস্তাবায়নে সহযোগী হয় বাংলাদেশ ওপেন সোর্স নেটওয়ার্ক (বিডিওএসএন), ই-কমার্স প্রতিষ্ঠান এসো ডটকম এবং প্রযুক্তি বিষয়ক লাইফস্টাইল পাৈর্টাল হাই-ফাই পাবলিক ডটকম। বিশ্ববিদ্যালয় পর্যায়ে অনুষ্ঠিত হয় গুগল ট্রান্সলেশন বুট ক্যাম্প। এরমধ্যেই ৮ ফেব্রুয়ারি গুগল অনুবাদ প্রকল্পের সফটওয়্যার প্রকৌশলী আর্না মোসের, বিপণন বিভাগের কর্মকর্তা ক্যাটি স্যান্ডালার্স এবং বাংলাদেশে গুগলের কান্ট্রি ইঞ্জিনিয়ারিং কনসালট্যান্ট খান মুহাম্মদ আনোয়ারুস সালামসহ ৫ সদস্যের একটি প্রতিনিধি দল বাংলাদেশে এসে জিডিজি বাংলা স্বেচ্ছাসেবীদের সঙ্গে বৈঠক করেন। সিদ্ধান্ত হয়—আন্তর্জাতিক মাতৃভাষা দিবসে (২১-২২ ফেব্রুয়ারি) বিশ্বজুড়ে মাতৃভাষায় অবদান নিয়ে গুগল ভাষাপ্রেমীদের অংশগ্রহণে একটি বিশেষ উদ্যোগ নেবে; এতে সর্বোচ্চ অংশগ্রহণের ভিত্তিতে সম্মাননাও জানানো হবে স্বেচ্ছাসেবকদের। এই ঘোষণার পর ফেব্রুয়ারির ১৭ তারিখের মধ্যেই দুই লাখ শব্দ/শব্দাংশ ও বাক্যাংশ/বাক্য অন্তর্ভুক্ত করে লক্ষ্যভেদ করে বিশ্ববিদ্যালয়ের তরুণ ভাষাপ্রেমী নেটিজেনরা। মাত্র ৯ দিনে ড্যাফোডিল ইন্টারন্যাশনাল ইউনিভার্সিটির শিক্ষার্থীরা ৩ লাখ ৩৪ হাজার বাক্যাংশ যুক্ত করে জন্ম দেয় নতুন উদ্দীপনার। এভাবে ঢাকা বিশ্বিবিদ্যালয়, কুয়েট, কক্সবাজার বালিকা বিদ্যালয়সহ ১৫টি বিশ্ববিদ্যালয় থেকে চলতে থাকে গুগল অনুবাদে বাংলা শব্দভাণ্ডার সমৃদ্ধের আয়োজন। গুগলের ২১ ফেব্রুয়ারির আয়োজনে একদিনে সর্বোচ্চ ৬৩ হাজারের মতো বাংলা শব্দ/বাক্য যোগ করা হয়। মাত্র তিন হাজার শব্দের ব্যবধানে এই আয়োজনে প্রথম হয় স্প্যানিশ ভাষা। এরপর উদ্যোগ নেওয়া হয় ২৬ মার্চ স্বাধীনতা দিবসে গুগল অনুবাদে চার লাখ শব্দ/বাক্য সংযোগের। এ পর্যায়ে এই উদ্যোগে সামিল হয় বাংলাদেশ সরকারের তথ্য ও যোগাযোগ প্রযুক্তি বিভাগ এবং বাংলাদেশ কম্পিউটার কাউন্সিল।

বাংলা ভাষার মৌলিক শব্দ তো মাত্র ১ লাখ ৪০ হাজার, তবে কেন লাখ লাখ শব্দ যোগ করার আয়োজন? এমন প্রশ্নের জবাবে জিডিজি বাংলার কমিউনিটি ব্যবস্থাপক জাবেদ সুলতান পিয়াস বলেন, ‘প্রাথমিক উত্স হিসেবে ইন্টারনেটে বাংলা শব্দভান্ডার ঋদ্ধ নয়। এটা করতে মেশিনের পাশাপাশি মানুষেরও অংশগ্রহণে ইন্টারনেটে বাংলা ভাষার শব্দভাণ্ডার সমৃদ্ধ করাই ছিল প্রথম কাজ। এখানে সুবিধার জন্য শব্দ বলতে শব্দ, শব্দসমষ্টি, বাগধারা, বাক্যাংশ এবং সম্পূর্ণ ও অসম্পূর্ণ বাক্যকে বুঝানো হয়েছে। যেহেতু গুগল অনুবাদ পরিসাংখ্যিক নিয়মে কাজ করে, তাই একই শব্দ কয়েকজনকে অনুবাদ বা যাচাই করতে হয়। এ জন্য আমার এর সঙ্গে সকলের অংশগ্রহণ নিশ্চিত করার উদ্যোগ নিয়েছি। এখন ইন্টারনেট পর্যাপ্ত বাংলা শব্দভাণ্ডার যুক্ত হয়েছে। এই সংখ্যা ২০ লাখের মতো। অথচ এই উদ্যোগের আগে এখানে ছিল তিন লাখ এক হাজারের মতো বাংলা শব্দ।’

বাংলার গুগলজয়

একেবারে শুরুর দিকে গুগল অনুবাদে ১০ লাখ শব্দসম্ভার সংযুক্তির প্রত্যয় নিয়ে শুরু হয়েছিল জিডিজি বাংলার যাত্রা। কিন্তু দেশ ও দেশের বাইরের বাংলাদেশি ভাষাপ্রেমী স্বেচ্ছাসেবকদের অদম্য যাত্রায় ২৩ ফেব্রুয়ারিতে তা অতিক্রম করে। এদিকে একইসময়ে থাইল্যান্ড, মিয়ানমার ও ভিয়েতনামে ধারাবাহিকভাবে গুগলে নিজস্ব ভাষা (শব্দ) যোগ করার অনুষ্ঠান অনুষ্ঠিত হয়। গুগল এর নাম দেয় ‘লাভ ইওর ল্যাংগুয়েজ’ যার বাংলা অনুবাদ করা হয়েছে ‘আপনার ভাষা প্রেম’। আর ‘বাংলার জন্য চার লাখ’ স্লোগানে স্বাধীনতা দিবসে দেশ-বিদেশের ৮১টি স্থানে বসে গুগল অনুবাদে বাংলা ভাষা সমৃদ্ধির আয়োজনের মৌলিক পর্বে ৭ লাখেরও বেশি বাংলা শব্দ/বাক্য সংযোজন করে চার হাজারেরও বেশি স্বেচ্ছাসেবী। গত ৯ এপ্রিল গুগলের এশিয়া ও প্রশান্ত মহাসাগরীয় অঞ্চলের আনুষ্ঠানিক ব্লগে জানানো হয়, গত মার্চ মাসের বিভিন্ন সময় (বিশেষ করে ২১ ফেব্রুয়ারির পরে) গুগল অনুবাদে যে পরিমাণ বাংলা শব্দ যোগ করা হয়েছে, সে তুলনায় স্বাধীনতা দিবসের এই সংখ্যা কয়েকগুণ বেশি। আর ২৬ মার্চ দিনজুড়ে (২৪ ঘণ্টায়) গুগল অনুবাদে অন্যান্য সময়ের চেয়ে বেশি শব্দ যুক্ত হয়েছে, যা ছাড়িয়ে গেছে নিকট অতীতের সব রেকর্ড। ২৬ মার্চে গুগল অনুবাদে যোগ হওয়া বাংলা শব্দের পরিমাণকে গুগল বলছে ‘মেজর স্পাইক’। এই অবদানের ফলে গুগলে বাংলা অনুবাদের মান অন্তত দ্বিগুণ উন্নত হয়েছে।

এ বিষয়ে বাংলাদেশে গুগলের কান্ট্রি ইঞ্জিনিয়ারিং কনসালট্যান্ট খান মুহাম্মদ আনোয়ারুস সালাম বলেন, ‘যান্ত্রিক অনুবাদ খুবই জটিল একটি বিষয়। তবে মানুষের অংশগ্রহণের মধ্য দিয়েই এটি ধীরে ধীরে সমৃদ্ধ হয়। ফলে এই রেকর্ডসংখ্যক অবদানের কারণে গুগলের যান্ত্রিক অনুবাদ সেবা গুগল ট্রান্সলেটে বাংলা ভাষা সমৃদ্ধ হয়েছে, তা বলার অপেক্ষা রাখে না। এর ফলে পৃথিবীর ৯০টির বেশি ভাষার লেখা বাংলায় অনুবাদ করা সম্ভব হবে।’

সেই লক্ষ্যে এখন ঢাকা বিশ্ববিদ্যালয়ের ভাষা বিজ্ঞান বিভাগের চেয়ারম্যান হাকিম আরিফের সহযোগিতায় এখন গুগল অনুবাদে সংযুক্ত বাংলা শব্দ ও বাক্যের পরিশোধন পক্রিয়া চলছে। আর ১৪ এপ্রিল অর্থাত্ পহেলা বৈশাখ পর্যন্ত চলমান শব্দ/বাক্য সংযোজন অনুষ্ঠান শেষে নির্ধারিত হবে সর্বোচ্চ বাংলা শব্দ/বাক্য সংযোগকারী স্বেচ্ছসেবীর নাম। তবে ঘটা করে না হলেও এই প্রক্রিয়া অব্যহত রাখতে হবে। কেননা এতে নতুন নতুন শব্দ যোগ করলে তা আরও শক্তিশালী ও অর্থবহ হবে। ইংরেজি থেকে বাংলা বা বাংলা থেকে ইংরেজি-দুই ভাষাতেই অনুবাদ করে তা প্রয়োজন অনুসারে কাজে লাগানো যাবে। এটি সঠিকভাবে বাস্তবায়ন হলে লাভ হবে সবার। অনুবাদ ডিজিটাল পদ্ধতিতেই করা যাবে; বাঁচবে সময়, ঘুঁচে যাবে ভাষার দূরত্ব।