বহুভাষী ওয়েব এবং উন্মুক্ত অনুবাদ

রেজওয়ান এর ছবি
লিখেছেন রেজওয়ান (তারিখ: রবি, ০৫/০৭/২০০৯ - ৬:৩০পূর্বাহ্ন)
ক্যাটেগরি:

এমন এক সময় ছিল যখন তথ্য শুধু লাইব্রেরী, বা সরকারী তথ্যাগারে থাকত। মানুষের কাছে তা সহজলভ্য হতো বই বা সংবাদপত্রের মাধ্যমে। কিন্তু ইন্টারনেটের প্রথম বিপ্লব এই বাধাকে ঘুঁচিয়ে দিল। বিভিন্ন স্ট্যাটিক ওয়েব পেইজের মাধ্যমে এবং অনলাইন সংবাদপত্রের মাধ্যমে তথ্যের অবাধ প্রবাহ চলতে লাগল।

এরপর আসল ইন্টারনেটের দ্বিতীয় জাগরণ। এটি ভেঙ্গে দিল কারা তথ্য সৃষ্টি করবে তার মনোপলি। লক্ষ কোটি মানুষ ডিসকাশন ফোরাম, ব্লগ, ছবি, ভিডিও ইত্যাদির মাধ্যমে তথ্যের সৃষ্টি ও আদান প্রদান করতে লাগল বিশ্বব্যাপী পাঠক-শ্রোতাদের জন্যে।

কিন্তু তথ্যের মনোপলি কি ভেঙ্গেছে? তথ্য আগেও উৎকৃষ্ট পণ্য ছিল, এখনও আছে। যেই তথ্যের চাহিদা বেশী, যোগান কম, তার মূল্য তত বেশী। বর্তমানে তথ্যের চাহিদা একই আছে (মানুষের তথ্য গ্রহণ করার ক্ষমতা অপরিবর্তিত আছে)। কিন্তু এখন তথ্যের যোগান অনেক। কিবোর্ড টিপলেই ডজনখানেক বাংলা পত্রিকা পড়া যায় আর ইংরেজীতো অগুণতি। তথ্যের এই বিস্ফোরণকে কেভিন কেলী বলেছেন দ্যা এক্সপানশন অফ ইগনোরেন্স। তিনি যুক্তি দেখাচ্ছেন যে যত বেশি তথ্য সহজলভ্য হচ্ছে তত আমাদের প্রশ্ন বেড়ে যাচ্ছে এবং উত্তরের চাহিদা বেড়ে যাচ্ছে। আমাদের উত্তরের যোগানের বিপরীতে প্রশ্নের হার বেড়ে যাওয়ায় আমাদের অজ্ঞানতা বাড়ছে। এটাকেই তিনি বলছেন দ্যা এক্সপানশন অফ ইগনোরেন্স।

তথ্যের প্রবাহ বাড়ার সাথে সাথে অপ্রক্রিয়াজাত তথ্যের মূল্য কমে যায় এবং মূল্য থাকে সেই সব তথ্যের যা আমাদের কাছে সংকলিত, অনুবাদিত, সহজবোধ্য; আমাদের বোধগম্য অবস্থায় যা পাওয়া যায়।

আপনি চিন্তা করুন দশ বছর আগের ইন্টারনেটের কথা। তখন বাংলা ইউনিকোড ছিল না। বাংলা ভাষায় কটি ডকুমেন্ট পাওয়া যেত? আজকে বাংলা উইকিপিডিয়ায় ২০০০০ এরও বেশী এন্ট্রি আছে। বাংলা ব্লগগুলোতে হাজার হাজার পোস্ট (যদিও যথার্থতা, মান নিয়ে প্রশ্ন আছে অনেকগুলোর)। কয়েক বছর আগের এক পরিসংখ্যান অনুযায়ী পাঁচ কোটি ব্লগের ৩৯% ইংরেজী ভাষায় ছিল। এর পরে ছিল জাপানী (৩৩%), চৈনিক (১৪%), স্প্যানিশ (৩%), ইটালিয়ান (৩%), রাশিয়ান (২%), ফ্রেন্চ (২%), পর্তুগীজ (১%), জার্মান (১%) ইত্যাদি। বর্তমানে এই পরিসংখ্যান নিশ্চয়ই অনেক বদলেছে, ইংরেজী ভাষার আধিপত্য কমে অন্যান্য ভাষার জাগরণ লক্ষ্য করা যাচ্ছে। কারন সবাই তার নিজের ভাষায় কথা বলতেই স্বাচ্ছন্দ বোধ করে।

তবে ইথান জুকারম্যান বলছেন যে আজকের ইন্টারনেট পরিমন্ডলে ভাষাগত বিচ্ছিন্নতার ভয় রয়েছে। আগের ইংরেজী ভাষার আধিপত্যের সময় পাঠকরা ভাষার বাধা ডিঙ্গিয়ে এক ভাষায় কথোপকথনের চেষ্টা চালাতো। বর্তমানে নিজের ভাষায় কথোপকথনের সুবিধার কারনে ইন্টারনেটে দেখা যাচ্ছে যে বিভিন্ন ভাষা ভাষাভাষীদের কমিউনিটিরা নিজেদের মধ্যে তথ্য আদানপ্রদানেই ব্যস্ত বেশী এবং অন্যান্য ভাষার কমিউনিটির সাথে যোগাযোগে আগ্রহী নয়। বা আগ্রহী নয় অন্যান্য ভাষায় পাওয়া যাওয়া বিষয়গুলো সম্পর্কে জানতে।

বিশ্বের অনেক কিছুই আমরা ভাষা জানি না বলে অন্যের দৃষ্টিতে দেখি। গাব্রিয়েল গার্সিয়া মার্কেজ এর বই বাংলায় অনুদিত হচ্ছে কি না বলে হা পিত্যেশ করে বসে থাকি, যাও হয়ত অনুবাদ করা হবে ইংরেজী অনুবাদ থেকে।

ভাষার বাধা তথ্য প্রবাহে মস্ত বড় বাধা। আমরা বিশ্বের বিভিন্ন ভাষায় পাওয়া যাওয়া ইন্টারনেট কন্টেন্টের কত অংশ বুঝতে পারি? এমন তথ্য নিশ্চয়ই আছে যা আমি জানতে চাই কিন্তু ফার্সী ভাষায় আছে বলে জানতে পাচ্ছি না। কিন্তু এই বাধা দুর করার উপায় কি?

বর্তমানে বেশ কিছু ভাষার জন্যে মেশিন ট্রান্সলেশন সুবিধা পাওয়া যাচ্ছে। গুগল ৪২টি ভাষা সাপোর্ট করে, কিন্তু তার মধ্যে বাংলা নেই। আর মেশিন অনুবাদের মানও আশানুরুপ নয়। মেশিন ট্রান্সলেশন নিয়ে কাজ করছে এমন এক প্রযুক্তিবিদের সাথে আলাপ করে জানলাম যে আগামী দশ বছরেও পার্ফেক্ট অনুবাদ প্রযুক্তি আবিষ্কারের সম্ভাবনা কম। কারন অনুবাদের সাথে স্টাইল, প্রাসঙ্গিকতা, সাংস্কৃতিক পটভূমি ইত্যাদি জড়িত এবং এটি শিল্প বলেই একে লজিকের দ্বারা সম্পূর্ণ বাধা যায় না। মেশিন অনুবাদের দ্বারা খুঁটিনাটি ও খাপছাড়া কাজ চলবে কিন্তু রিসার্চ বা প্রচলিত অনুবাদের জন্যে মানুষ কর্তৃক অনুবাদের বিকল্প নেই।

সারা বিশ্বের লক্ষ কোটি মানুষ একের অধিক ভাষা জানে। যে বাংলা এবং হিন্দি জানে, সে সহজেই হিন্দি থেকে বাংলা ভাষায় অনুবাদ করতে পারে (যা মেশিন অনুবাদের মাধ্যমে সম্ভব নয়, এখনো)। অনেকেরই সময় আছে তা করার জন্যে। ওপেন সোর্সের মত ওপেন ট্রান্সলেশন ও একটি আন্দোলন যার মাধ্যমে ইতিমধ্যে বেশ অনেকগুলো সফল কাজ হয়েছে বিশ্বের অনেক ভাষায়ই। বাংলার ক্ষেত্রে কলাবরেটিভ ট্রান্সলেশন এবং লোকালাইজেশন এর উদাহরণস্বরুপ বাংলা উইকিপিডিয়া, গ্লোবাল ভয়েসেস বাংলা সংস্করণ, ওয়ার্ডপ্রেস বাংলা লোকাইলেজেশন প্রকল্প মেঘদুত ইত্যাদি উল্লেখযোগ্য।

একটি বাংলা মেশিন ট্রান্সলেশন প্রকল্প - অনুবাদক কাজ করছে সেটিও ক্রাউডসোর্সিং (স্বেচ্ছাসেবীদের ইনপুট) এর মাধ্যমে এগিয়ে চলছে।

ইন্টারনেটকে আমাদের নিজস্ব ভাষায় সহজবোধ্য করার জন্যে দরকার বিভিন্ন টুল এবং আগ্রহী স্বেচ্ছাসেবী। যে যেই দ্বিতীয় ভাষা জানেন সেই ভাষার কন্টেন্ট যদি বাংলায় অনুবাদ করেন ও ইন্টারনেটে প্রকাশ করেন তাহলে বাংলা ভাষা ইন্টারনেটে প্রাণ পাবে। বেশী পরিমান লোক অনায়াসে তথ্য পাবে যা এখনও সহজলভ্য নয়।

ইথান জুকারম্যানের কথা দিয়েই শেষ করি:

"For the internet to reach its potential in bridging human differences, we need to make the problems of language and translation center to our conversations about the future of the internet."

অনুবাদের ভারটুকু আপনাদের উপরই ছেড়ে দিলাম।

বি: দ্র: গত মাসে আমস্টারডামে ওপেন ট্রান্সলেশন টুলস কনফারেন্সে অংশ নেয়ার পর তা নিয়ে লিখব লিখব করছিলাম। কিন্তু সুযোগ হয়ে উঠছিল না। এটি তার পটভূমি মাত্র। পরবর্তীতে বিস্তারিত আলোচনা করব।

(ছবির সূত্র)


মন্তব্য

তুলিরেখা এর ছবি

চমৎকার লেখা।
উদ্‌গ্রীব হয়ে বিস্তারিতের অপেক্ষায় রইলাম।
-----------------------------------------------
কোন দূর নক্ষত্রের চোখের বিস্ময়
তাহার মানুষ-চোখে ছবি দেখে
একা জেগে রয় -

-----------------------------------------------
কোনো এক নক্ষত্রের চোখের বিস্ময়
তাহার মানুষ-চোখে ছবি দেখে
একা জেগে রয় -

রাগিব এর ছবি

এই প্রসঙ্গে আমাদের বাংলা উইকিপিডিয়ার "হাতের পাঁচ" প্রকল্পের কথা বলি। প্রতিদিন আমরা ৫টা ভুক্তি তালিকায় রাখছি। পাশে ইংরেজি উইকির সংশ্লিষ্ট ভুক্তির লিংক থাকছে। কাজটা হলো একটু কষ্ট করে ইংরেজি উইকির ঐ পাতা থেকে ৩ টা অন্তত প্যারাগ্রাফ অনুবাদ করে দেয়া। সময় লাগবে বড়জোর ৫ মিনিট।

গত ৩ সপ্তাহে আমরা প্রায় ১১০টি ভুক্তি এভাবে পেয়েছি।

----------------
গণক মিস্তিরি
ভুট্টা ক্ষেত, আম্রিকা
ওয়েবসাইট | কুহুকুহু

----------------
গণক মিস্তিরি
জাদুনগর, আম্রিকা
ওয়েবসাইট | শিক্ষক.কম | যন্ত্রগণক.কম

রেজওয়ান এর ছবি

এই সম্মিলনে আপনার থাকাটা জরুরী ছিল বলে আমি মনে করি। তাদের ফিডব্যাক ফর্মে তাই লিখেছি। কারনটি আমার পরবর্তী লেখায় আসবে।

পৃথিবী কথা বলছে আপনি কি শুনছেন?

রাগিব এর ছবি

(সচলের "বাগে" কমেন্ট খেয়ে গেলো, তাই যতদূর পারি আবার লিখছি)।

এই ৫টা মিনিট দিয়ে হাতের পাঁচের একটা ভুক্তি তৈরী করে দিলে কী উপকার উদাহরণ দেই। অনেক অনেক বিষয়ের উপরে বাংলাতে একেবারেই তথ্য নেই। যেমন, বেলন কী, তা আমরা সবাই জানলেও ইন্টারনেটে "বেলন" শব্দটি খুঁজলে কিছুই পাবেন না। আমাদের এখনকার তালিকায় বেলন আছে, তাই ইংরেজি উইকির Rolling pin ভুক্তি দেখে ৩টা প্যারা অন্তত লেখা অনুবাদ করে দিন, কাল থেকে ইন্টারনেটে খুঁজলেই উইকি থেকে জানতে পারবেন বেলন কাকে বলে, কত প্রকার ও কী কী।
----------------
গণক মিস্তিরি
ভুট্টা ক্ষেত, আম্রিকা
ওয়েবসাইট | কুহুকুহু

----------------
গণক মিস্তিরি
জাদুনগর, আম্রিকা
ওয়েবসাইট | শিক্ষক.কম | যন্ত্রগণক.কম

পান্থ রহমান রেজা এর ছবি

অতি উত্তম প্রস্তাব। সবাই যদি নিজেদের ক্ষুদ্র সামর্থ্য নিয়ে এগিয়ে আসেন, তাহলে কাজটা অনেকদূর এগিয়ে যাবে।

এস এম মাহবুব মুর্শেদ এর ছবি

দারুন উদ্যোগ!!! পরের পর্বের অপেক্ষায় থাকলাম।

====
চিত্ত থাকুক সমুন্নত, উচ্চ থাকুক শির

প্রকৃতিপ্রেমিক এর ছবি

ভালো তো!

মূলত পাঠক এর ছবি

মাতৃভাষার প্রসারে যে কোনো উদ্যোগই স্বাগত। আরো জানান আপনার অভিজ্ঞতা।

ছায়ামূর্তি [অতিথি] এর ছবি

চমৎকার উদ্যোগ। চলুক

রণদীপম বসু এর ছবি

চমৎকার একটা বিষয় নিয়ে লিখলেন রেজওয়ান ভাই, অক্ষম বলেই যার প্রয়োজনীয়তা আমি নিজে টের পাই খুব। এক্ষেত্রে আমরা যাঁরা ব্লগিং করি তাঁদের মধ্যে মোটা দাগে দু'ধরনের ব্লগার রয়েছেন- সৃজনশীল ও মননশীল। এছাড়াও উভয় ক্ষমতার যৌথ অধিকারীও আছেন অনেকে। এদের মধ্যে ইংরেজি বা অন্য কোন ভাষায় দক্ষ কত শতাংশ রয়েছেন তা আমার জানার বাইরে।
এই সক্ষমদের মধ্যে যাঁরা সৃজনশীল কাজ নিয়ে ব্যস্ত, তাঁরা এই ভাষান্তর কর্মে কতটুকু সময় দিতে পারবেন জানিনা। তবে চাইলে পারেন। কিন্তু সক্ষম যাঁরা মননশীলতার চর্চা করেন তাঁরা হয়তো চাইলে আমাদের এই ঘাটতিটাতে বিন্দু বিন্দু করে জমা করার কাজটা একটু বেশিভাবে করে আমাদেরকে কৃতজ্ঞ করতে পারেন।

যাঁদের এই ক্ষমতা আছে তাঁদের কাছে আমাদের শ্রদ্ধাসহ আর্জি থাকলো আমরা নিশ্চয় আপনাদের কাছে আমাদের অক্ষমতার কারণেই চাইতেই পারি। আপনাদের সক্ষম মেধার এই ত্যাগে শ্রমে স্বার্থপরের মতো আমরাই না হয় সমৃদ্ধ হলাম। আমাদের ভাষা সমৃদ্ধ হলো। আমি অকৃতজ্ঞ হলেও এই ভাষা-ভাষীর সবাই তো নিশ্চযই অকৃতজ্ঞ হবেন না। তাঁরা আপনাদের এই অবদান শ্রদ্ধাচিত্তে স্মরণ করবেন।

-------------------------------------------
‘চিন্তারাজিকে লুকিয়ে রাখার মধ্যে কোন মাহাত্ম্য নেই।’

-------------------------------------------
‘চিন্তারাজিকে লুকিয়ে রাখার মধ্যে কোন মাহাত্ম্য নেই।’

হিমু এর ছবি

ইন্টারনেটে বাংলায় তথ্যের এক অন্যতম আধার হতে পারতো বাংলা দৈনিকগুলি। কোন এক রহস্যময় কারণে দেশের প্রথম সারির কয়েকটি পত্রিকার অনলাইন সংস্করণ এখনও ইউনিকোডিত হয়নি। সম্প্রতি একটি দৈনিক নিজেদের ওয়েবসাইটে চমৎকার কিছু পরিবর্তন এনেছে, ইউনিকোডেও এসেছে, কিন্তু গুগল ক্রলারের প্রবেশ সম্ভবত রুদ্ধ করে রেখেছে, ফলে তাদের কোন আর্টিকেলের শিরোনাম লিখে সার্চ করলেও কিছু পাওয়া যায় না। কেউ সার্চ করে তাদের খবর বিনা কষ্টে পেয়ে যাচ্ছে, এই ব্যাপারটিই বোধহয় তারা মেনে নিতে পারছে না।

অন্যদিকে মাসিক মদিনা কিন্তু ইউনিকোডিত, গুগল সার্চ দিলেও তার খোঁজ আসে হাসি

এ কারণেই প্রথমে উল্লেখ করা দৈনিকগুলিতে যখন তথ্যপ্রযুক্তি নিয়ে নানা বড় বড় বোলচাল পড়ি, হাসি পায়।



হাঁটুপানির জলদস্যু আলো দিয়ে লিখি

আনোয়ার সাদাত শিমুল এর ছবি

নতুন মন্তব্য করুন

এই ঘরটির বিষয়বস্তু গোপন রাখা হবে এবং জনসমক্ষে প্রকাশ করা হবে না।