সিআরবিএলপি প্রকাশ করেছে বাংলা TTF সঙ্কেতায়ন নথি থেকে ইউনিকোড রূপান্তরক

সিআরবিএলপি গত ১৪ মে ২০০৭ ইং তারিখে সিআরবিএলপি কনর্ভাটার প্রকাশ করেছে।

 

“সিআরবিএলপি/CRBLP”গত ১৪ মে ২০০৭ ইং তারিখে “সিআরবিএলপি কনর্ভাটার” প্রকাশ করেছে। “সিআরবিএলপি কনর্ভাটার” হলো বাংলা TTF সঙ্কেতায়ন নথি থেকে ইউনিকোডে পরিবর্তনের জন্য একটি সফট‌ওয়্যার প্যাকেজ বিশেষ। ASCII সঙ্কেতায়ন ফন্ট দিয়ে লেখা হাজার হাজার বাংলা নথি আছে যেগুলো একটির সাথে আরেকটির সঙ্কেতায়নে কোন মিল নেই। এমনকি অনেক ফন্ট রয়েছে যেগুলোর সঙ্কেত বিভিন্ন সংস্করণে পরিবর্তন করা হয়েছে কিন্তু সংস্করণ সংখ্যা পরিবর্তন করা হয়নি। এই সফটওয়্যারটি এমনভাবে নকশা করা হয়েছে যাতে করে এটি বিভিন্ন ফরম্যাটের ফাইল যেমন HTML, Microsoft Word এর ASCII সঙ্কেতায়িত লেখাগুলোকে স্বয়ংক্রিয়ভাবে ইউনিকোডে পরিবর্তন করতে পারে। এই রূপান্তরকটি বর্তমানে যে ফন্টগুলো রূপান্তর করতে পারে, সেগুলো হলো- SutonnyMJ, Bangsee Alpona, Prothoma এবং Alo । SutonnyMJ ফন্টটি বিভিন্ন সংস্করণে বিভিন্ন সংকেত ব্যবহার করেছে, যে কারণে SutonnyMJ এর কোন ফন্টটি ফাইলে ব্যবহার করেছে তা ব্যবহারকারীকে বলে দিতে হবে। এই সফটওয়্যারটি বিনামূল্যে বিতরণযোগ্য এবং উম্মুক্ত সঙ্কেত ভিত্তিক, যে কেউ ইচ্ছা করলে GNU Public License (GPL) version 2 এর আওতায় ব্যবহার করতে পারবেন। সফটওয়্যারটি উম্মুক্ত সঙ্কেত ভিত্তিক হওয়ায় যেকোন কর্মকুশলী (প্রোগ্রামার) এটি আরও সুযোগ সুবিধা দিয়ে উন্নত করতে পারবেন। ইহার আদ্য পৃষ্টা

(HomePage: http://sourceforge.net/project/showfiles.php?

group_id=158301&package_id=231644&release_id=508166 ) sourceforge রয়েছে।

বৈশিষ্টঃ

ভাষা সমর্থনঃ এটি বাংলা এবং ইংরেজি ইন্টারফেস সমর্থন করে।

হস্তলিপি এবং ফন্ট সমর্থনঃ ASCII/ANSI/Unicode হস্তলিপি থেকে ইউনিকোড ৫.০ সংষ্করণে রূপান্তর করতে পারে।

যে ফন্টগুলোর লেখা রূপান্তর করতে পারে তা হলোঃ
বিজয় ২০০০ SuttonyMJ ফন্ট থেকে ইউনিকোড।
Bangsee Alpona থেকে ইউনিকোড।
Prothoma (প্রথম আলো ফন্ট) থেকে ইউনিকোড।
Alo (প্রথম আলো ফন্ট) থেকে ইউনিকোড।
নথি (Document) সমর্থনঃ
Plain text ফাইল (*.txt) রূপান্তর।
Microsoft Word Document ফাইল (*.doc) রূপান্তর। তবে এটি ফাইলের পরিপূর্ণ সঙ্কেতায়ন সমর্থন পেতে হলে office XP, 2003 বা 2007 ব্যবহার করতে হবে। উল্লেখ্য এটি (*.txt) ফাইলে রূপান্তর হবে।
Html ফাইল (*.html) রূপান্তর। তবে যে ফাইলগুলোতে শুধু বাংলা লেখা রয়েছে সেগুলো রূপান্তর করতে পারবে।. “সিআরবিএলপি কনর্ভাটার” সর্ম্পকে আরও জানতে চাইলে আপনার এর আদ্যপৃষ্টা দেখতে পারেন।
উল্লেখ্য ২০০৩ সাল থেকে ডঃ মুমিত খানের তত্ত্বাবধানে CRBLP (Center for Reacherch on Bangla Language Processing) বাংলা ভাষার উপর কাজ করে চলছে। ইতি পূর্বে OCR, Spell checker, Bangla Pad সহ বিভিন্ন প্রয়োগন (Application) এই গবেষণা কেন্দ্রটি প্রকাশ করেছে। বর্তমানে OCR, Text to Speech, Speech Recognition সহ বিভিন্ন প্রয়োগনের উপর কাজ হচ্ছে।

CRBLP সর্ম্পকে জানতে চাইলে এর আদ্যপৃষ্টা [ http://www.bracu.ac.bd/research/crblp/index.php ] দেখতে পারেন।

ফেসবুক কমেন্ট


2 Comments

  1. এমন একটি কাজের জন্য সাধুবাদ জানাই সিআরবিএলপি কে । আশা করা যায় এখন থেকে বাংলা নিয়ে আর তেমন কোন জটিলতা তৈরী হবে না।

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।

You may use

আপনি চাইলে এই এইচটিএমএল ট্যাগগুলোও ব্যবহার করতে পারেন: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*