Source : BBC NEWS
ছবির উৎস, AFP
ইরানের সাবেক সর্বোচ্চ নেতা আয়াতুল্লাহ আলী খামেনির শাসনামলে ইরান সরকারের আচরণ বুঝতে হলে, তার বিভিন্ন সময়ের বক্তব্য ও চিন্তাধারা বিস্তারিতভাবে জানা প্রয়োজন।
“দ্য কোড ল্যাঙ্গুয়েজ অব আলী খামেনি” নামক ডকুমেন্টারিতে ইরানের এই দ্বিতীয় সর্বোচ্চ নেতার প্রায় ৫৫ লাখ শব্দের বক্তব্য বিশ্লেষণ করে তার সেই চিন্তাধারা ফুটিয়ে তোলার চেষ্টা করা হয়েছে।
এই সামগ্রিক বিশ্লেষণ থেকে তার শাসন ব্যবস্থার ভেতরের এমন কিছু গোপন দিক বেরিয়ে এসেছে, যা কেবল তার দুই-একটি বিচ্ছিন্ন বক্তব্য দেখে বোঝা সম্ভব নয়।
আয়াতুল্লাহ আলী খামেনির চিন্তাধারা বিশ্লেষণের জন্য প্রথমে ৩২ বছর ধরে তার দেওয়া বক্তব্য থেকে ১৫০টি গুরুত্বপূর্ণ এবং বারবার ব্যবহৃত হয়েছে, এমন মূল শব্দ বা কীওয়ার্ড বেছে নেওয়া হয়।
এরপর সময়ের সাথে সাথে এই শব্দগুলোর ব্যবহার কতটা বেড়েছে বা কমেছে, তা হিসাব করা হয়।
এই ডকুমেন্টারির প্রায় এক ঘণ্টার মধ্যে যতটুকু সম্ভব সেই হিসাবের ফলাফলগুলোই তুলে ধরা হয়েছে।
পরিবর্তনগুলো দেখানোর জন্য আয়াতুল্লাহ খামেনির ৩২ বছরের বক্তব্যের প্রতি বছরের মূল শব্দগুলোর বা কীওয়ার্ডের অবস্থান তুলনা করা যেত।
কিন্তু একটি অনুষ্ঠানের মধ্যে এই ৩২ ধাপের বড় হিসাব তুলে ধরা সম্ভব ছিল না।
এই কারণে এই ডকুমেন্টারিতে এক বছরের শাসনকালের পরিবর্তে আট বছরের প্রেসিডেন্সিয়াল শাসনামলগুলোকে তুলনা করা হয়েছে।
ছবির উৎস, Getty Images
বিশেষ করে, আলী খামেনির সময়ের দুই মেয়াদের চারজন প্রেসিডেন্টের আমলকে এখানে তুলনা করা হয়েছে।
তারা হলেন আকবর হাশেমি রাফসানজানি, মোহাম্মদ খাতামি, মাহমুদ আহমাদিনেজাদ এবং হাসান রুহানি।
যেহেতু ইব্রাহিম রাইসি এবং মাসুদ পেজেশকিয়ানের মেয়াদ এখনো শেষ হয়নি, তাই এই দুই প্রেসিডেন্টের সময়ে ইরানের দ্বিতীয় সর্বোচ্চ নেতার দেওয়া বক্তব্যগুলো এই হিসাবে অন্তর্ভুক্ত করা হয়নি।
কারণ আগের প্রেসিডেন্টের আট বছরের মেয়াদের সাথে তাদের এই ৩৩ মাস ও ১৯ মাসের সংক্ষিপ্ত সময়কালকে তুলনা করলে ভুল ফলাফল আসার সম্ভাবনা থাকত।
আলী খামেনির বক্তব্য থেকে সবচেয়ে গুরুত্বপূর্ণ ও “অর্থবহ” শব্দ হিসেবে বেছে নেওয়া হয়েছে গত ৩২ বছরে বিবর্তিত হওয়া ১৫০টি মূল শব্দ বা কীওয়ার্ড।
এই গবেষণায় অব্যয়, ক্রিয়া, সর্বনাম, ক্রিয়াবিশেষণ অথবা বেশিরভাগ বিশেষণ, যেমন: ‘রা’, ‘ইস্ট’, ‘মান’, ‘খিল’ এবং ‘বাদ’ ইত্যাদি বাদ দেওয়া হয়েছে।
এছাড়া সাধারণ কথ্য ভাষায় ব্যবহৃত এবং নির্দিষ্ট কোনো রাজনৈতিক অর্থ বহন করে না, এমন শব্দ যেমন: ‘সাহায্য’, ‘জনগণ’, ‘কথা’ এবং ‘আন্দোলন’ ইত্যাদিও বাদ দেওয়া হয়েছে।
একইসঙ্গে, নির্বাচিত মূল শব্দগুলোর তুলনা করা হয়েছে আট বছরের মেয়াদগুলোতে শব্দগুলোর ‘র্যাঙ্ক’ বা অবস্থানের ক্রমের ওপর ভিত্তি করে, সেগুলোর ‘পুনরাবৃত্তির সংখ্যার’ ওপর নয়।
শব্দের পুনরাবৃত্তির হারের পরিবর্তে শব্দের অবস্থানের ক্রমের ওপর নির্ভর করার কারণ হলো, এই চার মেয়াদে প্রাপ্ত শব্দের সংখ্যা ভিন্ন ছিল।
উদাহরণস্বরূপ, আকবর হাশেমি রাফসানজানির আমলে ইরানের সর্বোচ্চ নেতা আলী খামেনির দেওয়া বক্তব্যে শব্দের মোট সংখ্যা ছিল প্রায় ১৬ লাখ এবং হাসান রুহানির আমলে সেটি ছিল প্রায় ১২ লাখ।
এর ফলে, একটি শব্দ যদি উভয় আমলেই এক হাজার বার ব্যবহার হয়ে থাকে তাহলে তার মানে এই নয় যে, দুটি আমলেই শব্দটির “গুরুত্ব বা ওজন” সমান ছিল।
কারণ দুই মেয়াদের মোট শব্দের অনুপাতে ওই শব্দটির অনুপাত আলাদা ছিল।
এখানে উল্লেখ করা প্রয়োজন, এই ডকুমেন্টারির জন্য বিশ্লেষণ করা ১৫০টি শব্দের বেশিরভাগই সিঙ্গেল ওয়ার্ড বা একক শব্দ।
তবে আলী খামেনির চিন্তাধারায় বিশেষ গুরুত্ব থাকার কারণে কিছু কম্পাউন্ড ওয়ার্ড বা যৌগিক শব্দও, যেমন: “ইসলামিক রিপাবলিক বা প্রজাতন্ত্র” অথবা “আধিপত্যবাদী ব্যবস্থা” এই বিশ্লেষণে অন্তর্ভুক্ত করা হয়েছে।
ছবির উৎস, Getty Images
ফলাফল পৃথকীকরণ প্রক্রিয়া
ইরানের সর্বোচ্চ নেতার বক্তব্যগুলো সংগ্রহের প্রধান উৎস ছিল “আয়াতুল্লাহ খামেনি ওয়েবসাইট” অথবা খামেনি ডট আইআর এর “স্টেটমেন্ট বা বক্তব্য” এবং “ম্যাসেজেস বা বাণী”।
যেসব ক্ষেত্রে তার বক্তব্যের পুরো লেখা পাওয়া যায়নি, সেসব ক্ষেত্রে ওই ওয়েবসাইটের “নিউজ বা সংবাদ” বিভাগ থেকে বক্তব্যের সংক্ষিপ্ত রূপ ব্যবহার করা হয়েছে।
যখন “নিউজ বা সংবাদ” সেকশন থেকে বক্তব্য ব্যবহার করা হচ্ছিল, তখন এটা মনে রাখা হয়েছে যে, ওই সংবাদের সব শব্দই ইরানের সর্বোচ্চ নেতা আয়াতুল্লাহ আলী খামেনির নিজস্ব শব্দ ছিল না।
উদাহরণস্বরূপ, নিউজ লেখার সময় প্রায়ই “দ্য লিডার অব দ্য রেভুলিউশন বা বিপ্লবের নেতা বলেছেন” এমন বাক্য ব্যবহার করা হয়েছে।
যেখানে “নেতা” এবং “বিপ্লব” শব্দ দুইটি সংবাদ লেখকের, আলী খামেনির নয়।
এই কারণে, এই বিশেষ ক্ষেত্রে মূল শব্দ গণনার চূড়ান্ত ফলাফল থেকে এমন সব অতিরিক্ত “নেতা” এবং “বিপ্লব” শব্দ বাদ দেওয়া হয়েছে।
কীওয়ার্ড বা মূল শব্দ গণনার ক্ষেত্রে একই রূপ কিন্তু ভিন্ন অর্থ প্রকাশ করে, এমন শব্দগুলোকে আলাদা করা হয়েছে।
উদাহরণস্বরূপ, “হাসান” শব্দটি, শিয়াদের দ্বিতীয় ইমাম অর্থে এই ডকুমেন্টারিতে বিশ্লেষণ করা মূল শব্দগুলোর একটি।
তবে বিশ্লেষণধর্মী পর্যালোচনার আগে, ভালো অর্থে ব্যবহৃত “হুসন” শব্দের ব্যবহার কিংবা অন্য কোনো “হাসান”, যেমন: হাসান রুহানি অর্থে ব্যবহৃত শব্দগুলোকে এই হিসাব থেকে বাদ দেওয়া হয়েছে।
সাধারণভাবে, এই ডকুমেন্টারিতে ভিন্ন ভিন্ন প্রেক্ষাপটে পৃথক অর্থ বহনকারী শব্দগুলোকে আলাদা করার দিকে বিশেষ নজর দেওয়া হয়েছে।
উদাহরণস্বরূপ, আলী খামেনির আগের নেতাকে “ইমাম” হিসেবে কতবার উল্লেখ করেছেন সেটি গণনার সময়, শিয়াদের ক্ষেত্রে ব্যবহৃত শব্দগুলো বাদ দেওয়া হয়েছে।
একইভাবে, “পাশ্চাত্য” বা “পশ্চিম”, আমেরিকা ও ইউরোপীয় দেশগুলোর অর্থে, শব্দের ব্যবহার গণনার সময়, “পশ্চিম এশিয়া”, আলী খামেনির ভাষায় যেটি “মধ্যপ্রাচ্যের” সমার্থক এমন শব্দগুলোকে বাদ দেওয়া হয়েছে।
এই ডকুমেন্টারিতে শব্দের সাথে অক্ষরের, যেমন: ‘ওয়াই(ইংরেজি)বা ই’ যুক্ত হওয়ার কারণে অর্থের যে পরিবর্তন ঘটে, সেটিও বিবেচনায় নেওয়া হয়েছে।
উদাহরণস্বরূপ, “মিলিটারি” শব্দটি “সিস্টেম” এর সাথে যুক্ত “ই” এর প্রকৃতির ওপর ভিত্তি করে, দুইটি ভিন্ন অর্থে ব্যবহৃত হয়।
যার একটির সম্পর্ক সামরিক বাহিনীর সাথে এবং অন্যটি “সিস্টেম বা শাসনব্যবস্থা(গভর্নমেন্ট)” এবং “ই” এর সমন্বয়ে অর্থ দাঁড়ায় “একটি সিস্টেম বা একটি গভর্নমেন্ট বা সরকার।”
স্বাভাবিকভাবেই, প্রথম অর্থে “মিলিটারি বা সামরিক” শব্দটি কতবার পুনরাবৃত্তি হয়েছে সেটি গণনার সময়, দ্বিতীয় অর্থে ব্যবহৃত শব্দগুলোকে বাদ দেওয়া হয়েছে।
সবশেষে উল্লেখ্য যে, প্রতিটি ধাপে আয়াতুল্লাহ আলী খামেনির সবচেয়ে বেশি ব্যবহৃত মূল শব্দগুলো নির্ধারণ করা হয়েছে একটি বিশেষ সফটওয়্যারের সাহায্যে। যেটি বিশাল আকৃতির টেক্সট গ্রহণ করে শব্দগুলো গণনার পর তাদের ব্যবহারের সংখ্যা অনুযায়ী ক্রমানুসারে সাজায়।
তবে ভুল বা অপ্রাসঙ্গিক ফলাফলগুলো চিহ্নিত করে বাদ দেওয়ার জন্য পরবর্তীতে প্রাপ্ত তালিকাগুলো আলাদাভাবে এবং বিস্তারিতভাবে পরীক্ষা করা হয়েছে।
অবশ্যই, অপ্রাসঙ্গিক ফলাফলগুলো চিহ্নিত করার প্রক্রিয়ায় কোনো ধাপেই কৃত্রিম বুদ্ধিমত্তা বা এআই ব্যবহার করা হয়নি।
কারণ কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির অভাবনীয় উন্নয়ন সত্ত্বেও, ফার্সি ভাষায় লেখা কয়েক মিলিয়ন শব্দের টেক্সট নিখুঁতভাবে বিশ্লেষণ করার ক্ষেত্রে এই টুলগুলোর নির্ভুলতা নিয়ে এখনো সন্দেহ রয়েছে।




