শনিবার, ২১ নভেম্বর, ২০০৯

চেহারা সনাক্তকরণ - বুদ্ধিমত্তার পরিচালক নাকি স্রেফ ধোঁয়াশার খেলা

অ্যাপল আর গুগল বাজারে এনেছে কয়েকটি নতুন ফটো প্রোগ্রাম, যেগুলোতে ব্যবহার করা হয়েছে চেহারা সনাক্তকরণের জন্য রীতিমত বৈপ্লবিক কিছু প্রযুক্তি।

ধরুন, আপনার কম্পিউটারে হাজার পঁচিশেক ডিজিটাল ছবি স্টোর করা আছে। বেশির ভাগই মানুষের। এখন পর্যন্ত এসব ছবি থেকে কাঙিক্ষত ছবি খুঁজে বের করার একমাত্র উপায় হলো হাত এবং চোখ কাজে লাগানো। অর্থাৎ তারিখ, এক্সিফ ডাটা, ট্যাগ অথবা নিতান্তই নিজের ý মৃতিশক্তিকে কাজে লাগিয়ে খুঁজে বের করা। কিন্তু এখন থেকে এই খোঁজাখুঁজির কাজটা কম্পিউটারই করে ফেলতে পারবে। এজন্য অ্যাপল এবং গুগলকে ধন্যবাদ দিতেই হয়, কারণ তারা তাদের ফটো ম্যানেজমেন্ট সিস্টেমের নতুন ভার্সনে চেহারা সনাক্তকরণের নতুন প্রযুক্তিটি সংযুক্ত করেছে।

চেহারা সনাক্তকরণের এই প্রযুক্তিটির জন্ম মূলত ১১ সেপ্টেম্বর প্রেক্ষাপটে। সে সময় সন্ত্রাস প্রতিরোধে জন্ম নেয়া সুচতুর এবং কুশলী প্রযুক্তিগুলোর মধ্যে এটি একটি, যার পেছনে কাজ করেছে সত্যিকারের মেধা। উদ্দেশ্যটা ছিল এমন যে, কোন সন্দেহভাজন সন্ত্রাসী নিরাপত্তা চৌকি পার হবার সময় এই প্রযুক্তির মাধ্যমে তাকে স্বয়ংক্রিয়ভাবে সণাক্ত করা যাবে। যদিও ব্যাপারটি ঠিক সেভাবে কাজ করেনি। উদাহরণ স্বরূপ বলা যায় টাম্পাতে করা একটি পরীক্ষার কথা; শতকরা ৫৩ ভাগ ক্ষেত্রে এই প্রযুক্তির মাধ্যমে বিমানবন্দনের কর্মচারীদের সনাক্ত করা যায়নি। এছাড়া নাগরিক স্বাধীকারের জন্য কাজ করে এমন কিছু গোষ্ঠী জানিয়েছে, অনেক ক্ষেত্রেই নিরাপরাধ লোকজনকে এই প্রযুক্তির মাধ্যমে সন্ত্রাসী হিসেবে চিহ্নিত করা হয়েছে এবং তাদেরকে হয়রানি এমনকি গ্রেপ্তার হতে হয়েছে শুধুমাত্র তাদের চেহারার ধরনের কারণে। আর এভাবেই এই প্রযুক্তিটি নিজেকে কার্যকর প্রমাণ করতে ব্যর্থ হয়ে জনগণের দৃষ্টির বাইরে চলে গেছে। আর এভাবেই অকার্যকর যেকোন কিছুকে ছুড়ে ফেলে দেয় হয়।

যুক্তরাষ্ট্রসহ অনেক দেশই তাদের পাসপোর্টের জন্য প্রয়োজনীয় ছবির চাহিদা বদলে দিয়েছে যাতে একে সনাক্তকারী সফটওয়্যারের জন্য আরো সহায়ক করে তোলা যায়। ১৯৯৪ সাল থেকেই যুক্তরাষ্ট্রের ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস এ্যান্ড টেকনোলজি এই প্রযুক্তিটির পরীক্ষা-নীরিক্ষা চালিয়ে আসছিল। ২০০২ এবং ২০০৬ সালে তারা ব্যাপকভাবে এই পরীক্ষা চালায়। বিশেষ করে একজন মানুষ যখন ভিন্ন ভিন্ন পরিচয় ব্যবহার করে একাধিক ড্রাইভিং লাইসেন্স নিতে চায় তখন। প্রযুক্তিটি ক্রমশ উন্নতি দেখিয়েছে বেশ ভালভাবেই।

একটি কার্যকর চেহারা সনাক্তকারী ব্যবস্খার জন্য প্রথম যেটি প্রয়োজন, সেটি হলো কম্পিউটার যেন একটি ছবি থেকে মানুষের চেহারাকে আলাদাভাবে সনাক্ত করতে পারে। কৌশলগত ভাবে একটি নির্দিষ্ট মানুষকে খুঁজে বের করার চাইতে এটা অনেক সহজ কাজ। ২০০১ সালের ১২ সেপ্টেম্বরের পর এই প্রযুক্তিটিকে প্রায় আদর্শ রূপে এনে দাঁড় করানো হয়েছিল, যার ফলস্বরূপ কয়েক বছরের মধ্যেই ডিজিটাল ক্যামেরা ও ক্যাম কর্ডার গুলোতে চেহারা সনাক্তকরণের প্রযুক্তি চালু হয়ে যায়। এটি মূলত চোখ, নাক এবং চেহারার অন্যান্য অঙ্গের সাথে সঙ্গতিপূর্ণ আকৃতি খুঁজে বের করার মাধ্যমে কাজ করে। তারা একটি নির্দিষ্ট বক্সের ভেতর চেহারাটি থাকার সম্ভাবনা নির্দিষ্ট করে স্বয়ংক্রিয় ফোকাস করার সিস্টেমটিকে বলে দেয় কোথায় ফোকাস করতে হবে। কাঙিক্ষত কোন মানুষের চেহারা ছবিতে ঝাপসা হয়ে থাক, এটা কেউ চায় না।

আর তাই, চেহারা সনাক্তকরণের কাজটা শুরু হয় চিহ্নিতকরণের মাধ্যমেই। এরপর চেহারার বক্সটিকে ঘুরিয়ে ফিরিয়ে চোখ দু’টোকে সমান্তরালে আনা হয় এবং একই আকারে নিয়ে আসা হয়। এরপর তিনটি ভিন্ন প্রক্রিয়া কাজ করা শুরু করে। অবশ্য এই প্রত্যেকটি প্রক্রিয়ারই আলাদা আলাদা অনুপ্রক্রিয়া আছে। প্রত্যেকটিরই আছে নিজস্ব পেটেন্ট। একটি প্রক্রিয়ায় পুরো চেহারাটিকে গাণিতিক সংকেত পরিণত করে জমা রাখা হয় যার সাথে তুলনা করে পরে একই চেহারা খুঁজে বের করা যায়। অন্য একটি প্রক্রিয়ায় পুরো চোহারাটিকেই টেমপ্লেটে রূপান্তরিত করে জমা রাখা হয় এবং পরবর্তীতে পুরো চেহারাটিকেই সনাক্তকরণের সময় তুলনা করার জন্য ব্যবহার করা হয়। আর তৃতীয় একটি পদ্ধতিতে চেহারাটির একটি ত্রিমাত্রিক মডেল তৈরি করে পরবর্তীতে এক ধরনের জ্যামিতিক তুলনার মাধ্যমে সনাক্তকরণের কাজে ব্যবহার করা হয়। অভিজ্ঞতা বলছে, অ্যাপলের সফটওয়্যারটি যেখানে যুগান্তকারী প্রক্রিয়ায় কাজ করছে, সেখানে গুগলের সফটওয়্যারটি মূলত ইমেজ ম্যাচিং করছে। তবে এই ধারণা ভুলও হতে পারে। কারণ দু’টি কোম্পানির একটিও প্রকাশ করেনি, তারা আসলে কোন পদ্ধতি ব্যবহার করছে।

অ্যাপলের আই ফটো ০৯’কে পরীক্ষা করা হয়েছিল দু-দফায় ১৭০০০ এবং ১০০০০ ছবি দিয়ে। গুগলের পিকাসা শুধুমাত্র আগেই আপলোড করা ছবির ক্ষেত্রে কাজ করে। যদিও মাত্র ৫০০ ছবি ব্যবহার করেই এই ব্যাপারটা ধরা গেছে। তবে ফলাফল হিসেবে বলা যায়, দুটি সফটওয়্যারই দুর্দান্তভাবে কাজ করে। সেই সাথে এগুলো বেশ চতুরও বটে।

দুটোর মধ্যে আইফটো ’০৯ অবশ্যই তুলনামূলকভাবে ব্যবহারকারী বাব। প্রথমবার আইফটো চালু করার পর এটি নিজে থেকেই কম্পিউটারে থাকা সমস্ত ছবিকে যাচাই করে নেয়। একটি ডুয়েল কোর আই ম্যাকের ক্ষেত্রে এই সময়টা চার ঘন্টা পর্যন্ত হতে পারে। এরপর যখনই পরিচিত কারো মুখের ছবিতে ক্লিক করা হবে। তখনই একটি ডায়লগ বক্স আসবে। সেখানে নামটা লিখে দিলেই হলো, এরপর সফটওয়্যারটি নিজে থেকেই একই ধরনের ছবিগুলো খুঁজে বের করবে। সম্ভবত বক্সের ভেতর অবস্খিত চেহারার দুই পাশ, ভ্রু, চোখ, চিবুক ইত্যাদির মাধ্যমেই সনাক্তকরণ হয়। সব মিলে নাম লেখার পর সেই চেহারার মানুষটির বাদ-বাকী ছবিগুলো খুঁজে বের করার ক্ষেত্রে আইফটো বেশ ভাল কাজ দেয়। কিন্তু এটাও ঠিক যে এই কাজটা করতে গিয়ে অনেক সময় ভিন্ন মানুষের কিছু ছবিও চলে আসে। এ কারণেই পরবর্তীতে আই ফটোকে বলে দিতে হয় কোন ছবিটা ঠিক আর কোন ছবিটা ভুল। এর মাধ্যমে আই ফটো তার গাণিতিক মডেলটি সংশোধন করে নেয় এবং আবার সবগুলো ছবি যাচাই করে। আর বার বার এই প্রক্রিয়া চালাতে থাকলে ক্রমশই গাণিতিক মডেলটি উন্নত হতে থাকে।

সব চাইতে বিýময়কর দক্ষতাটি আই ফটো প্রদর্শন করে শিশুদের ছবি সনাক্ত করার ক্ষেত্রে। এমনকি একই রকম দেখতে জমজ দুই শিশুর ছবিও এটি আলাদা করতে পেরেছে, (বলা বাহুল্য, একটি শিশুর মুখ সরু এবং অন্যটির একটু মোটা গড়নের ছিল)। কিন্তু দু:খজনকভাবে সমান সংখ্যক ছবির ভেতর থেকে এই দুই জমজের একজনকে অন্যজনের তুলনায় বেশি সনাক্ত করেছে আইফটো। এক্ষেত্রে একটি মজার ব্যাপার ধরা পড়ে যেটি আইফটো ধরতে পেরেছিল কিন্তু অন্যরা পারেনি। একটি শিশু সরাসরি ক্যামেরার দিকে তাকায় কিন্তু অন্যজন তাকায় একপাশ থেকে। আর দুই চোখ সমানভাবে দেখা না গেলে আইফটোর পক্ষে চেহারা সনাক্ত করাটা খুবই কঠিন হয়ে দাঁড়ায়। এছাড়াও এই শিশুদের মুখে রঙ লাগিয়ে অনেক গুলো ছবি তোলা হয়েছে এবং দেখা গেছে সেগুলো আই ফটো সনাক্ত করতে পারছে না। শুধুমাত্র যেসব ক্ষেত্রে কপালের মাঝামাঝি রঙটা সীমাবদ্ধ ছিল সে ক্ষেত্রে এটি সনাক্ত করতে পেরেছে কারণ কপালটা থাকে সনাক্তকারী বাক্সের বাইরে।

আসলে আই ফটো সনাক্তকরণ পদ্ধতি সম্পর্কে এখনো অনেক কিছুই জানার আছে। বেথের ব্যাপারটাই ধরা যাক। যতবারই তার কম্পিউটারে বেথ এর ছবি খুঁজতে দেয়া হয়, ততবারই সাইমনের প্রাক্তন বাবীর ছবি চলে আসে। মনে হয় আই ফটো বুঝতে পারে সাইমন আসলে কাকে পছন্দ করে। ফাঁকিটা হলো, সাইমনের কম্পিউটারে তার প্রাক্তন বাবীর এত বেশি ছবি যে যে কেউ ইচ্ছেমতো কয়েকটা ছবি বেছে নেবে, তাতে ঐ মেয়ের একটা নয়ত একটা ছবি পড়বেই।

বেড়ালের ছবি সনাক্তকরণের ক্ষেত্রে আই ফটো বিûময়কর সাফল্য দেখিয়েছে, বিশেষ করে হলুদ ও সাদা বেড়ালের ক্ষেত্রে। কিন্তু ট্যাবি জাতের ক্ষেত্রে কথাটা প্রযোজ্য নয়, কারণ এগুলো চেহারা বোঝাটা একটু মুশকিল কাজই বটে। এদের চোখের রঙটা মুরগীর বাচ্চার মতই আর আই ফটো তার সনাক্তকরণের কাজটা ছায়াযুক্ত বা অল্প কনট্রাস্ট এর অংশ থেকেই শুরু করে। এর কারণ হলো ব্যাকগ্রাউন্ড থেকে চেহারাকে আলাদা করার জন্য এটি ভাল কাজ দেয়।

ঘরে আইফটো আসার পর অনেক সময় কম্পিউটারের পাশে পরিবার সদস্যদের আনাগোনা বেড়ে যায়। তারা সময় কাটায় কম্পিউটারকে নিজেদের চেহারাগুলো ভালভাবে চেনানোর কাজে। কম্পিউটারের হিসেব নিকেষটা বোঝার চেষ্টাটাও চলে। কম্পিউটার যখন ভুল ছবি বের করে তখন অনেক সময় হাসাহাসিও হয়। মাঝে মাঝে বেরিয়ে পড়ে ভুলে যাওয়া কোন ছবিও। এ হিসেবে অ্যাপলের তৈরি সবচাইতে আনন্দদায়ক সফটওয়্যারগুলোর মধ্যে নি:সন্দেহে স্খান করে নেবে আই ফটো।

এদিক থেকে গুগলের পিকাসা অনেক বেশি ধোঁয়াশাপূর্ণ। কার মুখটা খোঁজা হচ্ছে সেটা না জেনেই আপলোড করা সমস্ত ছবিকে যাচাই করে একই ধরনের মুখগুলোকে একই গ্রুপে ফেলে আলাদা আলাদা ক্লাস্টার তৈরি করে পিকাসা। অনেক ক্ষেত্রেই একই গ্রুপের সব ছবি একই মানুষেরই হয়। এরপর প্রত্যেক গ্রুপের মানুষটির পরিচয়, নাম, ই-মেইল অ্যাড্রেস এসব লেখার কাজটা ব্যবহারকারীকেই করতে হয়। তবে গুগলের এই ক্লাস্টারিং এর কাজটা আহামরি কিছু হয় না। হরহামেশাই বিভিন্ন ব্যক্তিকে একই ক্লাস্টারে এবং একই ব্যক্তিকে বিভিন্ন ক্লাস্টারে ফেলে দেয় পিকাসা। আই ফটোর মত ছদ্মবেশও ধরা পড়ে না এতে। বরং ছদ্মবেশধারী ব্যক্তিকে ভিন্ন ব্যক্তি বলেই ধরে নেয় এটি। তবে গুগলের ইউজার ইন্টারফেসটি চমৎকার। কিছু বুঝে ওঠার আগেই ক্লাস্টারিং এর কাজটি হয়ে যায় এবং সহজেই পরিচিত সব লোকজনের ছবি তাদের আসল নাম আর ই-মেইল অ্যাড্রেস সহ পাওয়া যায়, এমনকি একই ছবিতে অবস্খানকারী ভিন্ন ভিন্ন ব্যক্তির ক্ষেত্রেও, যা পিকাসার অন্যতম আকর্ষণীয় দিক।

আসল নাম জুড়ে দেয়াটাই গুগলের সফটওয়্যারটিকে রহস্যপূর্ণ করে তুলেছে। কারণ এই ছবিগুলো কারো কম্পিউটারে নয় বরং গুগলের সার্ভারে সংরক্ষিত। এই ছবি, নাম এবং ই-মেইল অ্যাড্রেস ব্যবহার করে গুগল চাইলেই একটি গ্লোবাল ডাটাবেজ তৈরি করতে পারবে এবং এজন্যে তার বিরুদ্ধে শর্তভঙ্গের অভিযোগও আনা যাবে না। কেননা সে এই কাজটি করছে তার সেবার মনোন্নয়নের খাতিরে।

গুগলের যে ব্যাপারটি একেবারেই সমাধানের বাইরে, সেটা হলো, এই সেবার মাধ্যমে তারা একটি ছবিতে অবস্খিত সবার পরিচয় জানতে চায়। এমনকি ছবির পেছনের হেটে যাওয়া পথচারীটিরও। গুগলের কর্পোরেট মিশনের উদ্দেশ্য হলো, ‘বিশ্বের সমস্ত তথ্যকে একীভূত করে সবার হাতে পৌছে দেয়া’। এই সেবার মাধ্যমে হয়ত গুগল তার মিশনটিকে সফল করতে চাইছে। কিন্তু সমস্যা হলো সব মানুষের সব তথ্য সবার কাছে থাকার ব্যাপারটা সবার কাছে সমানভাবে গ্রহণযোগ্য হতে পারে না। অন্তত একটি ফটো শেয়ারিং ওয়েব সাইটের কাছে তো এটা কাম্য নয়ই।

আই ফটোতে যখন কেউ নিজের একান্ত প্রিয়জনেদের ছবিগুলো নাড়াচাড়া করে, তখন সে যেমন আনন্দ পায় ঠিক তেমনি গুগলের পিকাসাতে অপরিচিত লোকজনের ছবিরও নাম জানতে চাওয়ায় নিজেকে মনে হয় যেন কোন সেচ্ছাচারী এক নায়কের গোয়েন্দা বিভাগের কর্মচারী।

এসব ভোক্তা তাড়িত চেহারা সনাক্তকারী সফটওয়্যার নি:সন্দেহে বায়োমেট্রিক্স ও জনগণের ওপর ভিত্তিও নজরদারি সংক্রান্ত সকল জননীতি বিতর্কের মৌলিক পরিবর্তন ঘটাবে। ১১ সেপ্টেম্বরের পরবর্তী সময়টাতে কেউ জানতো না এই প্রযুক্তি কিভাবে কাজ করে, এর ভেতর কতটুকু ভুল এবং ঠিকইবা কতটুকু। কিন্তু এ বছরের শেষ নাগাদ লক্ষ লক্ষ আমেরিকানের নিজ হাতে সময়কালের সর্বাধিক দ্রুত চেহারা সনাক্তকারী সফটওয়্যার ব্যবহার করার অভিজ্ঞতা থাকবে। শুধুমাত্র পরিবার সদস্যদের ছবি নিয়ে কাজ করার নতুনত্বটা ঝড়ে পড়লেই এর অন্যদিকগুলো সবার চোখের সামনে স্পষ্ট হয়ে উঠবে। তখন জনগণের পক্ষ থেকেই দাবী উঠবে এর গতিবৃদ্ধি করার এবং ব্যবহারবিধিতে নিয়ন্ত্রণ প্রতিষ্ঠার।

সৌজন্যে : মাসকি ই-বিজ

0 টি মন্তব্য:

একটি মন্তব্য পোস্ট করুন

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best Buy Coupons