ঢাকা, বাংলাদেশ   সোমবার ০৮ জুলাই ২০২৪, ২৪ আষাঢ় ১৪৩১

ডিপ ও শ্যালোফেক প্রযুক্তির কারসাজি

প্রকাশিত: ২০:৪২, ৫ জুলাই ২০২৪

ডিপ ও শ্যালোফেক প্রযুক্তির কারসাজি

.

সাকিব আফতাব

অবিশ্বাস্য দ্রুততায় বদলে যাচ্ছে সবকিছু। যা ছিল গতকাল পর্যন্ত অভাবনীয় আজ তা- সত্য হয়ে ধরা দিচ্ছে। মানুষের অনেক কঠিন কষ্টসাধ্য কাজকে নিখুঁতভাবে করে দিচ্ছে প্রযুক্তি। এআইর কল্যাণে প্রায় প্রতিদিনই আসছে নতুন নতুন সমাধান। এরকমই দুটি প্রযুক্তি হলো ডিপফেক শ্যালোফেক। এরা একে অপরের সহদরের মতোই। প্রথমে ডিপফেক নিয়েই বলা যাক। রাজনীতি থেকে বিনোদন জগৎ- সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব বিনোদন তারকা। ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।

মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।

শ্যালোফেক : ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়। পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম।

প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে। নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা। প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি।

×