সুপার মারিও ব্রাদার্স কৃত্রিম বুদ্ধিমত্তা মডেলগুলির জন্য একটি অপ্রত্যাশিত পরীক্ষার ক্ষেত্র হয়ে উঠেছে. সান ডিয়েগোর ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের অন্তর্গত হাও এআই ল্যাবের একদল গবেষক একটি গবেষণা করেছেন এই আইকনিক প্ল্যাটফর্ম ভিডিও গেমটি ব্যবহার করে বিভিন্ন AI মূল্যায়ন করা হয়েছে এমন পরীক্ষা.
পরীক্ষাটি চাওয়া হয়েছিল বাস্তব সময়ে উদ্দীপনার প্রতি সাড়া দেওয়ার জন্য AI-এর ক্ষমতা বিশ্লেষণ করুন।. সুপার মারিও ব্রাদার্সের মতো গতিশীল এবং চাহিদাপূর্ণ পরিবেশে, একটি ক্লাসিক ভিডিও গেমে তাদের পারফরম্যান্স মূল্যায়নের জন্য বিভিন্ন মডেলকে পরীক্ষা করা হয়েছিল। এই ধরণের পরীক্ষা-নিরীক্ষা কৃত্রিম বুদ্ধিমত্তার ভবিষ্যতের উন্নয়নের জন্য মূল্যবান অন্তর্দৃষ্টি প্রদান করতে পারে।
পরীক্ষায় শীর্ষস্থানীয় AI মডেলগুলি
ফলাফলগুলি মূল্যায়ন করা মডেলগুলির মধ্যে উল্লেখযোগ্য পার্থক্য দেখিয়েছে। অ্যানথ্রপিকের ক্লড ৩.৭ সবচেয়ে কার্যকর প্রমাণিত হয়েছে, তার পূর্বসূরী, ক্লড 3.5 কে ছাড়িয়ে গেছে। অন্যদিকে, বহুল পরিচিত মডেল যেমন এই পরীক্ষায় OpenAI এর GPT-4o এবং Google এর Gemini 1.5 Pro অসাধারণ পারফরম্যান্স দিতে ব্যর্থ হয়েছে।. এটি একটি AI বেঞ্চমার্কের অংশ হিসেবে মডেলগুলির আরও গবেষণা এবং মূল্যায়নের গুরুত্বকে তুলে ধরে।
এই ফলাফলগুলিকে প্রভাবিত করার অন্যতম কারণ ছিল ব্যবহৃত কাঠামো। কৃত্রিম বুদ্ধিমত্তাকে গেমের সাথে কার্যকরভাবে যোগাযোগ করার অনুমতি দেওয়ার জন্য, গেমিংএজেন্ট নামে একটি ফ্রেমওয়ার্ক ব্যবহার করা হয়েছিল. এই সফটওয়্যারটি AI মডেলদের জন্য গেমের চরিত্র নিয়ন্ত্রণ করা সহজ করে তুলেছে পাইথন কোডে প্রোগ্রাম করা নির্দেশাবলী.
সুপার মারিও ব্রাদার্সে কিছু মডেল কেন ব্যর্থ হয়েছিল?
কৌতূহলীভাবে, জটিল যুক্তি ক্ষমতা সম্পন্ন মডেলগুলির অসুবিধা ছিল. কারণ তাদের প্রক্রিয়াকরণ সাধারণত বিস্তারিত গণনা সম্পাদন করতে বা কৌশলগত সিদ্ধান্ত নিতে ধীর হয়, সুপার মারিও ব্রোসের মতো দ্রুতগতির পরিবেশে এই মডেলগুলি কম কার্যকর প্রতিক্রিয়া দেখিয়েছে।. ভবিষ্যতের পরীক্ষা-নিরীক্ষায় এটি অন্বেষণ করার মতো একটি ক্ষেত্র হতে পারে, যেখানে সহজ মডেলগুলি কীভাবে আরও ভালো পারফর্ম করতে পারে তা দেখা যাবে।
বিপরীতে, গভীর যুক্তি প্রক্রিয়ার উপর নির্ভর করে না এমন কৃত্রিম বুদ্ধিমত্তাগুলি আরও চটপটে ছিল. কম উন্নত বলে বিবেচিত মডেলগুলি কম প্রতিক্রিয়া সময় অর্জন করেছে, যা তাদের রিয়েল-টাইম গেমিংয়ের চাহিদার সাথে আরও ভালভাবে খাপ খাইয়ে নিতে সাহায্য করেছে। এই ঘটনাটি অন্যান্য প্রসঙ্গে, যেমন ভিডিও গেম ডেভেলপমেন্টে অ্যাপ্লিকেশন বিশ্লেষণের জন্য কার্যকর হতে পারে।
যদিও এই পরীক্ষাটিকে একটি সরকারী মানদণ্ড হিসেবে বিবেচনা করা যাবে না।প্রাপ্ত ফলাফলগুলি দেখায় যে গতিশীল এবং তাৎক্ষণিক প্রতিক্রিয়ার অবস্থার মুখোমুখি হলে বিভিন্ন কৃত্রিম বুদ্ধিমত্তা মডেলের কর্মক্ষমতার মধ্যে স্পষ্ট পার্থক্য রয়েছে।
এই ধরণের পরীক্ষা-নিরীক্ষা কৃত্রিম বুদ্ধিমত্তার ভবিষ্যতের উন্নয়নের জন্য মূল্যবান অন্তর্দৃষ্টি প্রদান করতে পারে। বিভিন্ন চ্যালেঞ্জের প্রতি মডেলরা কীভাবে প্রতিক্রিয়া দেখায় তা বিশ্লেষণ করা বিভিন্ন প্রেক্ষাপটে তাদের নকশা এবং প্রয়োগের উন্নতি সনাক্ত করতে সহায়তা করুন, হিসাবে রোবোটিক্স, লা স্বয়ংক্রিয়তা এবং ভিডিও গেমস. অধিকন্তু, শেখা শিক্ষাগুলি প্রযুক্তি এবং বিনোদনের অন্যান্য ক্ষেত্রেও প্রয়োগ করা যেতে পারে, যার ফলে তাদের দিগন্ত প্রসারিত হবে।
অন্যান্য খেলায় এই ধরণের আরও পরীক্ষা থাকবে।
এই ফলাফলগুলি অন্যান্য ধরণের ভিডিও গেমগুলিতে একই ধরণের পরীক্ষা চালানোর সম্ভাবনা উন্মুক্ত করে।. উদাহরণস্বরূপ, পালা-ভিত্তিক কৌশলগত গেমগুলিতে, আরও পরিশীলিত যুক্তিযুক্ত মডেলগুলি আরও ভাল ফলাফল পেতে পারে, বর্ধিত প্রতিক্রিয়া সময়ের দ্বারা দণ্ডিত না হয়ে কৌশলগত সিদ্ধান্তে আরও বেশি সময় ব্যয় করে। এটি তুলে ধরে যে ভবিষ্যতের গবেষণায় বিভিন্ন ধরণের খেলার ধরণ এবং ধরণ অন্বেষণ করতে হবে.
সুপার মারিও ব্রাদার্সের সাথে পরীক্ষা-নিরীক্ষা দেখায় যে কীভাবে ভিডিও গেমগুলি বিবর্তন মূল্যায়ন করতে ব্যবহার করা যেতে পারে কৃত্রিম বুদ্ধিমত্তা, ইন্টারেক্টিভ এবং গতিশীল পরিস্থিতিতে আপনার ক্ষমতা এবং সীমাবদ্ধতা পরিমাপ করার জন্য একটি অ্যাক্সেসযোগ্য পরিবেশ প্রদান করে। যদিও সবসময়, ভিডিও গেমের জগতে আমাদের সবচেয়ে বেশি অবাক করে কে? মানুষ হচ্ছে.