এআই মডেলের জন্য পরীক্ষা হিসেবে ব্যবহৃত সুপার মারিও ব্রাদার্স

  • গবেষকরা সুপার মারিও ব্রাদার্সকে রেফারেন্স হিসেবে ব্যবহার করে বিভিন্ন এআই মডেল পরীক্ষা করেছেন।
  • অ্যানথ্রপিকের ক্লড ৩.৭ জিপিটি-৪ও এবং জেমিনি ১.৫ প্রো-এর চেয়ে আলাদা ছিল।
  • গেমিংএজেন্ট নামে একটি ফ্রেমওয়ার্ক ব্যবহার করা হয়েছিল যাতে এআই গেমটি নিয়ন্ত্রণ করতে পারে।
  • জটিল যুক্তিযুক্ত মডেলগুলির প্রক্রিয়াকরণের সময় বেশি হওয়ার কারণে তাদের অসুবিধা বেশি ছিল।

সুপার মারিও ব্রোস পরীক্ষা করছে এআই মডেল।

সুপার মারিও ব্রাদার্স কৃত্রিম বুদ্ধিমত্তা মডেলগুলির জন্য একটি অপ্রত্যাশিত পরীক্ষার ক্ষেত্র হয়ে উঠেছে. সান ডিয়েগোর ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের অন্তর্গত হাও এআই ল্যাবের একদল গবেষক একটি গবেষণা করেছেন এই আইকনিক প্ল্যাটফর্ম ভিডিও গেমটি ব্যবহার করে বিভিন্ন AI মূল্যায়ন করা হয়েছে এমন পরীক্ষা.

পরীক্ষাটি চাওয়া হয়েছিল বাস্তব সময়ে উদ্দীপনার প্রতি সাড়া দেওয়ার জন্য AI-এর ক্ষমতা বিশ্লেষণ করুন।. সুপার মারিও ব্রাদার্সের মতো গতিশীল এবং চাহিদাপূর্ণ পরিবেশে, একটি ক্লাসিক ভিডিও গেমে তাদের পারফরম্যান্স মূল্যায়নের জন্য বিভিন্ন মডেলকে পরীক্ষা করা হয়েছিল। এই ধরণের পরীক্ষা-নিরীক্ষা কৃত্রিম বুদ্ধিমত্তার ভবিষ্যতের উন্নয়নের জন্য মূল্যবান অন্তর্দৃষ্টি প্রদান করতে পারে।

পরীক্ষায় শীর্ষস্থানীয় AI মডেলগুলি

সুপার মারিও ব্রোসে কিছু মডেল ব্যর্থ হয়েছে।

ফলাফলগুলি মূল্যায়ন করা মডেলগুলির মধ্যে উল্লেখযোগ্য পার্থক্য দেখিয়েছে। অ্যানথ্রপিকের ক্লড ৩.৭ সবচেয়ে কার্যকর প্রমাণিত হয়েছে, তার পূর্বসূরী, ক্লড 3.5 কে ছাড়িয়ে গেছে। অন্যদিকে, বহুল পরিচিত মডেল যেমন এই পরীক্ষায় OpenAI এর GPT-4o এবং Google এর Gemini 1.5 Pro অসাধারণ পারফরম্যান্স দিতে ব্যর্থ হয়েছে।. এটি একটি AI বেঞ্চমার্কের অংশ হিসেবে মডেলগুলির আরও গবেষণা এবং মূল্যায়নের গুরুত্বকে তুলে ধরে।

এই ফলাফলগুলিকে প্রভাবিত করার অন্যতম কারণ ছিল ব্যবহৃত কাঠামো। কৃত্রিম বুদ্ধিমত্তাকে গেমের সাথে কার্যকরভাবে যোগাযোগ করার অনুমতি দেওয়ার জন্য, গেমিংএজেন্ট নামে একটি ফ্রেমওয়ার্ক ব্যবহার করা হয়েছিল. এই সফটওয়্যারটি AI মডেলদের জন্য গেমের চরিত্র নিয়ন্ত্রণ করা সহজ করে তুলেছে পাইথন কোডে প্রোগ্রাম করা নির্দেশাবলী.

সুপার মারিও ব্রাদার্সে কিছু মডেল কেন ব্যর্থ হয়েছিল?

এআই মডেলের জন্য পরীক্ষা হিসেবে ব্যবহৃত সুপার মারিও ব্রাদার্স

কৌতূহলীভাবে, জটিল যুক্তি ক্ষমতা সম্পন্ন মডেলগুলির অসুবিধা ছিল. কারণ তাদের প্রক্রিয়াকরণ সাধারণত বিস্তারিত গণনা সম্পাদন করতে বা কৌশলগত সিদ্ধান্ত নিতে ধীর হয়, সুপার মারিও ব্রোসের মতো দ্রুতগতির পরিবেশে এই মডেলগুলি কম কার্যকর প্রতিক্রিয়া দেখিয়েছে।. ভবিষ্যতের পরীক্ষা-নিরীক্ষায় এটি অন্বেষণ করার মতো একটি ক্ষেত্র হতে পারে, যেখানে সহজ মডেলগুলি কীভাবে আরও ভালো পারফর্ম করতে পারে তা দেখা যাবে।

বিপরীতে, গভীর যুক্তি প্রক্রিয়ার উপর নির্ভর করে না এমন কৃত্রিম বুদ্ধিমত্তাগুলি আরও চটপটে ছিল. কম উন্নত বলে বিবেচিত মডেলগুলি কম প্রতিক্রিয়া সময় অর্জন করেছে, যা তাদের রিয়েল-টাইম গেমিংয়ের চাহিদার সাথে আরও ভালভাবে খাপ খাইয়ে নিতে সাহায্য করেছে। এই ঘটনাটি অন্যান্য প্রসঙ্গে, যেমন ভিডিও গেম ডেভেলপমেন্টে অ্যাপ্লিকেশন বিশ্লেষণের জন্য কার্যকর হতে পারে।

যদিও এই পরীক্ষাটিকে একটি সরকারী মানদণ্ড হিসেবে বিবেচনা করা যাবে না।প্রাপ্ত ফলাফলগুলি দেখায় যে গতিশীল এবং তাৎক্ষণিক প্রতিক্রিয়ার অবস্থার মুখোমুখি হলে বিভিন্ন কৃত্রিম বুদ্ধিমত্তা মডেলের কর্মক্ষমতার মধ্যে স্পষ্ট পার্থক্য রয়েছে।

এই ধরণের পরীক্ষা-নিরীক্ষা কৃত্রিম বুদ্ধিমত্তার ভবিষ্যতের উন্নয়নের জন্য মূল্যবান অন্তর্দৃষ্টি প্রদান করতে পারে। বিভিন্ন চ্যালেঞ্জের প্রতি মডেলরা কীভাবে প্রতিক্রিয়া দেখায় তা বিশ্লেষণ করা বিভিন্ন প্রেক্ষাপটে তাদের নকশা এবং প্রয়োগের উন্নতি সনাক্ত করতে সহায়তা করুন, হিসাবে রোবোটিক্স, লা স্বয়ংক্রিয়তা এবং ভিডিও গেমস. অধিকন্তু, শেখা শিক্ষাগুলি প্রযুক্তি এবং বিনোদনের অন্যান্য ক্ষেত্রেও প্রয়োগ করা যেতে পারে, যার ফলে তাদের দিগন্ত প্রসারিত হবে।

অন্যান্য খেলায় এই ধরণের আরও পরীক্ষা থাকবে।

এই ফলাফলগুলি অন্যান্য ধরণের ভিডিও গেমগুলিতে একই ধরণের পরীক্ষা চালানোর সম্ভাবনা উন্মুক্ত করে।. উদাহরণস্বরূপ, পালা-ভিত্তিক কৌশলগত গেমগুলিতে, আরও পরিশীলিত যুক্তিযুক্ত মডেলগুলি আরও ভাল ফলাফল পেতে পারে, বর্ধিত প্রতিক্রিয়া সময়ের দ্বারা দণ্ডিত না হয়ে কৌশলগত সিদ্ধান্তে আরও বেশি সময় ব্যয় করে। এটি তুলে ধরে যে ভবিষ্যতের গবেষণায় বিভিন্ন ধরণের খেলার ধরণ এবং ধরণ অন্বেষণ করতে হবে.

সুপার মারিও ব্রাদার্সের সাথে পরীক্ষা-নিরীক্ষা দেখায় যে কীভাবে ভিডিও গেমগুলি বিবর্তন মূল্যায়ন করতে ব্যবহার করা যেতে পারে কৃত্রিম বুদ্ধিমত্তা, ইন্টারেক্টিভ এবং গতিশীল পরিস্থিতিতে আপনার ক্ষমতা এবং সীমাবদ্ধতা পরিমাপ করার জন্য একটি অ্যাক্সেসযোগ্য পরিবেশ প্রদান করে। যদিও সবসময়, ভিডিও গেমের জগতে আমাদের সবচেয়ে বেশি অবাক করে কে? মানুষ হচ্ছে.


গুগল নিউজে আমাদের অনুসরণ করুন