نجح نموذج الذكاء الاصطناعي "Gemini 2.5 Pro" التابع لشركة جوجل في إنهاء لعبة الفيديو الكلاسيكية "بوكيمون بلو" التي صدرت لأول مرة عام 1996.
هذا الإنجاز لم يأت من داخل أروقة الشركة نفسها، بل على يد مبرمج مستقل يدعى جويل زد، لكنه جذب انتباه وتشجيع كبار مسؤولي جوجل بمن فيهم المدير التنفيذي سوندار بيتشاي.
مشروع مستقل بدعم من جوجل
المبرمج جويل زد وهو مهندس برمجيات يبلغ من العمر 30 عامًا أطلق بثًا مباشرًا على منصة تويتش، تحت اسم "Gemini Plays Pokemon" يظهر فيه كيف يمكن لنموذج الذكاء الاصطناعي من جوجل التفاعل مع لعبة بوكيمون والتقدم فيها.
ورغم أن المشروع غير رسمي ولا تديره جوجل بشكل مباشر إلا أن مسؤولي الشركة تابعوه بحماس، ونشر سوندار بيتشاي تعليقًا عبر منصة X قال فيه: "يا له من ختام! جيميني 2.5 برو أنهى بوكيمون بلو!"
سباق الذكاء الاصطناعي في عالم الألعاب
المشروع جاء في سياق منافسة غير مباشرة بين شركات الذكاء الاصطناعي، حيث كانت شركة Anthropic قد استعرضت قدرات نموذجها "Claude" في لعبة "بوكيمون ريد" مشيرة إلى أن قدراته في التفكير الممتد ساعدته على التعامل مع المهام المعقدة وغير المتوقعة داخل اللعبة.
هذا التنافس ألهم جويل زد الذي أشار إلى مشروع "Claude Plays Pokemon" باعتباره مصدر إلهام مباشر لتجربته معGemini .
لا مقارنات مباشرة بين النماذج
ورغم أن Gemini تمكن من إنهاء اللعبة بينما لم يفعل Claude ذلك بعد، إلا أن جويل زد شدد على أن المقارنة بين النموذجين ليست دقيقة، وكل منهما يستخدم أدوات مختلفة تُعرف باسم "agent harnesses"، وهي أنظمة وسيطة تعرض على النموذج لقطات من اللعبة مع معلومات إضافية، تمكنه من اتخاذ قرارات وتنفيذها عبر أزرار اللعبة، وهذه الفروقات تجعل من الصعب إجراء تقييم مباشر لأداء كل نموذج.
تدخلات فنية دون غش
أوضح جويل زد أنه أجرى بعض التعديلات على بيئة العمل لتحسين قدرة Gemini على اتخاذ قرارات أفضل أثناء اللعب لكنه أكد أن هذه التدخلات لا تعد غشًا، ولم يقدم للنموذج حلولًا مباشرة أو تعليمات تفصيلية بل اكتفى بتحسين قدراته العامة في التفكير واتخاذ القرار، والاستثناء الوحيد كان تنبيهه إلى خطأ معروف في اللعبة يتطلب الحديث مرتين مع أحد خصوم اللعبة للحصول على مفتاح وهو خطأ تم تصحيحه في إصدار لاحق.
إطار عمل متطور باستمرار
أشار جويل إلى أن مشروع "Gemini Plays Pokémon" لا يزال في طور التطوير، والإطار البرمجي الذي يستخدمه يخضع للتحديث المستمر، وهذا يعني أن ما تم تحقيقه حتى الآن لا يمثل الحد الأقصى لقدرات النموذج وأن الأداء قد يتحسن مستقبلًا مع مزيد من الضبط والدعم الفني.
0 تعليق