هل بدأ عصر الآلة؟.. الذكاء الاصطناعي يجتاز اختبار تورينج - الأول نويز

اخبار 24 0 تعليق ارسل طباعة تبليغ حذف

الاختبار يعد بمثابة المعيار النهائي والمؤشر الحاسم لتقييم ذكاء الآلة

في خطوة أثارت جدلًا واسعًا، كشفت دراسة حديثة عن نجاح روبوت دردشة يعمل بالذكاء الاصطناعي في اجتياز تورينج، وهو الاختبار الذي طالما عدَّه الكثير من الخبراء والباحثين المعيار النهائي، والمؤشر الحاسم لتقييم ذكاء الآلة وقدرتها على محاكاة الذكاء البشري.

"تورينج" يقيس قدرة نظام الذكاء على أن يحل محل شخص حقيقي

الدراسة التي أجراها باحثان متخصصان في جامعة كاليفورنيا في سان دييجو، اعادت من جديد الجدل حول فعالية اختبار تورينج كمقياس حقيقي لذكاء الآلات، خاصة أنه يمتلك تاريخًا حافلًا بالخلافات والتساؤلات.

وقال مؤلفا الدراسة الباحثان كاميرون جونز وبنجامين بيرجن، إن الاختبار يقيس مدى قدرة نظام الذكاء الاصطناعي على أن يحل وظيفيًا محل شخص حقيقي ضمن سياق تفاعلي محدد.

وتقوم الدراسة على تقييم أداء أربعة نماذج لغوية كبيرة متباينة، وهي: (ELIZA)، وهو نموذج قديم يعود إلى الستينيات، و(GPT-4o)، و(LLaMa-3.1-405B)، و(GPT-4.5).

واعتمدت الدراسة على تصميم تجريبي دقيق تضمن مشاركة مجموعة من المتطوعين في 8 جولات تفاعلية من المحادثات النصية، وفي كل جولة، أدى المتطوعون دور محقق يتبادل الرسائل مع شاهدين، وكان أحد هذين الشاهدين إنسانًا حقيقيًا، في حين كان الشاهد الآخر نموذجًا لغويًا كبيرًا من النماذج الأربعة المختبرة.

وبعد انتهاء مدة التفاعل، اتخذ كل محقق قرارًا بشأن كون أيٍ من الشاهدين كان الإنسان، وأيهما كان الذكاء الاصطناعي؛ بناءً على طبيعة الاستجابات التي تلقوها. وأظهرت نتائج الدراسة أن نموذج "GPT-4.5" كان الأكثر نجاحًا في محاكاة الإنسان بنسبة 73%، فيما حقق نموذج "LLaMa-3.1-405B" أداءً جيدًا نسبيًا بنسبة 56% من الحالات.

بينما فشل النموذجان الآخران، وهما: ELIZA، وGPT-4o، في خداع المشاركين، إلا في نسب منخفضة بلغت 23% و21% من الحالات على التوالي؛ مما يشير إلى وجود اختلافات واضحة في قدرات هذه النماذج على توليد استجابات شبيهة بالبشر.

ويعود اختبار تورينج لعام 1948، عندما ابتكره عالم الحاسوب الإنجليزي آلان تورينج، حيث يقدم لعبة محاكاة للملاحظة والتقييم، ويحدد مدى ذكاء الآلات؛ إذ يمتلك الاختبار تاريخًا حافلًا بالخلافات لأنه يخلط بين محاكاة السلوك والتفكير الحقيقي.

إخترنا لك

أخبار ذات صلة

0 تعليق