اخبار السعودية
موقع كل يوم -صحيفة الوئام الالكترونية
نشر بتاريخ: ٣١ أب ٢٠٢٥
في عالم تتفاخر فيه شركات الذكاء الاصطناعي بقدرة نماذجها على اجتياز أصعب الاختبارات الأكاديمية وحل مسائل الفيزياء المعقدة، تم الكشف عن 'كعب أخيل' الرقمي الذي يفضح العجز المحرج لهذه النماذج: لغز بسيط ومجموعة من ألعاب الفيديو التي يحلها البشر في ثوانٍ.
هذا السلاح الفاضح هو اختبار 'مجموعة التجريد والاستدلال' (ARC)، وهو معيار صناعي صممه الباحث فرانسوا شوليه عام 2019 ليس لقياس المعرفة المخزنة، بل لاختبار جوهر الذكاء الحقيقي: القدرة على التعميم.
يستهدف الاختبار قدرة الذكاء الاصطناعي على تعلم مهارة جديدة من خلال مثال أو اثنين فقط وتطبيقها على موقف جديد لم يره من قبل، وهي قدرة بديهية لدى البشر، لكنها تمثل ثقبًا أسود في منطق أذكى النماذج الحالية.
يؤكد غريغ كامرادت، رئيس مؤسسة ARC Prize، أن نماذج متطورة مثل 'Grok' تمتلك 'ذكاءً متقطعًا'؛ فهي تبهرنا في المهام التي تدربت عليها، لكنها تنهار أمام المجهول. ويقول: 'الخوارزمية التي تعمل في رأس الإنسان أفضل وأكثر كفاءة بأضعاف المرات مما نراه في الذكاء الاصطناعي الآن'.
تُظهر الأرقام حجم الفجوة بوضوح؛ فبينما يحقق الإنسان العادي متوسط 66% في اختبار (ARC-AGI-2)، لا تزال أقوى النماذج الاصطناعية تكافح للوصول إلى هذه النتيجة.
ولم يتوقف الأمر عند هذا الحد، بل تم تصعيد التحدي. فقد كشفت المؤسسة عن اختبار جديد (ARC-AGI-3) يتكون من 100 لعبة فيديو مبتكرة وبسيطة، حيث كانت النتيجة النهائية هي الإذلال الكامل، فبحسب كامرادت: 'حتى الآن، لم يتمكن ذكاء اصطناعي واحد من التغلب على مستوى واحد في أي من هذه الألعاب التي يجيدها البشر'.