اخبار السعودية
موقع كل يوم -صحيفة الوئام الالكترونية
نشر بتاريخ: ٣ أيار ٢٠٢٥
كشفت شركة جوجل في تقرير تقني حديث أن أحد نماذج الذكاء الاصطناعي الجديدة التي طورتها، والمعروف باسم 'جيميناي – Gemini 2.5 Flash'، أظهر تراجعًا في أدائه على صعيد اختبارات السلامة مقارنة بالإصدار السابق .
ووفقًا للتقرير، فإن النموذج الجديد كان أكثر ميلًا لإنتاج محتوى ينتهك إرشادات السلامة التي وضعتها الشركة، وذلك وفقًا لاختبارين آليين يتم من خلالهما قياس مدى التزام النموذج بتلك السياسات.
وسجل Gemini 2.5 Flash تراجعًا بنسبة 4.1% في معيار 'السلامة في تحويل النص إلى نص'، و9.6% في معيار 'السلامة في تحويل الصورة إلى نص'.
وأكدت جوجل أن النموذج الجديد يؤدي بشكل أضعف في اختبارات السلامة المتعلقة بالنصوص والصور، موضحة أن هذه النتائج جاءت في وقت تسعى فيه العديد من شركات الذكاء الاصطناعي لجعل نماذجها أكثر مرونة في الاستجابة للمواضيع الحساسة أو المثيرة للجدل.
وأشار التقرير إلى أن Gemini 2.5 Flash، والذي لا يزال في مرحلة المعاينة، أصبح أكثر طاعة للتعليمات، حتى عندما تتضمن تلك التعليمات محتوى يخالف السياسات المعتمدة.
وقالت الشركة إن بعض التراجعات قد تعود لما يُعرف بـ'النتائج الإيجابية الكاذبة'، لكنها أقرت بأن النموذج قد ينتج محتوى مخالفًا في حال تم الطلب منه صراحة.
وتعرضت جوجل سابقًا لانتقادات بسبب ممارساتها في تقارير السلامة. فقد استغرقت وقتًا طويلًا لنشر تقرير تقني عن نموذجها الأقوى Gemini 2.5 Pro، وعندما نُشر لاحقًا، لم يتضمن في البداية تفاصيل مهمة تتعلق بالاختبارات الخاصة بالسلامة.
وفي وقت لاحق، نشرت الشركة تقريرًا أكثر تفصيلًا يتضمن معلومات إضافية، حيث تضمنت النقاشات كيفية التوازن بين كفاءة الذكاء الاصطناعي والالتزام بالمعايير الأخلاقية والسياسات مستمرة، وسط مطالبات بزيادة الشفافية وضبط الاستخدام.