×



klyoum.com
egypt
مصر  ١٦ أذار ٢٠٢٦ 

قم بالدخول أو انشئ حساب شخصي لمتابعة مصادرك المفضلة

ملاحظة: الدخول عن طريق الدعوة فقط.

تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

klyoum.com
egypt
مصر  ١٦ أذار ٢٠٢٦ 

قم بالدخول أو انشئ حساب شخصي لمتابعة مصادرك المفضلة

ملاحظة: الدخول عن طريق الدعوة فقط.

تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

موقع كل يوم »

اخبار مصر

»منوعات» صدى البلد»

نماذج OpenAI الجديدة أكثر ذكاء... لكنها "تتخيل" أكثر من اللازم

صدى البلد
times

نشر بتاريخ:  السبت ١٩ نيسان ٢٠٢٥ - ١٧:٠٣

نماذج OpenAI الجديدة أكثر ذكاء... لكنها تتخيل أكثر من اللازم

نماذج OpenAI الجديدة أكثر ذكاء... لكنها "تتخيل" أكثر من اللازم

اخبار مصر

موقع كل يوم -

صدى البلد


نشر بتاريخ:  ١٩ نيسان ٢٠٢٥ 

رغم أن نماذج الذكاء الاصطناعي الجديدة من OpenAI، والمعروفة باسم o3 وo4-mini، تعد من أحدث ما توصلت إليه الشركة في مجال القدرات المنطقية والتحليلية، إلا أن المفاجأة كانت في ارتفاع معدل 'الهلاوس' أو المعلومات المختلقة التي تصدر عنها مقارنة بنماذج الشركة السابقة.

تعد الهلاوس هي واحدة من أبرز التحديات التي تواجه الذكاء الاصطناعي اليوم، وتعني تقديم معلومات خاطئة أو غير واقعية بثقة تامة، ورغم أن التوقعات كانت تشير إلى تحسن هذه النقطة مع كل جيل جديد، إلا أن o3 وo4-mini كسرا هذه القاعدة.

وفقا لتقارير OpenAI الداخلية، أظهرت النماذج الجديدة أداء مميزا في بعض المهام مثل حل المشكلات الرياضية وكتابة الشيفرات البرمجية، ولكن بسبب ميلها لتقديم عدد أكبر من 'الادعاءات' أو المعلومات، فإن ذلك يؤدي أيضا إلى زيادة احتمالية وقوعها في الخطأ والهلاوس.

على سبيل المثال، أظهر نموذج o3 معدل هلاوس وصل إلى 33% عند اختباره على معيار داخلي لدى OpenAI يعرف بـPersonQA، والذي يقيس مدى دقة معرفة النموذج بالمعلومات عن الأشخاص، وهذا المعدل يعادل ضعف ما سجلته النماذج السابقة مثل o1 وo3-mini، أما o4-mini فقد كان الأسوأ، حيث بلغ معدل الهلاوس لديه 48%.

مشكلة الهلاوس لم تمر دون ملاحظة من المختبرات الخارجية، حيث لاحظت مؤسسة Transluce غير الربحية، والمتخصصة في أبحاث الذكاء الاصطناعي، أن نموذج o3 يخترع خطوات وهمية يدعي القيام بها، مثل 'تشغيل كود على جهاز ماك بوك برو'، رغم أن النموذج لا يملك هذه الإمكانية التقنية.

وقالت سارة شفيتمان، الشريكة المؤسسة لـ Transluce، إن هذا السلوك قد يجعل النموذج أقل موثوقية في بعض السيناريوهات، خاصة في المجالات التي تتطلب دقة عالية مثل القانون أو الطب.

أما الأستاذ الجامعي في جامعة ستانفورد والمدير التنفيذي لمنصة Workera، كيان كتانفوروش، فأوضح أن فريقه يختبر نموذج o3 في عمليات كتابة الكود، وأكد أنه متفوق على المنافسين من حيث الكفاءة، لكنه يعاني من اختلاق روابط مواقع إلكترونية غير موجودة.

من الحلول المطروحة لتقليل الهلاوس، تمكين النماذج من الوصول إلى الإنترنت عند الحاجة، إذ يظهر نموذج GPT-4o، عند تمكين ميزة البحث عبر الإنترنت، دقة تصل إلى 90% في اختبارات مثل SimpleQA.

لكن إذا استمر الاتجاه نحو النماذج المنطقية ذات القدرات التحليلية المرتفعة، فقد يعني ذلك ارتفاعا إضافيا في معدلات الهلاوس، ما يجعل حل هذه المعضلة أكثر إلحاحا من أي وقت مضى.

وأكد متحدث باسم OpenAI، نيكو فيليكس، أن 'مشكلة الهلاوس لا تزال من أولويات فرق البحث لدينا، ونعمل باستمرار على تحسين دقة وموثوقية النماذج'.

نماذج OpenAI الجديدة أكثر ذكاء... لكنها تتخيل أكثر من اللازم نماذج OpenAI الجديدة أكثر ذكاء... لكنها تتخيل أكثر من اللازم
موقع كل يومموقع كل يوم

أخر اخبار مصر:

بسبب ماس كهربائي | الحماية المدنية تسيطر على حريق شقة سكنية بالبحيرة

* تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

* جميع المقالات تحمل إسم المصدر و العنوان الاكتروني للمقالة.

موقع كل يوم
12

أخبار كل يوم

lebanonKlyoum.com is 2328 days old | 1,395,574 Egypt News Articles | 21,142 Articles in Mar 2026 | 760 Articles Today | from 24 News Sources ~~ last update: 18 min ago
klyoum.com

×

موقع كل يوم


مقالات قمت بزيارتها مؤخرا



نماذج OpenAI الجديدة أكثر ذكاء... لكنها تتخيل أكثر من اللازم - eg
نماذج OpenAI الجديدة أكثر ذكاء... لكنها تتخيل أكثر من اللازم

منذ ٠ ثانية


اخبار مصر

ارتفاع قتلى احتجاجات إيران- تفاصيل - jo
ارتفاع قتلى احتجاجات إيران- تفاصيل

منذ ثانية


اخبار الاردن

رئيس الطائفة الإنجيلية يهنئ الحكومة الجديدة - eg
رئيس الطائفة الإنجيلية يهنئ الحكومة الجديدة

منذ ثانية


اخبار مصر

التعامل مع حريق في مستودع أخشاب بالقويسمة - jo
التعامل مع حريق في مستودع أخشاب بالقويسمة

منذ ثانيتين


اخبار الاردن

مواليد عام 2009 غادر منزله ولم يعد - lb
مواليد عام 2009 غادر منزله ولم يعد

منذ ثانيتين


اخبار لبنان

 الصحة : شهيد و8 جرحى في غارتين - lb
الصحة : شهيد و8 جرحى في غارتين

منذ ٣ ثواني


اخبار لبنان

طريقة عمل الباستا فلورا بالمربى بمذاق لا يقاوم - eg
طريقة عمل الباستا فلورا بالمربى بمذاق لا يقاوم

منذ ٤ ثواني


اخبار مصر

 حزب الله يطرق أبواب السعودية - sa
حزب الله يطرق أبواب السعودية

منذ ٤ ثواني


اخبار السعودية

دعي إليها النواب ...مأدبة إفطار جماعي تثير الجدل - tn
دعي إليها النواب ...مأدبة إفطار جماعي تثير الجدل

منذ ٤ ثواني


اخبار تونس

 تسلا تدخل رسميا إلى السوق المغربية - lb
تسلا تدخل رسميا إلى السوق المغربية

منذ ٥ ثواني


اخبار لبنان

بسبب وصلة رقص.. ميس دعاء تتعرض للانتقادات - xx
بسبب وصلة رقص.. ميس دعاء تتعرض للانتقادات

منذ ٦ ثواني


لايف ستايل

مايا دياب تعلن موعد زفافها؟ (صور) - lb
مايا دياب تعلن موعد زفافها؟ (صور)

منذ ٦ ثواني


اخبار لبنان

* تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

* جميع المقالات تحمل إسم المصدر و العنوان الاكتروني للمقالة.






لايف ستايل