×



klyoum.com
egypt
مصر  ٢٢ أذار ٢٠٢٦ 

قم بالدخول أو انشئ حساب شخصي لمتابعة مصادرك المفضلة

ملاحظة: الدخول عن طريق الدعوة فقط.

تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

klyoum.com
egypt
مصر  ٢٢ أذار ٢٠٢٦ 

قم بالدخول أو انشئ حساب شخصي لمتابعة مصادرك المفضلة

ملاحظة: الدخول عن طريق الدعوة فقط.

تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

موقع كل يوم »

اخبار مصر

»سياسة» صدى البلد»

اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini

صدى البلد
times

نشر بتاريخ:  الخميس ٢٢ كانون الثاني ٢٠٢٦ - ١٠:٤٤

اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini

اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini

اخبار مصر

موقع كل يوم -

صدى البلد


نشر بتاريخ:  ٢٢ كانون الثاني ٢٠٢٦ 

مع التوسع المتسارع في استخدام أدوات الذكاء الاصطناعي، بات من الصعب على المستخدم غير المتخصص التمييز بين قدرات النماذج المختلفة، خاصة عند المقارنة بين اثنين من أكبر الأسماء في هذا المجال: ChatGPT من شركة OpenAI وGemini التابع لشركة Google.

وتزداد حدة هذه المقارنات في ظل التحديثات المتلاحقة التي قد تُغير موازين الأداء خلال فترات قصيرة، كما حدث مؤخرًا بعد إطلاق الإصدار ChatGPT-5.2.

وللخروج من دائرة الانطباعات الشخصية والتجارب الفردية، يعتمد الخبراء على الاختبارات المعيارية (Benchmarks)، وهي أدوات تقييم محايدة تقيس قدرات الذكاء الاصطناعي في مجالات مثل التفكير المنطقي، وحل المشكلات، والاستدلال المجرد.

يُعد ChatGPTنموذج ذكاء اصطناعي توليدي طورته شركة OpenAI، ويعتمد على نماذج لغوية متقدمة قادرة على فهم السياق وتحليل اللغة الطبيعية وتقديم إجابات تتطلب تفكيرًا منطقيًا واستدلالًا عميقًا. ويُستخدم على نطاق واسع في مجالات التعليم، والبرمجة، وصناعة المحتوى، والتحليل.

في المقابل، طورت شركة Google نظام Gemini ليكون منصة ذكاء اصطناعي متعددة الوسائط، تجمع بين معالجة النصوص وتحليل البيانات والتكامل مع خدمات البحث، مع تركيز خاص على الاندماج داخل منظومة Googleالرقمية، ويُستخدم في البحث الذكي وتوليد المحتوى وتحليل المعلومات.

يُعد اختبار GPQA Diamond من أبرز المعايير التي تقيس قدرات التفكير العلمي المتقدم، حيث يضم أسئلة على مستوى الدكتوراه في الفيزياء والكيمياء والأحياء، وتتميز بكونها غير قابلة للبحث المباشر عبر الإنترنت، بل تتطلب ربطًا عميقًا بين مفاهيم علمية متعددة.

ووفقًا لنتائج الاختبار، حقق ChatGPT-5.2 نسبة 92.4%، متفوقًا بفارق محدود على Gemini 3 Proالذي سجل 91.9%.

وللمقارنة، يبلغ متوسط أداء خريجي الدكتوراه نحو 65%، بينما لا يتجاوز أداء غير المتخصصين 34%.

في مجال البرمجة، يُعد اختبار SWE-Bench Pro من أكثر الاختبارات تعقيدًا، لاعتماده على مشكلات حقيقية مأخوذة من منصة GitHub، وتشمل شيفرات معقدة وتقارير أعطال واقعية تتطلب فهمًا دقيقًا للبنية البرمجية.

وأظهرت النتائج أن ChatGPT-5.2 تمكن من حل نحو 24% من هذه المشكلات، مقابل 18% فقط لصالح Gemini.

ورغم أن هذه النسب قد تبدو محدودة، فإن طبيعة الاختبار الصعبة تفسر ذلك، إذ لا تزال هذه المهام تتطلب خبرة بشرية عالية.

في اختبار ARC-AGI-2، المصمم لقياس القدرة على استنتاج الأنماط المجردة من عدد محدود من الأمثلة، سجل ChatGPT-5.2 Pro نتيجة 54.2%.

في المقابل، لم يتجاوز أداء Gemini 3 Pro نسبة 31.1%، بينما اقتربت بعض الإصدارات الأعلى تكلفة من Geminiمن هذه النتائج دون أن تتفوق عليها.

ويُعد هذا النوع من الاختبارات من أصعب التحديات أمام نماذج الذكاء الاصطناعي، ما يجعل هذا الفارق مؤشرًا لافتًا على تطور قدرات ChatGPT في مجالات التفكير غير التقليدي.

اعتمد التحليل على أحدث الإصدارات المدفوعة من كلا النظامين، مع التركيز على الاختبارات المعيارية المعتمدة بدلًا من الاستخدامات اليومية أو التفضيلات الشخصية.

ورغم وجود مجالات أخرى يظهر فيها تفوق Gemini، فإن هذه الاختبارات الثلاثة تمثل مزيجًا مهمًا من التفكير العلمي العميق، وحل المشكلات الواقعية، والاستدلال المجرد.

اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini
موقع كل يومموقع كل يوم

أخر اخبار مصر:

أول قرار من الأهلي المصري بعد كارثة الخروج من دوري أبطال إفريقيا

* تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

* جميع المقالات تحمل إسم المصدر و العنوان الاكتروني للمقالة.

موقع كل يوم
10

أخبار كل يوم

lebanonKlyoum.com is 2333 days old | 1,402,176 Egypt News Articles | 27,744 Articles in Mar 2026 | 191 Articles Today | from 24 News Sources ~~ last update: 4 min ago
klyoum.com

×

موقع كل يوم


مقالات قمت بزيارتها مؤخرا



اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini - eg
اختبارات معيارية تحسم الجدل.. 3 مجالات يتفوق فيها Chat GPT على Gemini

منذ ثانية


اخبار مصر

أحمد فتوح يكشف كواليس إصابته في أمم أفريقيا: لعبت وأنا مصاب - eg
أحمد فتوح يكشف كواليس إصابته في أمم أفريقيا: لعبت وأنا مصاب

منذ ثانية


اخبار مصر

لقاء حار بين مربي حيونات وقردته بعد غياب أسبوعين .. فيديو - sa
لقاء حار بين مربي حيونات وقردته بعد غياب أسبوعين .. فيديو

منذ ثانية


اخبار السعودية

كأس إفريقيا للأمم لكرة اليد: المنتخب ينتصر على غينيا ويتأهل للدور الرئيسي - tn
كأس إفريقيا للأمم لكرة اليد: المنتخب ينتصر على غينيا ويتأهل للدور الرئيسي

منذ ثانية


اخبار تونس

 فاليوسترات : نمو أسعار الفلل في دبي يواصل التفوق على الشقق خلال 2026 - ae
فاليوسترات : نمو أسعار الفلل في دبي يواصل التفوق على الشقق خلال 2026

منذ ثانية


اخبار الإمارات

رقم تاريخي جديد ينتظر محمد صلاح في مباراة ليفربول ونيوكاسل.. ما هو؟ - eg
رقم تاريخي جديد ينتظر محمد صلاح في مباراة ليفربول ونيوكاسل.. ما هو؟

منذ ثانية


اخبار مصر

الزمالك يدرس ضم أحمد ربيع لتعويض غيابات الوسط قبل القمة - eg
الزمالك يدرس ضم أحمد ربيع لتعويض غيابات الوسط قبل القمة

منذ ثانية


اخبار مصر

نجم الزمالك يرد على شائعات انتقاله للأهلي : دايما بجدد للزمالك - eg
نجم الزمالك يرد على شائعات انتقاله للأهلي : دايما بجدد للزمالك

منذ ثانيتين


اخبار مصر

 زي القبر .. أرملة الشهيد يحيى عياش تكشف فصول التنكيل بسجون الاحتلال - ps
زي القبر .. أرملة الشهيد يحيى عياش تكشف فصول التنكيل بسجون الاحتلال

منذ ثانيتين


اخبار فلسطين

اكتشاف جديد من الألومنيوم قد يغير مستقبل الصناعة العالمية.. ما القصة؟ - eg
اكتشاف جديد من الألومنيوم قد يغير مستقبل الصناعة العالمية.. ما القصة؟

منذ ثانيتين


اخبار مصر

* تعبر المقالات الموجوده هنا عن وجهة نظر كاتبيها.

* جميع المقالات تحمل إسم المصدر و العنوان الاكتروني للمقالة.






لايف ستايل