اخبار السعودية
موقع كل يوم -صحيفة الوئام الالكترونية
نشر بتاريخ: ٢٨ أيلول ٢٠٢٥
أعلنت شركة آبل عن تطوير نموذج ذكاء اصطناعي جديد يحمل اسم Manzano، يهدف إلى الجمع بين فهم الصور وتوليدها في آن واحد، في خطوة تعكس توجه الشركة نحو تعزيز تقنياتها في مجال الذكاء الاصطناعي متعدد الوسائط.
ورغم أن النموذج لم يُطرح بعد للاستخدام العام، ولم تُطلق الشركة نسخة تجريبية له، فإنها نشرت ورقة بحثية تضمنت تفاصيل بنيته، إضافة إلى عينات صور منخفضة الدقة لمقارنة أدائه مع نماذج مفتوحة المصدر مثل Deepseek Janus Pro، وأنظمة تجارية مثل GPT-4o وGemini 2.5 Flash Image Generation.
يعتمد Manzano على مرمّز هجين قادر على إنتاج نوعين من الرموز: رموز مستمرة لفهم الصور، وأخرى منفصلة لتوليدها، ما يتيح تقليل التعارض بين المهمتين. ويتكون النموذج من ثلاثة مكونات رئيسية: المرمّز الهجين، ونموذج لغوي موحد، ومُفكك صور مستقل.
وطورت آبل ثلاث نسخ من مُفكك الصور بأحجام مختلفة (0.9 و1.75 و3.52 مليار معلمة)، تدعم دقة تبدأ من 256 بكسل حتى 2048 بكسل. كما دُرّب النظام على 1.6 تريليون رمز مأخوذة من مليارات أزواج الصور والنصوص.
أظهرت الاختبارات الأولية أن Manzano يتفوق في مهام تحليل الوثائق والرسوم البيانية، إضافة إلى نجاحه في اختبارات معيارية مثل ScienceQA وMMMU. كما أثبت قدرته على توليد الصور بمرونة عالية، بما يشمل نقل الأنماط الفنية، الإكمال، التوسيع وتقدير العمق. ويتحسن الأداء تدريجيًا مع زيادة حجم النموذج، ليصل إلى 30 مليار معلمة.
تؤكد آبل أن Manzano يمثل خطوة استراتيجية نحو تطوير أنظمة أكثر تقدمًا بفضل بنيته المعيارية القابلة للتطوير، لكنها اعترفت في الوقت نفسه بأن نماذجها لا تزال متأخرة عن بعض المنافسين، ما دفعها إلى الاستعانة بـGPT-5 من OpenAI لدعم مزايا Apple Intelligence في نظام iOS 26.
ورغم أن Manzano يعكس قفزة تقنية واعدة، إلا أن نجاحه في تقليل اعتماد آبل على النماذج الخارجية سيظل مرهونًا بالتحديثات والتجارب المستقبلية.