اخبار مصر

صدى البلد

منوعات

Gemini 2.5 Flash.. كل ما تحتاج معرفته عن أحدث تقنيات تحرير الصور بالذكاء الاصطناعي

Gemini 2.5 Flash.. كل ما تحتاج معرفته عن أحدث تقنيات تحرير الصور بالذكاء الاصطناعي

klyoum.com

أعلنت شركة جوجل رسميا عن إطلاق نموذجها الجديد Gemini 2.5 Flash Image – الذي يلقبه مجتمع المطورين باسم nano-banana – في خطوة تعيد رسم ملامح مستقبل الصور المولدة بالذكاء الاصطناعي.

لا يقتصر النموذج الجديد على إنشاء صور جميلة من أوامر نصية، بل يتيح دمج صور متعددة في لقطة واحدة، والحفاظ على ثبات الشخصيات أو العناصر عبر عدة مشاهد، إلى جانب تحرير الصور باستخدام اللغة الطبيعية، مع الاستفادة من قاعدة معارف Gemini الواسعة لتحقيق دقة أكبر وواقعية أوضح.

عند طرح Gemini 2.0 Flash في وقت سابق من هذا العام، أعجب المطورون بسرعة النموذج وانخفاض تكلفته، لكنهم طالبوا بجودة أعلى وتحكم أوسع، الإصدار الجديد Gemini 2.5 Flash Image جاء استجابة مباشرة لهذه المطالب، حيث يعالج 3 تحديات رئيسية:

- الثبات: الحفاظ على هوية الشخصيات أو المنتجات أو العلامات التجارية عبر أكثر من صورة.

- الدقة: القدرة على تعديل أجزاء محددة من الصورة بمجرد أوامر نصية.

- المعرفة السياقية: فهم أعمق للعالم الواقعي يقلل من الأخطاء أو المعلومات غير الدقيقة.

- الحفاظ على اتساق الشخصيات عبر مشاهد متعددة.

- دمج الصور أو ما يعرف بـ multi-image fusion.

- تحرير مباشر بالاعتماد على الأوامر النصية (إزالة عنصر، تغيير تعبير، إصلاح تفاصيل).

- الاستفادة من المعرفة الواقعية لنماذج جوجل اللغوية في إنتاج صور أكثر دقة.

- قوالب جاهزة في Google AI Studio لتسهيل التجارب الأولية.

- إضافة علامة مائية غير مرئية بتقنية SynthID لضمان الاستخدام الأخلاقي.

- التسويق والإعلانات: صور منتجات متسقة عبر الحملات.

- المحتوى الإبداعي: شخصيات متكررة للقصص المصورة أو الفيديوهات.

- التجارة الإلكترونية: تصميم صور توضيحية للمنتجات في بيئات متعددة.

- التعليم: تحويل الرسومات الأولية إلى مخططات تعليمية دقيقة.

- المطورون: بناء أدوات تحرير صور مخصصة داخل AI Studio.

يتوفر Gemini 2.5 Flash للمطورين والمؤسسات بسعر 30 دولارا لكل مليون رمز إخراج، بينما تعادل تكلفة الصورة الواحدة نحو 0.039 دولار فقط.

أما داخل تطبيق Gemini، فيمكن للمستخدمين العاديين الاستفادة من القدرات الجديدة مباشرة من خلال الأوامر النصية، وتضيف جوجل علامة مائية مرئية وأخرى رقمية غير مرئية بتقنية SynthID لضمان الشفافية والتأكيد على أن الصور مولدة بالذكاء الاصطناعي.

النموذج متاح الآن عبر:

- Gemini API لدمج مباشر مع التطبيقات.

- Google AI Studio للتجارب السريعة.

- Vertex AI للاستخدام المؤسسي واسع النطاق.

*المصدر: صدى البلد | elbalad.news
اخبار مصر على مدار الساعة

حقوق التأليف والنشر © 2026 موقع كل يوم

عنوان: Armenia, 8041, Yerevan
Nor Nork 3st Micro-District,

هاتف:

البريد الإلكتروني: admin@klyoum.com