أطلقت شركة "أوبن إيه آي"OpenAI، نموذج جديد لتوليد الصور بدقة عالية بتقنية الذكاء الاصطناعي، ويعد نموذج GPT-Image 1.5 لتوليد الصور، قفزة ملحوظة في دقة فهم الأوامر النصية، والحفاظ على التفاصيل البصرية، وسرعة المعالجة مقارنةً بالإصدار السابق.
أقوى مولد صور بتقنية الذكاء الاصطناعي
ويقوم النموذج الجديد بتوليد الصور بسرعة تصل إلى أربعة أضعاف، وقد أصبح النموذج متاحًا الآن لكافة مستخدمي "شات جي بي تي" ChatGPT، بالإضافةً إلى المطوّرين عبر واجهة البرمجة (API).
وأبانت، الرئيسة التنفيذية لتطبيقات "أوبن إيه آي" OpenAI، فيدجي سيمو، إن قدرات توليد الصور الجديدة تشكّل جزءًا من تحوّل أوسع في "شات جي بي تي"، من أداة نصية تفاعلية إلى “واجهة توليدية متكاملة” تستدعي المكوّنات المناسبة تلقائيًا وفق ما يرغب المستخدم في إنجازه.
مميزات نموذج GPT-Image 1.5
وبحسب الشركة، يُجري نموذج GPT-Image 1.5 لتوليد الصور تعديلات محدّدة دون التأثير في بقية العناصر، مع الحفاظ على اتساق الإضاءة والتكوين والوجوه، ويدعم النموذج كذلك عمليات الإضافة والحذف والدمج والمزج ونقل العناصر داخل الصورة، وبات النموذج الجديد الآن أداة حقيقية للتعديل على الصور باستخدام الذكاء الاصطناعي:
- أسرع 4 مرات في إنشاء الصور مقارنة بالنموذج السابق.
- دقة أعلى في التعديل وفهم أفضل للطلبات المعقدة.
- يحافظ على التفاصيل الثابتة مثل "الوجوه، الأشياء، الأسلوب"، وغيرها.
- نتائج عالية الجودة، مرتبة ومفصلة أكثر.
- تحسين في التعامل مع textures "الإضاءة والعناصر الدقيقة".
- تعدد الاستخدامات حيث أنه مناسب للتصميم، التسويق، الرسوم التوضيحية، واجهات المستخدم/التجربة، ووسائل التواصل الاجتماعي، والنموذج متاح لجميع مستخدمي "شات جي بي تي" ChatGPT مجانًا.
التزام أعلى بالتعليمات التفصيلية
وأفادت الشركة، أن النموذج الجديد بات يلتزم بالتعليمات التفصيلية بدرجة أعلى؛ ففي اختبار يتطلّب ترتيب 36 عنصرًا مختلفًا داخل شبكة، نجح GPT-Image 1.5 في وضع العناصر بدقة، على عكس الإصدار السابق، مما يسهّل إنشاء صور تتطلب توزيعًا دقيقًا للعناصر، كما تحسّنت قدرة النموذج على عرض النصوص داخل الصور، ويشمل ذلك عرض نصوص أصغر وأكثر كثافة، مثل مقتطفات المقالات والجداول القصيرة والإنفوجرافيك الرقمية.
وبالرغم من هذه المميزات المذهلة، إلا أن شركة "أوبن إيه آي" OpenAI أقرت باستمرار بعض التحديات، مثل التعامل مع النصوص الطويلة، أو الخطوط غير الشائعة، أو تعدّد الوجوه داخل الصورة الواحدة، أو إنتاج محتوى بلغات متعددة.
اطلعي على: أوبن أيه آي تعلن عن متصفح جديد مدعوم بالذكاء الاصطناعي
يمكنكم متابعة آخر الأخبار عبر حساب سيدتي على منصة إكس





