أداة تعمل بالذكاء الاصطناعي يمكنها تحويل الرسائل النصية إلى أعمال فنية

تحويل الرسائل النصية لأعمال فنية
تحويل الرسائل النصية لأعمال فنية

قام خبراء بتطوير أداة ذكاء اصطناعي يمكنها تحويل اللوحات الشهيرة إلى أنماط فنية مختلفة، أو إنشاء أعمال فنية جديدة من رسائل نصية، مبينين أنّ هذه الأداة تستخدم "لغة سرية".

مختبر الذكاء الاصطناعي


وبحسب صحيفة ديلي ميل البريطانية تم إطلاق تطبيق تحويل النص إلى صورة بواسطة مختبر الذكاء الاصطناعي "أوبن آل" الشهر الماضي، وهو قادر على إنشاء العديد من الصور الواقعية والأعمال الفنية من رسالة نصية واحدة. كما أنه قادر على إضافة كائنات إلى الصور الموجودة، أو حتى توفير وجهات نظر مختلفة على صورة موجودة.

الكلمات المبهمة تنتج صورًا محددة


يشار إلى أنّ الباحثين يعتقدون أنهم ربما اكتشفوا كيفية عمل التكنولوجيا، بعد اكتشاف أنّ الكلمات المبهمة تنتج صورًا محددة. واستخدم طالب الدكتوراه في علوم الكمبيوتر "جيانيس داراس" البرنامج في البداية لإنشاء صور تحتوي على نص بداخلها عن طريق طلب "تسميات توضيحية" أو "ترجمات"، ثم احتوت الصور الناتجة على ما بدا أنه تسلسل عشوائي من الحروف. إلا أنه وعندما أعاد إدخال هذه الأحرف إلى التطبيق وجد أنّ التطبيق ينتج صورًا لنفس الموضوع أو المشهد، مما يعني أنها لم تكن عشوائية على الإطلاق. على سبيل المثال، إذا كتبت Vicootes، فستحصل على سلسلة من صور الخضراوات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، وستنتج عبارة Apoploe vesrreaitars طيورًا.

تطبيق (DALL-E 2)


يشير هذا إلى أن تطبيق (DALL-E 2) يمكن أن يعمل عن طريق ترجمة النص المدخل إلى لغته الخاصة، والتي يستخدمها بعد ذلك لإنشاء الصور التي نراها.

وكانت شركة أوبن آل قد أمضت عامين في بناء تطبيق (DALL-E 2) الذي يعتمد على الشبكات العصبية الاصطناعية (ANNs) تحاول هذه الشبكات محاكاة الطريقة التي يعمل بها الدماغ من أجل التعلم، وتستخدم أيضًا في المساعدين الأذكياء مثل سيري وكورتانا.

ويمكن تدريب الشبكات العصبية الاصطناعية على التعرف على أنماط المعلومات، بما في ذلك الكلام أو البيانات النصية أو الصور المرئية، وهي الأساس لعدد كبير من التطورات في الذكاء الاصطناعي خلال السنوات الأخيرة.

جمع بيانات ملايين الصور


تجدر الإشارة إلى أنّ مطورو "أوبن آل" قاموا بجمع بيانات عن ملايين الصور للسماح لخوارزمية تطبيق ( DALL-E) بمعرفة الشكل الذي من المفترض أن تبدو عليه الكائنات المختلفة ووضعها معًا في النهاية.

فعندما يقوم المستخدم بإدخال نص ما لـ DALL-E لإنشاء صورة منه، فإنه يلاحظ سلسلة من الميزات الرئيسية التي يمكن أن تكون موجودة، ثم تقوم شبكة عصبية ثانية، تُعرف بنموذج الانتشار، بإنشاء الصورة وتوليد وحدات البكسل اللازمة لتصورها وتكرارها.

إلا أنّ بعض الكلمات التي ينتجها البرنامج بنفسه مشتقة من اللاتينية فعلى سبيل المثال كلمة Apoploeالتي تولد صورًا للطيور، تشبه كلمة Apodidae، وهي كلمة لاتينية تتعلق بعائلة من أنواع الطيور. وتعمل العديد من لغات الذكاء الاصطناعي عن طريق تقسيم نص الإدخال إلى الرموز التي تطبق المعنى عليها.



يمكنكم متابعة آخر الأخبار عبر تويتر "سيدتي"