mena-gmtdmp

السعودية تتصدر قائمة الدول المطوّرة للنماذج اللغوية العربية في 2025

الرياض عاصمة المملكة العربية السعودية - الصورة من منصة الصور السعودية
الرياض عاصمة المملكة العربية السعودية - الصورة من منصة الصور السعودية

استعرضت دراسة حديثة أجرتها الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا"، بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، الدور المحوري للنماذج اللغوية العربية الكبيرة في تمكين حضور اللغة العربية في الفضاءات الرقمية وتعزيز قدرتها على المنافسة عالميًا، بما يدعم حضور اللغة العربية في البيئة الرقمية، ويسرّع تبنّي الابتكار في المؤسسات، مبينة تصدر المملكة قائمة الدول المطوّرة للنماذج اللغوية العربية عام 2025.

واستهدفت الدراسة دعم تطوير منظومة الذكاء الاصطناعي باللغة العربية، وتحديد متطلبات تطوير نماذج أكثر قدرة على فهم اللغة العربية ولهجاتها المتنوعة، وتوليد المحتوى وتنفيذ التعليمات.

تأتي هذه الدراسة في إطار التعاون بين "سدايا" ومجمع الملك سلمان العالمي للغة العربية، كخطوة نوعية تعكس اهتمام السعودية بالجمع بين الهوية اللغوية والثقافية والتطور التقني، والعمل على ضمان حضور اللغة العربية في منظومة الذكاء الاصطناعي العالمية.

تطور النماذج اللغوية العربية في السعودية

وحسب ما ذكر في وكالة الأنباء السعودية "واس"، فإن الدراسة سلطت الضوء على تاريخ تطور النماذج اللغوية العربية منذ بداياتها اعتمادًا على الأنظمة القائمة على القواعد قبل عام 2000، مرورًا بالنماذج الإحصائية والشبكات العصبية، وصولًا إلى مرحلة النماذج اللغوية الكبيرة وتطبيقاتها التوليدية المعاصرة خلال الفترة من 2022 حتى 2025، وجاء التركيز على هذه المرحلة تحديدًا كونها شهدت إطلاق عشرات النماذج العربية، من بينها نماذج حوارية وأخرى توليدية موجّهة لدعم الاحتياج العربي في المجالات التقنية والتعليمية والمعرفية.

ورصدت الدراسة أكثر من 53 نموذجًا لغويًا عربيًا حتى الربع الأول من عام 2025، وتصدرت المملكة العربية السعودية قائمة الدول المطوّرة لهذه النماذج، الأمر الذي عزّز مكانة المملكة باعتبارها مركزًا إقليميًا رائدًا في تطوير تقنيات اللغة العربية وتمكين المحتوى العربي الرقمي.

وأظهرت التحليلات ضعف الاستثمار في النماذج اللغوية العربية الداعمة للصيغ الصوتية والبصرية، رغم أهميتها المستقبلية، إذ كانت 81% من هذه النماذج أحادية الوسائط وتتعامَل مع النصوص فقط، فيما كانت نسبة النماذج متعددة الوسائط 7%.

أما من ناحية القدرات، فقد أوضحت الدراسة أن النماذج اللغوية العربية تضمنت 3 مهام رئيسية، وهي: فهم اللغة، وتوليد المحتوى، والمحادثة وتنفيذ التعليمات، بينما لا تزال القدرات المعرفية والاستدلالية وتعدد اللغات والدعم البرمجي منخفضة المستوى مقارنة بالنماذج اللغوية العالمية.

الوضع الراهن للنماذج العربية

استعرضت الدراسة الوضع الراهن للنماذج العربية، مشيرةً إلى وجود نماذج مطوّرة في دول عربية أبرزها المملكة العربية السعودية والإمارات، إضافةً إلى نماذج طُوِّرت في جهات دولية داعمة للغة العربية.

على الجانب الآخر، كشفت الدراسة عن وجود فجوات أبرزها محدودية أحجام النماذج وعدد معاملاتها مقارنة بالنماذج العالمية، وافتقار البيانات العربية الشاملة، وندرة المقاييس المرجعية العربية المتخصصة في تقييم الأداء.

ووضعت الدراسة خارطة طريق توضّح خطوات عملية لتحقيق الريادة للنماذج اللغوية العربية الكبيرة، من خلال الاستثمار في الآتي:

  • التركيز على توفير البيانات العربية بجودة عالية وشمولية لمختلف اللهجات والمجالات.
  • تطوير نماذج لغوية متعددة القدرات وأحجام متنوعة.
  • بناء مقاييس مرجعية عربية لتقييم جودة النماذج.
  • دعم تبنّي النماذج العربية محليًا عبر المؤسسات الحكومية والخاصة، ونشرها للاستخدام المجتمعي.

الجدير بالذكر أنه، وفقًا لنتائج تقييم المقياس المعياري "بلسم" الصادر عن مجمع الملك سلمان العالمي للغة العربية التي تقارن أداء النماذج اللغوية العربية بنظيراتها العالمية في المهام اللغوية العربية، فقد أظهرت تفوق النماذج العالمية في أغلبية فئات المهارات اللغوية، وعكست في الوقت ذاته النتائج نقاط قوة واعدة لبعض النماذج العربية في بعض المهام النوعية، وتفوقت بشكل طفيف في مهارة التلخيص، فيما قدمت أداءً مقاربًا في مهام الكتابة الإبداعية والفهم القرائي.

تابعي أيضا وضع حجر الأساس لأكبر مركز بيانات حكومي في العالم من حيث الطاقة الاستيعابية بالميجاواط في الرياض

يمكنكم متابعة آخر الأخبار عبر حساب سيدتي على منصة إكس