انطلاق نموذج Jais 2 لتعزيز الذكاء الاصطناعي العربي
أحدث نموذج لغة عربي كبير مفتوح الوزن يعزّز الفهم والطّلاقة في الفصحى واللّهجات المحليّة، ويتيح استخداماتٍ واقعيّةً ومتقّدمةً في المحتوى الرّقميّ والإبداعيّ
أطلقت شركة إنسبشن (Inception) الإماراتية، التابعة لمجموعة G42، نموذج جيس 2 (Jais 2) بالتعاون مع شركة Cerebras Systems الأمريكية المتخصصة في الحوسبة بالذكاء الاصطناعي، ومع معهد نماذج الأساس (Institute of Foundation Models) التابع لجامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) في أبوظبي.
يمثل النموذج الجديد أحدث خطوة في تطوير نموذج اللغة الكبير المفتوح الوزن المخصص للغة العربية. بُني النموذج على 70 مليار معامل وتم تدريبه على مجموعة بيانات تركز على اللغة العربية، وسيكون متاحاً للتحميل عبر صفحة إنسبشن على منصة HuggingFace الأمريكية للذكاء الاصطناعي، وأيضاً من خلال تطبيق الشركة على الويب.
يقدّم جيس 2 بنية معاد تصميمها وبيانات أنظف، ما يعزز قدرة النموذج على الاستدلال والطلاقة في اللغة العربية الفصحى واللهجات الإقليمية. كما يُظهر أداءً ثابتاً في اللغة الإنجليزية، وتم تدريبه للتعامل مع الأنماط اللغوية الواقعية مثل التناوب بين اللغات (code-switching) والأسلوب غير الرسمي، مع الحفاظ على الكفاءة التقنية والإبداعية.
وفقاً للمطورين، يتضمّن النموذج المحدث إطاراً يركز على السلامة، يعتمد على توجيه التعليمات (instruction-tuning)، والتقييم المستمر، وردود المستخدمين. وقالوا إن جيس 2 يُظهر أداءً جيداً عبر مجموعة واسعة من المحتوى العربي، من الشعر والمراجع الثقافية إلى أسلوب الكتابة على وسائل التواصل الاجتماعي، ما يعكس اللغة كما تُستخدم في الحياة اليومية والتعبير المعاصر.
وقال أشيش كوشي (Ashish Koshy)، الرئيس التنفيذي لإنسبشن (Inception): "كان استخدام اللغة العربية في الذكاء الاصطناعي تاريخيّاً محدوداً بسبب قلة البيانات وتمثيلها المجزأ. كما يعالج جيس 2 هذه القيود من خلال تقديم عمق ودقة سياقية غير مسبوقة للغة. من اللهجات إلى النبرة، يفهم النموذج العربية كما تُستخدم منطوقة ومكتوبة وواقعية. ونحن فخورون جدّاً بتقديم نظام يُسرّع الابتكار لملايين الأشخاص في المنطقة وخارجها".
وقالت ناتاليا فاسيلييفا (Natalia Vassilieva)، نائبة الرئيس والمديرة التقنية الميدانية في Cerebras Systems: "يبرز جيس القيادة المتنامية للإمارات في بناء أنظمة ذكاء اصطناعي متقدمة مفتوحة الوزن. ونحن فخورون بأنّ جيس 2 تم تدريبه ويُقدّم الآن عبر أنظمة Cerebras، بالتعاون الوثيق مع شركائنا في الإمارات. ومن خلال دمج خبراتهم مع تقنيات التعلم الآلي المدعومة بأجهزة Cerebras، تمكنا من تحقيق جودة متقدمة باستخدام جزء صغير فقط من الموارد الحسابية التي استُخدمت سابقاً لتدريب نماذج مماثلة الحجم. الزخم في الإمارات مذهل، ونحن ملتزمون بدعم هذا النظام البيئي عبر حوسبة فعالة وتعاون عميق لتعزيز الابتكار وتوسيع الوصول إلى الذكاء الاصطناعي عالي الأداء".
كما أضاف البروفيسور بريسلاف ناكوف (Preslav Nakov)، رئيس قسم ومعلم معالجة اللغة الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI): "لطالما كانت العربية غير ممثلة بشكل كافٍ في تطوير الذكاء الاصطناعي بسبب نقص البيانات عالية الجودة لتدريب النماذج الكبيرة. اليوم، ومع جيس، نحقق تقدّماً حاسماً للذكاء الاصطناعي العربي، إذ نقدّم نموذجاً مبنيّاً ليس فقط على الحجم، بل على الالتزام بالدقة الثقافية واللغوية. ومن خلال توسيع جودة وتنوع البيانات العربية بشكل كبير، أنشأنا أساساً يعكس غنى اللغة العربية. ويمثّل هذا النموذج مثالاً على كيفية تطور الذكاء الاصطناعي من خلال التوافق الثقافي، والتصميم المرتكز على السلامة، والابتكار المفتوح".