جامعة محمد بن زايد للذكاء الاصطناعي تطلق النموذج اللغوي الكبير “K2-65B”

مايو30,2024

أعلنت جامعة محمد بن زايد للذكاء الاصطناعي، اليوم، وبالتعاون مع شركة “بيتووم” ومنصة “LLM360″، إطلاق نموذج “K2-65B” الجديد، وهو نموذج لغوي كبير رائد مفتوح المصدر يستند إلى 65 مليار مُعامِل.

يتميز هذا النموذج بأنه يرفع من مستوى معايير الشفافية والأداء في مجال الذكاء الاصطناعي مفتوح المصدر؛ إذ يوفر نهجاً محتملاً لتوثيق ودراسة دورة الحياة الكاملة للنماذج اللغوية الكبيرة، بما في ذلك جميع تفاصيل عملية الاستنساخ.

توفر منصة “LLM360” إطاراً لإصدار النماذج اللغوية الكبيرة يعزز جهود المجتمع التي تهدف إلى تحقيق رؤية الذكاء العام الاصطناعي، وذلك من خلال تمكين عمليات البحث والتطوير مفتوحة المصدر في مجال النماذج اللغوية الكبيرة، والتي تكون خاضعة لمراجعة النظراء، وتتسم بالشفافية وتكون قابلة للاستنساخ، كما تكون نتاج تعاون بين مختلف الأطراف المعنية.

أما نموذج “K2-65B” فهو متاح مجاناً على مستوى العالم بموجب رخصة “أباتشي 2.0″، وهو النموذج اللغوي الكبير الوحيد القابل للاستنساخ من طرف ثالث، والذي يتفوق في الأداء على أهم النماذج اللغوية الكبيرة المتقدمة المتوفرة في القطاع الخاص، مثل نموذج “لاما 270B”.

أصبحت النماذج اللغوية الكبيرة واحدة من أهم الأدوات في مجال معالجة اللغات الطبيعية، إذ إنها تُمكّن أجهزة الحاسوب من فهم النص وتوليده بطريقة تشبه إلى حد كبير التَواصل البشري.

أحرزت الشركات الإماراتية تقدماً هائلاً في هذا المجال في السنوات الأخيرة، لا سيما من خلال إطلاق “جيس”، وهو النموذج اللغوي الكبير الأكثر تقدماً في العالم باللغة العربية، والذي يُعتبر ثمار التعاون الوثيق بين شركة “كور 42″، وجامعة محمد بن زايد للذكاء الاصطناعي، وشركة “سيريبراس سيستمز”.

قال البروفيسور إريك زينغ، رئيس جامعة محمد بن زايد للذكاء الاصطناعي ، الذي دعم تطوير نموذج “K2″، بالإضافة إلى غيره من أنظمة الذكاء الاصطناعي واسعة النطاق التي يعمل عليها معهد النماذج التأسيسية التابع للجامعة: “إن إطلاق نموذج “K2-65B” يُثبت كفاءة دولة الإمارات في تطوير النماذج اللغوية الكبيرة عالية المستوى، وهي كفاءة تزداد يوماً بعد يوم، وإن هذا النموذج يجسد أهمية تبني نهج مفتوح يقوم على التعاون بين مختلف الأطراف بهدف إنشاء نماذج لغوية كبيرة تتميز بمستوى استثنائي من الأداء والكفاءة والقدرة على إحداث تغيير جذري في جميع القطاعات والمنظمات”.

تم تدريب نموذج “K2-65B” على مرحلتين، وخضع إلى 22 عملية تقييم صارمة وشاملة لتحديد مستوى أدائه في مختلف التخصصات، مثل الرياضيات والبرمجة والطب ومجالاتٍ أخرى، فتفوق على نموذج “لاما 270B” في كل مجالٍ من هذه المجالات.

أظهر هذا النموذج مستويات أداء عالية حتى في المجالات التي يُعتبر التنافس فيها صعباً مع أفضل النماذج اللغوية الكبيرة المفتوحة، وقد تفوق نموذج الدردشة الخاص به على نموذج الدردشة الخاص بـ”لاما 270B” على جميع المستويات التي شملها التقييم، إذ أثبت قدرته على الفهم وتوليد إجابات شبيهة بإجابات الإنسان في مختلف السيناريوهات.

قال هيكتور ليو، رئيس قسم الهندسة في شركة “بيتووم” والمطور الرئيسي للنموذج، إن إصدار نموذج بهذا الحجم وبهذه الجودة سيؤثر بشكل إيجابي في منظومة المصادر المفتوحة، إذ سيتفاعل المجتمع مع النموذج ويستفيد من الحلول التي توصلنا إليها، على غرار ما شهدته النماذج السابقة على منصة “LLM360″، مثل “أمبر” و”كريستال كودر”.

أما الخصائص الأخرى التي يتميّز نموذج “K2-65B” عن النماذج اللغوية الكبيرة المتوفرة حالياً، فتشمل الشفافية التامة التي يحققها من خلال توفير “مجموعات التدريب المسبق والتطوير” على منصة “LLM360″، فهو يضمن بذلك، ومن خلال التوجيهات التدريبية المفصلة، ومحطات التدقيق، ونتائج التقييم التي يوفرها، إمكانية الاستنساخ والتدقيق في جميع مراحل عملية تطويره.

يستخدم هذا النموذج، إضافة إلى ذلك، قدرات حاسوبية أقل من تلك التي تستخدمها النماذج اللغوية الكبيرة المشابهة، فيدعم زيادة الكفاءة التشغيلية ويسهم في الحد من استهلاك الطاقة، ما يمكّن المستخدمين في جميع أنحاء العالم من الالتزام بممارسات الحوسبة المستدامة.

يذكر أن فريق العمل الذي طوّر هذا النموذج يدرس إمكانية إعداده لفهم الصور، إلى جانب المبادرات التي أطلقها لتطويره وتقييمه والتي تهدف إلى تحسين أدائه بشكل مستمر وتعزيز استخداماته المتعددة.

وام

أخبار ذات علاقة