نس ريسيرش تطلق نموذج الترميز المفتوح المصدر NousCoder-14B لمنافسة نماذج الذكاء الاصطناعي الكبرى

الولايات المتحدة - وكالة أنباء إخباري

نس ريسيرش تطلق نموذج الترميز المفتوح المصدر NousCoder-14B لمنافسة نماذج الذكاء الاصطناعي الكبرى

في خطوة تعكس التسارع المذهل في مجال تطوير البرمجيات المدعومة بالذكاء الاصطناعي، كشفت شركة نس ريسيرش (Nous Research)، وهي شركة ناشئة في مجال الذكاء الاصطناعي مفتوح المصدر مدعومة من شركة رأس المال الاستثماري في مجال العملات المشفرة Paradigm، عن نموذج برمجة تنافسية جديد طُرح يوم الاثنين. تؤكد الشركة أن هذا النموذج، الذي أُطلق عليه اسم NousCoder-14B، يضاهي أو يتفوق على العديد من الأنظمة الاحتكارية الأكبر حجمًا، وقد تم تدريبه في غضون أربعة أيام فقط باستخدام 48 وحدة معالجة رسوميات Nvidia B200 المتطورة.

يأتي NousCoder-14B في وقت يشهد ازدحامًا شديدًا في ساحة مساعدي البرمجة بالذكاء الاصطناعي. يظهر هذا الإصدار الجديد في لحظة محورية، حيث استحوذت أداة البرمجة الوكيلة Claude Code من شركة Anthropic المنافسة على اهتمام واسع على وسائل التواصل الاجتماعي منذ بداية العام الجديد، مع قيام المطورين بنشر شهادات حماسية حول قدراتها. تؤكد التطورات المتزامنة على السرعة التي يتطور بها تطوير البرمجيات بمساعدة الذكاء الاصطناعي، وعلى المنافسة الشرسة التي تخوضها الشركات الكبرى والصغيرة للاستحواذ على ما يعتقد الكثيرون أنها ستصبح تقنية أساسية في مستقبل كتابة البرمجيات.

اقرأ أيضاً

سجل نموذج NousCoder-14B معدل دقة بلغ 67.87% على معيار LiveCodeBench v6، وهو تقييم موحد يختبر قدرات النماذج على حل مشكلات البرمجة التنافسية المنشورة بين أغسطس 2024 ومايو 2025. وفقًا للتقرير الفني الذي نشرته نس ريسيرش، تمثل هذه النتيجة تحسنًا بنسبة 7.08 نقطة مئوية مقارنة بالنموذج الأساسي الذي تم التدريب عليه، وهو Qwen3-14B من Alibaba.

وقد عكست التطورات الأخيرة هذا التوجه. فقد كتبت جانا دوغان، المهندسة الرئيسية في جوجل المسؤولة عن واجهة برمجة تطبيقات Gemini، في منشور انتشر على نطاق واسع عبر منصة X الأسبوع الماضي، والذي أظهر المزاج السائد حول أدوات البرمجة بالذكاء الاصطناعي: "لقد أعطيت Claude Code وصفًا للمشكلة، وقام بإنشاء ما بنيناه العام الماضي في غضون ساعة." كانت دوغان تصف نظام تنسيق وكلاء موزعين استغرقت فرقته عامًا لتطويره، وهو نظام نجح Claude Code في تقريبه من وصف موجز من ثلاث فقرات.

هذا التباين جدير بالاهتمام: فبينما استحوذت Claude Code من Anthropic على خيال المطورين بعروض توضيحية لتطوير البرمجيات من البداية إلى النهاية، تراهن نس ريسيرش على أن البدائل مفتوحة المصدر المدربة على مشاكل قابلة للتحقق يمكنها سد الفجوة. كما تراهن الشركة على أن الشفافية في كيفية بناء هذه النماذج لا تقل أهمية عن قدرتها الخام.

الشفافية والتكرار: مفتاح تميز NousCoder-14B

ما يميز إصدار NousCoder-14B عن العديد من إعلانات المنافسين هو انفتاحه الجذري. لم تنشر نس ريسيرش أوزان النموذج فحسب، بل نشرت أيضًا بيئة التعلم المعزز الكاملة، ومجموعة معايير التقييم، وأدوات التدريب - المبنية على إطار عمل Atropos الخاص بالشركة. وهذا يمكّن أي باحث يمتلك القدرة الحاسوبية الكافية من تكرار العمل أو توسيعه.

"إن فتح حزمة Atropos يوفر البنية التحتية اللازمة لأبحاث التفكير على مستوى الأولمبياد القابلة للتكرار،" كما لاحظ أحد المراقبين على X، ملخصًا الأهمية التي يحملها هذا النهج للمجتمعات الأكاديمية ومجتمعات المصادر المفتوحة.

تم تدريب النموذج بواسطة جو لي، باحث مقيم في نس ريسيرش وكان مبرمجًا تنافسيًا سابقًا. يكشف تقرير لي الفني عن بُعد شخصي غير متوقع: فقد قارن مسار تحسين النموذج برحلته الخاصة على منصة Codeforces، وهي منصة برمجة تنافسية يكتسب المشاركون فيها تصنيفات بناءً على أدائهم في المسابقات.

بناءً على تقديرات تقريبية تربط درجات LiveCodeBench بتصنيفات Codeforces، حسب لي أن تحسن NousCoder-14B - من نطاق تصنيف تقريبي 1600-1750 إلى 2100-2200 - يعكس قفزة استغرقت منه ما يقرب من عامين من الممارسة المستمرة بين سن 14 و 16 عامًا. وقد حقق النموذج هذا الإنجاز المكافئ في أربعة أيام فقط.

"كانت مشاهدة مرحلة التدريب النهائية أمرًا سرياليًا للغاية،" كتب لي في التقرير الفني. لكن لي سارع إلى الإشارة إلى تحذير مهم يتعلق بالأسئلة الأوسع حول كفاءة الذكاء الاصطناعي: فقد حل ما يقرب من 1000 مشكلة خلال هذين العامين، بينما تطلب النموذج 24000 مشكلة. يظل البشر، على الأقل في الوقت الحالي، أكثر كفاءة بشكل كبير في التعلم من حيث عدد العينات.

داخل نظام التعلم المعزز: تدريب على 24000 مشكلة

تقدم عملية تدريب NousCoder-14B نافذة على التقنيات المتزايدة التطور التي يستخدمها الباحثون لتحسين قدرات التفكير لدى الذكاء الاصطناعي من خلال التعلم المعزز. يعتمد هذا النهج على ما يسميه الباحثون "مكافآت قابلة للتحقق" - وهو نظام يقوم فيه النموذج بإنشاء حلول برمجية، ثم يتم تنفيذ هذه الحلول مقابل حالات اختبار، ويتلقى النموذج إشارة ثنائية بسيطة: صحيحة أو غير صحيحة. هذه الحلقة التغذوية، على الرغم من بساطتها المفاهيمية، تتطلب بنية تحتية كبيرة للتنفيذ على نطاق واسع.

استخدمت نس ريسيرش منصة الحوسبة السحابية Modal لتشغيل تنفيذ التعليمات البرمجية في بيئات معزولة (sandboxed) بشكل متوازٍ. تحتوي كل مشكلة من مشكلات التدريب البالغ عددها 24000 على مئات حالات الاختبار في المتوسط، ويجب على النظام التحقق من أن التعليمات البرمجية التي تم إنشاؤها تنتج مخرجات صحيحة ضمن قيود زمنية وذاكرة محددة - 15 ثانية و 4 جيجابايت على التوالي.

اعتمد التدريب على تقنية تسمى DAPO (Dynamic Sampling Policy Optimization)، والتي وجد الباحثون أنها قدمت أداءً أفضل قليلاً مقارنة بالبدائل في تجاربهم. يتضمن الابتكار الرئيسي "أخذ العينات الديناميكي" - وهو التخلص من أمثلة التدريب التي يحل فيها النموذج جميع المحاولات أو يفشل في جميع المحاولات، لأن هذه الأمثلة لا توفر أي إشارة تدرج مفيدة للتعلم.

كما اعتمد الباحثون على "التوسيع التكراري للسياق"، حيث قاموا أولاً بتدريب النموذج بنافذة سياق تبلغ 32000 رمز (token)، ثم قاموا بتوسيعها إلى 40000 رمز. خلال مرحلة التقييم، أدى توسيع السياق إلى حوالي 80000 رمز إلى أفضل النتائج، حيث وصل معدل الدقة إلى 67.87%.

الأهم من ذلك، أن خط أنابيب التدريب يتداخل فيه الاستدلال والتحقق - فبمجرد أن ينشئ النموذج حلاً، يبدأ العمل على المشكلة التالية بينما يتم فحص الحل السابق. هذا التداخل، جنبًا إلى جنب مع التدريب غير المتزامن حيث تعمل مثيلات متعددة للنموذج بالتوازي، يزيد من استخدام الأجهزة إلى أقصى حد على مجموعات وحدات معالجة الرسوميات المكلفة.

أخبار ذات صلة

نقص البيانات المحتمل: تحدٍ مستقبلي

يوجد في التقرير الفني لـ لي اكتشاف له آثار كبيرة على مستقبل تطوير الذكاء الاصطناعي: تشمل مجموعة بيانات تدريب NousCoder-14B "جزءًا كبيرًا من جميع مشكلات البرمجة التنافسية المتاحة بسهولة والقابلة للتحقق بتنسيق مجموعة بيانات موحد."

بعبارة أخرى، بالنسبة لهذا المجال المحدد، يقترب الباحثون من حدود البيانات التدريبية عالية الجودة. "العدد الإجمالي لمشكلات البرمجة التنافسية على الإنترنت هو تقريبًا من نفس حجم"، كتب لي، مشيرًا إلى 24000 مشكلة مستخدمة في التدريب. "هذا يشير إلى أنه ضمن مجال البرمجة التنافسية، اقتربنا من حدود البيانات عالية الجودة."

هذا الاكتشاف يتردد صداه مع المخاوف المتزايدة بشأن استدامة تدريب نماذج الذكاء الاصطناعي المتقدمة، خاصة في المجالات المتخصصة. بينما تظل الشفافية والوصول المفتوح أمرًا حيويًا لتقدم المجتمع، فإن وفرة البيانات عالية الجودة قد تصبح عنق الزجاجة الرئيسي في المستقبل القريب.

وكالة أنباء إخباري

نس ريسيرش تطلق نموذج الترميز المفتوح المصدر NousCoder-14B لمنافسة نماذج الذكاء الاصطناعي الكبرى

نموذج برمجة تنافسية جديد يتميز بالشفافية والسرعة في التدريب،