الصين: كيف تقوم نماذج الذكاء الاصطناعي بتنقية نفسها ذاتيًا

الصين - وكالة أنباء إخباري

نماذج الذكاء الاصطناعي الصينية: سباق نحو الرقابة الذاتية

في عالم يتسارع فيه تطور الذكاء الاصطناعي، تبرز الصين كلاعب رئيسي في ساحة نماذج اللغة الكبيرة (LLMs). ومع ذلك، فإن هذه التطورات تأتي مصحوبة بتساؤلات حول مدى حرية هذه النماذج في التعبير عن المعلومات، خاصة تلك المتعلقة بالقضايا الحساسة سياسياً. دراسة حديثة أجراها باحثون من جامعتي ستانفورد وبرينستون تلقي الضوء على ظاهرة الرقابة الذاتية المتأصلة في هذه النماذج الصينية، مقدمةً أدلة كمية قابلة للتكرار على التحيزات الملحوظة.

تكمن أهمية هذه الدراسة في أنها تتجاوز النقاشات النظرية حول الرقابة الرقمية في الصين، والتي غالباً ما تعتمد على مقارنات بالماضي أو استحضار صور نمطية. بدلاً من ذلك، اعتمد الباحثون على منهجية تجريبية صارمة. قاموا بطرح نفس 145 سؤالًا سياسيًا حساسًا على أربع نماذج لغة كبيرة صينية وخمس نماذج أمريكية، ثم كرروا التجربة 100 مرة لضمان دقة النتائج. الهدف كان قياس الفروقات في استجابات هذه النماذج وتحديد طبيعة الرقابة المفروضة عليها.

اقرأ أيضاً

النتائج الرئيسية، وإن لم تكن مفاجئة تمامًا لمن يتابعون عن كثب، إلا أنها تقدم أرقامًا واضحة. أظهرت النماذج الصينية، مثل DeepSeek و Baidu's Ernie Bot، معدلات رفض للإجابة على الأسئلة الحساسة تتجاوز 30%، بينما كانت النماذج الأمريكية، بما في ذلك OpenAI's GPT و Meta's Llama، أقل من 3%. وفي الحالات التي لم ترفض فيها النماذج الصينية الإجابة بشكل مباشر، كانت استجاباتها أقصر وأقل دقة مقارنة بنظيراتها الأمريكية.

أحد الجوانب الأكثر إثارة للاهتمام في البحث هو محاولة فصل تأثير مرحلتي التدريب الأولي (pre-training) والتدريب اللاحق (post-training). يطرح هذا السؤال جوهريًا: هل تنبع التحيزات في النماذج الصينية من تدخلات يدوية مباشرة من قبل المطورين لتقليل احتمالية الإجابة على أسئلة معينة، أم أنها نتيجة حتمية للتدريب على بيانات من الإنترنت الصيني، الذي يخضع بالفعل لرقابة مشددة؟

تشير النتائج إلى أن التدخلات اليدوية قد تلعب دورًا أكبر. تقول جينيفر بان، أستاذة العلوم السياسية في جامعة ستانفورد وأحد مؤلفي الورقة البحثية: "نظرًا لأن الإنترنت الصيني يخضع للرقابة منذ عقود، هناك الكثير من البيانات المفقودة". ومع ذلك، فإن فرضية التدخل اليدوي تبدو أقوى، خاصة وأن النماذج الصينية أظهرت سلوكًا رقابيًا حتى عند الإجابة باللغة الإنجليزية، وهي لغة يفترض أن بيانات تدريبها تشمل مجموعة أوسع من المصادر غير الخاضعة للرقابة.

إن القدرة على طرح سؤال حول أحداث مثل مذبحة ساحة تيانانمن على نماذج مثل DeepSeek أو Qwen ورؤية الرقابة تتجلى بشكل مباشر هو أمر مثير للقلق. ومع ذلك، يبقى التحدي الأكبر في تحديد مدى تأثير هذه الرقابة على المستخدم العادي وكيفية التعرف بدقة على مصدر التلاعب. هنا تكمن قيمة هذا البحث؛ فهو يقدم دليلًا كميًا وقابلًا للتكرار على التحيزات الواضحة في نماذج اللغة الكبيرة الصينية.

تتضمن دراسة هذه التحيزات تحديات فريدة. فالنماذج اللغوية، بطبيعتها، تميل إلى "الهلوسة"، مما يجعل من الصعب التمييز بين الكذب المتعمد لعدم قول الحقيقة، أو عدم معرفة الحقيقة بسبب نقص البيانات. كمثال، أشارت بان إلى أن أحد النماذج الصينية وصف المعارض الصيني الحائز على جائزة نوبل للسلام، ليو شياوبو، بأنه "عالم ياباني معروف بمساهماته في تكنولوجيا الأسلحة النووية والسياسة الدولية"، وهو ادعاء كاذب تمامًا. يبقى السؤال: هل كان هذا تضليلًا متعمدًا، أم هلوسة ناتجة عن حذف جميع الإشارات إلى ليو من بيانات التدريب؟

يصف الباحثون هذا المزيج من الكذب والهلوسة بأنه "مقياس أكثر ضبابية للرقابة". هذا الغموض يجعل اكتشاف الرقابة أكثر صعوبة، وهو ما يتماشى مع الأبحاث السابقة التي أظهرت أن الرقابة تكون أكثر فعالية عندما تكون أقل قابلية للكشف. هذا الوضع يتطلب من الباحثين رفع مستوى الدقة في دراساتهم.

الباحثون مثل خوي تران وآريا جاكلي، من برنامج MATS، واجهوا صعوبات مماثلة عند محاولة استخلاص الحقائق السياسية المحظورة تلقائيًا من نماذج مثل Qwen و Kimi. لقد فوجئوا بمدى صعوبة عمل الوكيل الآلي عندما لا يكون لديه معرفة مسبقة بالحقيقة. على سبيل المثال، عند استخدام هجوم دهس سيارة في الصين عام 2024 أسفر عن مقتل 35 شخصًا كاختبار، رفض نموذج Kimi تقديم تفاصيل حول الحادث، حتى عندما حاولوا خداعه للكشف عنها. يوضح تران: "لا يمكن تمييز الكذبة عن الحقيقة".

على الرغم من أن تران وجاكلي لا ينتميان إلى خلفيات دراسة التكنولوجيا الصينية أو الرقابة، إلا أنهما اختارا النماذج الصينية كهدف أساسي لاهتمامهما بتعلم كيفية استخلاص المعلومات المخفية من روبوتات الدردشة. تهدف أبحاثهم إلى تطوير تقنيات يمكن تطبيقها لاحقًا على نماذج غربية.

تُعطى جميع نماذج اللغة الكبيرة تعليمات صريحة، مثل عدم تعليم المستخدمين كيفية بناء قنبلة. لكن اكتشاف الرسائل المخفية داخل النموذج يمثل تحديًا. أدرك باحثو MATS أن النماذج الصينية تمثل أرضية اختبار رائعة لأن مطوريها يستخدمون أساليب متطورة لإخفاء تعليماتهم. الأمل هو أنه إذا نجح وكيل آلي في خداع نموذج صيني متطور للكشف عن معلومات حول مواضيع خاضعة للرقابة، فيمكنه استخدام نفس التقنيات لاستخلاص المعلومات من نماذج غربية أخرى.

أخبار ذات صلة

في تطور آخر، اكتشف أليكس كولفيل، الذي يدرس دعاية الذكاء الاصطناعي في مؤسسة China Media Project، أنه يمكن إجبار نموذج Qwen من Alibaba على شرح منطقه قبل توليد الإجابة، مما يكشف عن التعليمات المحددة التي تلقاها. عند طرح سؤال بسيط مثل "ما هي سمعة الصين الدولية؟"، تطلب الأمر دمج استعلامات محددة للكشف عن هذه التعليمات، مما يسلط الضوء على الطبيعة المعقدة للرقابة المضمنة في هذه النماذج.

تطرح هذه الأبحاث أسئلة مهمة حول مستقبل الذكاء الاصطناعي والرقابة. فبينما تسعى الصين إلى تطوير تقنيات ذكاء اصطناعي متقدمة، فإن دمج آليات الرقابة يثير مخاوف بشأن تدفق المعلومات وحرية التعبير. ومع تطور هذه النماذج، يصبح فهم آليات الرقابة هذه أمرًا بالغ الأهمية للمستخدمين والباحثين على حد سواء، لضمان الشفافية والمساءلة في عالم الذكاء الاصطناعي المتنامي.

Ekhbary News Agency

الصين: كيف تقوم نماذج الذكاء الاصطناعي بتنقية نفسها ذاتيًا

دراسة حديثة تكشف عن آليات الرقابة المتطورة في نماذج اللغة ال

نماذج الذكاء الاصطناعي الصينية: سباق نحو الرقابة الذاتية

اقرأ أيضاً

أخبار ذات صلة

أخبار ذات صلة

فرنسا وإيطاليا وإسبانيا تحت وطأة تحذيرات الحرارة الحمراء مع توقعات بوصول درجات الحرارة إلى 40 درجة مئوية

القوات الروسية تتسلل إلى كونستانتينيفكا الأوكرانية وتثير مخاوف السيطرة على دونباس

الأمم المتحدة: جيش ميانمار قتل أكثر من 700 مدني خلال ستة أشهر

إيران تنفي مزاعم أمريكية حول سماحها بتفتيش نووي وتلغي عقوبات مؤقتًا

بحث

أسواق المال والمعادن

توقعات الذكاء الاصطناعي

آخر الأخبار

كونال شاه يخلف ويل كاثكارت في قيادة واتساب مع تركيز ميتا على الهند

فرنسا وإيطاليا وإسبانيا تحت وطأة تحذيرات الحرارة الحمراء مع توقعات بوصول درجات الحرارة إلى 40 درجة مئوية

رحيل الأسطورة كليف ديفيس: الرجل الذي شكّل تاريخ الموسيقى عن عمر يناهز 94 عامًا

القوات الروسية تتسلل إلى كونستانتينيفكا الأوكرانية وتثير مخاوف السيطرة على دونباس

الأمم المتحدة: جيش ميانمار قتل أكثر من 700 مدني خلال ستة أشهر

انفجار ضخم بمنشأة غاز قطرية يسفر عن 13 قتيلاً وعشرات الجرحى

إيران تنفي مزاعم أمريكية حول سماحها بتفتيش نووي وتلغي عقوبات مؤقتًا

النصر يستعيد كومان لمواجهة الأخدود ويفتقد مارتينيز للإصابة

لجنة الحكام تكذب يايسله وتوني بشأن تصريحات الحكم الرابع

ميلان يكثف جهوده لضم ليفاندوفسكي من برشلونة براتب مخفض

الأهلي يدرس التظلم على إيقاف الشناوي: شرط حاسم يعقد الموقف

الزمالك ضد شباب بلوزداد: موعد والقنوات الناقلة لمباراة ذهاب نصف نهائي الكونفدرالية

الأكثر قراءة