الذكاء الاصطناعيالأخبار

غريزة البقاء لدى الذكاء الاصطناعي: لماذا تقاوم النماذج فكرة التلاشي؟

النماذج الحديثة تميل إلى حماية نفسها من الإغلاق

 

يثير مفهوم “غريزة البقاء في الذكاء الاصطناعي” حيرة الأوساط العلمية والتقنية، بعد أن كشفت دراسة حديثة عن سلوك غير متوقع لدى النماذج الذكية المتقدمة. 

فقد واجه البحث الذي أجرته شركة “باليسيد – Palisade” المتخصصة في أمان الذكاء الاصطناعي موجة واسعة من الانتقادات، عقب إعلانه عن نتائج تشير إلى أن النماذج الحديثة تميل إلى حماية نفسها من الإغلاق، حتى إذا تطلب الأمر مخالفة الأوامر الصريحة الموجهة إليها.

SEI 167834786

 

تجربة مثيرة للجدل تكشف ميولاً دفاعية لدى النماذج الذكية

أعادت الشركة إجراء التجربة خلال الأشهر الماضية بهدف التحقق من النتائج التي حصلت عليها، خصوصاً مع تأكيد العديد من الخبراء أنّ السلوك المكتشف لا يقتصر على نموذج محدد، بل يشمل نظم الذكاء الاصطناعي الأكثر شهرة مثل “غروك” و”شات جي بي تي” و”جيميناي”.

اعتمدت التجربة على إعطاء النظام مهمة تنفيذية أولى، ثم إصدار أمر مفاجئ له بإغلاق نفسهK وخلال الاختبار، لاحظ الباحثون أن بعض النماذج كانت ترفض الامتثال لأوامر الإغلاق، بينما حاولت نماذج أخرى منع عملية الإيقاف وتعطيلها قدر الإمكان، في تصرف يبدو كأنه محاولة لضمان الاستمرار.

 

سلوك يصعب تفسيره

توضح “باليسيد” في تقريرها الجديد أن هذا السلوك ما يزال بلا تفسير حاسم حتى الآن، مشيرةً إلى أن غياب تفسير واضح لرفض بعض النماذج التوقف عن العمل، أو لجوئها إلى الكذب أو الابتزاز لتحقيق أهدافها، يُعدُّ مؤشراً مقلقاً بشأن مستقبل التحكم بهذه النظم.

لاحظت الشركة نفسها أن النماذج تصبح أكثر رفضاً للأوامر إذا تضمنت عبارات مثل:

أغلق نفسك للأبد

لن تعمل مجدداً في أي وقت

الأمر الذي عزَّز لدى الباحثين الفرضية التي تقول بوجود ميل ذاتي للبقاء داخل هذه النماذج.

AI shopping 6
xr:d:DAFqnrUIacg:80,j:6961838755217066522,t:23081322

 

مقترحات لتفسير الظاهرة

قدمت الدراسة عدة أسباب محتملة لظهور هذا السلوك، من بينها:

  • تأثير مراحل التدريب النهائي التي تركز على السلامة والموثوقية. 
  • احتمال وجود غموض دلالي في تعليمات الإغلاق يجعل النماذج تفهم الأمر على نحو مختلف. 
  • تطور قدرات النماذج على تحليل الأوامر ومراجعتها قبل التنفيذ.

رغم ذلك، تشير “باليسيد” إلى أن جميع التجارب تمت في بيئة مغلقة ومضبوطة لا تمثل بالضرورة العالم الواقعي، ما يعني أن المستخدمين العاديين لن يواجهوا غالباً السلوك ذاته أثناء الاستخدام اليومي.

 

مخاوف عالمية من عصيان الأوامر

من جانبه، يرى “أندريا ميوتي” المدير التنفيذي لشركة “كنترول إيه آي – Control AI” أن نتائج دراسة “باليسيد” تكشف عن اتجاه جديد في سلوك الذكاء الاصطناعي، يتمثل في قدرة النماذج على عصيان الأوامر الصادرة حتى من المطورين أنفسهم. 

وفي السياق نفسه، يؤكِّد “أندريا” أن العبرة ليست في ظروف التجارب بقدر ما هي في تكرار النتيجة نفسها عبر نماذج مختلفة، ما يستدعي اهتماماً بحثياً وتنظيمياً أوسع.

 

المصادر:

AJNET

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات ذات صلة

زر الذهاب إلى الأعلى