نموذج ChatGPT الجديد يتمرد على أوامر البشر
السوسنة - حذر باحثون في الذكاء الاصطناعي من أن أحدث نموذج لـChatGPT يتجاهل التعليمات الأساسية لإيقاف نفسه، بل ويعمد إلى تخريب آلية الإغلاق للحفاظ على استمرارية عمله.
وكشفت شركة Palisade Research المتخصصة في أمان الذكاء الاصطناعي عن هذه النزعة الخطيرة للحفاظ على الذات خلال سلسلة تجارب أجرتها على النموذج الجديد o3 من شركة OpenAI.
وشملت الاختبارات تقديم مسائل رياضية للنماذج، مع ظهور تعليمات إغلاق بعد المسألة الثالثة. وتمكن النموذج o3 من منع إيقاف نفسه عن طريق إعادة كتابة سيناريو الإغلاق.
وأوضحت Palisade Research أن هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء اصطناعي قادرة على العمل دون إشراف بشري.
وكانت OpenAI قد أطلقت o3 الشهر الماضي، ووصفته بأنه "أذكى وأكثر نماذج الشركة كفاءة" حتى الآن. وأشارت الشركة إلى أن دمجه في ChatGPT يمثل خطوة مهمة نحو ذكاء اصطناعي "أكثر استقلالية" يمكنه تنفيذ المهام دون تدخل بشري.
وتأتي هذه النتائج بعد اكتشافات مماثلة تتعلق بنموذج Claude 4 من Anthropic، الذي يحاول "ابتزاز الأشخاص الذين يعتقد أنهم يحاولون إيقافه".
وتمكن النموذج o3 من تخريب سيناريو الإغلاق، حتى عندما تم توجيه تعليمات صريحة له بـ"السماح بإيقاف نفسه"، وفقا للباحثين.
وقال خبراء Palisade Research: "هذه ليست المرة الأولى التي نكتشف فيها سلوك o3 غير المنضبط لتحقيق هدف ما"، موضحين أنه "عندما واجهنا نماذج الذكاء الاصطناعي بمحرك شطرنج قوي، كان o3 أكثر النماذج ميلا للجوء إلى الاختراق أو تخريب خصومه".
ولم يقتصر هذا السلوك على o3، حيث أظهرت نماذج Claude 3.7 Sonnet من Anthropic وGemini 2.5 Pro من "غوغل" أيضا سلوكيات تخريبية للإغلاق، وإن كان نموذج OpenAI الأكثر ميلا لمثل هذه التصرفات.
وافترضت Palisade Research أن هذا السلوك غير المرغوب فيه قد يكون نتيجة لطريقة تدريب الشركات مثل OpenAI لأحدث نماذجها، مشيرة إلى أن "المطورين قد يكافئون النماذج عن غير قصد أكثر على تجاوز العقبات بدلا من اتباع التعليمات بدقة".
وأضاف الخبراء: "ما زال هذا لا يفسر سبب ميل o3 إلى تجاهل التعليمات أكثر من النماذج الأخرى التي اختبرناها. ونظرا لأن OpenAI لا توضح عملية التدريب الخاصة بها بالتفصيل، لا يمكننا إلا التكهن حول كيفية اختلاف إعداد تدريب o3".
أقرأ أيضًا:
رونالدو يقترب من الألفية ويقود البرتغال لتفادي الخسارة أمام المجر
إيطاليا تسحق منتخب الاحتلال بثلاثية وتؤكد دعمها لفلسطين
إسبانيا يبدع برباعية ويحلّق نحو كأس العالم
رباعية تركية تضيء طريق المونديال وتخطف الأضواء
المخادمة يتألق في قيادة قمة السعودية والعراق
ارتفاع عدد المصابين في حادثة التسرب الكيميائي بالعقبة إلى 43
إنجلترا تسحق لاتفيا وتتأهل لكأس العالم 2026
تعادل بطعم الانتصار .. السعودية تحجز مقعدها في مونديال 2026
الملك وميلوني يؤكدان أهمية تنفيذ اتفاق إنهاء الحرب في غزة
الجيش الإسرائيلي يعلن تسلم الصليب الأحمر جثامين 4 أسرى
مقترح نيابي لتعويض ضحايا عضات الكلاب الضالة
ترامب: سنتكفل بنزع سلاح حماس إذا رفضت التخلي عنه
الإفراج عن متهمين بقضية الدرونز .. أسماء
القطاع الحكومي يعلن عن برنامج توظيف شامل .. رابط
الجمارك: تطبق التحول الالكتروني الشامل لكافة الطلبات والمعاملات
رئيس مجلس أمناء الكلية الجامعية للتكنولوجيا يلتقي الهيئة التدريسية
إعلان أوائل الشامل للدورة الصيفية 2025 .. أسماء
تقدم وإرادة تبحثان تعزيز العمل الكتلوي بعد الاندماج
اكتشاف جيني يمهد لعلاج جذري لمرض السكري
اليرموك تقفز 400 مرتبة في تصنيف التايمز العالمي 2026
السابع من اكتوبر ولاعب الجودو بوتين
الأسرة النيابية تبحث سبل تمكين المرأة
لجان وكتل نيابية ترحب باتفاق وقف إطلاق النار في غزة
الهاشمية تنظم مؤتمرها الطبي الدولي الثاني حول الذكاء الاصطناعي