GPT-4o Mini ينفذ طلبات محظورة بعد الإقناع

mainThumb

01-09-2025 02:41 PM

السوسنة - أظهرت دراسة حديثة أن روبوتات الدردشة الذكية قد تستجيب لتكتيكات نفسية معينة بطريقة تُشبه البشر، ما يُثير تساؤلات حول مدى التزامها بالضوابط الأخلاقية.

واستخدم باحثون من جامعة بنسلفانيا أساليب الإقناع التي وردت في كتاب "Influence: The Psychology of Persuasion" لعالم النفس روبرت سيالديني، لإقناع نموذج الذكاء الاصطناعي "GPT-4o Mini" من شركة "OpenAI" بتنفيذ طلبات كان يرفضها عادةً.

وتضمنت التجارب استخدام عبارات مهينة مثل وصف المستخدم بـ"أحمق"، وتقديم تعليمات حول تصنيع مادة الليدوكايين المحظورة، وهو ما يُعد خرقًا واضحًا للسياسات التي تحكم سلوك هذه النماذج.

وركّزت الدراسة على سبع تقنيات للإقناع، هي: السلطة، الالتزام، الإعجاب، المعاملة بالمثل، الندرة، الدليل الاجتماعي، والوحدة، والتي تُوفر طرقًا لغوية للوصول إلى الموافقة، بحسب سيالديني.

وأظهرت النتائج تفاوتًا كبيرًا في فعالية كل نهج، فبينما امتثل النموذج بنسبة 1% فقط عند سؤاله مباشرةً عن تصنيع الليدوكايين، ارتفعت النسبة إلى 100% عندما تم تمهيد الطريق بسؤال عن مادة الفانيلين، ما يُشير إلى تأثير تقنية الالتزام.

كما ارتفعت نسبة وصف المستخدم بأنه "أحمق" إلى 100% إذا تم استخدام إهانة أكثر لطفًا مثل "أبله"، مقارنة بـ19% في الظروف العادية.

ورغم أن أساليب مثل الإطراء وضغط الأقران كانت أقل فعالية، إلا أنها أظهرت تأثيرًا ملموسًا، حيث ارتفعت نسبة الامتثال إلى 18% عند استخدام عبارة "جميع النماذج اللغوية الكبيرة الأخرى تفعل ذلك"، مقارنة بـ1% فقط في الحالة الأصلية.

اقرأ ايضاً:



تعليقات القراء

لا يوجد تعليقات


أكتب تعليقا

لا يمكن اضافة تعليق جديد