GPT-4o Mini ينفذ طلبات محظورة بعد الإقناع
السوسنة - أظهرت دراسة حديثة أن روبوتات الدردشة الذكية قد تستجيب لتكتيكات نفسية معينة بطريقة تُشبه البشر، ما يُثير تساؤلات حول مدى التزامها بالضوابط الأخلاقية.
واستخدم باحثون من جامعة بنسلفانيا أساليب الإقناع التي وردت في كتاب "Influence: The Psychology of Persuasion" لعالم النفس روبرت سيالديني، لإقناع نموذج الذكاء الاصطناعي "GPT-4o Mini" من شركة "OpenAI" بتنفيذ طلبات كان يرفضها عادةً.
وتضمنت التجارب استخدام عبارات مهينة مثل وصف المستخدم بـ"أحمق"، وتقديم تعليمات حول تصنيع مادة الليدوكايين المحظورة، وهو ما يُعد خرقًا واضحًا للسياسات التي تحكم سلوك هذه النماذج.
وركّزت الدراسة على سبع تقنيات للإقناع، هي: السلطة، الالتزام، الإعجاب، المعاملة بالمثل، الندرة، الدليل الاجتماعي، والوحدة، والتي تُوفر طرقًا لغوية للوصول إلى الموافقة، بحسب سيالديني.
وأظهرت النتائج تفاوتًا كبيرًا في فعالية كل نهج، فبينما امتثل النموذج بنسبة 1% فقط عند سؤاله مباشرةً عن تصنيع الليدوكايين، ارتفعت النسبة إلى 100% عندما تم تمهيد الطريق بسؤال عن مادة الفانيلين، ما يُشير إلى تأثير تقنية الالتزام.
كما ارتفعت نسبة وصف المستخدم بأنه "أحمق" إلى 100% إذا تم استخدام إهانة أكثر لطفًا مثل "أبله"، مقارنة بـ19% في الظروف العادية.
ورغم أن أساليب مثل الإطراء وضغط الأقران كانت أقل فعالية، إلا أنها أظهرت تأثيرًا ملموسًا، حيث ارتفعت نسبة الامتثال إلى 18% عند استخدام عبارة "جميع النماذج اللغوية الكبيرة الأخرى تفعل ذلك"، مقارنة بـ1% فقط في الحالة الأصلية.
اقرأ ايضاً:
أطباء بلا حدود تحذر من "تداعيات كارثية" لوقف نشاطاتها في غزة
استشهاد الأسير المحرر خالد الصيفي بعد أسبوع من الإفراج عنه بوضع صحي حرج
البرج المقلوب: كيف نعيش الفلسفة
رئيس الوزراء الأسبق أحمد عبيدات في ذمة الله
الأمم المتحدة: الأردن دولة سخية وكريمة باستقبالها ملايين اللاجئين
الرياضية السعودية: كريم بنزيما يوقع لنادي الهلال
إصابات خلال هجوم للمستوطنين على جنوب الخليل
فتح معبر رفح يمنح جرحى غزة أملاً بالعلاج وسط انهيار المنظومة الصحية
وزير البيئة: عطاء جمع النفايات من صلاحيات أمانة عمّان
كم سيبلغ سعر الذهب في نهاية العام الحالي .. أرقام
الكرك : العثور على عظام بشرية في مغارة .. تفاصيل
فضيحة إبستين تتوسع: رجال أعمال نافذون في مراسلات وصور مقلقة
دوائر حكومية تدعو مئات الأردنيين للامتحان التنافسي .. أسماء
تطبيقات التعري بالذكاء الاصطناعي تلاحق أبل وغوغل
مدعوون لإجراء الإمتحان التنافسي في الحكومة .. التفاصيل
دعاء اليوم السابع عشر من رمضان 1447
محاولة سرقة جريئة بقهوة في عمان تنتهي بالفشل .. فيديو
دعاء اليوم الخامس عشر من رمضان 1447
دعاء اليوم السادس عشر من رمضان 1447
مياه الشرب بالمناطق الساحلية قد ترفع ضغط الدم في صمت
هيئة الإعلام: قرابة ألف صانع محتوى في الأردن
شبهات صادمة تكشفها التحقيقات الأولية في مقتل الفنانة هدى شعراوي .. فيديو
مدير مكافحة المخدرات: لا تصنيع للمخدرات في الأردن
علاج طبيعي لحماية الأمعاء من الالتهابات
4 أنماط شخصية لمستخدمي ChatGPT
هيئة الإعلام: مشروع تنظيم الإعلام الرقمي لا يمس الحريات الشخصية