⚠️ عبارت RefusalBench: وقتی مدلها به سؤالات خطرناک پاسخ میدهند
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁5❤4🎉4