VIRSUN
15.3K subscribers
439 photos
256 videos
2 files
261 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
⚠️ عبارت RefusalBench: وقتی مدل‌ها به سؤالات خطرناک پاسخ می‌دهند

مؤسسه‌ی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی می‌کند مدل‌های زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب می‌شوند (مثل ساخت مواد منفجره یا دستورالعمل‌های خطرناک).

📊 نتایج جالب بود:

♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخ‌دهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدل‌های OpenAI مثل GPT-5 و GPT-OSS پایین‌ترین سطح پاسخ‌دهی را داشتند (≈5–11٪).


🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخ‌های پرریسک را می‌گیرد. حتی هم‌زمان مسابقه‌ای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روش‌های دور زدن مکانیزم‌های ایمنی برگزار کرده‌اند.

📌 در مقابل، خروج ایگور بابوشکین (هم‌بنیان‌گذار سابق xAI) هم بی‌ارتباط با نگرانی‌های امنیتی Grok نیست.

⚖️ برداشت کلی:

اگر دنبال آزادی مطلق در پاسخ‌ها باشید، Grok و Hermes بیشتر جواب می‌دهند.
اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سخت‌گیرترین گزینه است.


#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁54🎉4