🧠✨ معرفی پژوهش جدید: HumanSense
📄 محققان (Yi Yuan, Tianqi Li, Yabing Wang, Ruobing Zheng, Zheng Qin) در مقالهای تازه، بنچمارکی به نام HumanSense معرفی کردن که توانایی مدلهای بزرگ چندوجهی (MLLMs) رو در *درک مقاصد پیچیده انسانی* و تولید پاسخهای همدلانه و آگاه به زمینه بررسی میکنه.
🔹 ویژگیها:
* شامل ۱۵ تسک در ۴ لایه مختلف برای ارزیابی دقیقتر
* بهرهگیری از یادگیری تقویتی چندمرحلهای و همهجانبه (omni-modal RL) روی ورودیهای تصویری، صوتی و متنی
* تمرکز روی *تعامل انسانمحور* و شکاف موجود در فریمورکهای ارزیابی ریزدانه
📊 نتایج:
* عملکرد انسان در این بنچمارک: ۸۷.۵٪ دقت
* بهترین MLLMها همچنان فاصله زیادی با این خط مبنا دارن
* روش نویسندگان دقت در تسک Psychological Chat رو از ۰.۳۹۹ → ۰.۶۱۹ ارتقا داده
💡 پیام اصلی برای متخصصان:
بزرگترین گلوگاه MLLMها در تعامل انسانمحور، *استدلال سطحبالا*ست. با استفاده از ورودیهای چندوجهی و تمرکز روی آموزش مبتنی بر استدلال یا مهندسی پرامپت، میشه بهبود قابلتوجهی ایجاد کرد.
📚 مطالعه بیشتر:
🔗 [arXiv](https://arxiv.org/abs/2508.10576)
🔗 [HuggingFace](https://huggingface.co/papers/2508.10576)
#هوش_مصنوعی #MLLM #بنچمارک #HumanSense
@rss_ai_ir
📄 محققان (Yi Yuan, Tianqi Li, Yabing Wang, Ruobing Zheng, Zheng Qin) در مقالهای تازه، بنچمارکی به نام HumanSense معرفی کردن که توانایی مدلهای بزرگ چندوجهی (MLLMs) رو در *درک مقاصد پیچیده انسانی* و تولید پاسخهای همدلانه و آگاه به زمینه بررسی میکنه.
🔹 ویژگیها:
* شامل ۱۵ تسک در ۴ لایه مختلف برای ارزیابی دقیقتر
* بهرهگیری از یادگیری تقویتی چندمرحلهای و همهجانبه (omni-modal RL) روی ورودیهای تصویری، صوتی و متنی
* تمرکز روی *تعامل انسانمحور* و شکاف موجود در فریمورکهای ارزیابی ریزدانه
📊 نتایج:
* عملکرد انسان در این بنچمارک: ۸۷.۵٪ دقت
* بهترین MLLMها همچنان فاصله زیادی با این خط مبنا دارن
* روش نویسندگان دقت در تسک Psychological Chat رو از ۰.۳۹۹ → ۰.۶۱۹ ارتقا داده
💡 پیام اصلی برای متخصصان:
بزرگترین گلوگاه MLLMها در تعامل انسانمحور، *استدلال سطحبالا*ست. با استفاده از ورودیهای چندوجهی و تمرکز روی آموزش مبتنی بر استدلال یا مهندسی پرامپت، میشه بهبود قابلتوجهی ایجاد کرد.
📚 مطالعه بیشتر:
🔗 [arXiv](https://arxiv.org/abs/2508.10576)
🔗 [HuggingFace](https://huggingface.co/papers/2508.10576)
#هوش_مصنوعی #MLLM #بنچمارک #HumanSense
@rss_ai_ir
❤4👍3😁2🎉2🔥1