🧩 بنچمارک جدید برای LLM — Werewolf Benchmark
در ماههای اخیر بنچمارکهای خلاقانه و متفاوتی برای مدلهای زبانی بزرگ معرفی شدهاند. یکی از تازهترینها Werewolf Benchmark است که توانایی استدلال اجتماعی تحت فشار را میسنجد.
🎭 این تست بر اساس بازی «مافیا» ساخته شده (که در دانشگاه دولتی مسکو اختراع شد).
نقشها: شهروندان، گرگینهها، دکتر، غیبگو، شکارچی و …
شب گرگینهها قربانی انتخاب میکنند، روز همه رأی میدهند چه کسی گرگینه است.
⚙️ روش کار:
♻️فرض کنید ۶ بازیکن داریم.
♻️سه بازیکن توسط مدل A و سه بازیکن توسط مدل B کنترل میشوند.
♻️هر مدل فکر میکند با افراد مستقل روبهروست، در حالی که در واقع «مغز واحدی» پشت بازیکنان است.
💡 نتیجه این طراحی:
♻️امکان تشکیل اتحادها 🤝
♻️بلف زدن 🃏
♻️قربانی کردن اعضای خودی
♻️ساخت روایتهای دروغین و ایجاد دسیسه
📊 در جدول رتبهبندی فعلی، GPT-5 با اختلاف زیاد اول است. این یعنی نهتنها توانایی استدلال و استراتژی بالایی دارد، بلکه توانایی فریب دادن را هم نشان میدهد 😐
👉 این تست ابزاری جالب برای مطالعه الگوهای رفتاری مدلهای زبانی است.
🔗 جزئیات و لیدربورد: werewolf.foaster.ai
@rss_ai_ir 🐺🤖
#هوش_مصنوعی #LLM #بنچمارک #مافیا #گرگینه #استدلال_اجتماعی
در ماههای اخیر بنچمارکهای خلاقانه و متفاوتی برای مدلهای زبانی بزرگ معرفی شدهاند. یکی از تازهترینها Werewolf Benchmark است که توانایی استدلال اجتماعی تحت فشار را میسنجد.
🎭 این تست بر اساس بازی «مافیا» ساخته شده (که در دانشگاه دولتی مسکو اختراع شد).
نقشها: شهروندان، گرگینهها، دکتر، غیبگو، شکارچی و …
شب گرگینهها قربانی انتخاب میکنند، روز همه رأی میدهند چه کسی گرگینه است.
⚙️ روش کار:
♻️فرض کنید ۶ بازیکن داریم.
♻️سه بازیکن توسط مدل A و سه بازیکن توسط مدل B کنترل میشوند.
♻️هر مدل فکر میکند با افراد مستقل روبهروست، در حالی که در واقع «مغز واحدی» پشت بازیکنان است.
💡 نتیجه این طراحی:
♻️امکان تشکیل اتحادها 🤝
♻️بلف زدن 🃏
♻️قربانی کردن اعضای خودی
♻️ساخت روایتهای دروغین و ایجاد دسیسه
📊 در جدول رتبهبندی فعلی، GPT-5 با اختلاف زیاد اول است. این یعنی نهتنها توانایی استدلال و استراتژی بالایی دارد، بلکه توانایی فریب دادن را هم نشان میدهد 😐
👉 این تست ابزاری جالب برای مطالعه الگوهای رفتاری مدلهای زبانی است.
🔗 جزئیات و لیدربورد: werewolf.foaster.ai
@rss_ai_ir 🐺🤖
#هوش_مصنوعی #LLM #بنچمارک #مافیا #گرگینه #استدلال_اجتماعی
❤2🔥2👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
📚🤖 جشن آغاز سال تحصیلی با حضور ربات humanoid
برای نخستین بار در روسیه، در روز اول مدرسه (روز دانش) زنگ آغاز سال تحصیلی نه تنها توسط دانشآموزان، بلکه با کمک یک ربات انساننما Unitree G1 Edu Ultimate C به نام داشا نواخته شد.
🔹 ربات دasha با بهرهگیری از سیستم هوش مصنوعی بومی، به زبان روسی برای دانشآموزان و معلمان پانسیون وابسته به وزارت دفاع روسیه سخنرانی کرد. او توانست با تغییر لحن، شوخی کردن، واکنش به جملات مخاطب و حتی نشان دادن «احساسات»، فضایی شبیه گفتوگوی واقعی ایجاد کند.
🔹 نقطه اوج مراسم زمانی بود که دаша با استفاده از دستهای مکانیکی پیشرفته خود در زنگ مدرسه نواخت. هر انگشت این ربات موتور و سامانه حرکتی اختصاصی دارد که امکان انجام حرکات دقیق را فراهم میکند.
✨ این ربات علاوه بر توانایی گفتوگو، به لطف برنامهنویسی متخصصان روسی دارای قابلیتهای پیشرفتهای مانند تشخیص اشیاء و دنبال کردن هدف است؛ گامی مهم در ترکیب نوآوری، رباتیک و آموزش.
@rss_ai_ir ⚙️🇷🇺
#هوش_مصنوعی #رباتیک #آموزش #نوآوری #روبات_انساننما #فناوری
برای نخستین بار در روسیه، در روز اول مدرسه (روز دانش) زنگ آغاز سال تحصیلی نه تنها توسط دانشآموزان، بلکه با کمک یک ربات انساننما Unitree G1 Edu Ultimate C به نام داشا نواخته شد.
🔹 ربات دasha با بهرهگیری از سیستم هوش مصنوعی بومی، به زبان روسی برای دانشآموزان و معلمان پانسیون وابسته به وزارت دفاع روسیه سخنرانی کرد. او توانست با تغییر لحن، شوخی کردن، واکنش به جملات مخاطب و حتی نشان دادن «احساسات»، فضایی شبیه گفتوگوی واقعی ایجاد کند.
🔹 نقطه اوج مراسم زمانی بود که دаша با استفاده از دستهای مکانیکی پیشرفته خود در زنگ مدرسه نواخت. هر انگشت این ربات موتور و سامانه حرکتی اختصاصی دارد که امکان انجام حرکات دقیق را فراهم میکند.
✨ این ربات علاوه بر توانایی گفتوگو، به لطف برنامهنویسی متخصصان روسی دارای قابلیتهای پیشرفتهای مانند تشخیص اشیاء و دنبال کردن هدف است؛ گامی مهم در ترکیب نوآوری، رباتیک و آموزش.
@rss_ai_ir ⚙️🇷🇺
#هوش_مصنوعی #رباتیک #آموزش #نوآوری #روبات_انساننما #فناوری
❤3👍1🔥1👏1
🧩 زنجیره فکر (Chain-of-Thought) در مدلهای زبانی بزرگ
وقتی از یک مدل زبانی سوال میپرسیم، همیشه بهتر نیست فقط جواب نهایی را بدهد.
گاهی لازم است مدل مسیر استدلال خود را مرحلهبهمرحله بازگو کند؛ این همان چیزی است که به آن زنجیره فکر (CoT) میگوییم.
🔹 چرا مهم است؟
توانایی حل مسائل چندمرحلهای (ریاضی، منطقی، برنامهریزی).
کاهش خطاهای «پرش مستقیم به جواب».
شفافیت در نحوه رسیدن مدل به نتیجه.
🔹 مثال ساده
❓ علی ۳ سیب دارد، رضا ۲ سیب دارد. در مجموع چند سیب دارند؟
✅ پاسخ بدون زنجیره فکر: ۵
✅ پاسخ با زنجیره فکر: علی ۳ سیب دارد، رضا ۲ سیب دارد → ۳+۲=۵
📊 پژوهشها نشان دادهاند که استفاده از CoT باعث میشود مدلها در حل مسائل پیچیده عملکرد بسیار بهتری داشته باشند.
@rss_ai_ir 🤖🧠
#هوش_مصنوعی #LLM #زنجیره_فکر #Chain_of_Thought #مدل_زبان
وقتی از یک مدل زبانی سوال میپرسیم، همیشه بهتر نیست فقط جواب نهایی را بدهد.
گاهی لازم است مدل مسیر استدلال خود را مرحلهبهمرحله بازگو کند؛ این همان چیزی است که به آن زنجیره فکر (CoT) میگوییم.
🔹 چرا مهم است؟
توانایی حل مسائل چندمرحلهای (ریاضی، منطقی، برنامهریزی).
کاهش خطاهای «پرش مستقیم به جواب».
شفافیت در نحوه رسیدن مدل به نتیجه.
🔹 مثال ساده
❓ علی ۳ سیب دارد، رضا ۲ سیب دارد. در مجموع چند سیب دارند؟
✅ پاسخ بدون زنجیره فکر: ۵
✅ پاسخ با زنجیره فکر: علی ۳ سیب دارد، رضا ۲ سیب دارد → ۳+۲=۵
📊 پژوهشها نشان دادهاند که استفاده از CoT باعث میشود مدلها در حل مسائل پیچیده عملکرد بسیار بهتری داشته باشند.
@rss_ai_ir 🤖🧠
#هوش_مصنوعی #LLM #زنجیره_فکر #Chain_of_Thought #مدل_زبان
👍2🔥1👏1
🌆 SAT-SKYLINES:
بازسازی سهبعدی ساختمانها از تصاویر ماهوارهای
پژوهش تازهای با نام SAT-SKYLINES منتشر شده که هدف آن تولید مشهای سهبعدی از ساختمانها بر اساس ترکیب:
تصاویر ماهوارهای 🛰️
هندسه تقریبی و دادههای بازی Cities: Skylines 🏙️
🔹 ایده اینجاست که تصاویر دوبعدی ماهوارهای به همراه دادههای شبهواقعی از بازی، برای بازسازی سهبعدی شهری استفاده شوند. نتیجه کار: مدلهایی نزدیک به واقعیت که میتوانند در شبیهسازیها، طراحی شهری و حتی متاورس بهکار گرفته شوند.
📄 جزئیات بیشتر: arXiv:2508.18531
@rss_ai_ir 🤖🏗️
#هوش_مصنوعی #بینایی_ماشین #مدل_سهبعدی #unrealneural #شهرهوشمند
بازسازی سهبعدی ساختمانها از تصاویر ماهوارهای
پژوهش تازهای با نام SAT-SKYLINES منتشر شده که هدف آن تولید مشهای سهبعدی از ساختمانها بر اساس ترکیب:
تصاویر ماهوارهای 🛰️
هندسه تقریبی و دادههای بازی Cities: Skylines 🏙️
🔹 ایده اینجاست که تصاویر دوبعدی ماهوارهای به همراه دادههای شبهواقعی از بازی، برای بازسازی سهبعدی شهری استفاده شوند. نتیجه کار: مدلهایی نزدیک به واقعیت که میتوانند در شبیهسازیها، طراحی شهری و حتی متاورس بهکار گرفته شوند.
📄 جزئیات بیشتر: arXiv:2508.18531
@rss_ai_ir 🤖🏗️
#هوش_مصنوعی #بینایی_ماشین #مدل_سهبعدی #unrealneural #شهرهوشمند
👍2🔥1👏1
🖥️ نمونههای کدنویسی با GPT-5
با یک پرامپت ساده میتوان یک وبسایت تکصفحهای ساخت! 🎨
اینجا مجموعهای از مثالها جمعآوری شده که نشان میدهد چطور میتوان از GPT-5 برای ایجاد اپلیکیشنهای سبک استفاده کرد:
🔗 نمونهها
✨ نکته جالب اینجاست که هیچ جادویی در کار نیست؛ فقط سایت مرتب و شستهرفتهای ساخته شده تا بتوانید از آن ترفندها و ساختارهای مختلف یاد بگیرید.
📌 حتی میتوانید ببینید چطور پرامپت مستقیماً داخل کادر ورودی قرار داده میشود و کافی است روی Enter بزنید:
👉 مثال زنده
@rss_ai_ir 🤖💡
#GPT5 #هوش_مصنوعی #کدنویسی #فرانتاند #وب #AI_industrial_news
با یک پرامپت ساده میتوان یک وبسایت تکصفحهای ساخت! 🎨
اینجا مجموعهای از مثالها جمعآوری شده که نشان میدهد چطور میتوان از GPT-5 برای ایجاد اپلیکیشنهای سبک استفاده کرد:
🔗 نمونهها
✨ نکته جالب اینجاست که هیچ جادویی در کار نیست؛ فقط سایت مرتب و شستهرفتهای ساخته شده تا بتوانید از آن ترفندها و ساختارهای مختلف یاد بگیرید.
📌 حتی میتوانید ببینید چطور پرامپت مستقیماً داخل کادر ورودی قرار داده میشود و کافی است روی Enter بزنید:
👉 مثال زنده
@rss_ai_ir 🤖💡
#GPT5 #هوش_مصنوعی #کدنویسی #فرانتاند #وب #AI_industrial_news
👍3🔥1🙏1
🍌 معرفی Zananabanana — مدلی با «درک از جهان»
برخلاف Flux یا Reve، درون بانانا یک مدل زبانی چندوجهی (Multimodal LLM) قرار دارد که فقط تصویر تولید نمیکند، بلکه مفاهیم پایهای از جهان را هم میشناسد:
کمی فیزیک بلد است ⚖️
✳️جغرافیا را خوب میشناسد 🌍
✳️از تاریخ سر در میآورد 📜
✳️و بهطور کلی ارتباطات و قوانین دنیا را میفهمد.
👉 به همین دلیل میتوان پرامپتهایی هوشمندانهتر نسبت به مدلهای دیفیوشنی نسل قبل نوشت.
🔹 یکی از ترفندهای جالب: استفاده از جایگزینی داخل [object] در پرامپت.
مثال:
که در آن [object] میتواند house یا room باشد.
✨ امکانات جذاب:
♻️میتوان درخواست چند زاویه مختلف از همان ایزومتریک را داد.
♻️میتوان رندرها را در ابزارهایی مثل Klinger (با قابلیت First Frame → Last Frame) انداخت و پروازی مجازی روی آبجکت داشت.
♻️حتی میشود خواست یک wireframe روی آن بیندازد، انگار که یک مدل سهبعدی پولیگانی است.
@rss_ai_ir 🤖🎨
#هوش_مصنوعی #مدل_تولیدی #بانانا #گرافیک #AI_industrial_news
برخلاف Flux یا Reve، درون بانانا یک مدل زبانی چندوجهی (Multimodal LLM) قرار دارد که فقط تصویر تولید نمیکند، بلکه مفاهیم پایهای از جهان را هم میشناسد:
کمی فیزیک بلد است ⚖️
✳️جغرافیا را خوب میشناسد 🌍
✳️از تاریخ سر در میآورد 📜
✳️و بهطور کلی ارتباطات و قوانین دنیا را میفهمد.
👉 به همین دلیل میتوان پرامپتهایی هوشمندانهتر نسبت به مدلهای دیفیوشنی نسل قبل نوشت.
🔹 یکی از ترفندهای جالب: استفاده از جایگزینی داخل [object] در پرامپت.
مثال:
"Make an isometric model of the [object] only."
که در آن [object] میتواند house یا room باشد.
✨ امکانات جذاب:
♻️میتوان درخواست چند زاویه مختلف از همان ایزومتریک را داد.
♻️میتوان رندرها را در ابزارهایی مثل Klinger (با قابلیت First Frame → Last Frame) انداخت و پروازی مجازی روی آبجکت داشت.
♻️حتی میشود خواست یک wireframe روی آن بیندازد، انگار که یک مدل سهبعدی پولیگانی است.
@rss_ai_ir 🤖🎨
#هوش_مصنوعی #مدل_تولیدی #بانانا #گرافیک #AI_industrial_news
👍2🔥1👏1
🚨 خطای مرگبار در اعتماد به ChatGPT برای تشخیص پزشکی
یک پدر ۳۷ ساله اهل ایرلند به دلیل اعتماد به پاسخهای ChatGPT در مورد درد گلویش، ماهها مراجعه به پزشک را به تأخیر انداخت. ربات به او اطمینان داده بود که این مشکل «بهاحتمال زیاد سرطان نیست» و ناشی از کشیدگی عضلانی است.
❌ وقتی بالاخره به بیمارستان رفت، پزشکان تشخیص دادند که او به سرطان پیشرفته مری (مرحله ۴) مبتلاست — با نرخ بقا زیر ۱۰٪.
💼 همسر او کمپینی برای جمعآوری کمک مالی جهت درمان در خارج از کشور راهاندازی کرده، زیرا پزشکان ایرلندی تنها مراقبت تسکینی را پیشنهاد دادهاند.
⚠️ این پرونده نشان میدهد که استفاده از چتباتهای هوش مصنوعی برای اطمینان پزشکی میتواند خطرناک باشد. اعتماد بیجا ممکن است زمان حیاتی را در بیماریهای تهدیدکننده زندگی از بین ببرد.
لینک
@rss_ai_ir ⚙️🩺
#هوش_مصنوعی #پزشکی #ChatGPT #سرطان #خطرات_AI
یک پدر ۳۷ ساله اهل ایرلند به دلیل اعتماد به پاسخهای ChatGPT در مورد درد گلویش، ماهها مراجعه به پزشک را به تأخیر انداخت. ربات به او اطمینان داده بود که این مشکل «بهاحتمال زیاد سرطان نیست» و ناشی از کشیدگی عضلانی است.
❌ وقتی بالاخره به بیمارستان رفت، پزشکان تشخیص دادند که او به سرطان پیشرفته مری (مرحله ۴) مبتلاست — با نرخ بقا زیر ۱۰٪.
💼 همسر او کمپینی برای جمعآوری کمک مالی جهت درمان در خارج از کشور راهاندازی کرده، زیرا پزشکان ایرلندی تنها مراقبت تسکینی را پیشنهاد دادهاند.
⚠️ این پرونده نشان میدهد که استفاده از چتباتهای هوش مصنوعی برای اطمینان پزشکی میتواند خطرناک باشد. اعتماد بیجا ممکن است زمان حیاتی را در بیماریهای تهدیدکننده زندگی از بین ببرد.
لینک
@rss_ai_ir ⚙️🩺
#هوش_مصنوعی #پزشکی #ChatGPT #سرطان #خطرات_AI
👍2👎1🔥1😱1
🛠️ CAD-GPT:
هوش مصنوعی برای طراحی سهبعدی
♻️مدل CAD-GPT یک LLM چندوجهی است که میتواند بر اساس پرامپت متنی یا حتی یک تصویر، فایلهای CAD (بهصورت مجموعهای از پارامترها) تولید کند.
🔹 در نمونههای ارائهشده، اشکال ساده سهبعدی ساخته شدهاند، اما همین هم نشان میدهد که این رویکرد میتواند نقطه شروعی جدی برای طراحی هوشمند باشد.
💡 ایده اصلی روش:
♻️مدل، موقعیتهای سهبعدی در فضا را به یک فضای زبانی یکبعدی نگاشت میکند؛ در نتیجه خروجی آن چیزی شبیه کد CAD است.
📄 جزئیات بیشتر: CAD-GPT
@rss_ai_ir 🤖🏗️
#هوش_مصنوعی #مدل_زبان #CAD #سهبعدی #طراحی #AI_industrial_news
هوش مصنوعی برای طراحی سهبعدی
♻️مدل CAD-GPT یک LLM چندوجهی است که میتواند بر اساس پرامپت متنی یا حتی یک تصویر، فایلهای CAD (بهصورت مجموعهای از پارامترها) تولید کند.
🔹 در نمونههای ارائهشده، اشکال ساده سهبعدی ساخته شدهاند، اما همین هم نشان میدهد که این رویکرد میتواند نقطه شروعی جدی برای طراحی هوشمند باشد.
💡 ایده اصلی روش:
♻️مدل، موقعیتهای سهبعدی در فضا را به یک فضای زبانی یکبعدی نگاشت میکند؛ در نتیجه خروجی آن چیزی شبیه کد CAD است.
📄 جزئیات بیشتر: CAD-GPT
@rss_ai_ir 🤖🏗️
#هوش_مصنوعی #مدل_زبان #CAD #سهبعدی #طراحی #AI_industrial_news
This media is not supported in your browser
VIEW IN TELEGRAM
🪴 Pixie: Physics from Pixels 🪴
پژوهشگران دانشگاههای UPenn و MIT از مدل Pixie رونمایی کردند؛ یک شبکه عصبی که میتواند ویژگیهای بصری پیشآموزشدیده (مثل CLIP) را به فیلدهای متراکم ویژگیهای فیزیکی مواد نگاشت کند — آن هم تنها در یک forward pass.
🔹 نتیجه: شبیهسازی فیزیک در زمان واقعی (Real-time) ✨
📂 این پروژه شامل دیتاست و کد متنباز تحت لایسنس MIT است.
🔗 منابع:
👉 مرور
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #شبیهسازی #Pixie #فیزیک #بینایی_ماشین #AI_industrial_news
پژوهشگران دانشگاههای UPenn و MIT از مدل Pixie رونمایی کردند؛ یک شبکه عصبی که میتواند ویژگیهای بصری پیشآموزشدیده (مثل CLIP) را به فیلدهای متراکم ویژگیهای فیزیکی مواد نگاشت کند — آن هم تنها در یک forward pass.
🔹 نتیجه: شبیهسازی فیزیک در زمان واقعی (Real-time) ✨
📂 این پروژه شامل دیتاست و کد متنباز تحت لایسنس MIT است.
🔗 منابع:
👉 مرور
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #شبیهسازی #Pixie #فیزیک #بینایی_ماشین #AI_industrial_news