VIRSUN
15.7K subscribers
350 photos
210 videos
2 files
215 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🎓🧠 تحولی نو از MIT: بازآفرینی تصویر با توکنایزرها و کشف میانبرهای ریاضی در مدل‌های زبانی!

پژوهشگران مؤسسه فناوری ماساچوست (MIT) در دو پروژه‌ی پیشرو، کاربردهای جدیدی از توکنایزرها و مدل‌های زبانی بزرگ (LLMs) را در حوزه بینایی ماشین و استدلال ریاضیاتی به نمایش گذاشته‌اند. این پیشرفت‌ها می‌توانند مسیر توسعه مدل‌های چندحالته و reasoning در نسل‌های آینده‌ی هوش مصنوعی را متحول کنند.
---
🔸 ۱. ویرایش و تولید تصویر با استفاده از توکنایزرهای متنی (Tokenizer-to-Image Framework)
♻️در روش نوآورانه‌ی MIT، یک تصویر ابتدا به مجموعه‌ای از توکن‌ها با معنی خاص ترجمه می‌شود، مشابه نحوه‌ی پردازش زبان طبیعی در مدل‌های ترنسفورمر. سپس با اصلاح این توکن‌ها — درست مانند ویرایش جملات — می‌توان ویژگی‌های محتوایی یا ظاهری تصویر را تغییر داد یا تصویر جدیدی تولید کرد.

📌 مزایا:

♻️کاهش نیاز به مدل‌های حجیم Vision.
♻️امکان کنترل دقیق و قابل‌درک روی ساختار تصاویر.
♻️سازگاری بالا با مدل‌های متنی موجود.


🔗 مطالعه کامل MIT درباره ویرایش/تولید تصویر

---
🔸 ۲. کشف میانبرهای ریاضیاتی (Mathematical Shortcuts) در مدل‌های زبانی بزرگ (LLM)
در پروژه‌ای دیگر، تیم تحقیقاتی MIT کشف کرده که مدل‌های زبانی هنگام مواجهه با سناریوهای پیچیده‌ی دینامیک (مثلاً فیزیک، پیش‌بینی، یا تصمیم‌گیری در شرایط متغیر) به‌جای محاسبه‌ی کامل، تمایل دارند از یک نوع ساختار ریاضیاتی میان‌بر استفاده کنند که به آنها امکان استنتاج سریع‌تر و دقیق‌تر می‌دهد.

📌 این کشف می‌تواند:

♻️به طراحی LLMهای آینده با تمرکز بر قابلیت reasoning کمک کند.
♻️زمینه‌ساز مدل‌هایی با توانایی بیشتر در حل مسائل پیچیده فیزیکی، ریاضی یا برنامه‌ریزی چندمرحله‌ای باشد.
♻️پیوندی بین شبکه‌های عصبی و سیستم‌های نمادین (symbolic AI) برقرار کند.

🔗 مطالعه کامل MIT درباره میانبرهای ریاضی در LLMs

---
🎯 جمع‌بندی تخصصی:
✳️این مطالعات MIT نشان می‌دهد که آینده‌ی هوش مصنوعی در همگرایی توانمندی‌های چندرسانه‌ای (vision, language, structure) و تعمیق درک ساختارهای ریاضی و استدلال نهفته است. ترکیب توکنایزرهای قابل تفسیر با قدرت مدل‌های زبانی می‌تواند دروازه‌ای به‌سوی AIهای قابل‌کنترل‌تر، دقیق‌تر و کاراتر باشد.

---
📡 دنبال کنید برای تحلیل تخصصی اخبار روز AI:
@rss_ai_ir


#خبر_AI #MIT #ویرایش_تصویر #توکنایزر #مدل_زبانی #استدلال #Reasoning #LLM #VisionTransformer #AI_Research #AI_Tools #هوش_مصنوعی
👍2🔥2👏1
🌀 آینده مدل‌های زبانی در مسیر DiffusionLM؟

♻️مدل‌های زبانی مبتنی بر انتشار یا DiffusionLM به‌عنوان نسل جدید معماری‌های تولید متن، توجه محققان را به‌خود جلب کرده‌اند؛ به‌ویژه در شرایطی که داده‌های آموزشی محدود هستند و نیاز به استدلال عمیق‌تری وجود دارد.

♻️در معماری Diffusion، برخلاف مدل‌های اتورگرسیو (AR) که متن را به‌صورت گام‌به‌گام پیش‌بینی می‌کنند، فرآیند تولید شامل افزودن نویز به داده و سپس بازسازی آن به‌صورت تدریجی است. این ساختار امکان استفاده چندباره از داده (تا صدها بار) را فراهم می‌سازد، در حالی‌که مدل‌های AR معمولاً پس از چند ایپاک به اشباع می‌رسند.

📌 مزایای کلیدی DiffusionLM:

✳️توانایی استخراج اطلاعات عمیق‌تر از داده‌های محدود
✳️انعطاف بالا در کنترل ساختار و محتوای خروجی
✳️کارایی بهتر در سناریوهای reasoning و پاسخ به پرسش‌های ترکیبی
✳️قابلیت تعمیم بهتر به وظایف جدید با داده کم


♻️از منظر عملکرد، در سناریوهایی که داده‌ کم ولی منابع محاسباتی کافی هستند، مدل‌های Diffusion برتری محسوسی نسبت به مدل‌های سنتی AR دارند. اگرچه سرعت تولید متن در Diffusion پایین‌تر است، اما کیفیت و قابلیت هدایت‌پذیری خروجی به‌ویژه برای کاربردهایی مانند agentهای زبانی یا تولید محتوای دقیق‌تر، بسیار بالاست.

📚 مطالعهٔ کامل پژوهش:
🔗 arXiv:2507.15857 - DiffusionLM vs AR

——
@rss_ai_ir
#هوش_مصنوعی #مدل_زبانی #NLP #DiffusionLM #LLM #یادگیری_عمیق #Reasoning #AI
👍2🔥2👏1
📊 آمار جالب از سمت Altman

قبل از معرفی GPT-5، تنها حدود ۷٪ از کاربران نسخه Plus سراغ مدل‌های Reasoning می‌رفتند. حالا این عدد به ۲۴٪ رسیده است، چون سیستم جدید به‌صورت خودکار درخواست‌ها را به مدل‌های استدلالی هدایت می‌کند.

در بخش کاربران رایگان، اوضاع حتی جالب‌تر است: پیش‌تر کمتر از ۱٪ آن‌ها Reasoning Models را امتحان کرده بودند، ولی حالا این رقم به ۷٪ رسیده است.

پرسش اینجاست که آیا همه واقعاً این‌قدر به gpt-4o علاقه‌مند بودند، یا مشکل اصلی این بوده که بلد نبودند از منوی کشویی انتخاب مدل استفاده کنند؟ 😄

#هوش_مصنوعی #GPT5 #Reasoning #OpenAI
@rss_ai_ir 🚀
18🥰12👏12🎉6👍5🔥5😁4