VIRSUN
15.7K subscribers
351 photos
211 videos
2 files
216 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
🎓 ویدیوی کارتونی: یادگیری تقویتی از صفر تا درک!


اگر هنوز نمی‌دونی یادگیری تقویتی (Reinforcement Learning) چطور کار می‌کنه، این انیمیشن کوتاه و بامزه دقیقاً همونه که دنبالش بودی!

💡 توی این ویدیو با مفاهیم پایه RL آشنا می‌شی مثل:
– عامل (Agent)، محیط (Environment)، پاداش (Reward)، سیاست رفتاری (Policy)
– چطور یه عامل با آزمون‌و‌خطا یاد می‌گیره که بهترین تصمیم رو بگیره؟
– چرا RL با بقیه روش‌های یادگیری ماشین فرق داره؟

🔁 مناسب برای مبتدی‌ها، دانشجوها و علاقه‌مندان به هوش مصنوعی که می‌خوان مفاهیم رو تصویری و قابل لمس یاد بگیرن.

زیرنویس فارسی.

#هوش_مصنوعی #یادگیری_تقویتی #ReinforcementLearning #AI #آموزش #RL #DeepLearning #ویدیو_آموزشی

@rss_ai_ir
🔥41🙏1
🚦 ابزار جدید MIT برای یادگیری تقویتی در ترافیک هوشمند: IntersectionZoo

---

دانشگاه MIT در تیرماه ۲۰۲۵ از بنچمارکی پیشرفته به نام IntersectionZoo رونمایی کرد؛ ابزاری تحول‌آفرین برای ارزیابی الگوریتم‌های یادگیری تقویتی عمیق (Deep RL) در سناریوهای واقع‌گرایانه ترافیکی.
---
این ابزار شامل بیش از ۱ میلیون سناریوی واقعی تقاطع شهری است و به‌طور خاص بر روی دو کاربرد مهم تمرکز دارد:
✔️ بهینه‌سازی رانندگی برای کاهش مصرف انرژی (eco-driving)
✔️ کنترل چندعاملی (multi-agent RL) در محیط‌های پویا

---
ویژگی منحصربه‌فرد IntersectionZoo این است که برخلاف اغلب بنچمارک‌های قبلی، موضوع تعمیم‌پذیری (Generalization) را هدف قرار داده است. یعنی بررسی می‌کند آیا یک عامل یادگیرنده که در یک تقاطع خاص آموزش دیده، در شرایط جدید مثل اضافه شدن دوچرخه‌سوار یا تغییر چراغ راهنمایی هم می‌تواند تصمیم درست بگیرد یا خیر.
---

بر اساس سخنان پروفسور کَتی وو (Cathy Wu) از MIT:
«هدف ما فقط تست دقت نبود، بلکه می‌خواستیم بدانیم آیا RL واقعاً می‌تونه در شرایط دنیای واقعی مثل ترافیک شهری، مصرف انرژی و آلودگی را کاهش بده؟ و پاسخ این سوال فقط با تست پایداری و تعمیم‌پذیری ممکنه.»
---

این بنچمارک می‌تواند در حوزه‌های زیر نقش کلیدی ایفا کند:
🔹 شهرهای هوشمند
🔹 کنترل تطبیقی چراغ‌های راهنمایی
🔹 خودروهای خودران
🔹 ربات‌های لجستیکی در محیط‌های پیچیده
---
لینک‌های رسمی و منابع:
📄 توضیحات رسمی: MIT News
💻 کد و مستندات:
link
📘 مقاله کامل:
link
---
#یادگیری_تقویتی #هوش_مصنوعی #RL #کنترل_هوشمند #رباتیک #شهر_هوشمند #MIT #IntersectionZoo #اکو_درایوینگ

📡 برای تحلیل‌های تخصصی از ابزارها و پژوهش‌های روز AI:
🔗 https://yangx.top/rss_ai_ir
2👍1🙏1
🧠 ۹ تکنیک مدرن برای بهینه‌سازی سیاست (Policy Optimization) در مدل‌های هوش مصنوعی

در دنیای مدل‌های زبانی بزرگ (LLM)، الگوریتم‌های تقویتی مثل RLHF باید بهینه، دقیق و کم‌مصرف باشند. این ۹ روش جدید، هر کدام برای یک چالش خاص طراحی شده‌اند 👇

🔹 1. GSPO: بهینه‌سازی مبتنی بر توالی کامل پاسخ، نه فقط توکن‌ها. مناسب برای مدل‌های بسیار بزرگ.
🔹 2. LAPO: تطبیق طول پاسخ با آموزش دو مرحله‌ای. کاهش مصرف توکن تا ۴۰٪!
🔹 3. HBPO: استفاده از بودجه توکنی (۵۱۲ تا ۲۵۶۰) برای آموزش مؤثرتر. دقت بالاتر، مصرف پایین‌تر.
🔹 4. SOPHIA: ترکیب یادگیری بینایی و زبان با پاداش چندبخشی.
🔹 5. RePO: حافظه‌ی replay برای تنوع بیشتر در نمونه‌ها.
🔹 6. CISPO: کلیپ کردن وزن‌های نمونه برای کنترل نوسان گرادیان.
🔹 7. PAPO: افزایش دقت مدل‌های vision-language با تطبیق ادراک و پاسخ.
🔹 8. OPO: یادگیری کامل on-policy بدون نیاز به baseline خارجی.
🔹 9. EXPO: ترکیب یک مدل اصلی با مدل ویرایشگر سبک و سریع.

💡 این روش‌ها در پروژه‌های مدل‌سازی زبانی، بینایی‌زبانی، بازیابی اطلاعات و RL بسیار مؤثر هستند.

📥 مطالعه کامل این روش‌ها با مثال:
🔗 HuggingFace Post

#هوش_مصنوعی #RL #LLM #الگوریتم #یادگیری_تقویتی #پاداش #توکن #GPT
🆔 @rss_ai_ir
👍2🔥1👏1😁1
📚 یکی از بهترین دوره‌های رایگان برای یادگیری تقویتی!

♻️دانشگاه UCL با همکاری DeepMind دوره‌ای ۲۰ ساعته ارائه داده که به‌جرئت میشه گفت یکی از کامل‌ترین و محبوب‌ترین منابع آموزش یادگیری تقویتی تو دنیاست.


🔍 از مفاهیم پایه مثل Q-Learning و SARSA شروع می‌کنه، بعد سراغ الگوریتم‌های پیشرفته‌تری مثل Rainbow DQN می‌ره و در ادامه مفاهیمی مثل off-policy، eligibility trace و multi-step learning رو هم با دقت آموزش می‌ده.

🎓 تا الان بیش از ۲۵۰ هزار نفر از محقق‌ها و توسعه‌دهنده‌های AI ازش استفاده کردن.


📺 ویدئوها روی یوتیوب هستن
💻 کدها و پروژه‌ها توی گیت‌هاب
🔗 لینک‌ها:
YouTube Playlist
GitHub Repo

#یادگیری_تقویتی #هوش_مصنوعی #RL #AI

@rss_ai_ir
3🔥1👏1
📌 یادگیری تقویتی در صنعت — چه زمانی مناسب است؟
@rss_ai_ir 🤖🏭

یادگیری تقویتی (Reinforcement Learning) زمانی در پروژه‌های صنعتی کاربرد دارد که:


---

🔹 محیط پویا و غیرقطعی است
وقتی فرآیند یا سیستم دائم در حال تغییر است و مدل باید به مرور زمان بهترین تصمیم را یاد بگیرد، RL انتخاب مناسبی است.
#DynamicSystems

🔹 هدف رسیدن به حداکثر بهره‌وری در بلندمدت است
اگر سود یا کیفیت وابسته به سلسله‌ تصمیم‌ها باشد و نه یک خروجی لحظه‌ای، RL می‌تواند راه‌حل بهینه ارائه دهد.
#LongTermOptimization

🔹 امکان شبیه‌سازی یا تعامل مکرر با سیستم وجود دارد
RL برای یادگیری نیاز به آزمون‌وخطای فراوان دارد؛ داشتن یک شبیه‌ساز صنعتی یا امکان تست ایمن روی سیستم، ضروری است.
#IndustrialSimulation

🔹 قوانین تصمیم‌گیری سخت و دقیق نیستند
وقتی نمی‌توان با قوانین از پیش‌تعریف‌شده تمام سناریوها را پوشش داد، RL می‌تواند با تجربه‌آموزی، سیاست تصمیم‌گیری را کشف کند.
#AdaptiveControl

🔹 مسئله چندمرحله‌ای یا کنترل فرآیند است
از کنترل ربات‌ها و خطوط تولید گرفته تا زمان‌بندی تعمیرات و مدیریت مصرف انرژی، RL در مسائل Sequential Decision Making می‌درخشد.
#ProcessControl


---

📍 مثال‌ها در صنعت:

♻️بهینه‌سازی مصرف انرژی در کارخانه
♻️کنترل بازوی رباتیک در مونتاژ
♻️زمان‌بندی تولید و تعمیرات پیشگیرانه
♻️تنظیمات خودکار پارامترهای فرآیند ذوب یا ریخته‌گری


#ReinforcementLearning #هوش_مصنوعی #AI_industrial #RL_industry #machinelearning
🔥8👍7🎉53😁3👏1