VIRSUN
15.7K subscribers
350 photos
210 videos
2 files
215 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
📉 عدم تعادل کلاس‌ها؛ دشمن خاموش یادگیری عمیق در مسائل واقعی

@rss_ai_ir
🎯 در بسیاری از پروژه‌های صنعتی و پزشکی، داده‌های ما به‌صورت طبیعی نامتوازن هستند. یعنی برخی کلاس‌ها (مثلاً قطعات معیوب یا بیماران نادر) بسیار کمتر از کلاس‌های عادی در دیتاست حضور دارند.

🤖 در شبکه‌های کانولوشنی (CNN)، این عدم تعادل باعث می‌شود مدل با سرعت بیشتری کلاس پرتکرار را یاد بگیرد و کلاس اقلیت را نادیده بگیرد. نتیجه چیست؟
مدلی که به‌ظاهر دقت بالا دارد، اما در شناسایی موارد بحرانی کاملاً ناکارآمد است.


⚠️ مشکلات اصلی ناشی از عدم تعادل کلاس:
– تمایل مدل به پیش‌بینی کلاس اکثریت
– کاهش حساسیت (Recall) برای کلاس‌های نادر
– یادگیری ناقص ویژگی‌های مهم در کلاس اقلیت
– ناتوانی در تعمیم‌پذیری مدل به داده‌های واقعی


🛠 برای مقابله با این چالش، راهکارهایی وجود دارد:
🔹 استفاده از تابع زیان مناسب مثل Focal Loss
🔹 وزن‌دهی کلاس‌ها در تابع زیان
🔹اعمال Oversampling برای کلاس‌های اقلیت یا Undersampling برای کلاس اکثریت
🔹 استفاده از تکنیک‌های ترکیبی مثل SMOTE
🔹 استفاده از شاخص‌های ارزیابی دقیق‌تر مانند AUC و F1 به‌جای Accuracy ساده


📌 اگر در پروژه‌ای با داده‌های نامتوازن کار می‌کنید، حتماً به نحوه آموزش CNN و تحلیل شاخص‌های عملکرد آن دقت بیشتری داشته باشید. یادگیری صحیح کلاس اقلیت، کلید موفقیت مدل در شرایط واقعی است.

#یادگیری_عمیق #عدم_توازن #شبکه_عصبی #تشخیص_عیب #هوش_مصنوعی #طبقه‌بندی_تصاویر #CNN #AI_Industrial

@rss_ai_ir
🔥21👍20👏1716😁16🎉11🥰10
📌 ربات‌ها در آستانه ورود به زندگی روزمره
@rss_ai_ir

🤖 وان شین‌سین، بنیان‌گذار Unitree Robotics، اعلام کرده که در ۱ تا ۲ سال آینده صنعت رباتیک جهشی هم‌تراز با ظهور ChatGPT خواهد داشت. ربات‌ها قادر خواهند بود در محیط‌های ناشناخته و بدون برنامه‌نویسی قبلی وظایفی مانند تمیز کردن یا تحویل اشیا را انجام دهند.

🔍 به گفته او، سخت‌افزار برای این مرحله آماده است، اما «هوش مصنوعی برای هوش تجسدی» (Embodied Intelligence) هنوز عقب‌تر از نیاز بازار است.

⚙️ مدل‌های Vision-Language-Action در حال حاضر برای کارهای پیچیده بیش‌ازحد ساده‌سازی شده‌اند. Unitree این مدل‌ها را همراه با یادگیری تقویتی (Reinforcement Learning) استفاده می‌کند، اما این رویکرد هنوز به بهبود نیاز دارد.

💡 آینده در مدلی است که بتواند از متن، ویدئو یا شبیه‌سازی فیزیکی محیط بسازد و بر اساس آن حرکات ربات را کنترل کند. نمونه‌ای از این رویکرد، مدل جهانی Genie 3 گوگل است که ویژگی‌های فیزیکی اشیا را در نظر می‌گیرد.

#هوش_مصنوعی #رباتیک #EmbodiedIntelligence #VisionLanguageAction #Genie3 #یادگیری_تقویتی #AI_industrial_news
🔥3👍1👏1
📌 یادگیری تقویتی در صنعت — چه زمانی مناسب است؟
@rss_ai_ir 🤖🏭

یادگیری تقویتی (Reinforcement Learning) زمانی در پروژه‌های صنعتی کاربرد دارد که:


---

🔹 محیط پویا و غیرقطعی است
وقتی فرآیند یا سیستم دائم در حال تغییر است و مدل باید به مرور زمان بهترین تصمیم را یاد بگیرد، RL انتخاب مناسبی است.
#DynamicSystems

🔹 هدف رسیدن به حداکثر بهره‌وری در بلندمدت است
اگر سود یا کیفیت وابسته به سلسله‌ تصمیم‌ها باشد و نه یک خروجی لحظه‌ای، RL می‌تواند راه‌حل بهینه ارائه دهد.
#LongTermOptimization

🔹 امکان شبیه‌سازی یا تعامل مکرر با سیستم وجود دارد
RL برای یادگیری نیاز به آزمون‌وخطای فراوان دارد؛ داشتن یک شبیه‌ساز صنعتی یا امکان تست ایمن روی سیستم، ضروری است.
#IndustrialSimulation

🔹 قوانین تصمیم‌گیری سخت و دقیق نیستند
وقتی نمی‌توان با قوانین از پیش‌تعریف‌شده تمام سناریوها را پوشش داد، RL می‌تواند با تجربه‌آموزی، سیاست تصمیم‌گیری را کشف کند.
#AdaptiveControl

🔹 مسئله چندمرحله‌ای یا کنترل فرآیند است
از کنترل ربات‌ها و خطوط تولید گرفته تا زمان‌بندی تعمیرات و مدیریت مصرف انرژی، RL در مسائل Sequential Decision Making می‌درخشد.
#ProcessControl


---

📍 مثال‌ها در صنعت:

♻️بهینه‌سازی مصرف انرژی در کارخانه
♻️کنترل بازوی رباتیک در مونتاژ
♻️زمان‌بندی تولید و تعمیرات پیشگیرانه
♻️تنظیمات خودکار پارامترهای فرآیند ذوب یا ریخته‌گری


#ReinforcementLearning #هوش_مصنوعی #AI_industrial #RL_industry #machinelearning
🔥8👍7🎉53😁3👏1
🚀مدل MolmoAct: نسل تازه مدل‌های بینایی-زبان-اکشن برای رباتیک

🧩 پژوهشگران در مقاله‌ای جدید MolmoAct را معرفی کرده‌اند؛ یک مدل متن‌باز VLA (Vision-Language-Action) که برای دستکاری رباتیک طراحی شده و با استدلال فضایی چندمرحله‌ای کار می‌کند.

🔹 ایده کلیدی
برخلاف روش‌های مرسوم end-to-end که از تصویر مستقیم به اکشن می‌روند، MolmoAct یک لایه میانی استدلال فضایی اضافه می‌کند تا:

♻️تعمیم‌پذیری بهتر

♻️شفافیت در تصمیم‌گیری

♻️امکان تعامل و اصلاح توسط کاربر


🔹 مراحل تولید خودبازگشتی (ARM)
مدل با ورودی تصویری + دستور زبانی سه نوع توکن تولید می‌کند:

1. توکن‌های عمق → نمایش هندسه سه‌بعدی صحنه


2. توکن‌های استدلال تصویری → مسیر دوبعدی (Polyline) برنامه‌ریزی‌شده برای ابزار انتهایی


3. توکن‌های اکشن سطح پایین



🔹 نتایج برجسته

📈 86.6% میانگین موفقیت در دیتاست LIBERO (بهترین عملکرد نسبت به همه مدل‌های پایه)

🦾 در وظایف واقعی، تا 22.7% بهبود پیشرفت کارها نسبت به خط پایه π-FAST در کارهای دو-دستی


🔹 اهمیت برای صنعت
ساختار شفاف و قابل‌ویرایش MolmoAct این امکان را می‌دهد که کاربران مسیر حرکت ربات را ویرایش کنند (Editable Trajectory Steering) و همین قابلیت آن را برای ربات‌های صنعتی و همکاری انسان-ماشین بسیار ارزشمند می‌کند.

📚 منبع: arXiv و HuggingFace

🌐 @rss_ai_ir
#هوش_مصنوعی #رباتیک #VisionLanguageModels #AI_industrial
😁9🔥86🎉6👍5