VIRSUN
13.9K subscribers
494 photos
293 videos
2 files
297 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🛠️ CAD-GPT:
هوش مصنوعی برای طراحی سه‌بعدی

♻️مدل CAD-GPT یک LLM چندوجهی است که می‌تواند بر اساس پرامپت متنی یا حتی یک تصویر، فایل‌های CAD (به‌صورت مجموعه‌ای از پارامترها) تولید کند.

🔹 در نمونه‌های ارائه‌شده، اشکال ساده سه‌بعدی ساخته شده‌اند، اما همین هم نشان می‌دهد که این رویکرد می‌تواند نقطه شروعی جدی برای طراحی هوشمند باشد.

💡 ایده اصلی روش:
♻️مدل، موقعیت‌های سه‌بعدی در فضا را به یک فضای زبانی یک‌بعدی نگاشت می‌کند؛ در نتیجه خروجی آن چیزی شبیه کد CAD است.

📄 جزئیات بیشتر: CAD-GPT

@rss_ai_ir 🤖🏗️

#هوش_مصنوعی #مدل_زبان #CAD #سه‌بعدی #طراحی #AI_industrial_news
🔥15👏14🎉13👍10😁108🥰6
This media is not supported in your browser
VIEW IN TELEGRAM
🪴 Pixie: Physics from Pixels 🪴

پژوهشگران دانشگاه‌های UPenn و MIT از مدل Pixie رونمایی کردند؛ یک شبکه عصبی که می‌تواند ویژگی‌های بصری پیش‌آموزش‌دیده (مثل CLIP) را به فیلدهای متراکم ویژگی‌های فیزیکی مواد نگاشت کند — آن هم تنها در یک forward pass.

🔹 نتیجه: شبیه‌سازی فیزیک در زمان واقعی (Real-time)

📂 این پروژه شامل دیتاست و کد متن‌باز تحت لایسنس MIT است.

🔗 منابع:
👉 مرور
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #شبیه‌سازی #Pixie #فیزیک #بینایی_ماشین #AI_industrial_news
👍9😁5🎉54🔥4🥰4👏4
This media is not supported in your browser
VIEW IN TELEGRAM
🍏 اپل دو مدل متن‌باز جدید معرفی کرد: FastVLM و MobileCLIP2

🔹 این مدل‌ها تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:

♻️OCR (تشخیص متن از تصویر)

♻️Image Captioning (تولید توضیحات برای تصاویر)

♻️Visual Question Answering (پاسخ به سوالات تصویری)

♻️Image Understanding (درک محتوای تصویر)


⚡️ اپل با این حرکت جدی‌تر از همیشه وارد رقابت مدل‌های سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.

لینک
@rss_ai_ir

#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
👍2🔥2👏2
🎬 PixVerse V5؛ نسل تازه‌ای از مدل‌های ویدیویی

بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. به‌نظر می‌رسد این نسخه تمام قابلیت‌های ترند روز را یک‌جا جمع کرده — حتی تا مرحله‌ی Lip-sync 👄🎶

🔹 طبق نمونه‌های منتشرشده (Cherry-pickها)، خروجی‌ها کیفیت بالایی دارند.

🔹 اولین دموی رسمی: یک تریلر ساخته‌شده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشم‌نواز و قابل توجهه.


👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنت‌ها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش می‌دارم تا ببینیم چه آینده‌ای براش رقم می‌خوره.


🔗 تست و جزئیات: PixVerse V5

@rss_ai_ir 🤖🎥
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
👍2🔥1👏1
🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉64🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛

محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاست‌های متنوع نشان داده است.

🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) به‌زودی منتشر خواهد شد.

🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁86🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپن‌اِی‌آی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.

قابلیت‌ها:

✳️درک نشانه‌های غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر


📊 امتیاز خیره‌کننده ۸۲.۸٪ روی بنچمارک‌های استدلال صوتی (audio reasoning)

این مدل می‌تواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمه‌ای باشد.

@rss_ai_ir

#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥54🎉4😁1
🧬 نسخه OpenVision 2 منتشر شد! 🧬

👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانواده‌ای نوآورانه از visual encoder‌های مولد که بدون نیاز به text encoder و contrastive loss آموزش می‌بینند. این مدل‌ها فقط با caption-only supervision آموزش داده شده‌اند.

🔹 کاملاً اوپن‌سورس و تحت لایسنس Apache 2.0 💙

🔗 منابع:

👉 Paper
👉 Project
👉 Repo

@rss_ai_ir

#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉87👍5🥰4👏4😁4🔥3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶‍♂️🦾 تصور کن توی خیابون راه می‌ری و یک ربات انسان‌نما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار می‌کنی؟ 😅

@rss_ai_ir

#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣3👍2😁1