VIRSUN

🛠️ CAD-GPT:
هوش مصنوعی برای طراحی سه‌بعدی

♻️مدل CAD-GPT یک LLM چندوجهی است که می‌تواند بر اساس پرامپت متنی یا حتی یک تصویر، فایل‌های CAD (به‌صورت مجموعه‌ای از پارامترها) تولید کند.

🔹 در نمونه‌های ارائه‌شده، اشکال ساده سه‌بعدی ساخته شده‌اند، اما همین هم نشان می‌دهد که این رویکرد می‌تواند نقطه شروعی جدی برای طراحی هوشمند باشد.

💡 ایده اصلی روش:
♻️مدل، موقعیت‌های سه‌بعدی در فضا را به یک فضای زبانی یک‌بعدی نگاشت می‌کند؛ در نتیجه خروجی آن چیزی شبیه کد CAD است.

📄 جزئیات بیشتر: CAD-GPT

@rss_ai_ir 🤖🏗️

#هوش_مصنوعی #مدل_زبان #CAD #سه‌بعدی #طراحی #AI_industrial_news

🔥15👏14🎉13👍10😁10❤8🥰6

3.01K views14:02

VIRSUN

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

🪴 Pixie: Physics from Pixels 🪴

پژوهشگران دانشگاه‌های UPenn و MIT از مدل Pixie رونمایی کردند؛ یک شبکه عصبی که می‌تواند ویژگی‌های بصری پیش‌آموزش‌دیده (مثل CLIP) را به فیلدهای متراکم ویژگی‌های فیزیکی مواد نگاشت کند — آن هم تنها در یک forward pass.

🔹 نتیجه: شبیه‌سازی فیزیک در زمان واقعی (Real-time) ✨

📂 این پروژه شامل دیتاست و کد متن‌باز تحت لایسنس MIT است.

🔗 منابع:
👉 مرور
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #شبیه‌سازی #Pixie #فیزیک #بینایی_ماشین #AI_industrial_news

👍9😁5🎉5❤4🔥4🥰4👏4

3.01K views14:02

VIRSUN

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

🍏 اپل دو مدل متن‌باز جدید معرفی کرد: FastVLM و MobileCLIP2

🔹 این مدل‌ها تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:

♻️OCR (تشخیص متن از تصویر)

♻️Image Captioning (تولید توضیحات برای تصاویر)

♻️Visual Question Answering (پاسخ به سوالات تصویری)

♻️Image Understanding (درک محتوای تصویر)

⚡️ اپل با این حرکت جدی‌تر از همیشه وارد رقابت مدل‌های سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.

لینک
@rss_ai_ir

#Apple #AI #FastVLM #MobileCLIP2 #VisionModels

👍2🔥2👏2

764 views02:50

VIRSUN

1:56

This media is not supported in your browser

VIEW IN TELEGRAM

0:16

This media is not supported in your browser

🎬 PixVerse V5؛ نسل تازه‌ای از مدل‌های ویدیویی

بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. به‌نظر می‌رسد این نسخه تمام قابلیت‌های ترند روز را یک‌جا جمع کرده — حتی تا مرحله‌ی Lip-sync 👄🎶

🔹 طبق نمونه‌های منتشرشده (Cherry-pickها)، خروجی‌ها کیفیت بالایی دارند.

🔹 اولین دموی رسمی: یک تریلر ساخته‌شده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشم‌نواز و قابل توجهه.

👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنت‌ها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش می‌دارم تا ببینیم چه آینده‌ای براش رقم می‌خوره.

🔗 تست و جزئیات: PixVerse V5

@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news

👍2🔥1👏1

752 views06:22

VIRSUN

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news

👍11🔥6👏6🎉6❤4🥰3😁2

774 views07:12

VIRSUN

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

🫛 TMR: Few-Shot Template-Matching 🫛

محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاست‌های متنوع نشان داده است.

🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) به‌زودی منتشر خواهد شد.

🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news

👍10👏8😁8❤6🥰6🔥5🎉1

838 views10:20

🎤 اوپن‌اِی‌آی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.

✨ قابلیت‌ها:

✳️درک نشانه‌های غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر

📊 امتیاز خیره‌کننده ۸۲.۸٪ روی بنچمارک‌های استدلال صوتی (audio reasoning)

این مدل می‌تواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمه‌ای باشد.

@rss_ai_ir

#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant

👏8🥰7👍5🔥5❤4🎉4😁1

800 views10:20

VIRSUN

🧬 نسخه OpenVision 2 منتشر شد! 🧬

👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانواده‌ای نوآورانه از visual encoder‌های مولد که بدون نیاز به text encoder و contrastive loss آموزش می‌بینند. این مدل‌ها فقط با caption-only supervision آموزش داده شده‌اند.

🔹 کاملاً اوپن‌سورس و تحت لایسنس Apache 2.0 💙

🔗 منابع:

👉 Paper
👉 Project
👉 Repo

@rss_ai_ir

#AI #ML #CV #OpenVision2 #opensource #UCSC

🎉8❤7👍5🥰4👏4😁4🔥3🙏1

2.97K views15:48

VIRSUN

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

🚶‍♂️🦾 تصور کن توی خیابون راه می‌ری و یک ربات انسان‌نما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار می‌کنی؟ 😅

@rss_ai_ir

#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics

🤣3👍2😁1

2.89K views18:31

About

Blog

Apps

Platform