VIRSUN

🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news

👍11🔥6👏6🎉6❤4🥰3😁2

812 views07:12

VIRSUN

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

📌 تسلا استراتژی آموزش ربات Optimus را تغییر داد

♻️طبق گزارش Business Insider، تسلا تصمیم گرفته آموزش ربات Optimus را بر پایه‌ی رویکرد فقط-بینایی (vision-only) جلو ببرد؛ یعنی یادگیری صرفاً از طریق تصاویر و ویدئو.

🔑 نکات کلیدی:

✳️در اواخر جولای به کارکنان اعلام شد که از این پس تمرکز بر آموزش با تصویر و ویدئو خواهد بود. این دقیقاً همان فلسفه‌ای است که تسلا در توسعه‌ی سیستم رانندگی خودکارش دنبال می‌کند و برخلاف رقبا از LiDAR استفاده نمی‌کند.

✳️پیش‌تر از هدست‌های VR و لباس‌های موشن‌کپچر برای ضبط حرکات انسان‌ها استفاده می‌کردند. اکنون تمرکز روی ضبط ویدئو از کارگران در حال انجام وظایف است.

✳️حذف موشن‌کپچر باعث می‌شود مقیاس‌پذیری افزایش یابد، زیرا دیگر مشکلات فنی و تعمیر تجهیزات مزاحم نیست.

✳️ویدئوها ساده و معمولی نیستند: تسلا در حال آزمایش سیستمی با ۵ دوربین است — یک دوربین روی کلاه و چهار دوربین روی «کوله‌پشتی» سنگین برای پوشش دید چند جهته.

✳️در حالی‌که رقبایی مانند Figure.AI ،Physical Intelligence و Boston Dynamics همچنان بر موشن‌کپچر تکیه دارند، تسلا مسیر متفاوتی را انتخاب کرده است.

🤔 پرسش مهم این است: آیا رویکرد vision-only می‌تواند سریع‌تر از روش‌های سنتی مبتنی بر موشن‌کپچر پیش برود؟

@rss_ai_ir

#تسلا #Optimus #رباتیک #هوش_مصنوعی #vision_only #BostonDynamics #FigureAI

👍11🎉6❤5🥰4👏4😁4🔥3

843 views08:46

VIRSUN

0:50

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 سام آلتمن درباره GPT-5

«بازگشت به مدل‌های قدیمی بعد از GPT-5 مثل یک عذاب است.»

به گفته‌ی او، GPT-5 عمیق‌تر، طبیعی‌تر و به‌طور محسوسی باهوش‌تر شده. این مدل یکپارچه است، بدون نیاز به سوییچ کردن بین نسخه‌ها، و مثل یک تیم متخصص همیشه در کنار شما عمل می‌کند.

✨ قابلیت‌ها:
⚡ نوشتن برنامه‌ها از صفر
📚 تولید گزارش‌های دقیق درباره سخت‌ترین موضوعات
🎯 برنامه‌ریزی رویدادهای واقعی به صورت کاملاً خودکار

@rss_ai_ir 🤖🚀

#هوش_مصنوعی #GPT5 #SamAltman #مدل_زبان

🎉11👏9👍6🥰5❤2😁2🔥1

795 views10:19

VIRSUN

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

🫛 TMR: Few-Shot Template-Matching 🫛

محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاست‌های متنوع نشان داده است.

🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) به‌زودی منتشر خواهد شد.

🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news

👍10👏8😁8❤6🥰6🔥5🎉1

887 views10:20

🎤 اوپن‌اِی‌آی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.

✨ قابلیت‌ها:

✳️درک نشانه‌های غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر

📊 امتیاز خیره‌کننده ۸۲.۸٪ روی بنچمارک‌های استدلال صوتی (audio reasoning)

این مدل می‌تواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمه‌ای باشد.

@rss_ai_ir

#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant

👏8🥰7👍5🔥5❤4🎉4😁1

1.44K views10:20

VIRSUN

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

👨‍🌾 آینده کشاورزی بدون شک در ترکیب ماشین‌آلات پیشرفته + هوش مصنوعی خواهد بود؛ جایی که حتی کیفیت گوجه‌ها هم به‌صورت خودکار پایش و درجه‌بندی می‌شود.

#کشاورزی_هوشمند #ماشین_برداشت #گوجه_فرنگی #فناوری_صنعتی

@rss_ai_ir

🔥8👍7👏5🎉5🥰4❤3😁3🙏1

1.43K viewsedited 14:18

VIRSUN

2:43

This media is not supported in your browser

VIEW IN TELEGRAM

🎬 حالا وقتشه برای انیمیشن!

امروز دیگه ساختن یک انیمیشن سال‌ها کار دستی نمی‌خواد؛ فقط کافیه استک درستی از ابزارهای هوش مصنوعی رو کنار هم بچینید:

🔹 Midjourney — طراحی شخصیت‌ها و صحنه‌ها
🔹 HeyGen Avatar IV — لیپ‌سینک و جان‌بخشی به چهره‌ها
🔹 Nano Banana + Flux Kontext — تولید نماها و زاویه‌های جدید
🔹 Flow / Veo 3 — ساخت اصلی شات‌ها
🔹 ElevenLabs v3 — صداگذاری با کیفیت بالا
🔹 Suno — موسیقی و ترک صوتی
🔹 DaVinci Resolve — کامپوزیت و مونتاژ نهایی

📌 جزئیات بیشتر اینجاست:
👉 https://cartoonhero.ai/

دنیای انیمیشن جلوی چشم‌هامون در حال تغییره؛ حالا هر کسی می‌تونه تقریبا از هیچ، یک کارتون کامل بسازه 🚀

@rss_ai_ir

#انیمیشن #هوش_مصنوعی #midjourney #heygen #nanobanana #veo3 #elevenlabs #suno #davinci

🔥8👍7🥰6😁6🎉4❤3👏2🙏1

1.57K views14:34

VIRSUN

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

♨️ربات سقفی جذاب

@rss_ai_ir ⚙️🧠

#هوش_مصنوعی #رباتیک #سقفی #روبات

❤6👍5🔥5🎉5🥰4👏4😁4🤩1

3.6K views15:45

VIRSUN

🧬 نسخه OpenVision 2 منتشر شد! 🧬

👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانواده‌ای نوآورانه از visual encoder‌های مولد که بدون نیاز به text encoder و contrastive loss آموزش می‌بینند. این مدل‌ها فقط با caption-only supervision آموزش داده شده‌اند.

🔹 کاملاً اوپن‌سورس و تحت لایسنس Apache 2.0 💙

🔗 منابع:

👉 Paper
👉 Project
👉 Repo

@rss_ai_ir

#AI #ML #CV #OpenVision2 #opensource #UCSC

🎉8❤7👍5🥰4👏4😁4🔥3🙏1

3.65K views15:48

VIRSUN

👥 چرا در پروژه‌های صنعتی تیم مهم‌تر از فرد است؟

در دنیای صنعت، مخصوصاً در پروژه‌های هوش مصنوعی، رباتیک و اتوماسیون، موفقیت معمولاً حاصل تلاش یک تیم منسجم است نه یک فرد.

🔹 پیچیدگی پروژه‌ها: ابعاد مختلف مثل سخت‌افزار، نرم‌افزار، داده و مدیریت باید کنار هم دیده شوند.
🔹 تقسیم تخصص‌ها: یک نفر متخصص الگوریتم است، دیگری سنسورها را می‌شناسد و فردی دیگر مدیریت پروژه را برعهده دارد.
🔹 سرعت و مقیاس‌پذیری: کار گروهی باعث می‌شود بخش‌ها موازی پیش بروند و پروژه سریع‌تر نتیجه دهد.
🔹 خلاقیت جمعی: هر نفر زاویه دید خودش را دارد؛ کنار هم گذاشتن این دیدگاه‌ها ایده‌های نو و عملی می‌سازد.
🔹 پایداری پروژه: اگر همه‌چیز روی دوش یک نفر باشد، با نبود او پروژه فلج می‌شود. تیم قوی این ریسک را از بین می‌برد.

✅ در صنعت، هم‌افزایی تیمی کلید موفقیت است. توان یک تیم خوب همیشه از مجموع توانایی‌های افرادش بیشتر است.

#مدیریت_پروژه #صنعت #تیم_کاری #هوش_مصنوعی #اتوماسیون

@rss_ai_ir

❤11👍7🔥6😁5🥰4👏4🎉1

3.65K viewsedited 15:54

VIRSUN

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

🚶‍♂️🦾 تصور کن توی خیابون راه می‌ری و یک ربات انسان‌نما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار می‌کنی؟ 😅

@rss_ai_ir

#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics

🤣4👍2😁1

3.58K views18:31

VIRSUN

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 HunyuanWorld-Voyager — هوش مصنوعی متن‌باز برای ساخت دنیای سه‌بعدی

شرکت Tencent از HunyuanWorld-Voyager رونمایی کرد؛ اولین هوش مصنوعی open-source جهان که تولید ویدئو را با بازسازی سه‌بعدی واقعی ترکیب می‌کند.

✨ چرا مهم است؟
✅ ویدئو به طور مستقیم به صحنه‌های کامل سه‌بعدی تبدیل می‌شود (بدون نیاز به ابزار اضافی)
✅ مدل «حافظه فضایی» دارد و هندسه صحیح را از هر زاویه حفظ می‌کند
✅ رتبه اول در Stanford WorldScore برای ویدئو و بازسازی سه‌بعدی

🎮 کاربردها: واقعیت مجازی (VR)، بازی‌ها، شبیه‌سازی‌ها و پروژه‌های سه‌بعدی — با کنترل از طریق کیبورد یا دسته بازی.

🌐 Project Page: HunyuanWorld-Voyager
💻 GitHub: کد منبع
🤗 HuggingFace: مدل‌ها
📄 PDF: جزئیات کامل
🏆 Leaderboard: WorldScore

@rss_ai_ir

#هوش_مصنوعی #سه‌بعدی #VR #گیمینگ #OpenSource

👍3❤1🙏1👌1

3.62K views18:45

VIRSUN

0:43

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 وسیله فوق‌متحرک (UMV) + یادگیری تقویتی

با استفاده از یادگیری با تقویت، دامنه حرکات UMV برای عبور از موانع گسترش یافته است:

✳️پرش‌ها 🦘
✳️حفظ تعادل در خارج از سطح صاف ⚖️
✳️چرخش و پشت‌ورو شدن روی سطح هموار 🔄

📊 میلیون‌ها شبیه‌سازی در موتورهای فیزیکی به‌عنوان داده آموزشی استفاده شده‌اند و همین باعث می‌شود مدل بتواند این حرکات را به‌صورت zero-shot، یعنی بدون نیاز به آموزش دوباره در دنیای واقعی، اجرا کند.

#هوش_مصنوعی #یادگیری_تقویتی #رباتیک #شبیه‌سازی

@rss_ai_ir

👍2👏1🤔1

777 views10:27

VIRSUN

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 بالاخره یادگیری ماشین کاربردی شد!
😂
@rss_ai_ir

👍2😁2🔥1👏1

759 views10:27

VIRSUN

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 تشخیص سه‌بعدی اشیا با توجه عمومی 🔥

🟢 فریم ورک GATE3D یک فریم‌ورک نوآورانه برای تشخیص سه‌بعدی اشیا از تصاویر تک‌چشمی است که با استفاده از نظارت ضعیف (Weak Supervision) توسعه داده شده.
این روش با بهره‌گیری از lossهای سازگاری بین پیش‌بینی‌های ۲D و ۳D، شکاف دامنه‌ها را به‌طور مؤثر پر می‌کند.

🔗 منابع:

👉 مقاله https://arxiv.org/pdf/2504.11014

👉 پروژه: https://ies0411.github.io/GATE3D/

#هوش_مصنوعی #بینایی_ماشین #تشخیص_سه‌بعدی #GATE3D

@rss_ai_ir

👏8🔥7🥰6👍5🎉4😁3❤1

830 viewsedited 10:28

VIRSUN

🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI

در حالی‌که شرکت‌های آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت می‌کند.

🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزه‌های سلامت، تولید، کشاورزی و خدمات عمومی تسریع می‌کند.
🚀 غول‌های آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایه‌گذاری می‌کنند، با وجود تردیدها درباره دستاوردهای کوتاه‌مدت.
⚙️ چین با تکیه بر ابزارهای اوپن‌سورس و کم‌هزینه (به دلیل محدودیت‌های تجاری تراشه‌ها)، بیشتر بر تاب‌آوری و کاربردهای مقیاس‌پذیر تمرکز دارد تا پروژه‌های بلندپروازانه.

🔎 این تضاد، دو استراتژی متفاوت را نشان می‌دهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آینده‌نگر شرط‌بندی می‌کند.
🇨🇳 چین روی بهره‌وری واقعی و دستاوردهای ملموس صنعتی.

@rss_ai_ir

#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی

👍11😁5👏4🎉4🔥3🥰3❤2

715 viewsedited 17:40

VIRSUN

✨ Stable Diffusion WebUI Forge – Neo ✨

خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉

نسخه‌ی جدید Forge (محیط کار با مدل‌های تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:

🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدل‌های flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعه‌ای از مدل‌ها، شتاب‌دهنده‌ها و فیچرهای اضافی

📌 نکته مهم: نسخه‌ی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخه‌ی Neo دوباره نفس تازه‌ای به آن داده است.

#AI #StableDiffusion #WebUI #text2image #text2video #tools

@rss_ai_ir

😁8🎉7🔥6👍4👏4❤2🥰1

734 viewsedited 17:40

VIRSUN

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬

ادوبی در نسخه‌ی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایه‌ی هوش مصنوعی.

🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع می‌کند به دانلود مدل‌های موردنیاز و فایل‌های جانبی با حجم نسبتاً بالا.
🔹 ماسک‌هایی که ساخته می‌شوند حجم زیادی دارند، بنابراین ادوبی توصیه می‌کند پوشه‌ی جداگانه‌ای برای ذخیره‌ی آنها بسازید.

🔹 بعد از ایجاد ماسک، می‌توانید آن را Refine کنید یا بخش‌هایی از شیء را اضافه/حذف کنید.

📌 این یعنی کار با ویدئوها بسیار ساده‌تر شده: جداسازی سوژه‌ها، حذف عناصر ناخواسته و کنترل دقیق روی بخش‌های مختلف تصویر تنها با چند کلیک.

جزئیات بیشتر 👇

🌐 Object Masking در Adobe Premiere Pro

#Adobe #PremierePro #AI #VideoEditing #ObjectMasking

@rss_ai_ir

🥰8❤6🔥5👏4😁3🎉3👍1

716 viewsedited 17:42

VIRSUN

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨

هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایه‌ی Nano Banana و Veo 3 ساخته شده.

🔹 چیزی که این تیم رو خاص می‌کنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست می‌کنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربه‌ی کاربر کار می‌کنن.
🔹 از اون طرف، منتقدها می‌گن که از مدل‌های اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیع‌کننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلی‌شون، Speak 2.0، موفقیت خوبی داشت).

🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیک‌تاک‌مانند رو به ساده‌ترین حالت برسونه:

1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبک‌های صوتی (Audio styles)
6️⃣ افزودن پس‌زمینه مناسب

🎯 بدون نیاز به پرامپت‌های طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!

📌 لینک تست: Higgsfield UGC Factory

@rss_ai_ir

#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration

❤12👍11🔥10👏10😁9🎉7🥰6

2.93K views17:46

About

Blog

Apps

Platform