VIRSUN
13.8K subscribers
499 photos
300 videos
2 files
303 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉64🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
📌 تسلا استراتژی آموزش ربات Optimus را تغییر داد

♻️طبق گزارش Business Insider، تسلا تصمیم گرفته آموزش ربات Optimus را بر پایه‌ی رویکرد فقط-بینایی (vision-only) جلو ببرد؛ یعنی یادگیری صرفاً از طریق تصاویر و ویدئو.

🔑 نکات کلیدی:

✳️در اواخر جولای به کارکنان اعلام شد که از این پس تمرکز بر آموزش با تصویر و ویدئو خواهد بود. این دقیقاً همان فلسفه‌ای است که تسلا در توسعه‌ی سیستم رانندگی خودکارش دنبال می‌کند و برخلاف رقبا از LiDAR استفاده نمی‌کند.

✳️پیش‌تر از هدست‌های VR و لباس‌های موشن‌کپچر برای ضبط حرکات انسان‌ها استفاده می‌کردند. اکنون تمرکز روی ضبط ویدئو از کارگران در حال انجام وظایف است.

✳️حذف موشن‌کپچر باعث می‌شود مقیاس‌پذیری افزایش یابد، زیرا دیگر مشکلات فنی و تعمیر تجهیزات مزاحم نیست.

✳️ویدئوها ساده و معمولی نیستند: تسلا در حال آزمایش سیستمی با ۵ دوربین است — یک دوربین روی کلاه و چهار دوربین روی «کوله‌پشتی» سنگین برای پوشش دید چند جهته.

✳️در حالی‌که رقبایی مانند Figure.AI ،Physical Intelligence و Boston Dynamics همچنان بر موشن‌کپچر تکیه دارند، تسلا مسیر متفاوتی را انتخاب کرده است.


🤔 پرسش مهم این است: آیا رویکرد vision-only می‌تواند سریع‌تر از روش‌های سنتی مبتنی بر موشن‌کپچر پیش برود؟

@rss_ai_ir

#تسلا #Optimus #رباتیک #هوش_مصنوعی #vision_only #BostonDynamics #FigureAI
👍11🎉65🥰4👏4😁4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 سام آلتمن درباره GPT-5

«بازگشت به مدل‌های قدیمی بعد از GPT-5 مثل یک عذاب است.»

به گفته‌ی او، GPT-5 عمیق‌تر، طبیعی‌تر و به‌طور محسوسی باهوش‌تر شده. این مدل یکپارچه است، بدون نیاز به سوییچ کردن بین نسخه‌ها، و مثل یک تیم متخصص همیشه در کنار شما عمل می‌کند.

قابلیت‌ها:
نوشتن برنامه‌ها از صفر
📚 تولید گزارش‌های دقیق درباره سخت‌ترین موضوعات
🎯 برنامه‌ریزی رویدادهای واقعی به صورت کاملاً خودکار

@rss_ai_ir 🤖🚀

#هوش_مصنوعی #GPT5 #SamAltman #مدل_زبان
🎉11👏9👍6🥰52😁2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛

محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاست‌های متنوع نشان داده است.

🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) به‌زودی منتشر خواهد شد.

🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁86🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپن‌اِی‌آی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.

قابلیت‌ها:

✳️درک نشانه‌های غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر


📊 امتیاز خیره‌کننده ۸۲.۸٪ روی بنچمارک‌های استدلال صوتی (audio reasoning)

این مدل می‌تواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمه‌ای باشد.

@rss_ai_ir

#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥54🎉4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
👨‍🌾 آینده کشاورزی بدون شک در ترکیب ماشین‌آلات پیشرفته + هوش مصنوعی خواهد بود؛ جایی که حتی کیفیت گوجه‌ها هم به‌صورت خودکار پایش و درجه‌بندی می‌شود.

#کشاورزی_هوشمند #ماشین_برداشت #گوجه_فرنگی #فناوری_صنعتی

@rss_ai_ir
🔥8👍7👏5🎉5🥰43😁3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 حالا وقتشه برای انیمیشن!

امروز دیگه ساختن یک انیمیشن سال‌ها کار دستی نمی‌خواد؛ فقط کافیه استک درستی از ابزارهای هوش مصنوعی رو کنار هم بچینید:

🔹 Midjourney — طراحی شخصیت‌ها و صحنه‌ها
🔹 HeyGen Avatar IV — لیپ‌سینک و جان‌بخشی به چهره‌ها
🔹 Nano Banana + Flux Kontext — تولید نماها و زاویه‌های جدید
🔹 Flow / Veo 3 — ساخت اصلی شات‌ها
🔹 ElevenLabs v3 — صداگذاری با کیفیت بالا
🔹 Suno — موسیقی و ترک صوتی
🔹 DaVinci Resolve — کامپوزیت و مونتاژ نهایی

📌 جزئیات بیشتر اینجاست:
👉 https://cartoonhero.ai/

دنیای انیمیشن جلوی چشم‌هامون در حال تغییره؛ حالا هر کسی می‌تونه تقریبا از هیچ، یک کارتون کامل بسازه 🚀

@rss_ai_ir

#انیمیشن #هوش_مصنوعی #midjourney #heygen #nanobanana #veo3 #elevenlabs #suno #davinci
🔥8👍7🥰6😁6🎉43👏2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
♨️ربات سقفی جذاب

@rss_ai_ir ⚙️🧠

#هوش_مصنوعی #رباتیک #سقفی #روبات
6👍5🔥5🎉5🥰4👏4😁4🤩1
🧬 نسخه OpenVision 2 منتشر شد! 🧬

👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانواده‌ای نوآورانه از visual encoder‌های مولد که بدون نیاز به text encoder و contrastive loss آموزش می‌بینند. این مدل‌ها فقط با caption-only supervision آموزش داده شده‌اند.

🔹 کاملاً اوپن‌سورس و تحت لایسنس Apache 2.0 💙

🔗 منابع:

👉 Paper
👉 Project
👉 Repo

@rss_ai_ir

#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉87👍5🥰4👏4😁4🔥3🙏1
👥 چرا در پروژه‌های صنعتی تیم مهم‌تر از فرد است؟

در دنیای صنعت، مخصوصاً در پروژه‌های هوش مصنوعی، رباتیک و اتوماسیون، موفقیت معمولاً حاصل تلاش یک تیم منسجم است نه یک فرد.

🔹 پیچیدگی پروژه‌ها: ابعاد مختلف مثل سخت‌افزار، نرم‌افزار، داده و مدیریت باید کنار هم دیده شوند.
🔹 تقسیم تخصص‌ها: یک نفر متخصص الگوریتم است، دیگری سنسورها را می‌شناسد و فردی دیگر مدیریت پروژه را برعهده دارد.
🔹 سرعت و مقیاس‌پذیری: کار گروهی باعث می‌شود بخش‌ها موازی پیش بروند و پروژه سریع‌تر نتیجه دهد.
🔹 خلاقیت جمعی: هر نفر زاویه دید خودش را دارد؛ کنار هم گذاشتن این دیدگاه‌ها ایده‌های نو و عملی می‌سازد.
🔹 پایداری پروژه: اگر همه‌چیز روی دوش یک نفر باشد، با نبود او پروژه فلج می‌شود. تیم قوی این ریسک را از بین می‌برد.

در صنعت، هم‌افزایی تیمی کلید موفقیت است. توان یک تیم خوب همیشه از مجموع توانایی‌های افرادش بیشتر است.

#مدیریت_پروژه #صنعت #تیم_کاری #هوش_مصنوعی #اتوماسیون

@rss_ai_ir
11👍7🔥6😁5🥰4👏4🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶‍♂️🦾 تصور کن توی خیابون راه می‌ری و یک ربات انسان‌نما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار می‌کنی؟ 😅

@rss_ai_ir

#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣4👍2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 HunyuanWorld-Voyager — هوش مصنوعی متن‌باز برای ساخت دنیای سه‌بعدی

شرکت Tencent از HunyuanWorld-Voyager رونمایی کرد؛ اولین هوش مصنوعی open-source جهان که تولید ویدئو را با بازسازی سه‌بعدی واقعی ترکیب می‌کند.

چرا مهم است؟
ویدئو به طور مستقیم به صحنه‌های کامل سه‌بعدی تبدیل می‌شود (بدون نیاز به ابزار اضافی)
مدل «حافظه فضایی» دارد و هندسه صحیح را از هر زاویه حفظ می‌کند
رتبه اول در Stanford WorldScore برای ویدئو و بازسازی سه‌بعدی

🎮 کاربردها: واقعیت مجازی (VR)، بازی‌ها، شبیه‌سازی‌ها و پروژه‌های سه‌بعدی — با کنترل از طریق کیبورد یا دسته بازی.

🌐 Project Page: HunyuanWorld-Voyager
💻 GitHub: کد منبع
🤗 HuggingFace: مدل‌ها
📄 PDF: جزئیات کامل
🏆 Leaderboard: WorldScore

@rss_ai_ir

#هوش_مصنوعی #سه‌بعدی #VR #گیمینگ #OpenSource
👍31🙏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 وسیله فوق‌متحرک (UMV) + یادگیری تقویتی

با استفاده از یادگیری با تقویت، دامنه حرکات UMV برای عبور از موانع گسترش یافته است:

✳️پرش‌ها 🦘
✳️حفظ تعادل در خارج از سطح صاف ⚖️
✳️چرخش و پشت‌ورو شدن روی سطح هموار 🔄


📊 میلیون‌ها شبیه‌سازی در موتورهای فیزیکی به‌عنوان داده آموزشی استفاده شده‌اند و همین باعث می‌شود مدل بتواند این حرکات را به‌صورت zero-shot، یعنی بدون نیاز به آموزش دوباره در دنیای واقعی، اجرا کند.


#هوش_مصنوعی #یادگیری_تقویتی #رباتیک #شبیه‌سازی

@rss_ai_ir
👍2👏1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 بالاخره یادگیری ماشین کاربردی شد!
😂
@rss_ai_ir
👍2😁2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 تشخیص سه‌بعدی اشیا با توجه عمومی 🔥

🟢 فریم ورک GATE3D یک فریم‌ورک نوآورانه برای تشخیص سه‌بعدی اشیا از تصاویر تک‌چشمی است که با استفاده از نظارت ضعیف (Weak Supervision) توسعه داده شده.
این روش با بهره‌گیری از lossهای سازگاری بین پیش‌بینی‌های ۲D و ۳D، شکاف دامنه‌ها را به‌طور مؤثر پر می‌کند.

🔗 منابع:

👉 مقاله https://arxiv.org/pdf/2504.11014

👉 پروژه: https://ies0411.github.io/GATE3D/

#هوش_مصنوعی #بینایی_ماشین #تشخیص_سه‌بعدی #GATE3D

@rss_ai_ir
👏8🔥7🥰6👍5🎉4😁31
🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI

در حالی‌که شرکت‌های آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت می‌کند.

🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزه‌های سلامت، تولید، کشاورزی و خدمات عمومی تسریع می‌کند.
🚀 غول‌های آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایه‌گذاری می‌کنند، با وجود تردیدها درباره دستاوردهای کوتاه‌مدت.
⚙️ چین با تکیه بر ابزارهای اوپن‌سورس و کم‌هزینه (به دلیل محدودیت‌های تجاری تراشه‌ها)، بیشتر بر تاب‌آوری و کاربردهای مقیاس‌پذیر تمرکز دارد تا پروژه‌های بلندپروازانه.

🔎 این تضاد، دو استراتژی متفاوت را نشان می‌دهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آینده‌نگر شرط‌بندی می‌کند.
🇨🇳 چین روی بهره‌وری واقعی و دستاوردهای ملموس صنعتی.

@rss_ai_ir

#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
👍11😁5👏4🎉4🔥3🥰32
Stable Diffusion WebUI Forge – Neo

خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉

نسخه‌ی جدید Forge (محیط کار با مدل‌های تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:

🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدل‌های flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعه‌ای از مدل‌ها، شتاب‌دهنده‌ها و فیچرهای اضافی

📌 نکته مهم: نسخه‌ی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخه‌ی Neo دوباره نفس تازه‌ای به آن داده است.

#AI #StableDiffusion #WebUI #text2image #text2video #tools

@rss_ai_ir
😁8🎉7🔥6👍4👏42🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬

ادوبی در نسخه‌ی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایه‌ی هوش مصنوعی.

🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع می‌کند به دانلود مدل‌های موردنیاز و فایل‌های جانبی با حجم نسبتاً بالا.
🔹 ماسک‌هایی که ساخته می‌شوند حجم زیادی دارند، بنابراین ادوبی توصیه می‌کند پوشه‌ی جداگانه‌ای برای ذخیره‌ی آنها بسازید.

🔹 بعد از ایجاد ماسک، می‌توانید آن را Refine کنید یا بخش‌هایی از شیء را اضافه/حذف کنید.

📌 این یعنی کار با ویدئوها بسیار ساده‌تر شده: جداسازی سوژه‌ها، حذف عناصر ناخواسته و کنترل دقیق روی بخش‌های مختلف تصویر تنها با چند کلیک.

جزئیات بیشتر 👇

🌐 Object Masking در Adobe Premiere Pro

#Adobe #PremierePro #AI #VideoEditing #ObjectMasking

@rss_ai_ir
🥰86🔥5👏4😁3🎉3👍1
🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥

هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایه‌ی Nano Banana و Veo 3 ساخته شده.

🔹 چیزی که این تیم رو خاص می‌کنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست می‌کنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربه‌ی کاربر کار می‌کنن.
🔹 از اون طرف، منتقدها می‌گن که از مدل‌های اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیع‌کننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلی‌شون، Speak 2.0، موفقیت خوبی داشت).

🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیک‌تاک‌مانند رو به ساده‌ترین حالت برسونه:

1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبک‌های صوتی (Audio styles)
6️⃣ افزودن پس‌زمینه مناسب

🎯 بدون نیاز به پرامپت‌های طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!

📌 لینک تست: Higgsfield UGC Factory

@rss_ai_ir

#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
12👍11🔥10👏10😁9🎉7🥰6