🌐 Droplet3D
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉6❤4🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
📌 تسلا استراتژی آموزش ربات Optimus را تغییر داد
♻️طبق گزارش Business Insider، تسلا تصمیم گرفته آموزش ربات Optimus را بر پایهی رویکرد فقط-بینایی (vision-only) جلو ببرد؛ یعنی یادگیری صرفاً از طریق تصاویر و ویدئو.
🔑 نکات کلیدی:
✳️در اواخر جولای به کارکنان اعلام شد که از این پس تمرکز بر آموزش با تصویر و ویدئو خواهد بود. این دقیقاً همان فلسفهای است که تسلا در توسعهی سیستم رانندگی خودکارش دنبال میکند و برخلاف رقبا از LiDAR استفاده نمیکند.
✳️پیشتر از هدستهای VR و لباسهای موشنکپچر برای ضبط حرکات انسانها استفاده میکردند. اکنون تمرکز روی ضبط ویدئو از کارگران در حال انجام وظایف است.
✳️حذف موشنکپچر باعث میشود مقیاسپذیری افزایش یابد، زیرا دیگر مشکلات فنی و تعمیر تجهیزات مزاحم نیست.
✳️ویدئوها ساده و معمولی نیستند: تسلا در حال آزمایش سیستمی با ۵ دوربین است — یک دوربین روی کلاه و چهار دوربین روی «کولهپشتی» سنگین برای پوشش دید چند جهته.
✳️در حالیکه رقبایی مانند Figure.AI ،Physical Intelligence و Boston Dynamics همچنان بر موشنکپچر تکیه دارند، تسلا مسیر متفاوتی را انتخاب کرده است.
🤔 پرسش مهم این است: آیا رویکرد vision-only میتواند سریعتر از روشهای سنتی مبتنی بر موشنکپچر پیش برود؟
@rss_ai_ir
#تسلا #Optimus #رباتیک #هوش_مصنوعی #vision_only #BostonDynamics #FigureAI
♻️طبق گزارش Business Insider، تسلا تصمیم گرفته آموزش ربات Optimus را بر پایهی رویکرد فقط-بینایی (vision-only) جلو ببرد؛ یعنی یادگیری صرفاً از طریق تصاویر و ویدئو.
🔑 نکات کلیدی:
✳️در اواخر جولای به کارکنان اعلام شد که از این پس تمرکز بر آموزش با تصویر و ویدئو خواهد بود. این دقیقاً همان فلسفهای است که تسلا در توسعهی سیستم رانندگی خودکارش دنبال میکند و برخلاف رقبا از LiDAR استفاده نمیکند.
✳️پیشتر از هدستهای VR و لباسهای موشنکپچر برای ضبط حرکات انسانها استفاده میکردند. اکنون تمرکز روی ضبط ویدئو از کارگران در حال انجام وظایف است.
✳️حذف موشنکپچر باعث میشود مقیاسپذیری افزایش یابد، زیرا دیگر مشکلات فنی و تعمیر تجهیزات مزاحم نیست.
✳️ویدئوها ساده و معمولی نیستند: تسلا در حال آزمایش سیستمی با ۵ دوربین است — یک دوربین روی کلاه و چهار دوربین روی «کولهپشتی» سنگین برای پوشش دید چند جهته.
✳️در حالیکه رقبایی مانند Figure.AI ،Physical Intelligence و Boston Dynamics همچنان بر موشنکپچر تکیه دارند، تسلا مسیر متفاوتی را انتخاب کرده است.
🤔 پرسش مهم این است: آیا رویکرد vision-only میتواند سریعتر از روشهای سنتی مبتنی بر موشنکپچر پیش برود؟
@rss_ai_ir
#تسلا #Optimus #رباتیک #هوش_مصنوعی #vision_only #BostonDynamics #FigureAI
👍11🎉6❤5🥰4👏4😁4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 سام آلتمن درباره GPT-5
«بازگشت به مدلهای قدیمی بعد از GPT-5 مثل یک عذاب است.»
به گفتهی او، GPT-5 عمیقتر، طبیعیتر و بهطور محسوسی باهوشتر شده. این مدل یکپارچه است، بدون نیاز به سوییچ کردن بین نسخهها، و مثل یک تیم متخصص همیشه در کنار شما عمل میکند.
✨ قابلیتها:
⚡ نوشتن برنامهها از صفر
📚 تولید گزارشهای دقیق درباره سختترین موضوعات
🎯 برنامهریزی رویدادهای واقعی به صورت کاملاً خودکار
@rss_ai_ir 🤖🚀
#هوش_مصنوعی #GPT5 #SamAltman #مدل_زبان
«بازگشت به مدلهای قدیمی بعد از GPT-5 مثل یک عذاب است.»
به گفتهی او، GPT-5 عمیقتر، طبیعیتر و بهطور محسوسی باهوشتر شده. این مدل یکپارچه است، بدون نیاز به سوییچ کردن بین نسخهها، و مثل یک تیم متخصص همیشه در کنار شما عمل میکند.
✨ قابلیتها:
⚡ نوشتن برنامهها از صفر
📚 تولید گزارشهای دقیق درباره سختترین موضوعات
🎯 برنامهریزی رویدادهای واقعی به صورت کاملاً خودکار
@rss_ai_ir 🤖🚀
#هوش_مصنوعی #GPT5 #SamAltman #مدل_زبان
🎉11👏9👍6🥰5❤2😁2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁8❤6🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپناِیآی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥5❤4🎉4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
👨🌾 آینده کشاورزی بدون شک در ترکیب ماشینآلات پیشرفته + هوش مصنوعی خواهد بود؛ جایی که حتی کیفیت گوجهها هم بهصورت خودکار پایش و درجهبندی میشود.
#کشاورزی_هوشمند #ماشین_برداشت #گوجه_فرنگی #فناوری_صنعتی
@rss_ai_ir
#کشاورزی_هوشمند #ماشین_برداشت #گوجه_فرنگی #فناوری_صنعتی
@rss_ai_ir
🔥8👍7👏5🎉5🥰4❤3😁3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 حالا وقتشه برای انیمیشن!
امروز دیگه ساختن یک انیمیشن سالها کار دستی نمیخواد؛ فقط کافیه استک درستی از ابزارهای هوش مصنوعی رو کنار هم بچینید:
🔹 Midjourney — طراحی شخصیتها و صحنهها
🔹 HeyGen Avatar IV — لیپسینک و جانبخشی به چهرهها
🔹 Nano Banana + Flux Kontext — تولید نماها و زاویههای جدید
🔹 Flow / Veo 3 — ساخت اصلی شاتها
🔹 ElevenLabs v3 — صداگذاری با کیفیت بالا
🔹 Suno — موسیقی و ترک صوتی
🔹 DaVinci Resolve — کامپوزیت و مونتاژ نهایی
📌 جزئیات بیشتر اینجاست:
👉 https://cartoonhero.ai/
دنیای انیمیشن جلوی چشمهامون در حال تغییره؛ حالا هر کسی میتونه تقریبا از هیچ، یک کارتون کامل بسازه 🚀
@rss_ai_ir
#انیمیشن #هوش_مصنوعی #midjourney #heygen #nanobanana #veo3 #elevenlabs #suno #davinci
امروز دیگه ساختن یک انیمیشن سالها کار دستی نمیخواد؛ فقط کافیه استک درستی از ابزارهای هوش مصنوعی رو کنار هم بچینید:
🔹 Midjourney — طراحی شخصیتها و صحنهها
🔹 HeyGen Avatar IV — لیپسینک و جانبخشی به چهرهها
🔹 Nano Banana + Flux Kontext — تولید نماها و زاویههای جدید
🔹 Flow / Veo 3 — ساخت اصلی شاتها
🔹 ElevenLabs v3 — صداگذاری با کیفیت بالا
🔹 Suno — موسیقی و ترک صوتی
🔹 DaVinci Resolve — کامپوزیت و مونتاژ نهایی
📌 جزئیات بیشتر اینجاست:
👉 https://cartoonhero.ai/
دنیای انیمیشن جلوی چشمهامون در حال تغییره؛ حالا هر کسی میتونه تقریبا از هیچ، یک کارتون کامل بسازه 🚀
@rss_ai_ir
#انیمیشن #هوش_مصنوعی #midjourney #heygen #nanobanana #veo3 #elevenlabs #suno #davinci
🔥8👍7🥰6😁6🎉4❤3👏2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
❤6👍5🔥5🎉5🥰4👏4😁4🤩1
🧬 نسخه OpenVision 2 منتشر شد! 🧬
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉8❤7👍5🥰4👏4😁4🔥3🙏1
👥 چرا در پروژههای صنعتی تیم مهمتر از فرد است؟
در دنیای صنعت، مخصوصاً در پروژههای هوش مصنوعی، رباتیک و اتوماسیون، موفقیت معمولاً حاصل تلاش یک تیم منسجم است نه یک فرد.
🔹 پیچیدگی پروژهها: ابعاد مختلف مثل سختافزار، نرمافزار، داده و مدیریت باید کنار هم دیده شوند.
🔹 تقسیم تخصصها: یک نفر متخصص الگوریتم است، دیگری سنسورها را میشناسد و فردی دیگر مدیریت پروژه را برعهده دارد.
🔹 سرعت و مقیاسپذیری: کار گروهی باعث میشود بخشها موازی پیش بروند و پروژه سریعتر نتیجه دهد.
🔹 خلاقیت جمعی: هر نفر زاویه دید خودش را دارد؛ کنار هم گذاشتن این دیدگاهها ایدههای نو و عملی میسازد.
🔹 پایداری پروژه: اگر همهچیز روی دوش یک نفر باشد، با نبود او پروژه فلج میشود. تیم قوی این ریسک را از بین میبرد.
✅ در صنعت، همافزایی تیمی کلید موفقیت است. توان یک تیم خوب همیشه از مجموع تواناییهای افرادش بیشتر است.
#مدیریت_پروژه #صنعت #تیم_کاری #هوش_مصنوعی #اتوماسیون
@rss_ai_ir
در دنیای صنعت، مخصوصاً در پروژههای هوش مصنوعی، رباتیک و اتوماسیون، موفقیت معمولاً حاصل تلاش یک تیم منسجم است نه یک فرد.
🔹 پیچیدگی پروژهها: ابعاد مختلف مثل سختافزار، نرمافزار، داده و مدیریت باید کنار هم دیده شوند.
🔹 تقسیم تخصصها: یک نفر متخصص الگوریتم است، دیگری سنسورها را میشناسد و فردی دیگر مدیریت پروژه را برعهده دارد.
🔹 سرعت و مقیاسپذیری: کار گروهی باعث میشود بخشها موازی پیش بروند و پروژه سریعتر نتیجه دهد.
🔹 خلاقیت جمعی: هر نفر زاویه دید خودش را دارد؛ کنار هم گذاشتن این دیدگاهها ایدههای نو و عملی میسازد.
🔹 پایداری پروژه: اگر همهچیز روی دوش یک نفر باشد، با نبود او پروژه فلج میشود. تیم قوی این ریسک را از بین میبرد.
✅ در صنعت، همافزایی تیمی کلید موفقیت است. توان یک تیم خوب همیشه از مجموع تواناییهای افرادش بیشتر است.
#مدیریت_پروژه #صنعت #تیم_کاری #هوش_مصنوعی #اتوماسیون
@rss_ai_ir
❤11👍7🔥6😁5🥰4👏4🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶♂️🦾 تصور کن توی خیابون راه میری و یک ربات انساننما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣4👍2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 HunyuanWorld-Voyager — هوش مصنوعی متنباز برای ساخت دنیای سهبعدی
شرکت Tencent از HunyuanWorld-Voyager رونمایی کرد؛ اولین هوش مصنوعی open-source جهان که تولید ویدئو را با بازسازی سهبعدی واقعی ترکیب میکند.
✨ چرا مهم است؟
✅ ویدئو به طور مستقیم به صحنههای کامل سهبعدی تبدیل میشود (بدون نیاز به ابزار اضافی)
✅ مدل «حافظه فضایی» دارد و هندسه صحیح را از هر زاویه حفظ میکند
✅ رتبه اول در Stanford WorldScore برای ویدئو و بازسازی سهبعدی
🎮 کاربردها: واقعیت مجازی (VR)، بازیها، شبیهسازیها و پروژههای سهبعدی — با کنترل از طریق کیبورد یا دسته بازی.
🌐 Project Page: HunyuanWorld-Voyager
💻 GitHub: کد منبع
🤗 HuggingFace: مدلها
📄 PDF: جزئیات کامل
🏆 Leaderboard: WorldScore
@rss_ai_ir
#هوش_مصنوعی #سهبعدی #VR #گیمینگ #OpenSource
شرکت Tencent از HunyuanWorld-Voyager رونمایی کرد؛ اولین هوش مصنوعی open-source جهان که تولید ویدئو را با بازسازی سهبعدی واقعی ترکیب میکند.
✨ چرا مهم است؟
✅ ویدئو به طور مستقیم به صحنههای کامل سهبعدی تبدیل میشود (بدون نیاز به ابزار اضافی)
✅ مدل «حافظه فضایی» دارد و هندسه صحیح را از هر زاویه حفظ میکند
✅ رتبه اول در Stanford WorldScore برای ویدئو و بازسازی سهبعدی
🎮 کاربردها: واقعیت مجازی (VR)، بازیها، شبیهسازیها و پروژههای سهبعدی — با کنترل از طریق کیبورد یا دسته بازی.
🌐 Project Page: HunyuanWorld-Voyager
💻 GitHub: کد منبع
🤗 HuggingFace: مدلها
📄 PDF: جزئیات کامل
🏆 Leaderboard: WorldScore
@rss_ai_ir
#هوش_مصنوعی #سهبعدی #VR #گیمینگ #OpenSource
👍3❤1🙏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 وسیله فوقمتحرک (UMV) + یادگیری تقویتی
با استفاده از یادگیری با تقویت، دامنه حرکات UMV برای عبور از موانع گسترش یافته است:
✳️پرشها 🦘
✳️حفظ تعادل در خارج از سطح صاف ⚖️
✳️چرخش و پشتورو شدن روی سطح هموار 🔄
📊 میلیونها شبیهسازی در موتورهای فیزیکی بهعنوان داده آموزشی استفاده شدهاند و همین باعث میشود مدل بتواند این حرکات را بهصورت zero-shot، یعنی بدون نیاز به آموزش دوباره در دنیای واقعی، اجرا کند.
#هوش_مصنوعی #یادگیری_تقویتی #رباتیک #شبیهسازی
@rss_ai_ir
با استفاده از یادگیری با تقویت، دامنه حرکات UMV برای عبور از موانع گسترش یافته است:
✳️پرشها 🦘
✳️حفظ تعادل در خارج از سطح صاف ⚖️
✳️چرخش و پشتورو شدن روی سطح هموار 🔄
📊 میلیونها شبیهسازی در موتورهای فیزیکی بهعنوان داده آموزشی استفاده شدهاند و همین باعث میشود مدل بتواند این حرکات را بهصورت zero-shot، یعنی بدون نیاز به آموزش دوباره در دنیای واقعی، اجرا کند.
#هوش_مصنوعی #یادگیری_تقویتی #رباتیک #شبیهسازی
@rss_ai_ir
👍2👏1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 تشخیص سهبعدی اشیا با توجه عمومی 🔥
🟢 فریم ورک GATE3D یک فریمورک نوآورانه برای تشخیص سهبعدی اشیا از تصاویر تکچشمی است که با استفاده از نظارت ضعیف (Weak Supervision) توسعه داده شده.
این روش با بهرهگیری از lossهای سازگاری بین پیشبینیهای ۲D و ۳D، شکاف دامنهها را بهطور مؤثر پر میکند.
🔗 منابع:
👉 مقاله https://arxiv.org/pdf/2504.11014
👉 پروژه: https://ies0411.github.io/GATE3D/
#هوش_مصنوعی #بینایی_ماشین #تشخیص_سهبعدی #GATE3D
@rss_ai_ir
🟢 فریم ورک GATE3D یک فریمورک نوآورانه برای تشخیص سهبعدی اشیا از تصاویر تکچشمی است که با استفاده از نظارت ضعیف (Weak Supervision) توسعه داده شده.
این روش با بهرهگیری از lossهای سازگاری بین پیشبینیهای ۲D و ۳D، شکاف دامنهها را بهطور مؤثر پر میکند.
🔗 منابع:
👉 مقاله https://arxiv.org/pdf/2504.11014
👉 پروژه: https://ies0411.github.io/GATE3D/
#هوش_مصنوعی #بینایی_ماشین #تشخیص_سهبعدی #GATE3D
@rss_ai_ir
👏8🔥7🥰6👍5🎉4😁3❤1
🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI
در حالیکه شرکتهای آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت میکند.
🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزههای سلامت، تولید، کشاورزی و خدمات عمومی تسریع میکند.
🚀 غولهای آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایهگذاری میکنند، با وجود تردیدها درباره دستاوردهای کوتاهمدت.
⚙️ چین با تکیه بر ابزارهای اوپنسورس و کمهزینه (به دلیل محدودیتهای تجاری تراشهها)، بیشتر بر تابآوری و کاربردهای مقیاسپذیر تمرکز دارد تا پروژههای بلندپروازانه.
🔎 این تضاد، دو استراتژی متفاوت را نشان میدهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آیندهنگر شرطبندی میکند.
🇨🇳 چین روی بهرهوری واقعی و دستاوردهای ملموس صنعتی.
@rss_ai_ir
#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
در حالیکه شرکتهای آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت میکند.
🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزههای سلامت، تولید، کشاورزی و خدمات عمومی تسریع میکند.
🚀 غولهای آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایهگذاری میکنند، با وجود تردیدها درباره دستاوردهای کوتاهمدت.
⚙️ چین با تکیه بر ابزارهای اوپنسورس و کمهزینه (به دلیل محدودیتهای تجاری تراشهها)، بیشتر بر تابآوری و کاربردهای مقیاسپذیر تمرکز دارد تا پروژههای بلندپروازانه.
🔎 این تضاد، دو استراتژی متفاوت را نشان میدهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آیندهنگر شرطبندی میکند.
🇨🇳 چین روی بهرهوری واقعی و دستاوردهای ملموس صنعتی.
@rss_ai_ir
#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
👍11😁5👏4🎉4🔥3🥰3❤2
✨ Stable Diffusion WebUI Forge – Neo ✨
خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉
نسخهی جدید Forge (محیط کار با مدلهای تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:
🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدلهای flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعهای از مدلها، شتابدهندهها و فیچرهای اضافی
📌 نکته مهم: نسخهی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخهی Neo دوباره نفس تازهای به آن داده است.
#AI #StableDiffusion #WebUI #text2image #text2video #tools
@rss_ai_ir
خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉
نسخهی جدید Forge (محیط کار با مدلهای تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:
🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدلهای flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعهای از مدلها، شتابدهندهها و فیچرهای اضافی
📌 نکته مهم: نسخهی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخهی Neo دوباره نفس تازهای به آن داده است.
#AI #StableDiffusion #WebUI #text2image #text2video #tools
@rss_ai_ir
😁8🎉7🔥6👍4👏4❤2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬
ادوبی در نسخهی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایهی هوش مصنوعی.
🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع میکند به دانلود مدلهای موردنیاز و فایلهای جانبی با حجم نسبتاً بالا.
🔹 ماسکهایی که ساخته میشوند حجم زیادی دارند، بنابراین ادوبی توصیه میکند پوشهی جداگانهای برای ذخیرهی آنها بسازید.
🔹 بعد از ایجاد ماسک، میتوانید آن را Refine کنید یا بخشهایی از شیء را اضافه/حذف کنید.
📌 این یعنی کار با ویدئوها بسیار سادهتر شده: جداسازی سوژهها، حذف عناصر ناخواسته و کنترل دقیق روی بخشهای مختلف تصویر تنها با چند کلیک.
جزئیات بیشتر 👇
🌐 Object Masking در Adobe Premiere Pro
#Adobe #PremierePro #AI #VideoEditing #ObjectMasking
@rss_ai_ir
ویرایش ماسک اشیا با هوش مصنوعی 🎬
ادوبی در نسخهی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایهی هوش مصنوعی.
🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع میکند به دانلود مدلهای موردنیاز و فایلهای جانبی با حجم نسبتاً بالا.
🔹 ماسکهایی که ساخته میشوند حجم زیادی دارند، بنابراین ادوبی توصیه میکند پوشهی جداگانهای برای ذخیرهی آنها بسازید.
🔹 بعد از ایجاد ماسک، میتوانید آن را Refine کنید یا بخشهایی از شیء را اضافه/حذف کنید.
📌 این یعنی کار با ویدئوها بسیار سادهتر شده: جداسازی سوژهها، حذف عناصر ناخواسته و کنترل دقیق روی بخشهای مختلف تصویر تنها با چند کلیک.
جزئیات بیشتر 👇
🌐 Object Masking در Adobe Premiere Pro
#Adobe #PremierePro #AI #VideoEditing #ObjectMasking
@rss_ai_ir
🥰8❤6🔥5👏4😁3🎉3👍1
🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨
هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایهی Nano Banana و Veo 3 ساخته شده.
🔹 چیزی که این تیم رو خاص میکنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست میکنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربهی کاربر کار میکنن.
🔹 از اون طرف، منتقدها میگن که از مدلهای اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیعکننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلیشون، Speak 2.0، موفقیت خوبی داشت).
🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیکتاکمانند رو به سادهترین حالت برسونه:
1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبکهای صوتی (Audio styles)
6️⃣ افزودن پسزمینه مناسب
🎯 بدون نیاز به پرامپتهای طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!
📌 لینک تست: Higgsfield UGC Factory
@rss_ai_ir
#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨
هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایهی Nano Banana و Veo 3 ساخته شده.
🔹 چیزی که این تیم رو خاص میکنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست میکنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربهی کاربر کار میکنن.
🔹 از اون طرف، منتقدها میگن که از مدلهای اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیعکننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلیشون، Speak 2.0، موفقیت خوبی داشت).
🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیکتاکمانند رو به سادهترین حالت برسونه:
1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبکهای صوتی (Audio styles)
6️⃣ افزودن پسزمینه مناسب
🎯 بدون نیاز به پرامپتهای طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!
📌 لینک تست: Higgsfield UGC Factory
@rss_ai_ir
#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
❤12👍11🔥10👏10😁9🎉7🥰6