This media is not supported in your browser
VIEW IN TELEGRAM
🍏 اپل دو مدل متنباز جدید معرفی کرد: FastVLM و MobileCLIP2
🔹 این مدلها تا ۸۵ برابر سریعتر و ۳.۴ برابر کوچکتر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:
♻️OCR (تشخیص متن از تصویر)
♻️Image Captioning (تولید توضیحات برای تصاویر)
♻️Visual Question Answering (پاسخ به سوالات تصویری)
♻️Image Understanding (درک محتوای تصویر)
⚡️ اپل با این حرکت جدیتر از همیشه وارد رقابت مدلهای سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.
لینک
@rss_ai_ir
#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
🔹 این مدلها تا ۸۵ برابر سریعتر و ۳.۴ برابر کوچکتر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:
♻️OCR (تشخیص متن از تصویر)
♻️Image Captioning (تولید توضیحات برای تصاویر)
♻️Visual Question Answering (پاسخ به سوالات تصویری)
♻️Image Understanding (درک محتوای تصویر)
⚡️ اپل با این حرکت جدیتر از همیشه وارد رقابت مدلهای سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.
لینک
@rss_ai_ir
#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
👍2🔥2👏2
🎬 PixVerse V5؛ نسل تازهای از مدلهای ویدیویی
بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. بهنظر میرسد این نسخه تمام قابلیتهای ترند روز را یکجا جمع کرده — حتی تا مرحلهی Lip-sync 👄🎶
🔹 طبق نمونههای منتشرشده (Cherry-pickها)، خروجیها کیفیت بالایی دارند.
🔹 اولین دموی رسمی: یک تریلر ساختهشده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشمنواز و قابل توجهه.
👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنتها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش میدارم تا ببینیم چه آیندهای براش رقم میخوره.
🔗 تست و جزئیات: PixVerse V5
@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. بهنظر میرسد این نسخه تمام قابلیتهای ترند روز را یکجا جمع کرده — حتی تا مرحلهی Lip-sync 👄🎶
🔹 طبق نمونههای منتشرشده (Cherry-pickها)، خروجیها کیفیت بالایی دارند.
🔹 اولین دموی رسمی: یک تریلر ساختهشده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشمنواز و قابل توجهه.
👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنتها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش میدارم تا ببینیم چه آیندهای براش رقم میخوره.
🔗 تست و جزئیات: PixVerse V5
@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
👍2🔥1👏1
🌐 Droplet3D
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉6❤4🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁8❤6🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپناِیآی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥5❤4🎉4😁1
🧬 نسخه OpenVision 2 منتشر شد! 🧬
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉8❤7👍5🥰4👏4😁4🔥3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶♂️🦾 تصور کن توی خیابون راه میری و یک ربات انساننما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣4👍2😁1
🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI
در حالیکه شرکتهای آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت میکند.
🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزههای سلامت، تولید، کشاورزی و خدمات عمومی تسریع میکند.
🚀 غولهای آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایهگذاری میکنند، با وجود تردیدها درباره دستاوردهای کوتاهمدت.
⚙️ چین با تکیه بر ابزارهای اوپنسورس و کمهزینه (به دلیل محدودیتهای تجاری تراشهها)، بیشتر بر تابآوری و کاربردهای مقیاسپذیر تمرکز دارد تا پروژههای بلندپروازانه.
🔎 این تضاد، دو استراتژی متفاوت را نشان میدهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آیندهنگر شرطبندی میکند.
🇨🇳 چین روی بهرهوری واقعی و دستاوردهای ملموس صنعتی.
@rss_ai_ir
#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
در حالیکه شرکتهای آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت میکند.
🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزههای سلامت، تولید، کشاورزی و خدمات عمومی تسریع میکند.
🚀 غولهای آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایهگذاری میکنند، با وجود تردیدها درباره دستاوردهای کوتاهمدت.
⚙️ چین با تکیه بر ابزارهای اوپنسورس و کمهزینه (به دلیل محدودیتهای تجاری تراشهها)، بیشتر بر تابآوری و کاربردهای مقیاسپذیر تمرکز دارد تا پروژههای بلندپروازانه.
🔎 این تضاد، دو استراتژی متفاوت را نشان میدهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آیندهنگر شرطبندی میکند.
🇨🇳 چین روی بهرهوری واقعی و دستاوردهای ملموس صنعتی.
@rss_ai_ir
#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
👍11😁5👏4🎉4🔥3🥰3❤2
✨ Stable Diffusion WebUI Forge – Neo ✨
خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉
نسخهی جدید Forge (محیط کار با مدلهای تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:
🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدلهای flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعهای از مدلها، شتابدهندهها و فیچرهای اضافی
📌 نکته مهم: نسخهی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخهی Neo دوباره نفس تازهای به آن داده است.
#AI #StableDiffusion #WebUI #text2image #text2video #tools
@rss_ai_ir
خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉
نسخهی جدید Forge (محیط کار با مدلهای تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:
🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدلهای flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعهای از مدلها، شتابدهندهها و فیچرهای اضافی
📌 نکته مهم: نسخهی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخهی Neo دوباره نفس تازهای به آن داده است.
#AI #StableDiffusion #WebUI #text2image #text2video #tools
@rss_ai_ir
😁8🎉7🔥6👍4👏4❤2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬
ادوبی در نسخهی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایهی هوش مصنوعی.
🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع میکند به دانلود مدلهای موردنیاز و فایلهای جانبی با حجم نسبتاً بالا.
🔹 ماسکهایی که ساخته میشوند حجم زیادی دارند، بنابراین ادوبی توصیه میکند پوشهی جداگانهای برای ذخیرهی آنها بسازید.
🔹 بعد از ایجاد ماسک، میتوانید آن را Refine کنید یا بخشهایی از شیء را اضافه/حذف کنید.
📌 این یعنی کار با ویدئوها بسیار سادهتر شده: جداسازی سوژهها، حذف عناصر ناخواسته و کنترل دقیق روی بخشهای مختلف تصویر تنها با چند کلیک.
جزئیات بیشتر 👇
🌐 Object Masking در Adobe Premiere Pro
#Adobe #PremierePro #AI #VideoEditing #ObjectMasking
@rss_ai_ir
ویرایش ماسک اشیا با هوش مصنوعی 🎬
ادوبی در نسخهی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایهی هوش مصنوعی.
🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع میکند به دانلود مدلهای موردنیاز و فایلهای جانبی با حجم نسبتاً بالا.
🔹 ماسکهایی که ساخته میشوند حجم زیادی دارند، بنابراین ادوبی توصیه میکند پوشهی جداگانهای برای ذخیرهی آنها بسازید.
🔹 بعد از ایجاد ماسک، میتوانید آن را Refine کنید یا بخشهایی از شیء را اضافه/حذف کنید.
📌 این یعنی کار با ویدئوها بسیار سادهتر شده: جداسازی سوژهها، حذف عناصر ناخواسته و کنترل دقیق روی بخشهای مختلف تصویر تنها با چند کلیک.
جزئیات بیشتر 👇
🌐 Object Masking در Adobe Premiere Pro
#Adobe #PremierePro #AI #VideoEditing #ObjectMasking
@rss_ai_ir
🥰8❤6🔥5👏4😁3🎉3👍1
🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨
هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایهی Nano Banana و Veo 3 ساخته شده.
🔹 چیزی که این تیم رو خاص میکنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست میکنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربهی کاربر کار میکنن.
🔹 از اون طرف، منتقدها میگن که از مدلهای اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیعکننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلیشون، Speak 2.0، موفقیت خوبی داشت).
🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیکتاکمانند رو به سادهترین حالت برسونه:
1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبکهای صوتی (Audio styles)
6️⃣ افزودن پسزمینه مناسب
🎯 بدون نیاز به پرامپتهای طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!
📌 لینک تست: Higgsfield UGC Factory
@rss_ai_ir
#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨
هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایهی Nano Banana و Veo 3 ساخته شده.
🔹 چیزی که این تیم رو خاص میکنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست میکنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربهی کاربر کار میکنن.
🔹 از اون طرف، منتقدها میگن که از مدلهای اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیعکننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلیشون، Speak 2.0، موفقیت خوبی داشت).
🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیکتاکمانند رو به سادهترین حالت برسونه:
1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبکهای صوتی (Audio styles)
6️⃣ افزودن پسزمینه مناسب
🎯 بدون نیاز به پرامپتهای طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!
📌 لینک تست: Higgsfield UGC Factory
@rss_ai_ir
#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
❤12👍11🔥10👏10😁9🎉7🥰6
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Event Blurry Super-Resolution (Ev-DeblurVSR) 🔍
پژوهشگران USTC مدل جدیدی به نام Ev-DeblurVSR معرفی کردند؛ ترکیبی از سیگنالهای رخدادی (Event signals) با Blurry Video Super-Resolution (BVSR) برای تولید ویدیوهای وضوح بالا (HR) از ورودیهای کموضوح و تار.
✨ ویژگیها:
✳️ادغام اطلاعات رخدادی برای افزایش دقت بازسازی جزئیات.
✳️بهبود چشمگیر کیفیت ویدیوهای تار و کمکیفیت.
✳️انتشار مدلهای از پیش آموزشدیده و دادههای تست تحت لایسنس Apache.
📌 منابع:
👉 مقاله: لینک
👉 ریپازیتوری: لینک
@rss_ai_ir
#AI #ML #VSR #EventCamera #Deblur #SuperResolution #USTC
پژوهشگران USTC مدل جدیدی به نام Ev-DeblurVSR معرفی کردند؛ ترکیبی از سیگنالهای رخدادی (Event signals) با Blurry Video Super-Resolution (BVSR) برای تولید ویدیوهای وضوح بالا (HR) از ورودیهای کموضوح و تار.
✨ ویژگیها:
✳️ادغام اطلاعات رخدادی برای افزایش دقت بازسازی جزئیات.
✳️بهبود چشمگیر کیفیت ویدیوهای تار و کمکیفیت.
✳️انتشار مدلهای از پیش آموزشدیده و دادههای تست تحت لایسنس Apache.
📌 منابع:
👉 مقاله: لینک
👉 ریپازیتوری: لینک
@rss_ai_ir
#AI #ML #VSR #EventCamera #Deblur #SuperResolution #USTC
🔥9👏6👍4🥰4🎉4❤3😁3