This media is not supported in your browser
VIEW IN TELEGRAM
🍏 اپل دو مدل متنباز جدید معرفی کرد: FastVLM و MobileCLIP2
🔹 این مدلها تا ۸۵ برابر سریعتر و ۳.۴ برابر کوچکتر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:
♻️OCR (تشخیص متن از تصویر)
♻️Image Captioning (تولید توضیحات برای تصاویر)
♻️Visual Question Answering (پاسخ به سوالات تصویری)
♻️Image Understanding (درک محتوای تصویر)
⚡️ اپل با این حرکت جدیتر از همیشه وارد رقابت مدلهای سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.
لینک
@rss_ai_ir
#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
🔹 این مدلها تا ۸۵ برابر سریعتر و ۳.۴ برابر کوچکتر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:
♻️OCR (تشخیص متن از تصویر)
♻️Image Captioning (تولید توضیحات برای تصاویر)
♻️Visual Question Answering (پاسخ به سوالات تصویری)
♻️Image Understanding (درک محتوای تصویر)
⚡️ اپل با این حرکت جدیتر از همیشه وارد رقابت مدلهای سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.
لینک
@rss_ai_ir
#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
👍2🔥2👏2
🎬 PixVerse V5؛ نسل تازهای از مدلهای ویدیویی
بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. بهنظر میرسد این نسخه تمام قابلیتهای ترند روز را یکجا جمع کرده — حتی تا مرحلهی Lip-sync 👄🎶
🔹 طبق نمونههای منتشرشده (Cherry-pickها)، خروجیها کیفیت بالایی دارند.
🔹 اولین دموی رسمی: یک تریلر ساختهشده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشمنواز و قابل توجهه.
👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنتها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش میدارم تا ببینیم چه آیندهای براش رقم میخوره.
🔗 تست و جزئیات: PixVerse V5
@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. بهنظر میرسد این نسخه تمام قابلیتهای ترند روز را یکجا جمع کرده — حتی تا مرحلهی Lip-sync 👄🎶
🔹 طبق نمونههای منتشرشده (Cherry-pickها)، خروجیها کیفیت بالایی دارند.
🔹 اولین دموی رسمی: یک تریلر ساختهشده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشمنواز و قابل توجهه.
👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنتها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش میدارم تا ببینیم چه آیندهای براش رقم میخوره.
🔗 تست و جزئیات: PixVerse V5
@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
👍2🔥1👏1
🌐 Droplet3D
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉6❤4🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁8❤6🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپناِیآی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥5❤4🎉4😁1
🧬 نسخه OpenVision 2 منتشر شد! 🧬
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉8❤7👍5🥰4👏4😁4🔥3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶♂️🦾 تصور کن توی خیابون راه میری و یک ربات انساننما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣3👍2😁1