VIRSUN

🍏 اپل دو مدل متن‌باز جدید معرفی کرد: FastVLM و MobileCLIP2

🔹 این مدل‌ها تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:

♻️OCR (تشخیص متن از تصویر)

♻️Image Captioning (تولید توضیحات برای تصاویر)

♻️Visual Question Answering (پاسخ به سوالات تصویری)

♻️Image Understanding (درک محتوای تصویر)

⚡️ اپل با این حرکت جدی‌تر از همیشه وارد رقابت مدل‌های سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.

لینک
@rss_ai_ir

#Apple #AI #FastVLM #MobileCLIP2 #VisionModels

👍2🔥2👏2

788 views02:50

VIRSUN

1:56

This media is not supported in your browser

VIEW IN TELEGRAM

0:16

This media is not supported in your browser

🎬 PixVerse V5؛ نسل تازه‌ای از مدل‌های ویدیویی

بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. به‌نظر می‌رسد این نسخه تمام قابلیت‌های ترند روز را یک‌جا جمع کرده — حتی تا مرحله‌ی Lip-sync 👄🎶

🔹 طبق نمونه‌های منتشرشده (Cherry-pickها)، خروجی‌ها کیفیت بالایی دارند.

🔹 اولین دموی رسمی: یک تریلر ساخته‌شده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشم‌نواز و قابل توجهه.

👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنت‌ها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش می‌دارم تا ببینیم چه آینده‌ای براش رقم می‌خوره.

🔗 تست و جزئیات: PixVerse V5

@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news

👍2🔥1👏1

782 views06:22

VIRSUN

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news

👍11🔥6👏6🎉6❤4🥰3😁2

808 views07:12

VIRSUN

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

🫛 TMR: Few-Shot Template-Matching 🫛

محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاست‌های متنوع نشان داده است.

🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) به‌زودی منتشر خواهد شد.

🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news

👍10👏8😁8❤6🥰6🔥5🎉1

882 views10:20

🎤 اوپن‌اِی‌آی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.

✨ قابلیت‌ها:

✳️درک نشانه‌های غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر

📊 امتیاز خیره‌کننده ۸۲.۸٪ روی بنچمارک‌های استدلال صوتی (audio reasoning)

این مدل می‌تواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمه‌ای باشد.

@rss_ai_ir

#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant

👏8🥰7👍5🔥5❤4🎉4😁1

841 views10:20

VIRSUN

🧬 نسخه OpenVision 2 منتشر شد! 🧬

👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانواده‌ای نوآورانه از visual encoder‌های مولد که بدون نیاز به text encoder و contrastive loss آموزش می‌بینند. این مدل‌ها فقط با caption-only supervision آموزش داده شده‌اند.

🔹 کاملاً اوپن‌سورس و تحت لایسنس Apache 2.0 💙

🔗 منابع:

👉 Paper
👉 Project
👉 Repo

@rss_ai_ir

#AI #ML #CV #OpenVision2 #opensource #UCSC

🎉8❤7👍5🥰4👏4😁4🔥3🙏1

3.04K views15:48

VIRSUN

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

🚶‍♂️🦾 تصور کن توی خیابون راه می‌ری و یک ربات انسان‌نما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار می‌کنی؟ 😅

@rss_ai_ir

#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics

🤣4👍2😁1

2.98K views18:31

VIRSUN

🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI

در حالی‌که شرکت‌های آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت می‌کند.

🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزه‌های سلامت، تولید، کشاورزی و خدمات عمومی تسریع می‌کند.
🚀 غول‌های آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایه‌گذاری می‌کنند، با وجود تردیدها درباره دستاوردهای کوتاه‌مدت.
⚙️ چین با تکیه بر ابزارهای اوپن‌سورس و کم‌هزینه (به دلیل محدودیت‌های تجاری تراشه‌ها)، بیشتر بر تاب‌آوری و کاربردهای مقیاس‌پذیر تمرکز دارد تا پروژه‌های بلندپروازانه.

🔎 این تضاد، دو استراتژی متفاوت را نشان می‌دهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آینده‌نگر شرط‌بندی می‌کند.
🇨🇳 چین روی بهره‌وری واقعی و دستاوردهای ملموس صنعتی.

@rss_ai_ir

#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی

👍11😁5👏4🎉4🔥3🥰3❤2

123 viewsedited 17:40

VIRSUN

✨ Stable Diffusion WebUI Forge – Neo ✨

خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉

نسخه‌ی جدید Forge (محیط کار با مدل‌های تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:

🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدل‌های flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعه‌ای از مدل‌ها، شتاب‌دهنده‌ها و فیچرهای اضافی

📌 نکته مهم: نسخه‌ی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخه‌ی Neo دوباره نفس تازه‌ای به آن داده است.

#AI #StableDiffusion #WebUI #text2image #text2video #tools

@rss_ai_ir

😁8🎉7🔥6👍4👏4❤2🥰1

112 viewsedited 17:40

VIRSUN

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬

ادوبی در نسخه‌ی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایه‌ی هوش مصنوعی.

🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع می‌کند به دانلود مدل‌های موردنیاز و فایل‌های جانبی با حجم نسبتاً بالا.
🔹 ماسک‌هایی که ساخته می‌شوند حجم زیادی دارند، بنابراین ادوبی توصیه می‌کند پوشه‌ی جداگانه‌ای برای ذخیره‌ی آنها بسازید.

🔹 بعد از ایجاد ماسک، می‌توانید آن را Refine کنید یا بخش‌هایی از شیء را اضافه/حذف کنید.

📌 این یعنی کار با ویدئوها بسیار ساده‌تر شده: جداسازی سوژه‌ها، حذف عناصر ناخواسته و کنترل دقیق روی بخش‌های مختلف تصویر تنها با چند کلیک.

جزئیات بیشتر 👇

🌐 Object Masking در Adobe Premiere Pro

#Adobe #PremierePro #AI #VideoEditing #ObjectMasking

@rss_ai_ir

🥰8❤6🔥5👏4😁3🎉3👍1

118 viewsedited 17:42

VIRSUN

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨

هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایه‌ی Nano Banana و Veo 3 ساخته شده.

🔹 چیزی که این تیم رو خاص می‌کنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست می‌کنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربه‌ی کاربر کار می‌کنن.
🔹 از اون طرف، منتقدها می‌گن که از مدل‌های اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیع‌کننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلی‌شون، Speak 2.0، موفقیت خوبی داشت).

🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیک‌تاک‌مانند رو به ساده‌ترین حالت برسونه:

1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبک‌های صوتی (Audio styles)
6️⃣ افزودن پس‌زمینه مناسب

🎯 بدون نیاز به پرامپت‌های طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!

📌 لینک تست: Higgsfield UGC Factory

@rss_ai_ir

#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration

❤12👍11🔥10👏10😁9🎉7🥰6

129 views17:46

VIRSUN

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

🔍 Event Blurry Super-Resolution (Ev-DeblurVSR) 🔍

پژوهشگران USTC مدل جدیدی به نام Ev-DeblurVSR معرفی کردند؛ ترکیبی از سیگنال‌های رخدادی (Event signals) با Blurry Video Super-Resolution (BVSR) برای تولید ویدیوهای وضوح بالا (HR) از ورودی‌های کم‌وضوح و تار.

✨ ویژگی‌ها:

✳️ادغام اطلاعات رخدادی برای افزایش دقت بازسازی جزئیات.
✳️بهبود چشمگیر کیفیت ویدیوهای تار و کم‌کیفیت.
✳️انتشار مدل‌های از پیش آموزش‌دیده و داده‌های تست تحت لایسنس Apache.

📌 منابع:
👉 مقاله: لینک
👉 ریپازیتوری: لینک

@rss_ai_ir

#AI #ML #VSR #EventCamera #Deblur #SuperResolution #USTC

🔥9👏6👍4🥰4🎉4❤3😁3

127 views17:53

About

Blog

Apps

Platform