VIRSUN
13.7K subscribers
507 photos
305 videos
2 files
310 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🎬 PixVerse V5؛ نسل تازه‌ای از مدل‌های ویدیویی

بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. به‌نظر می‌رسد این نسخه تمام قابلیت‌های ترند روز را یک‌جا جمع کرده — حتی تا مرحله‌ی Lip-sync 👄🎶

🔹 طبق نمونه‌های منتشرشده (Cherry-pickها)، خروجی‌ها کیفیت بالایی دارند.

🔹 اولین دموی رسمی: یک تریلر ساخته‌شده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشم‌نواز و قابل توجهه.


👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنت‌ها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش می‌دارم تا ببینیم چه آینده‌ای براش رقم می‌خوره.


🔗 تست و جزئیات: PixVerse V5

@rss_ai_ir 🤖🎥
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
👍2🔥1👏1
🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉64🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛

محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاست‌های متنوع نشان داده است.

🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) به‌زودی منتشر خواهد شد.

🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁86🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپن‌اِی‌آی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.

قابلیت‌ها:

✳️درک نشانه‌های غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر


📊 امتیاز خیره‌کننده ۸۲.۸٪ روی بنچمارک‌های استدلال صوتی (audio reasoning)

این مدل می‌تواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمه‌ای باشد.

@rss_ai_ir

#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥54🎉4😁1
🧬 نسخه OpenVision 2 منتشر شد! 🧬

👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانواده‌ای نوآورانه از visual encoder‌های مولد که بدون نیاز به text encoder و contrastive loss آموزش می‌بینند. این مدل‌ها فقط با caption-only supervision آموزش داده شده‌اند.

🔹 کاملاً اوپن‌سورس و تحت لایسنس Apache 2.0 💙

🔗 منابع:

👉 Paper
👉 Project
👉 Repo

@rss_ai_ir

#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉87👍5🥰4👏4😁4🔥3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶‍♂️🦾 تصور کن توی خیابون راه می‌ری و یک ربات انسان‌نما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار می‌کنی؟ 😅

@rss_ai_ir

#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣4👍2😁1
🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI

در حالی‌که شرکت‌های آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت می‌کند.

🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزه‌های سلامت، تولید، کشاورزی و خدمات عمومی تسریع می‌کند.
🚀 غول‌های آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایه‌گذاری می‌کنند، با وجود تردیدها درباره دستاوردهای کوتاه‌مدت.
⚙️ چین با تکیه بر ابزارهای اوپن‌سورس و کم‌هزینه (به دلیل محدودیت‌های تجاری تراشه‌ها)، بیشتر بر تاب‌آوری و کاربردهای مقیاس‌پذیر تمرکز دارد تا پروژه‌های بلندپروازانه.

🔎 این تضاد، دو استراتژی متفاوت را نشان می‌دهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آینده‌نگر شرط‌بندی می‌کند.
🇨🇳 چین روی بهره‌وری واقعی و دستاوردهای ملموس صنعتی.

@rss_ai_ir

#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
👍12😁5👏4🎉4🔥3🥰32
Stable Diffusion WebUI Forge – Neo

خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉

نسخه‌ی جدید Forge (محیط کار با مدل‌های تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:

🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدل‌های flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعه‌ای از مدل‌ها، شتاب‌دهنده‌ها و فیچرهای اضافی

📌 نکته مهم: نسخه‌ی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخه‌ی Neo دوباره نفس تازه‌ای به آن داده است.

#AI #StableDiffusion #WebUI #text2image #text2video #tools

@rss_ai_ir
😁8🎉7🔥6👍4👏42🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬

ادوبی در نسخه‌ی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایه‌ی هوش مصنوعی.

🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع می‌کند به دانلود مدل‌های موردنیاز و فایل‌های جانبی با حجم نسبتاً بالا.
🔹 ماسک‌هایی که ساخته می‌شوند حجم زیادی دارند، بنابراین ادوبی توصیه می‌کند پوشه‌ی جداگانه‌ای برای ذخیره‌ی آنها بسازید.

🔹 بعد از ایجاد ماسک، می‌توانید آن را Refine کنید یا بخش‌هایی از شیء را اضافه/حذف کنید.

📌 این یعنی کار با ویدئوها بسیار ساده‌تر شده: جداسازی سوژه‌ها، حذف عناصر ناخواسته و کنترل دقیق روی بخش‌های مختلف تصویر تنها با چند کلیک.

جزئیات بیشتر 👇

🌐 Object Masking در Adobe Premiere Pro

#Adobe #PremierePro #AI #VideoEditing #ObjectMasking

@rss_ai_ir
🥰87🔥5👏4😁3🎉3👍1
🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥

هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایه‌ی Nano Banana و Veo 3 ساخته شده.

🔹 چیزی که این تیم رو خاص می‌کنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست می‌کنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربه‌ی کاربر کار می‌کنن.
🔹 از اون طرف، منتقدها می‌گن که از مدل‌های اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیع‌کننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلی‌شون، Speak 2.0، موفقیت خوبی داشت).

🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیک‌تاک‌مانند رو به ساده‌ترین حالت برسونه:

1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبک‌های صوتی (Audio styles)
6️⃣ افزودن پس‌زمینه مناسب

🎯 بدون نیاز به پرامپت‌های طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!

📌 لینک تست: Higgsfield UGC Factory

@rss_ai_ir

#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
13👍11🔥10👏10😁9🎉7🥰6
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Event Blurry Super-Resolution (Ev-DeblurVSR) 🔍

پژوهشگران USTC مدل جدیدی به نام Ev-DeblurVSR معرفی کردند؛ ترکیبی از سیگنال‌های رخدادی (Event signals) با Blurry Video Super-Resolution (BVSR) برای تولید ویدیوهای وضوح بالا (HR) از ورودی‌های کم‌وضوح و تار.

ویژگی‌ها:

✳️ادغام اطلاعات رخدادی برای افزایش دقت بازسازی جزئیات.
✳️بهبود چشمگیر کیفیت ویدیوهای تار و کم‌کیفیت.
✳️انتشار مدل‌های از پیش آموزش‌دیده و داده‌های تست تحت لایسنس Apache.


📌 منابع:
👉 مقاله: لینک
👉 ریپازیتوری: لینک

@rss_ai_ir

#AI #ML #VSR #EventCamera #Deblur #SuperResolution #USTC
🔥10👏6👍4🥰4🎉43😁3
Media is too big
VIEW IN TELEGRAM
🧠 پیشرفت مدل‌های زبانی بزرگ: از مفاهیم پایه تا کاربردهای واقعی

👤 اسحاق کارگر
دانشمند ارشد هوش مصنوعی در شرکت In_Parallel فنلاند
دانشجوی دکترای هوش مصنوعی رباتیک، دانشگاه آلتو فنلاند

📚 سرفصل‌ها
🔹 مقدمه – مدل‌های زبانی چیستند؟
🔹 مبانی معماری ترنسفورمر (به زبان ساده)
🔹 آموزش و تنظیم مدل‌های زبانی بزرگ
🔹 کاربردهای کلیدی LLM
🔹 چالش‌ها و محدودیت‌ها
🔹 مسیرهای آینده و نکات پایانی
🔹 پرسش و پاسخ

🏛 برگزار شده توسط آکادمی
- شبکه نخبگان ایران

🌐 @rss_ai_ir

#هوش_مصنوعی #مدل_زبانی #LLM #یادگیری_عمیق #ترنسفورمر #AI #مدلسازی #علمی #آموزش
👍86🎉6😁4🔥3👏1🙏1
⚙️ چرا پروژه‌های هوش مصنوعی صنعتی بدون متخصص فرآیند شکست می‌خورند؟


📌 تیم قوی در AI کافی نیست! اگر کسی نباشد که فرآیند صنعتی را بشناسد، پروژه به احتمال زیاد بی‌نتیجه می‌ماند.


🔹 دلایل:
1️⃣ مسئله درست تعریف نمی‌شود.
2️⃣ داده‌های بی‌فایده جمع‌آوری می‌شوند.
3️⃣ خروجی مدل قابل تفسیر عملی نیست.
4️⃣ در محیط واقعی پیاده‌سازی سخت یا غیرممکن می‌شود.

ترکیب دانش فنی (AI/ML) + دانش فرآیند شرط اصلی موفقیت است.

#هوش_مصنوعی #صنعت #اتوماسیون #AI_industrial
@rss_ai_ir
🔥85😁4👍3🎉3🙏1
🔥 انویدیا از Universal Deep Research (UDR) رونمایی کرد

✳️همچنین UDR یک ایجنت قابل‌سفارشی‌سازی برای تحقیقات عمیق است که می‌تواند روی هر LLM قرار بگیرد و آن را هوشمندتر و منعطف‌تر کند.

📌 چرا مهم است؟
🟠 سفارشی‌سازی ایجنت بدون کدنویسی — بر خلاف بسیاری از ابزارها که سناریوهای محدودی دارند، UDR آزادی کامل برای طراحی استراتژی دارد.
🟠 می‌توانید استراتژی‌های جستجو و تحلیل را بسازید، ویرایش کنید و ترکیب کنید.
🟠 در ریپوی پروژه مثال‌هایی از استراتژی‌ها (حداقلی، گسترده، فشرده) قرار داده شده، اما قدرت اصلی UDR در ساخت سناریوهای اختصاصی برای نیاز خودتان است.

در واقع، با UDR می‌توانید یک ایجنت تحقیقاتی انعطاف‌پذیر بسازید که با هر جریان کاری (workflow) هماهنگ شود.

🟢 پروژه: https://research.nvidia.com/labs/lpr/udr
🟢 کد: https://github.com/NVlabs/UniversalDeepResearch
🟢 لَب: https://nv-dler.github.io

@rss_ai_ir

#NVIDIA #UDR #UniversalDeepResearch #AI #LLM #ResearchAgent #AIAgents #DeepResearch
😁9👍54🔥4🎉2🙏1
🚀 گوگل از EmbeddingGemma رونمایی کرد؛ یک مدل سبک و اوپن‌سورس برای ایجاد امبدینگ‌های متنی.

📌 ویژگی مهم: این مدل را می‌توان مستقیم روی موبایل یا لپ‌تاپ اجرا کرد، بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.

🟢 چه چیزی داخلش هست؟

✳️308 میلیون پارامتر، اما از همه مدل‌های زیر 500M در کیفیت بهتر عمل می‌کند (طبق MTEB)

✳️سرعت بسیار بالا: کمتر از 15 میلی‌ثانیه روی EdgeTPU (برای 256 توکن)

✳️پشتیبانی از بیش از 100 زبان

✳️امکان کاهش ابعاد امبدینگ از 768 → 128 بدون افت کیفیت

✳️پشتیبانی از کانتکست تا 2000 توکن

✳️سازگار با Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate و دیگر ابزارهای محبوب


🟠 وبلاگ: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدل‌ها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

@rss_ai_ir

#AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP
👍85🔥5🎉4👏1😁1🙏1
🌟 یک مقاله مروری درباره دیتاست‌های اوپن ML در Hugging Face منتشر شد.

📝 نویسنده‌ی رسانه‌ی Daily Dose of Data Science جالب‌ترین دیتاست‌ها و مدل‌های اوپن اخیر را گردآوری کرده است. یکی از برجسته‌ترین‌ها Yambda-5B از تیم Yandex است؛ بزرگ‌ترین دیتاست اوپن در دنیا برای سیستم‌های توصیه‌گر موسیقی.

🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعه‌ی نسل جدید سیستم‌های پیشنهاددهنده می‌باشد.

🔗 مطالعه‌ی بیشتر


@rss_ai_ir

#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
👍8🔥7🎉6😁42
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 WebEyeTrack:
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻

👉 فریم ورک WebEyeTrack یک فریم‌ورک نوآورانه است که مدل‌های سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام می‌کند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب می‌آورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر می‌گیرد.

🟢 کد منبع با لایسنس MIT منتشر شده است 💙


🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack

@rss_ai_ir

#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
👍75🔥5🎉5😁3🙏2👏1