🎬 PixVerse V5؛ نسل تازهای از مدلهای ویدیویی
بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. بهنظر میرسد این نسخه تمام قابلیتهای ترند روز را یکجا جمع کرده — حتی تا مرحلهی Lip-sync 👄🎶
🔹 طبق نمونههای منتشرشده (Cherry-pickها)، خروجیها کیفیت بالایی دارند.
🔹 اولین دموی رسمی: یک تریلر ساختهشده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشمنواز و قابل توجهه.
👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنتها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش میدارم تا ببینیم چه آیندهای براش رقم میخوره.
🔗 تست و جزئیات: PixVerse V5
@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. بهنظر میرسد این نسخه تمام قابلیتهای ترند روز را یکجا جمع کرده — حتی تا مرحلهی Lip-sync 👄🎶
🔹 طبق نمونههای منتشرشده (Cherry-pickها)، خروجیها کیفیت بالایی دارند.
🔹 اولین دموی رسمی: یک تریلر ساختهشده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشمنواز و قابل توجهه.
👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنتها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش میدارم تا ببینیم چه آیندهای براش رقم میخوره.
🔗 تست و جزئیات: PixVerse V5
@rss_ai_ir 🤖🎥✨
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
👍2🔥1👏1
🌐 Droplet3D
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
؛ نسل جدید مدلهای سهبعدی از چین
♻️مدل Droplet3D برای آموزش از ویدیو استفاده میکند. این یعنی سیستم میتواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سهبعدی را بالا ببرد. 📹➡️🧩➡️🕹️
🔹 هرچه ویدیو زاویههای بیشتری داشته باشد، اطلاعات دقیقتری از شکل و ساختار شیء به دست میآید.
📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سهبعدی با توضیحات متنی کامل.
⚡ هرچند در دموی اولیه کیفیت هنوز شبیه نسلهای قدیمیتر و کمی خشن بهنظر میرسد، اما رویکرد نشان میدهد که در آینده نزدیک شاهد جهش جدی در مدلهای 3D خواهیم بود.
🔗 جزئیات بیشتر: Droplet3D
@rss_ai_ir 🤖🎥🏗️
#هوش_مصنوعی #مدل_سهبعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉6❤4🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🫛 TMR: Few-Shot Template-Matching 🫛
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
محققان دانشگاه POSTECH از رویکرد جدیدی به نام TMR رونمایی کردند؛ یک الگوریتم ساده و نوآورانه برای شناسایی الگوها که با استفاده از few-shot learning عملکردی بسیار قوی و حتی SOTA روی دیتاستهای متنوع نشان داده است.
🔹 همچنین یک دیتاست جدید به نام RPINE معرفی شده و مخزن کد (repo) بهزودی منتشر خواهد شد.
🔗 منابع:
👉 مرور
👉 مقاله
👉 پروژه
👉 مخزن کد
@rss_ai_ir 🤖🧩
#هوش_مصنوعی #الگوریتم #TMR #FewShot #یادگیری_ماشین #AI_industrial_news
👍10👏8😁8❤6🥰6🔥5🎉1
Media is too big
VIEW IN TELEGRAM
🎤 اوپناِیآی مدل gpt-realtime را معرفی کرد؛ یک مدل پیشرفته speech-to-speech با پشتیبانی از MCPهای ریموت و ورودی تصویری.
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
✨ قابلیتها:
✳️درک نشانههای غیرکلامی (nonverbal cues) در مکالمه
✳️تغییر زبان حین گفتگو با حفظ جریان طبیعی
✳️پشتیبانی همزمان از صدا و تصویر
📊 امتیاز خیرهکننده ۸۲.۸٪ روی بنچمارکهای استدلال صوتی (audio reasoning)
این مدل میتواند نقطه عطفی در ساخت دستیارهای هوشمند مکالمهای باشد.
@rss_ai_ir
#OpenAI #GPTRealtime #SpeechAI #AI #MCP #VoiceAssistant
👏8🥰7👍5🔥5❤4🎉4😁1
🧬 نسخه OpenVision 2 منتشر شد! 🧬
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
👉 دانشگاه UCSC نسخه دوم OpenVision2 را معرفی کرد: خانوادهای نوآورانه از visual encoderهای مولد که بدون نیاز به text encoder و contrastive loss آموزش میبینند. این مدلها فقط با caption-only supervision آموزش داده شدهاند.
🔹 کاملاً اوپنسورس و تحت لایسنس Apache 2.0 💙
🔗 منابع:
👉 Paper
👉 Project
👉 Repo
@rss_ai_ir
#AI #ML #CV #OpenVision2 #opensource #UCSC
🎉8❤7👍5🥰4👏4😁4🔥3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🚶♂️🦾 تصور کن توی خیابون راه میری و یک ربات انساننما مثل Unitree G1 جلوت سبز بشه...
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
فقط یک سؤال: چی کار میکنی؟ 😅
@rss_ai_ir
#UnitreeG1 #ربات #هوش_مصنوعی #آینده #AI #Robotics
🤣4👍2😁1
🌏 چین مسیر متفاوتی در هوش مصنوعی انتخاب کرده — تمرکز بر کاربرد، نه AGI
در حالیکه شرکتهای آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت میکند.
🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزههای سلامت، تولید، کشاورزی و خدمات عمومی تسریع میکند.
🚀 غولهای آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایهگذاری میکنند، با وجود تردیدها درباره دستاوردهای کوتاهمدت.
⚙️ چین با تکیه بر ابزارهای اوپنسورس و کمهزینه (به دلیل محدودیتهای تجاری تراشهها)، بیشتر بر تابآوری و کاربردهای مقیاسپذیر تمرکز دارد تا پروژههای بلندپروازانه.
🔎 این تضاد، دو استراتژی متفاوت را نشان میدهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آیندهنگر شرطبندی میکند.
🇨🇳 چین روی بهرهوری واقعی و دستاوردهای ملموس صنعتی.
@rss_ai_ir
#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
در حالیکه شرکتهای آمریکایی به دنبال دستیابی به هوش مصنوعی عمومی (AGI) هستند، چین هوش مصنوعی را به سمت تأثیر فوری و عملی در دنیای واقعی هدایت میکند.
🏥 طرح «AI+» پکن، پذیرش هوش مصنوعی را در حوزههای سلامت، تولید، کشاورزی و خدمات عمومی تسریع میکند.
🚀 غولهای آمریکایی مانند OpenAI، Meta و Google میلیاردها دلار روی تحقیق در مورد AGI سرمایهگذاری میکنند، با وجود تردیدها درباره دستاوردهای کوتاهمدت.
⚙️ چین با تکیه بر ابزارهای اوپنسورس و کمهزینه (به دلیل محدودیتهای تجاری تراشهها)، بیشتر بر تابآوری و کاربردهای مقیاسپذیر تمرکز دارد تا پروژههای بلندپروازانه.
🔎 این تضاد، دو استراتژی متفاوت را نشان میدهد:
🇺🇸 آمریکا روی ابرهوش احتمالی و آیندهنگر شرطبندی میکند.
🇨🇳 چین روی بهرهوری واقعی و دستاوردهای ملموس صنعتی.
@rss_ai_ir
#AI_industrial_news #چین #AGI #هوش_مصنوعی #صنعتی
👍12😁5👏4🎉4🔥3🥰3❤2
✨ Stable Diffusion WebUI Forge – Neo ✨
خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉
نسخهی جدید Forge (محیط کار با مدلهای تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:
🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدلهای flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعهای از مدلها، شتابدهندهها و فیچرهای اضافی
📌 نکته مهم: نسخهی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخهی Neo دوباره نفس تازهای به آن داده است.
#AI #StableDiffusion #WebUI #text2image #text2video #tools
@rss_ai_ir
خبر خوش برای کسانی که با ComfyUI میانه خوبی ندارند! 🎉
نسخهی جدید Forge (محیط کار با مدلهای تولید تصویر و ویدیو) منتشر شده و کلی قابلیت تازه به آن اضافه شده است:
🔹 Wan 2.2 — پشتیبانی از txt2img، img2img، txt2vid و img2vid
🔹 Nunchaku — شامل مدلهای flux-dev، flux-krea، flux-kontext، T5
🔹 Flux-Kontext — پشتیبانی از img2img و inpaint
🔹 + مجموعهای از مدلها، شتابدهندهها و فیچرهای اضافی
📌 نکته مهم: نسخهی اصلی Forge از سال گذشته بدون تغییر مانده بود، اما این نسخهی Neo دوباره نفس تازهای به آن داده است.
#AI #StableDiffusion #WebUI #text2image #text2video #tools
@rss_ai_ir
😁8🎉7🔥6👍4👏4❤2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Adobe Premiere Pro Beta
ویرایش ماسک اشیا با هوش مصنوعی 🎬
ادوبی در نسخهی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایهی هوش مصنوعی.
🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع میکند به دانلود مدلهای موردنیاز و فایلهای جانبی با حجم نسبتاً بالا.
🔹 ماسکهایی که ساخته میشوند حجم زیادی دارند، بنابراین ادوبی توصیه میکند پوشهی جداگانهای برای ذخیرهی آنها بسازید.
🔹 بعد از ایجاد ماسک، میتوانید آن را Refine کنید یا بخشهایی از شیء را اضافه/حذف کنید.
📌 این یعنی کار با ویدئوها بسیار سادهتر شده: جداسازی سوژهها، حذف عناصر ناخواسته و کنترل دقیق روی بخشهای مختلف تصویر تنها با چند کلیک.
جزئیات بیشتر 👇
🌐 Object Masking در Adobe Premiere Pro
#Adobe #PremierePro #AI #VideoEditing #ObjectMasking
@rss_ai_ir
ویرایش ماسک اشیا با هوش مصنوعی 🎬
ادوبی در نسخهی بتای Premiere Pro قابلیت جدیدی معرفی کرده: Object Masking بر پایهی هوش مصنوعی.
🔹 وقتی برای اولین بار از این قابلیت استفاده کنید، برنامه شروع میکند به دانلود مدلهای موردنیاز و فایلهای جانبی با حجم نسبتاً بالا.
🔹 ماسکهایی که ساخته میشوند حجم زیادی دارند، بنابراین ادوبی توصیه میکند پوشهی جداگانهای برای ذخیرهی آنها بسازید.
🔹 بعد از ایجاد ماسک، میتوانید آن را Refine کنید یا بخشهایی از شیء را اضافه/حذف کنید.
📌 این یعنی کار با ویدئوها بسیار سادهتر شده: جداسازی سوژهها، حذف عناصر ناخواسته و کنترل دقیق روی بخشهای مختلف تصویر تنها با چند کلیک.
جزئیات بیشتر 👇
🌐 Object Masking در Adobe Premiere Pro
#Adobe #PremierePro #AI #VideoEditing #ObjectMasking
@rss_ai_ir
🥰8❤7🔥5👏4😁3🎉3👍1
🚀 Higgsfield و UGC Factory:
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨
هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایهی Nano Banana و Veo 3 ساخته شده.
🔹 چیزی که این تیم رو خاص میکنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست میکنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربهی کاربر کار میکنن.
🔹 از اون طرف، منتقدها میگن که از مدلهای اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیعکننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلیشون، Speak 2.0، موفقیت خوبی داشت).
🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیکتاکمانند رو به سادهترین حالت برسونه:
1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبکهای صوتی (Audio styles)
6️⃣ افزودن پسزمینه مناسب
🎯 بدون نیاز به پرامپتهای طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!
📌 لینک تست: Higgsfield UGC Factory
@rss_ai_ir
#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
انقلاب در ساخت ویدیوهای کاربرمحور 🎥✨
هایگزفیلد دوباره برگشته با محصولی تازه به نام UGC Factory که بر پایهی Nano Banana و Veo 3 ساخته شده.
🔹 چیزی که این تیم رو خاص میکنه، اینه که همیشه محصولاتشون رو زود روی کاربرها تست میکنن و به جای تمرکز صرف روی مدل، بیشتر روی خروجی واقعی و تجربهی کاربر کار میکنن.
🔹 از اون طرف، منتقدها میگن که از مدلهای اصلی Higgsfield تقریباً چیزی باقی نمونده و بیشتر شبیه به تجمیعکننده API برای ژنراتورها شدن. (البته نباید فراموش کرد که محصول قبلیشون، Speak 2.0، موفقیت خوبی داشت).
🟢 اما برگردیم به UGC Factory:
ایده اینه که ساخت ویدیوهای تبلیغاتی یا تیکتاکمانند رو به سادهترین حالت برسونه:
1️⃣ انتخاب مدل و محصول/شیء
2️⃣ تولید ۴ تصویر با Nano Banana 🍌
3️⃣ اضافه کردن حرکت (Action)
4️⃣ انتخاب یا اضافه کردن صدا 🎶
5️⃣ انتخاب سبکهای صوتی (Audio styles)
6️⃣ افزودن پسزمینه مناسب
🎯 بدون نیاز به پرامپتهای طولانی یا تنظیمات پیچیده. فقط چند کلیک و خروجی آماده!
📌 لینک تست: Higgsfield UGC Factory
@rss_ai_ir
#AI #UGC #NanoBanana #Veo3 #Higgsfield #VideoGeneration
❤13👍11🔥10👏10😁9🎉7🥰6
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Event Blurry Super-Resolution (Ev-DeblurVSR) 🔍
پژوهشگران USTC مدل جدیدی به نام Ev-DeblurVSR معرفی کردند؛ ترکیبی از سیگنالهای رخدادی (Event signals) با Blurry Video Super-Resolution (BVSR) برای تولید ویدیوهای وضوح بالا (HR) از ورودیهای کموضوح و تار.
✨ ویژگیها:
✳️ادغام اطلاعات رخدادی برای افزایش دقت بازسازی جزئیات.
✳️بهبود چشمگیر کیفیت ویدیوهای تار و کمکیفیت.
✳️انتشار مدلهای از پیش آموزشدیده و دادههای تست تحت لایسنس Apache.
📌 منابع:
👉 مقاله: لینک
👉 ریپازیتوری: لینک
@rss_ai_ir
#AI #ML #VSR #EventCamera #Deblur #SuperResolution #USTC
پژوهشگران USTC مدل جدیدی به نام Ev-DeblurVSR معرفی کردند؛ ترکیبی از سیگنالهای رخدادی (Event signals) با Blurry Video Super-Resolution (BVSR) برای تولید ویدیوهای وضوح بالا (HR) از ورودیهای کموضوح و تار.
✨ ویژگیها:
✳️ادغام اطلاعات رخدادی برای افزایش دقت بازسازی جزئیات.
✳️بهبود چشمگیر کیفیت ویدیوهای تار و کمکیفیت.
✳️انتشار مدلهای از پیش آموزشدیده و دادههای تست تحت لایسنس Apache.
📌 منابع:
👉 مقاله: لینک
👉 ریپازیتوری: لینک
@rss_ai_ir
#AI #ML #VSR #EventCamera #Deblur #SuperResolution #USTC
🔥10👏6👍4🥰4🎉4❤3😁3
Media is too big
VIEW IN TELEGRAM
🧠 پیشرفت مدلهای زبانی بزرگ: از مفاهیم پایه تا کاربردهای واقعی
👤 اسحاق کارگر
⏺ دانشمند ارشد هوش مصنوعی در شرکت In_Parallel فنلاند
⏺ دانشجوی دکترای هوش مصنوعی رباتیک، دانشگاه آلتو فنلاند
📚 سرفصلها
🔹 مقدمه – مدلهای زبانی چیستند؟
🔹 مبانی معماری ترنسفورمر (به زبان ساده)
🔹 آموزش و تنظیم مدلهای زبانی بزرگ
🔹 کاربردهای کلیدی LLM
🔹 چالشها و محدودیتها
🔹 مسیرهای آینده و نکات پایانی
🔹 پرسش و پاسخ
🏛 برگزار شده توسط آکادمی
- شبکه نخبگان ایران
🌐 @rss_ai_ir
#هوش_مصنوعی #مدل_زبانی #LLM #یادگیری_عمیق #ترنسفورمر #AI #مدلسازی #علمی #آموزش
👤 اسحاق کارگر
⏺ دانشمند ارشد هوش مصنوعی در شرکت In_Parallel فنلاند
⏺ دانشجوی دکترای هوش مصنوعی رباتیک، دانشگاه آلتو فنلاند
📚 سرفصلها
🔹 مقدمه – مدلهای زبانی چیستند؟
🔹 مبانی معماری ترنسفورمر (به زبان ساده)
🔹 آموزش و تنظیم مدلهای زبانی بزرگ
🔹 کاربردهای کلیدی LLM
🔹 چالشها و محدودیتها
🔹 مسیرهای آینده و نکات پایانی
🔹 پرسش و پاسخ
🏛 برگزار شده توسط آکادمی
- شبکه نخبگان ایران
🌐 @rss_ai_ir
#هوش_مصنوعی #مدل_زبانی #LLM #یادگیری_عمیق #ترنسفورمر #AI #مدلسازی #علمی #آموزش
👍8❤6🎉6😁4🔥3👏1🙏1
⚙️ چرا پروژههای هوش مصنوعی صنعتی بدون متخصص فرآیند شکست میخورند؟
📌 تیم قوی در AI کافی نیست! اگر کسی نباشد که فرآیند صنعتی را بشناسد، پروژه به احتمال زیاد بینتیجه میماند.
🔹 دلایل:
1️⃣ مسئله درست تعریف نمیشود.
2️⃣ دادههای بیفایده جمعآوری میشوند.
3️⃣ خروجی مدل قابل تفسیر عملی نیست.
4️⃣ در محیط واقعی پیادهسازی سخت یا غیرممکن میشود.
✅ ترکیب دانش فنی (AI/ML) + دانش فرآیند شرط اصلی موفقیت است.
#هوش_مصنوعی #صنعت #اتوماسیون #AI_industrial
@rss_ai_ir
📌 تیم قوی در AI کافی نیست! اگر کسی نباشد که فرآیند صنعتی را بشناسد، پروژه به احتمال زیاد بینتیجه میماند.
🔹 دلایل:
1️⃣ مسئله درست تعریف نمیشود.
2️⃣ دادههای بیفایده جمعآوری میشوند.
3️⃣ خروجی مدل قابل تفسیر عملی نیست.
4️⃣ در محیط واقعی پیادهسازی سخت یا غیرممکن میشود.
✅ ترکیب دانش فنی (AI/ML) + دانش فرآیند شرط اصلی موفقیت است.
#هوش_مصنوعی #صنعت #اتوماسیون #AI_industrial
@rss_ai_ir
🔥8❤5😁4👍3🎉3🙏1
🔥 انویدیا از Universal Deep Research (UDR) رونمایی کرد
✳️همچنین UDR یک ایجنت قابلسفارشیسازی برای تحقیقات عمیق است که میتواند روی هر LLM قرار بگیرد و آن را هوشمندتر و منعطفتر کند.
📌 چرا مهم است؟
🟠 سفارشیسازی ایجنت بدون کدنویسی — بر خلاف بسیاری از ابزارها که سناریوهای محدودی دارند، UDR آزادی کامل برای طراحی استراتژی دارد.
🟠 میتوانید استراتژیهای جستجو و تحلیل را بسازید، ویرایش کنید و ترکیب کنید.
🟠 در ریپوی پروژه مثالهایی از استراتژیها (حداقلی، گسترده، فشرده) قرار داده شده، اما قدرت اصلی UDR در ساخت سناریوهای اختصاصی برای نیاز خودتان است.
✅ در واقع، با UDR میتوانید یک ایجنت تحقیقاتی انعطافپذیر بسازید که با هر جریان کاری (workflow) هماهنگ شود.
🟢 پروژه: https://research.nvidia.com/labs/lpr/udr
🟢 کد: https://github.com/NVlabs/UniversalDeepResearch
🟢 لَب: https://nv-dler.github.io
@rss_ai_ir
#NVIDIA #UDR #UniversalDeepResearch #AI #LLM #ResearchAgent #AIAgents #DeepResearch
✳️همچنین UDR یک ایجنت قابلسفارشیسازی برای تحقیقات عمیق است که میتواند روی هر LLM قرار بگیرد و آن را هوشمندتر و منعطفتر کند.
📌 چرا مهم است؟
🟠 سفارشیسازی ایجنت بدون کدنویسی — بر خلاف بسیاری از ابزارها که سناریوهای محدودی دارند، UDR آزادی کامل برای طراحی استراتژی دارد.
🟠 میتوانید استراتژیهای جستجو و تحلیل را بسازید، ویرایش کنید و ترکیب کنید.
🟠 در ریپوی پروژه مثالهایی از استراتژیها (حداقلی، گسترده، فشرده) قرار داده شده، اما قدرت اصلی UDR در ساخت سناریوهای اختصاصی برای نیاز خودتان است.
✅ در واقع، با UDR میتوانید یک ایجنت تحقیقاتی انعطافپذیر بسازید که با هر جریان کاری (workflow) هماهنگ شود.
🟢 پروژه: https://research.nvidia.com/labs/lpr/udr
🟢 کد: https://github.com/NVlabs/UniversalDeepResearch
🟢 لَب: https://nv-dler.github.io
@rss_ai_ir
#NVIDIA #UDR #UniversalDeepResearch #AI #LLM #ResearchAgent #AIAgents #DeepResearch
😁9👍5❤4🔥4🎉2🙏1
🚀 گوگل از EmbeddingGemma رونمایی کرد؛ یک مدل سبک و اوپنسورس برای ایجاد امبدینگهای متنی.
📌 ویژگی مهم: این مدل را میتوان مستقیم روی موبایل یا لپتاپ اجرا کرد، بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.
🟢 چه چیزی داخلش هست؟
✳️308 میلیون پارامتر، اما از همه مدلهای زیر 500M در کیفیت بهتر عمل میکند (طبق MTEB)
✳️سرعت بسیار بالا: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
✳️پشتیبانی از بیش از 100 زبان
✳️امکان کاهش ابعاد امبدینگ از 768 → 128 بدون افت کیفیت
✳️پشتیبانی از کانتکست تا 2000 توکن
✳️سازگار با Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate و دیگر ابزارهای محبوب
🟠 وبلاگ: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
@rss_ai_ir
#AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP
📌 ویژگی مهم: این مدل را میتوان مستقیم روی موبایل یا لپتاپ اجرا کرد، بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.
🟢 چه چیزی داخلش هست؟
✳️308 میلیون پارامتر، اما از همه مدلهای زیر 500M در کیفیت بهتر عمل میکند (طبق MTEB)
✳️سرعت بسیار بالا: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
✳️پشتیبانی از بیش از 100 زبان
✳️امکان کاهش ابعاد امبدینگ از 768 → 128 بدون افت کیفیت
✳️پشتیبانی از کانتکست تا 2000 توکن
✳️سازگار با Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate و دیگر ابزارهای محبوب
🟠 وبلاگ: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
@rss_ai_ir
#AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP
👍8❤5🔥5🎉4👏1😁1🙏1
🌟 یک مقاله مروری درباره دیتاستهای اوپن ML در Hugging Face منتشر شد.
📝 نویسندهی رسانهی Daily Dose of Data Science جالبترین دیتاستها و مدلهای اوپن اخیر را گردآوری کرده است. یکی از برجستهترینها Yambda-5B از تیم Yandex است؛ بزرگترین دیتاست اوپن در دنیا برای سیستمهای توصیهگر موسیقی.
🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعهی نسل جدید سیستمهای پیشنهاددهنده میباشد.
🔗 مطالعهی بیشتر
@rss_ai_ir
#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
📝 نویسندهی رسانهی Daily Dose of Data Science جالبترین دیتاستها و مدلهای اوپن اخیر را گردآوری کرده است. یکی از برجستهترینها Yambda-5B از تیم Yandex است؛ بزرگترین دیتاست اوپن در دنیا برای سیستمهای توصیهگر موسیقی.
🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعهی نسل جدید سیستمهای پیشنهاددهنده میباشد.
🔗 مطالعهی بیشتر
@rss_ai_ir
#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
👍8🔥7🎉6😁4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 WebEyeTrack:
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
👍7❤5🔥5🎉5😁3🙏2👏1