⚠️ عبارت RefusalBench: وقتی مدلها به سؤالات خطرناک پاسخ میدهند
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁5❤4🎉4
🔵 همکاری متا با Midjourney؛ لایسنس فناوری برای مدلها و محصولات آینده
پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکتهای دنیا برای تقویت سبد AI خود.
اینبار نوبت به Midjourney رسید؛ همکاریای که میتواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصیسازیشده برای شبکههای اجتماعی.
❓سؤال بزرگ: شرکت بعدی که متا سراغش میرود کدام است؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا
پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکتهای دنیا برای تقویت سبد AI خود.
اینبار نوبت به Midjourney رسید؛ همکاریای که میتواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصیسازیشده برای شبکههای اجتماعی.
❓سؤال بزرگ: شرکت بعدی که متا سراغش میرود کدام است؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا
🎉7😁6🔥5❤4👍2
⚡️ انویدیا نسل جدید پلتفرمهای محاسباتی برای رباتیک را معرفی کرد — Jetson Thor
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
👍2🔥1👏1
🔥 انتشار دیتاست جدید VK-LSDV برای سیستمهای توصیهگر و ویدئوهای کوتاه
📊 جزئیات دیتاست:
♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازهی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️دادهها: لایک، دیسلایک، اشتراکگذاری، مدتزمان تماشا، ریاکشنها، کانتکست پخش
🟢 فرصتها برای پژوهشگران و مهندسان:
♻️امکان سفارشیسازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونهگیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود
⚡️ چرا این مهم است؟
🟠 یکی از بزرگترین دیتاستهای باز در حوزه ویدئوهای کوتاه برای سیستمهای توصیهگر است.
🟠 به جای دادههای کوچک و مصنوعی، پژوهشگران میتوانند روی دادههای واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتمهای شخصیسازی و تست فرضیات است.
این منبع میتواند فرصتهای تازهای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستمهای توصیهگر را ارتقا دهد.
🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD
#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK
@rss_ai_ir
📊 جزئیات دیتاست:
♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازهی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️دادهها: لایک، دیسلایک، اشتراکگذاری، مدتزمان تماشا، ریاکشنها، کانتکست پخش
🟢 فرصتها برای پژوهشگران و مهندسان:
♻️امکان سفارشیسازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونهگیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود
⚡️ چرا این مهم است؟
🟠 یکی از بزرگترین دیتاستهای باز در حوزه ویدئوهای کوتاه برای سیستمهای توصیهگر است.
🟠 به جای دادههای کوچک و مصنوعی، پژوهشگران میتوانند روی دادههای واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتمهای شخصیسازی و تست فرضیات است.
این منبع میتواند فرصتهای تازهای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستمهای توصیهگر را ارتقا دهد.
🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD
#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK
@rss_ai_ir
👍2🔥1👏1
⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر میکند
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
👍3🔥1👏1
Media is too big
VIEW IN TELEGRAM
🌟 مدل MiniCPM-V 4.5؛ رقیب جمعوجور غولهای چندمودالی
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
👍3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
⚽ نتایج SoccerNet 2025! ⚽
🔹 رقابتهای SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالشها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستمهای هوشمند ورزشی بازتر میکنند.
📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo
#AI #ComputerVision #SoccerNet #FootballTech
🔹 رقابتهای SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالشها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستمهای هوشمند ورزشی بازتر میکنند.
📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo
#AI #ComputerVision #SoccerNet #FootballTech
❤16🎉11👍10🔥7😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌹 مدل ROSE: حذف اشیا و اثرات محیطی 🌹
یکی از چالشهای بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام میدهد.
🔸 قابلیتها:
♻️حذف شیء ناخواسته همراه با سایهها و بازتابها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی
🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست
این پیشرفت میتونه ابزار قدرتمندی برای طراحان گرافیک، فیلمسازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀
#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI
@rss_ai_ir
یکی از چالشهای بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام میدهد.
🔸 قابلیتها:
♻️حذف شیء ناخواسته همراه با سایهها و بازتابها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی
🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست
این پیشرفت میتونه ابزار قدرتمندی برای طراحان گرافیک، فیلمسازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀
#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI
@rss_ai_ir
👍15❤13🔥11😁7🎉6
This media is not supported in your browser
VIEW IN TELEGRAM
🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!
این ظرفیت بالا میتواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمکرسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی
❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین رباتهایی در صنایع و شهرها خواهیم بود؟
#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
این ظرفیت بالا میتواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمکرسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی
❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین رباتهایی در صنایع و شهرها خواهیم بود؟
#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
🎉11❤10👍10🔥9😁8
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍12❤9😁3👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ویدئوسازی همزمان با Krea.ai
استارتاپ Krea ثبتنام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.
⚡ مشخصات:
♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی میتواند شامل پرامپت متنی، تصویر، اسکرینشات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً بهصورت همزمان ساخته میشود
🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر میخواهد ایجاد کند.
🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video
📌 به نظر میرسد این قابلیت بتواند انقلابی در طراحی، بازیسازی و تولید محتوا به وجود بیاورد.
#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI
@rss_ai_ir
استارتاپ Krea ثبتنام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.
⚡ مشخصات:
♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی میتواند شامل پرامپت متنی، تصویر، اسکرینشات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً بهصورت همزمان ساخته میشود
🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر میخواهد ایجاد کند.
🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video
📌 به نظر میرسد این قابلیت بتواند انقلابی در طراحی، بازیسازی و تولید محتوا به وجود بیاورد.
#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI
@rss_ai_ir
❤7👍6🎉6🔥4😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌈 ردیابی سهبعدی چندنما (Multi-View 3D Tracking) 🌈
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔥9🎉9👍5❤1😁1🙏1👌1