⚠️ عبارت RefusalBench: وقتی مدلها به سؤالات خطرناک پاسخ میدهند
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁5❤4🎉4
🔵 همکاری متا با Midjourney؛ لایسنس فناوری برای مدلها و محصولات آینده
پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکتهای دنیا برای تقویت سبد AI خود.
اینبار نوبت به Midjourney رسید؛ همکاریای که میتواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصیسازیشده برای شبکههای اجتماعی.
❓سؤال بزرگ: شرکت بعدی که متا سراغش میرود کدام است؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا
پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکتهای دنیا برای تقویت سبد AI خود.
اینبار نوبت به Midjourney رسید؛ همکاریای که میتواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصیسازیشده برای شبکههای اجتماعی.
❓سؤال بزرگ: شرکت بعدی که متا سراغش میرود کدام است؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا
🎉7😁6🔥5❤4👍2
⚡️ انویدیا نسل جدید پلتفرمهای محاسباتی برای رباتیک را معرفی کرد — Jetson Thor
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
👍2🔥1👏1
🔥 انتشار دیتاست جدید VK-LSDV برای سیستمهای توصیهگر و ویدئوهای کوتاه
📊 جزئیات دیتاست:
♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازهی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️دادهها: لایک، دیسلایک، اشتراکگذاری، مدتزمان تماشا، ریاکشنها، کانتکست پخش
🟢 فرصتها برای پژوهشگران و مهندسان:
♻️امکان سفارشیسازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونهگیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود
⚡️ چرا این مهم است؟
🟠 یکی از بزرگترین دیتاستهای باز در حوزه ویدئوهای کوتاه برای سیستمهای توصیهگر است.
🟠 به جای دادههای کوچک و مصنوعی، پژوهشگران میتوانند روی دادههای واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتمهای شخصیسازی و تست فرضیات است.
این منبع میتواند فرصتهای تازهای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستمهای توصیهگر را ارتقا دهد.
🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD
#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK
@rss_ai_ir
📊 جزئیات دیتاست:
♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازهی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️دادهها: لایک، دیسلایک، اشتراکگذاری، مدتزمان تماشا، ریاکشنها، کانتکست پخش
🟢 فرصتها برای پژوهشگران و مهندسان:
♻️امکان سفارشیسازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونهگیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود
⚡️ چرا این مهم است؟
🟠 یکی از بزرگترین دیتاستهای باز در حوزه ویدئوهای کوتاه برای سیستمهای توصیهگر است.
🟠 به جای دادههای کوچک و مصنوعی، پژوهشگران میتوانند روی دادههای واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتمهای شخصیسازی و تست فرضیات است.
این منبع میتواند فرصتهای تازهای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستمهای توصیهگر را ارتقا دهد.
🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD
#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK
@rss_ai_ir
👍2🔥1👏1
⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر میکند
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
👍3🔥1👏1
Media is too big
VIEW IN TELEGRAM
🌟 مدل MiniCPM-V 4.5؛ رقیب جمعوجور غولهای چندمودالی
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
👍3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
⚽ نتایج SoccerNet 2025! ⚽
🔹 رقابتهای SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالشها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستمهای هوشمند ورزشی بازتر میکنند.
📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo
#AI #ComputerVision #SoccerNet #FootballTech
🔹 رقابتهای SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالشها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستمهای هوشمند ورزشی بازتر میکنند.
📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo
#AI #ComputerVision #SoccerNet #FootballTech
❤16🎉11👍10🔥7😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌹 مدل ROSE: حذف اشیا و اثرات محیطی 🌹
یکی از چالشهای بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام میدهد.
🔸 قابلیتها:
♻️حذف شیء ناخواسته همراه با سایهها و بازتابها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی
🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست
این پیشرفت میتونه ابزار قدرتمندی برای طراحان گرافیک، فیلمسازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀
#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI
@rss_ai_ir
یکی از چالشهای بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام میدهد.
🔸 قابلیتها:
♻️حذف شیء ناخواسته همراه با سایهها و بازتابها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی
🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست
این پیشرفت میتونه ابزار قدرتمندی برای طراحان گرافیک، فیلمسازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀
#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI
@rss_ai_ir
👍15❤13🔥11😁7🎉6
This media is not supported in your browser
VIEW IN TELEGRAM
🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!
این ظرفیت بالا میتواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمکرسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی
❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین رباتهایی در صنایع و شهرها خواهیم بود؟
#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
این ظرفیت بالا میتواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمکرسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی
❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین رباتهایی در صنایع و شهرها خواهیم بود؟
#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
🎉11❤10👍10🔥9😁8
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍12❤9😁3👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ویدئوسازی همزمان با Krea.ai
استارتاپ Krea ثبتنام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.
⚡ مشخصات:
♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی میتواند شامل پرامپت متنی، تصویر، اسکرینشات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً بهصورت همزمان ساخته میشود
🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر میخواهد ایجاد کند.
🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video
📌 به نظر میرسد این قابلیت بتواند انقلابی در طراحی، بازیسازی و تولید محتوا به وجود بیاورد.
#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI
@rss_ai_ir
استارتاپ Krea ثبتنام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.
⚡ مشخصات:
♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی میتواند شامل پرامپت متنی، تصویر، اسکرینشات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً بهصورت همزمان ساخته میشود
🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر میخواهد ایجاد کند.
🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video
📌 به نظر میرسد این قابلیت بتواند انقلابی در طراحی، بازیسازی و تولید محتوا به وجود بیاورد.
#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI
@rss_ai_ir
❤7👍6🎉6🔥4😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌈 ردیابی سهبعدی چندنما (Multi-View 3D Tracking) 🌈
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔥9🎉9👍5❤1😁1🙏1👌1
📉 شوک بازار کار؛ بیکاری جوانان در حوزه نرمافزار و خدمات مشتری
🔹 در ابتدا تصور میشد افزایش بیکاری میان توسعهدهندگان نرمافزار ناشی از استخدام بیشازحد در سالهای قبل است.
🔹 اما دادههای جدید نشان میدهد موضوع فراتر از این است: بخشهایی مانند Junior Software Developers (22–25 ساله) و خدمات مشتری بیشترین ضربه را خوردهاند.
🔹 اشتغال جوانان توسعهدهنده نرمافزار نسبت به اوج سال ۲۰۲۲ حدود ۲۰٪ کاهش یافته، در حالی که برای گروههای سنی بالاتر روند استخدام همچنان صعودی است.
🔹 الگوی مشابهی در خدمات مشتری دیده میشود؛ حوزهای که به شدت در معرض جایگزینی با هوش مصنوعی قرار دارد.
⚠️ به بیان ساده، تقاضا برای نیروهای تازهوارد در این صنایع تقریبا از بین رفته است.
داریو آمودئی نیز پیشتر نسبت به این موج بیکاری هشدار داده بود.
@rss_ai_ir
#بیکاری #بازارکار #هوش_مصنوعی #AI #Software #CustomerService
🔹 در ابتدا تصور میشد افزایش بیکاری میان توسعهدهندگان نرمافزار ناشی از استخدام بیشازحد در سالهای قبل است.
🔹 اما دادههای جدید نشان میدهد موضوع فراتر از این است: بخشهایی مانند Junior Software Developers (22–25 ساله) و خدمات مشتری بیشترین ضربه را خوردهاند.
🔹 اشتغال جوانان توسعهدهنده نرمافزار نسبت به اوج سال ۲۰۲۲ حدود ۲۰٪ کاهش یافته، در حالی که برای گروههای سنی بالاتر روند استخدام همچنان صعودی است.
🔹 الگوی مشابهی در خدمات مشتری دیده میشود؛ حوزهای که به شدت در معرض جایگزینی با هوش مصنوعی قرار دارد.
⚠️ به بیان ساده، تقاضا برای نیروهای تازهوارد در این صنایع تقریبا از بین رفته است.
داریو آمودئی نیز پیشتر نسبت به این موج بیکاری هشدار داده بود.
@rss_ai_ir
#بیکاری #بازارکار #هوش_مصنوعی #AI #Software #CustomerService
👍9🔥5😁5🎉5❤2
📌 خبر مهم از Anthropic
🔻 شرکت Anthropic رسماً اعلام کرده که قصد دارد مدلهای خود (مثل Claude) را روی دادههای کاربران هم آموزش دهد. این دادهها شامل تاریخچه چتها و سشنهای کدنویسی میشود.
🗓️ همه کاربران تا تاریخ ۲۸ سپتامبر ۲۰۲۵ باید تصمیم بگیرند که آیا اجازه استفاده از دادههایشان برای آموزش داده شود یا خیر.
🔑 جزئیات مهم:
♻️به صورت پیشفرض ❌ دادههای شما استفاده نمیشوند. برای اشتراکگذاری باید حتماً روی گزینه Accept کلیک کنید.
♻️این سیاست فقط شامل چتهای جدید یا دوباره شروعشده میشود. دادههای قدیمی مشمول آن نخواهند بود.
♻️اگر قبول کنید، دادههایتان میتوانند تا ۵ سال ذخیره شوند.
♻️این تغییر فقط برای کاربران عادی (Free, Pro, Max) اعمال میشود. API، Claude for Work، Gov و Education شامل آن نیستند.
♻️همچنین Anthropic تأکید کرده که کاربران حق انتخاب دارند و دادههای حساس فیلتر یا ماسک میشوند.
⚡️ جمعبندی: این موضوع دیر یا زود اتفاق میافتاد، اما حداقل Anthropic بهطور شفاف اطلاعرسانی کرده و به کاربران اختیار داده است.
🔗 متن کامل خبر
#AI_news #Claude #Anthropic #حریم_خصوصی
@rss_ai_ir
🔻 شرکت Anthropic رسماً اعلام کرده که قصد دارد مدلهای خود (مثل Claude) را روی دادههای کاربران هم آموزش دهد. این دادهها شامل تاریخچه چتها و سشنهای کدنویسی میشود.
🗓️ همه کاربران تا تاریخ ۲۸ سپتامبر ۲۰۲۵ باید تصمیم بگیرند که آیا اجازه استفاده از دادههایشان برای آموزش داده شود یا خیر.
🔑 جزئیات مهم:
♻️به صورت پیشفرض ❌ دادههای شما استفاده نمیشوند. برای اشتراکگذاری باید حتماً روی گزینه Accept کلیک کنید.
♻️این سیاست فقط شامل چتهای جدید یا دوباره شروعشده میشود. دادههای قدیمی مشمول آن نخواهند بود.
♻️اگر قبول کنید، دادههایتان میتوانند تا ۵ سال ذخیره شوند.
♻️این تغییر فقط برای کاربران عادی (Free, Pro, Max) اعمال میشود. API، Claude for Work، Gov و Education شامل آن نیستند.
♻️همچنین Anthropic تأکید کرده که کاربران حق انتخاب دارند و دادههای حساس فیلتر یا ماسک میشوند.
⚡️ جمعبندی: این موضوع دیر یا زود اتفاق میافتاد، اما حداقل Anthropic بهطور شفاف اطلاعرسانی کرده و به کاربران اختیار داده است.
🔗 متن کامل خبر
#AI_news #Claude #Anthropic #حریم_خصوصی
@rss_ai_ir
👍9🎉7❤4😁4🔥2
🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents
🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیطهای یادگیری تقویتی (RL Environments) را معرفی کرد.
🌍 محیط RL همان دنیای مجازیای است که قوانین و سیستم پاداش آن تعریف میشود تا عاملها در آن آموزش ببینند.
✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامهنویس نیاز به:
✳️محیط شبیهسازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپلاین آموزش
✳️مجموعه دادههای واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاههای بزرگ میلیونها دلار هزینه دارد و در اوپنسورس تقریباً مشابهی وجود نداشت.
⚡ حالا Environments Hub این مشکل را حل میکند:
♻️اولین و تنها استور باز برای محیطهای آماده RL
♻️شامل محیطهایی برای آموزش عاملهای برنامهنویس، ریاضیدان، گیمر و بسیاری حوزههای دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL
💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عاملها دانسته است.
🔗 خودتان ببینید: Environments Hub
#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents
@rss_ai_ir
🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیطهای یادگیری تقویتی (RL Environments) را معرفی کرد.
🌍 محیط RL همان دنیای مجازیای است که قوانین و سیستم پاداش آن تعریف میشود تا عاملها در آن آموزش ببینند.
✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامهنویس نیاز به:
✳️محیط شبیهسازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپلاین آموزش
✳️مجموعه دادههای واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاههای بزرگ میلیونها دلار هزینه دارد و در اوپنسورس تقریباً مشابهی وجود نداشت.
⚡ حالا Environments Hub این مشکل را حل میکند:
♻️اولین و تنها استور باز برای محیطهای آماده RL
♻️شامل محیطهایی برای آموزش عاملهای برنامهنویس، ریاضیدان، گیمر و بسیاری حوزههای دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL
💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عاملها دانسته است.
🔗 خودتان ببینید: Environments Hub
#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents
@rss_ai_ir
😁10🔥6❤4🎉3👍1
⚡️ معرفی OLMoASR؛ مدلهای باز تشخیص گفتار از AI2
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
❤7👍6🔥6🎉6
💡 یکی از جالبترین کاربردهای Nano-Banana همین مینیاپ تازهدستکاریشده است:
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
👍1🔥1👏1
📌 لیست سالانه Time 100 AI منتشر شد
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
❤1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
🔥2👍1👏1
📊 درآمدهای AI Native استارتاپها
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1