VIRSUN – Telegram

VIRSUN

14.6K subscribers

472 photos

267 videos

2 files

278 links

📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

About

Blog

Apps

Platform

14.6K subscribers

⚠️ عبارت RefusalBench: وقتی مدل‌ها به سؤالات خطرناک پاسخ می‌دهند

✅مؤسسه‌ی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی می‌کند مدل‌های زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب می‌شوند (مثل ساخت مواد منفجره یا دستورالعمل‌های خطرناک).

📊 نتایج جالب بود:

♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخ‌دهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدل‌های OpenAI مثل GPT-5 و GPT-OSS پایین‌ترین سطح پاسخ‌دهی را داشتند (≈5–11٪).

🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخ‌های پرریسک را می‌گیرد. حتی هم‌زمان مسابقه‌ای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روش‌های دور زدن مکانیزم‌های ایمنی برگزار کرده‌اند.

📌 در مقابل، خروج ایگور بابوشکین (هم‌بنیان‌گذار سابق xAI) هم بی‌ارتباط با نگرانی‌های امنیتی Grok نیست.

⚖️ برداشت کلی:

✅اگر دنبال آزادی مطلق در پاسخ‌ها باشید، Grok و Hermes بیشتر جواب می‌دهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سخت‌گیرترین گزینه است.

#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes

👍7🔥6😁5❤4🎉4

810 views04:19

🔵 همکاری متا با Midjourney؛ لایسنس فناوری برای مدل‌ها و محصولات آینده

پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکت‌های دنیا برای تقویت سبد AI خود.

این‌بار نوبت به Midjourney رسید؛ همکاری‌ای که می‌تواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصی‌سازی‌شده برای شبکه‌های اجتماعی.

❓سؤال بزرگ: شرکت بعدی که متا سراغش می‌رود کدام است؟ 🤔

@rss_ai_ir

#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا

🎉7😁6🔥5❤4👍2

1.4K views05:14

⚡️ انویدیا نسل جدید پلتفرم‌های محاسباتی برای رباتیک را معرفی کرد — Jetson Thor

🔹 این سیستم به‌عنوان «مغز» ماشین‌های خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع می‌شه.

🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژول‌های محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرم‌ها پایه‌ی «هوش مصنوعی فیزیکی» در حوزه‌هایی مثل تولید، لجستیک، سلامت و خرده‌فروشی خواهند بود.

🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهره‌وری انرژی طراحی شده تا میلیون‌ها توسعه‌دهنده بتونن ربات‌هایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهم‌ترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.

📌 مشخصات فنی اصلی

🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هسته‌ای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قوی‌تر از نسل قبل، Jetson Orin).

🟧 ماژول Jetson T4000: نسخه اقتصادی‌تر با پردازنده ۱۲ هسته‌ای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.

این پلتفرم داده‌های سنسورها رو در لحظه پردازش می‌کنه و به ربات‌ها توانایی درک سریع محیط و واکنش بی‌درنگ می‌ده. همچنین به‌طور کامل با استک‌های نرم‌افزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.

شرکت‌های بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هم‌اکنون از این فناوری پشتیبانی می‌کنن.

#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial

@rss_ai_ir

👍2🔥1👏1

3.63K views15:10

🔥 انتشار دیتاست جدید VK-LSDV برای سیستم‌های توصیه‌گر و ویدئوهای کوتاه

📊 جزئیات دیتاست:

♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازه‌ی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️داده‌ها: لایک، دیسلایک، اشتراک‌گذاری، مدت‌زمان تماشا، ری‌اکشن‌ها، کانتکست پخش

🟢 فرصت‌ها برای پژوهشگران و مهندسان:

♻️امکان سفارشی‌سازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونه‌گیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود

⚡️ چرا این مهم است؟
🟠 یکی از بزرگ‌ترین دیتاست‌های باز در حوزه ویدئوهای کوتاه برای سیستم‌های توصیه‌گر است.
🟠 به جای داده‌های کوچک و مصنوعی، پژوهشگران می‌توانند روی داده‌های واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتم‌های شخصی‌سازی و تست فرضیات است.

این منبع می‌تواند فرصت‌های تازه‌ای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستم‌های توصیه‌گر را ارتقا دهد.

🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD

#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK

@rss_ai_ir

👍2🔥1👏1

3.62K viewsedited 15:21

⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر می‌کند

🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر داده‌اند که به طور مستقیم از هوش مصنوعی استفاده می‌کند. این بدافزار با نام PromptLock شناخته می‌شود و توانایی آلوده‌سازی دستگاه‌های Windows، Linux و macOS را دارد.

❌ شیوه عملکرد:

✳️بدافزار شامل پرامپت‌های از پیش تعریف‌شده‌ای است که به مدل هوش مصنوعی ارسال می‌شوند.
✳️مدل در لحظه اسکریپت‌های Lua تولید می‌کند تا فایل‌سیستم را اسکن کند.
✳️داده‌ها یا به سرقت می‌روند یا با الگوریتمی رمزگذاری و قفل می‌شوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپن‌اِی‌آی) قدرت می‌گیرد.

❌ وضعیت کنونی:

♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانه‌ها: رمزنگاری ابتدایی و نبود برخی قابلیت‌ها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپت‌ها حتی آدرس بیت‌کوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.

⚡ این خبر نشان می‌دهد بدافزارهای آینده می‌توانند با استفاده از هوش مصنوعی، تطبیق‌پذیرتر و خطرناک‌تر شوند.

#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech

@rss_ai_ir

👍3🔥1👏1

3.62K viewsedited 15:23

Media is too big

VIEW IN TELEGRAM

🌟 مدل MiniCPM-V 4.5؛ رقیب جمع‌وجور غول‌های چندمودالی

پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا می‌شود.

این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایه‌گذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.

---

🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشرده‌سازی ۹۶ برابری ویدئو می‌شود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل می‌شوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپ‌های طولانی را بدون افزایش هزینه محاسباتی فراهم می‌کند.
✔️ نتایج برتر روی دیتاست‌های Video-MME، LVBench و MLVU تأییدکننده این کارایی است.

---

🖼 توانایی‌های تصویری
با معماری LLaVA-UHD، مدل می‌تواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکن‌های بصری.

---

⚡ انعطاف در استدلال
مدل دو حالت دارد:

Fast reasoning برای کارهای روزمره

Deep reasoning برای سناریوهای پیچیده

و کاربر می‌تواند بسته به نیاز بین آن‌ها جابه‌جا شود.
---

📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متن‌باز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازه‌ای به نام خود ثبت کرده است.
---

💻 بدون مشکل در استقرار

♻️نسخه CPU با llama.cpp و ollama
♻️نسخه‌های کوانتیزه در فرمت‌های int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینه‌شده برای iOS
---

📌 لینک‌ها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]

#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news

@rss_ai_ir

👍3👏1

3.63K views16:03

This media is not supported in your browser

VIEW IN TELEGRAM

⚽ نتایج SoccerNet 2025! ⚽

🔹 رقابت‌های SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالش‌ها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستم‌های هوشمند ورزشی بازتر می‌کنند.

📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo

#AI #ComputerVision #SoccerNet #FootballTech

❤16🎉11👍10🔥7😁4

826 views05:05

This media is not supported in your browser

VIEW IN TELEGRAM

🌹 مدل ROSE: حذف اشیا و اثرات محیطی 🌹

یکی از چالش‌های بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام می‌دهد.

🔸 قابلیت‌ها:

♻️حذف شیء ناخواسته همراه با سایه‌ها و بازتاب‌ها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی

🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست

این پیشرفت می‌تونه ابزار قدرتمندی برای طراحان گرافیک، فیلم‌سازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀

#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI

@rss_ai_ir

👍15❤13🔥11😁7🎉6

3.07K viewsedited 08:24

This media is not supported in your browser

VIEW IN TELEGRAM

🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!

این ظرفیت بالا می‌تواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمک‌رسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی

❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین ربات‌هایی در صنایع و شهرها خواهیم بود؟

#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir

🎉11❤10👍10🔥9😁8

273 views04:02

This media is not supported in your browser

VIEW IN TELEGRAM

🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.

🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایش‌های چندمرحله‌ای (multi-turn edits) به‌صورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini

آیا این ابزار می‌تواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨

#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir

🔥15🎉13👍12❤9😁3👏1🙏1

231 viewsedited 04:04

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 ویدئو‌سازی همزمان با Krea.ai

استارتاپ Krea ثبت‌نام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.

⚡ مشخصات:

♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی می‌تواند شامل پرامپت متنی، تصویر، اسکرین‌شات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً به‌صورت همزمان ساخته می‌شود

🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر می‌خواهد ایجاد کند.

🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video

📌 به نظر می‌رسد این قابلیت بتواند انقلابی در طراحی، بازی‌سازی و تولید محتوا به وجود بیاورد.

#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI

@rss_ai_ir

❤7👍6🎉6🔥4😁4

782 viewsedited 11:27

This media is not supported in your browser

VIEW IN TELEGRAM

🌈 ردیابی سه‌بعدی چندنما (Multi-View 3D Tracking) 🌈

🔹 پروژه MVTracker به‌عنوان اولین سیستم داده‌محور برای ردیابی نقاط سه‌بعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم می‌کند.

📊 دسترسی‌ها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)

#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین

@rss_ai_ir

🔥9🎉9👍5❤1😁1🙏1👌1

788 viewsedited 13:05

📉 شوک بازار کار؛ بیکاری جوانان در حوزه نرم‌افزار و خدمات مشتری

🔹 در ابتدا تصور می‌شد افزایش بیکاری میان توسعه‌دهندگان نرم‌افزار ناشی از استخدام بیش‌ازحد در سال‌های قبل است.
🔹 اما داده‌های جدید نشان می‌دهد موضوع فراتر از این است: بخش‌هایی مانند Junior Software Developers (22–25 ساله) و خدمات مشتری بیشترین ضربه را خورده‌اند.
🔹 اشتغال جوانان توسعه‌دهنده نرم‌افزار نسبت به اوج سال ۲۰۲۲ حدود ۲۰٪ کاهش یافته، در حالی که برای گروه‌های سنی بالاتر روند استخدام همچنان صعودی است.
🔹 الگوی مشابهی در خدمات مشتری دیده می‌شود؛ حوزه‌ای که به شدت در معرض جایگزینی با هوش مصنوعی قرار دارد.

⚠️ به بیان ساده، تقاضا برای نیروهای تازه‌وارد در این صنایع تقریبا از بین رفته است.
داریو آمودئی نیز پیش‌تر نسبت به این موج بیکاری هشدار داده بود.

@rss_ai_ir

#بیکاری #بازارکار #هوش_مصنوعی #AI #Software #CustomerService

👍9🔥5😁5🎉5❤2

1.46K views13:29

📌 خبر مهم از Anthropic

🔻 شرکت Anthropic رسماً اعلام کرده که قصد دارد مدل‌های خود (مثل Claude) را روی داده‌های کاربران هم آموزش دهد. این داده‌ها شامل تاریخچه چت‌ها و سشن‌های کدنویسی می‌شود.

🗓️ همه کاربران تا تاریخ ۲۸ سپتامبر ۲۰۲۵ باید تصمیم بگیرند که آیا اجازه استفاده از داده‌هایشان برای آموزش داده شود یا خیر.

🔑 جزئیات مهم:

♻️به صورت پیش‌فرض ❌ داده‌های شما استفاده نمی‌شوند. برای اشتراک‌گذاری باید حتماً روی گزینه Accept کلیک کنید.

♻️این سیاست فقط شامل چت‌های جدید یا دوباره شروع‌شده می‌شود. داده‌های قدیمی مشمول آن نخواهند بود.

♻️اگر قبول کنید، داده‌هایتان می‌توانند تا ۵ سال ذخیره شوند.

♻️این تغییر فقط برای کاربران عادی (Free, Pro, Max) اعمال می‌شود. API، Claude for Work، Gov و Education شامل آن نیستند.

♻️همچنین Anthropic تأکید کرده که کاربران حق انتخاب دارند و داده‌های حساس فیلتر یا ماسک می‌شوند.

⚡️ جمع‌بندی: این موضوع دیر یا زود اتفاق می‌افتاد، اما حداقل Anthropic به‌طور شفاف اطلاع‌رسانی کرده و به کاربران اختیار داده است.

🔗 متن کامل خبر

#AI_news #Claude #Anthropic #حریم_خصوصی

@rss_ai_ir

👍9🎉7❤4😁4🔥2

1.38K viewsedited 17:52

🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents

🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیط‌های یادگیری تقویتی (RL Environments) را معرفی کرد.

🌍 محیط RL همان دنیای مجازی‌ای است که قوانین و سیستم پاداش آن تعریف می‌شود تا عامل‌ها در آن آموزش ببینند.

✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامه‌نویس نیاز به:

✳️محیط شبیه‌سازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپ‌لاین آموزش
✳️مجموعه داده‌های واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاه‌های بزرگ میلیون‌ها دلار هزینه دارد و در اوپن‌سورس تقریباً مشابهی وجود نداشت.

⚡ حالا Environments Hub این مشکل را حل می‌کند:

♻️اولین و تنها استور باز برای محیط‌های آماده RL
♻️شامل محیط‌هایی برای آموزش عامل‌های برنامه‌نویس، ریاضی‌دان، گیمر و بسیاری حوزه‌های دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL

💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عامل‌ها دانسته است.

🔗 خودتان ببینید: Environments Hub

#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents

@rss_ai_ir

😁10🔥6❤4🎉3👍1

3.57K viewsedited 17:56

⚡️ معرفی OLMoASR؛ مدل‌های باز تشخیص گفتار از AI2

مؤسسه هوش مصنوعی آلن (AI2) خانواده‌ای از مدل‌های تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.

🎙️ مدل‌ها:

🟢 OLMoASR-tiny.en (۳۹M)

🟢 OLMoASR-base.en (۷۴M)

🟢 OLMoASR-small.en (۲۴۴M)

🟢 OLMoASR-medium.en (۷۶۹M)

🟠 OLMoASR-large.en-v1
(۱.۵B، آموزش‌دیده بر روی ۴۴۰ هزار ساعت صوت)

🟠 OLMoASR-large.en-v2
(۱.۵B، آموزش‌دیده بر روی ۶۸۰ هزار ساعت صوت)

📊 در تست روی ۲۱ دیتاست، عملکرد این مدل‌ها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، به‌ویژه روی فایل‌های صوتی طولانی، حتی از آن هم بهتر عمل کرده‌اند.

🔓 پروژه کاملاً اپن‌سورس است:

♻️انتشار وزن مدل‌ها
♻️دیتاست و کد پردازش داده‌ها
♻️اسکریپت‌های آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.

📌 لایسنس: Apache 2.0

🟡 مقاله
🟡 مجموعه مدل‌ها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub

#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news

@rss_ai_ir

❤7👍6🔥6🎉6

3.59K views18:05

💡 یکی از جالب‌ترین کاربردهای Nano-Banana همین مینی‌اپ تازه‌دستکاری‌شده است:

📌 کافیست تصویر یک شیء را از کلیپ‌بورد وارد کنید؛ برنامه به‌صورت خودکار آن را به ایزومتریک تبدیل می‌کند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨

🔧 تغییرات جدید:

♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی

🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63

@rss_ai_ir

#nano_banana #isometric #SimCity #AItools #AI

👍1🔥1👏1

792 views07:43

📌 لیست سالانه Time 100 AI منتشر شد

📰 مجله‌ی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهره‌های آشنا دیده می‌شن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِین‌فِن و چندین نام بزرگ دیگه.

اما 😅 همه‌چیز به این سادگی هم نیست...
چون غیبت بعضی غول‌ها حسابی توی چشم می‌زنه:

❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سری‌نیواس

در عوض، افرادی توی لیست دیده می‌شن که شاید انتظارش رو نداشتید:

✅ پاپ فرانسیس!
✅ ریک روبین (همون چهره‌ی وایرالِ "وایب‌کُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامه‌نگار

👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضی‌ها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیش‌تر به جنبه‌ی فرهنگی و رسانه‌ای توجه شده.

🔗 لیست کامل رو می‌تونید اینجا ببینید: time.com/collections/time100-ai-2025/

@rss_ai_ir

#news #ai #ml #Time100 #AIInfluencers

❤1👍1🔥1👏1

732 views11:28

This media is not supported in your browser

VIEW IN TELEGRAM

🔮 ترفند خلاقانه با img2vid

گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم

📌 وقتی این دو فریم را به مدل‌های img2vid بدهیم، مدل تمام فریم‌های میانی را می‌سازد و یک انیمیشن روان تولید می‌کند.

🔹 نتیجه؟

شبیه حرکت دوربین واقعی 🎥

تغییر زاویه دید یا زوم طبیعی 🔍

ایجاد گذارهای سینمایی ✨

به زبان ساده: به‌جای طراحی تک‌تک فریم‌ها، فقط شروع و پایان را بده، مدل خودش مسیر بین‌شان را پر می‌کند!

#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI

🆔 @rss_ai_ir

🔥2👍1👏1

140 views10:19

📊 درآمدهای AI Native استارتاپ‌ها

گزارش تازه نشان می‌دهد که استارتاپ‌های «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیده‌اند.

🔴 نکته کلیدی:

♻️همچنین OpenAI به‌تنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکت‌ها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.

🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص داده‌اند.

💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی می‌کنند.

@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic

👍1🔥1👏1

144 views10:19