VIRSUN
14.6K subscribers
472 photos
267 videos
2 files
278 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
⚡️ انویدیا نسل جدید پلتفرم‌های محاسباتی برای رباتیک را معرفی کرد — Jetson Thor

🔹 این سیستم به‌عنوان «مغز» ماشین‌های خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع می‌شه.

🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژول‌های محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرم‌ها پایه‌ی «هوش مصنوعی فیزیکی» در حوزه‌هایی مثل تولید، لجستیک، سلامت و خرده‌فروشی خواهند بود.

🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهره‌وری انرژی طراحی شده تا میلیون‌ها توسعه‌دهنده بتونن ربات‌هایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهم‌ترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.

📌 مشخصات فنی اصلی

🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هسته‌ای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قوی‌تر از نسل قبل، Jetson Orin).

🟧 ماژول Jetson T4000: نسخه اقتصادی‌تر با پردازنده ۱۲ هسته‌ای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.

این پلتفرم داده‌های سنسورها رو در لحظه پردازش می‌کنه و به ربات‌ها توانایی درک سریع محیط و واکنش بی‌درنگ می‌ده. همچنین به‌طور کامل با استک‌های نرم‌افزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.

شرکت‌های بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هم‌اکنون از این فناوری پشتیبانی می‌کنن.

#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial

@rss_ai_ir
👍2🔥1👏1
⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر می‌کند

🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر داده‌اند که به طور مستقیم از هوش مصنوعی استفاده می‌کند. این بدافزار با نام PromptLock شناخته می‌شود و توانایی آلوده‌سازی دستگاه‌های Windows، Linux و macOS را دارد.

شیوه عملکرد:

✳️بدافزار شامل پرامپت‌های از پیش تعریف‌شده‌ای است که به مدل هوش مصنوعی ارسال می‌شوند.
✳️مدل در لحظه اسکریپت‌های Lua تولید می‌کند تا فایل‌سیستم را اسکن کند.
✳️داده‌ها یا به سرقت می‌روند یا با الگوریتمی رمزگذاری و قفل می‌شوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپن‌اِی‌آی) قدرت می‌گیرد.


وضعیت کنونی:

♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانه‌ها: رمزنگاری ابتدایی و نبود برخی قابلیت‌ها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپت‌ها حتی آدرس بیت‌کوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.


این خبر نشان می‌دهد بدافزارهای آینده می‌توانند با استفاده از هوش مصنوعی، تطبیق‌پذیرتر و خطرناک‌تر شوند.

#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech

@rss_ai_ir
👍3🔥1👏1
Media is too big
VIEW IN TELEGRAM
🌟 مدل MiniCPM-V 4.5؛ رقیب جمع‌وجور غول‌های چندمودالی

پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا می‌شود.

این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایه‌گذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.

---

🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشرده‌سازی ۹۶ برابری ویدئو می‌شود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل می‌شوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپ‌های طولانی را بدون افزایش هزینه محاسباتی فراهم می‌کند.
✔️ نتایج برتر روی دیتاست‌های Video-MME، LVBench و MLVU تأییدکننده این کارایی است.

---

🖼 توانایی‌های تصویری
با معماری LLaVA-UHD، مدل می‌تواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکن‌های بصری.

---

انعطاف در استدلال
مدل دو حالت دارد:

Fast reasoning برای کارهای روزمره

Deep reasoning برای سناریوهای پیچیده


و کاربر می‌تواند بسته به نیاز بین آن‌ها جابه‌جا شود.
---

📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متن‌باز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازه‌ای به نام خود ثبت کرده است.
---

💻 بدون مشکل در استقرار

♻️نسخه CPU با llama.cpp و ollama
♻️نسخه‌های کوانتیزه در فرمت‌های int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینه‌شده برای iOS
---

📌 لینک‌ها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]

#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news

@rss_ai_ir
👍3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!

این ظرفیت بالا می‌تواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمک‌رسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی

اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین ربات‌هایی در صنایع و شهرها خواهیم بود؟

#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
🎉1110👍10🔥9😁8
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.

🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایش‌های چندمرحله‌ای (multi-turn edits) به‌صورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini

آیا این ابزار می‌تواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨

#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍129😁3👏1🙏1
🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents

🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیط‌های یادگیری تقویتی (RL Environments) را معرفی کرد.

🌍 محیط RL همان دنیای مجازی‌ای است که قوانین و سیستم پاداش آن تعریف می‌شود تا عامل‌ها در آن آموزش ببینند.

✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامه‌نویس نیاز به:

✳️محیط شبیه‌سازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپ‌لاین آموزش
✳️مجموعه داده‌های واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاه‌های بزرگ میلیون‌ها دلار هزینه دارد و در اوپن‌سورس تقریباً مشابهی وجود نداشت.

حالا Environments Hub این مشکل را حل می‌کند:

♻️اولین و تنها استور باز برای محیط‌های آماده RL
♻️شامل محیط‌هایی برای آموزش عامل‌های برنامه‌نویس، ریاضی‌دان، گیمر و بسیاری حوزه‌های دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL


💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عامل‌ها دانسته است.

🔗 خودتان ببینید: Environments Hub

#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents

@rss_ai_ir
😁10🔥64🎉3👍1
⚡️ معرفی OLMoASR؛ مدل‌های باز تشخیص گفتار از AI2

مؤسسه هوش مصنوعی آلن (AI2) خانواده‌ای از مدل‌های تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.

🎙️ مدل‌ها:

🟢 OLMoASR-tiny.en (۳۹M)

🟢 OLMoASR-base.en (۷۴M)

🟢 OLMoASR-small.en (۲۴۴M)

🟢 OLMoASR-medium.en (۷۶۹M)

🟠 OLMoASR-large.en-v1
(۱.۵B، آموزش‌دیده بر روی ۴۴۰ هزار ساعت صوت)

🟠 OLMoASR-large.en-v2
(۱.۵B، آموزش‌دیده بر روی ۶۸۰ هزار ساعت صوت)


📊 در تست روی ۲۱ دیتاست، عملکرد این مدل‌ها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، به‌ویژه روی فایل‌های صوتی طولانی، حتی از آن هم بهتر عمل کرده‌اند.

🔓 پروژه کاملاً اپن‌سورس است:

♻️انتشار وزن مدل‌ها
♻️دیتاست و کد پردازش داده‌ها
♻️اسکریپت‌های آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.


📌 لایسنس: Apache 2.0

🟡 مقاله
🟡 مجموعه مدل‌ها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub

#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news

@rss_ai_ir
7👍6🔥6🎉6