🛠️ پایان پروژه، پایان مسئولیت نیست!
خیلی وقتها وقتی یک پروژه صنعتی تموم میشه و به کارفرما تحویل داده میشه، تیم فکر میکنه کارش تمومه و باید سریع سراغ پروژه بعدی بره. اما واقعیت اینه که مرحلهی پس از تحویل (Post-Deployment Monitoring) یکی از حیاتیترین بخشهای موفقیت پروژه است.
🔍 چرا مهمه؟
♻️شرایط واقعی صنعت با محیط تست متفاوته.
♻️اپراتورها ممکنه خطاهایی انجام بدن که در سناریوهای آزمایشی پیشبینی نشده.
♻️دادههای جدید میتونن الگوهای متفاوتی داشته باشن.
♻️گاهی تنظیمات ساده مثل کالیبراسیون سنسور یا ریستارت سرویس باعث بروز مشکل میشه.
✅ بهترین کار اینه که بعد از تحویل:
1. حداقل چند هفته پایش فعال داشته باشید.
2. گزارش خطاها و لاگها رو جمعآوری و تحلیل کنید.
3. آموزش کاربران نهایی رو جدی بگیرید.
4. آماده باشید برای تغییرات کوچک (Patch) یا اصلاحات سریع.
🔑 تحویل یک پروژه موفق فقط به روز Delivery ختم نمیشه؛ بلکه زمانی معنا پیدا میکنه که در محیط واقعی پایدار و قابل اعتماد کار کنه.
#هوش_مصنوعی #پروژه_صنعتی #مدیریت_پروژه #AI_industrial
خیلی وقتها وقتی یک پروژه صنعتی تموم میشه و به کارفرما تحویل داده میشه، تیم فکر میکنه کارش تمومه و باید سریع سراغ پروژه بعدی بره. اما واقعیت اینه که مرحلهی پس از تحویل (Post-Deployment Monitoring) یکی از حیاتیترین بخشهای موفقیت پروژه است.
🔍 چرا مهمه؟
♻️شرایط واقعی صنعت با محیط تست متفاوته.
♻️اپراتورها ممکنه خطاهایی انجام بدن که در سناریوهای آزمایشی پیشبینی نشده.
♻️دادههای جدید میتونن الگوهای متفاوتی داشته باشن.
♻️گاهی تنظیمات ساده مثل کالیبراسیون سنسور یا ریستارت سرویس باعث بروز مشکل میشه.
✅ بهترین کار اینه که بعد از تحویل:
1. حداقل چند هفته پایش فعال داشته باشید.
2. گزارش خطاها و لاگها رو جمعآوری و تحلیل کنید.
3. آموزش کاربران نهایی رو جدی بگیرید.
4. آماده باشید برای تغییرات کوچک (Patch) یا اصلاحات سریع.
🔑 تحویل یک پروژه موفق فقط به روز Delivery ختم نمیشه؛ بلکه زمانی معنا پیدا میکنه که در محیط واقعی پایدار و قابل اعتماد کار کنه.
#هوش_مصنوعی #پروژه_صنعتی #مدیریت_پروژه #AI_industrial
❤10🔥4😁4🎉4👍2
📌 قبل از پرپوزال صنعتی حتماً خط تولید و کارکنان را ببینید
خیلی وقتها ایدههای هوش مصنوعی وقتی روی کاغذ هستند عالی بهنظر میرسند، اما در عمل با نیازها و محدودیتهای خط تولید فاصله دارند. ✨
🔹 یکبار قبل از نوشتن و ارائهی پرپوزال، به خط تولید سر بزنید و از نزدیک جریان واقعی کار را ببینید.
🔹 با اپراتورها و کارکنان خط صحبت کنید؛ آنها مشکلات ریز و درشتی را میبینند که در گزارشهای مدیریتی پیدا نمیشوند.
مثلاً:
✅ ممکن است شما در پرپوزال پیشنهاد مدل بینایی ماشین برای تشخیص عیوب سطحی بدهید، اما اپراتور به شما بگوید که «بیشتر خرابیها در شب و به خاطر بخار یا نور کم رخ میدهد». همین یک نکته میتواند مسیر پروژه را تغییر دهد و شما را به سمت استفاده از ترکیب بینایی ماشین و سنسورهای حرارتی یا LiDAR هدایت کند.
✅ یا شاید فکر کنید بهترین ایده، پیشبینی خرابی ماشینآلات با تحلیل دادههای سنسورها است. اما وقتی با تعمیرکاران صحبت کنید، متوجه میشوید مشکل اصلی در نبودن سنسورهای کافی روی دستگاههای قدیمی است؛ پس در پرپوزال باید راهکارهای دیتافیوژن و مدلسازی ترکیبی (Hybrid Modeling) را جایگزین کنید.
🔑 خلاصه اینکه:
هوش مصنوعی فقط وقتی در صنعت موفق است که روی واقعیات خط تولید بنا شود. و این واقعیتها را بهترین منبع داده، یعنی کارکنان خط، به شما منتقل میکنند.
#هوش_مصنوعی #بینایی_ماشین #صنعت #پرپوزال #مدیریت_صنعتی #خط_تولید #AI_industrial
@rss_ai_ir
خیلی وقتها ایدههای هوش مصنوعی وقتی روی کاغذ هستند عالی بهنظر میرسند، اما در عمل با نیازها و محدودیتهای خط تولید فاصله دارند. ✨
🔹 یکبار قبل از نوشتن و ارائهی پرپوزال، به خط تولید سر بزنید و از نزدیک جریان واقعی کار را ببینید.
🔹 با اپراتورها و کارکنان خط صحبت کنید؛ آنها مشکلات ریز و درشتی را میبینند که در گزارشهای مدیریتی پیدا نمیشوند.
مثلاً:
✅ ممکن است شما در پرپوزال پیشنهاد مدل بینایی ماشین برای تشخیص عیوب سطحی بدهید، اما اپراتور به شما بگوید که «بیشتر خرابیها در شب و به خاطر بخار یا نور کم رخ میدهد». همین یک نکته میتواند مسیر پروژه را تغییر دهد و شما را به سمت استفاده از ترکیب بینایی ماشین و سنسورهای حرارتی یا LiDAR هدایت کند.
✅ یا شاید فکر کنید بهترین ایده، پیشبینی خرابی ماشینآلات با تحلیل دادههای سنسورها است. اما وقتی با تعمیرکاران صحبت کنید، متوجه میشوید مشکل اصلی در نبودن سنسورهای کافی روی دستگاههای قدیمی است؛ پس در پرپوزال باید راهکارهای دیتافیوژن و مدلسازی ترکیبی (Hybrid Modeling) را جایگزین کنید.
🔑 خلاصه اینکه:
هوش مصنوعی فقط وقتی در صنعت موفق است که روی واقعیات خط تولید بنا شود. و این واقعیتها را بهترین منبع داده، یعنی کارکنان خط، به شما منتقل میکنند.
#هوش_مصنوعی #بینایی_ماشین #صنعت #پرپوزال #مدیریت_صنعتی #خط_تولید #AI_industrial
@rss_ai_ir
🎉11❤6😁5👍2🔥2👏1🙏1
🦀 وقتی رباتها به قلمرو حیوانات وارد میشوند!
گروهی از پژوهشگران یک رباتخرچنگ زیستمقلد به نام «موجزن دیو» طراحی کردند تا واکنش خرچنگهای نر واقعی را در فصل جفتگیری بررسی کنند.
🔹 این ربات با پرینتر سهبعدی ساخته شده، چنگکهای قابلتعویض در اندازههای مختلف دارد و از طریق اپلیکیشن بلوتوثی کنترل میشود. محققان آن را در فاصله ۳۰ سانتیمتری خرچنگ واقعی قرار دادند و واکنشها را با دوربین ثبت کردند.
🔸 خرچنگهای نر برای جذب مادهها جلوی لانه خود چنگک تکان میدهند. با دیدن ربات، زمان تکان دادن چنگک افزایش یافت اما سرعت تغییر نکرد. دانشمندان میگویند شاید نرها حضور رقیب را به معنای احتمال حضور ماده بدانند، ولی تا وقتی مطمئن نشوند انرژی بیشتری خرج نمیکنند.
⚡ جالبتر اینکه برخی نرها به ربات حمله کردند و یکی حتی چنگکش را از جا کند! همین باعث شد آزمایش موقتاً متوقف شود.
❓بهنظر شما، آیا آیندهی زیستشناسی میتواند پر از اینگونه رباتهای آزمایشگاهی باشد؟
#هوش_مصنوعی #رباتیک #بیومیمتیک #پژوهش #AI_industrial_news
@rss_ai_ir
گروهی از پژوهشگران یک رباتخرچنگ زیستمقلد به نام «موجزن دیو» طراحی کردند تا واکنش خرچنگهای نر واقعی را در فصل جفتگیری بررسی کنند.
🔹 این ربات با پرینتر سهبعدی ساخته شده، چنگکهای قابلتعویض در اندازههای مختلف دارد و از طریق اپلیکیشن بلوتوثی کنترل میشود. محققان آن را در فاصله ۳۰ سانتیمتری خرچنگ واقعی قرار دادند و واکنشها را با دوربین ثبت کردند.
🔸 خرچنگهای نر برای جذب مادهها جلوی لانه خود چنگک تکان میدهند. با دیدن ربات، زمان تکان دادن چنگک افزایش یافت اما سرعت تغییر نکرد. دانشمندان میگویند شاید نرها حضور رقیب را به معنای احتمال حضور ماده بدانند، ولی تا وقتی مطمئن نشوند انرژی بیشتری خرج نمیکنند.
⚡ جالبتر اینکه برخی نرها به ربات حمله کردند و یکی حتی چنگکش را از جا کند! همین باعث شد آزمایش موقتاً متوقف شود.
❓بهنظر شما، آیا آیندهی زیستشناسی میتواند پر از اینگونه رباتهای آزمایشگاهی باشد؟
#هوش_مصنوعی #رباتیک #بیومیمتیک #پژوهش #AI_industrial_news
@rss_ai_ir
😁10🔥5🎉5❤3👍3
⚡ افزایش مصرف انرژی با گسترش هوش مصنوعی در آمریکا
💥 رشد سریع مراکز داده (Data Centers) برای آموزش و اجرای مدلهای هوش مصنوعی باعث شده قبضهای برق در ایالات متحده به شکل محسوسی بالا برود. شبکه بزرگ PJM که ۱۳ ایالت و واشنگتن دیسی را پوشش میدهد، با فشار سنگینی مواجه شده است.
📊 آمارها نشان میدهد:
🟢 در ۹ ایالت تحت پوشش PJM و همچنین واشنگتن دیسی، قبضهای برق بیش از میانگین کشوری و بالای ۶٪ رشد داشته است.
🟢 در نیوجرسی افزایش ۱۳.۳٪ و در نیویورک ۱۴.۴٪ ثبت شده است.
🟢 طبق گزارش Monitoring Analytics، حدود ۶۴٪ از هزینههای جدید مستقیماً به تقاضای فعلی و پیشبینیشده مراکز داده مرتبط است.
⚡ آموزش و استفاده از مدلهای هوش مصنوعی چندین برابر بیشتر از یک جستجوی اینترنتی عادی انرژی مصرف میکند.
هرچند اپراتورها به سمت بهبود بهرهوری انرژی حرکت کردهاند، اما بازار هنوز نیاز به زمان برای سازگاری دارد. تحلیلگران Bloomberg میگویند اگر هوش مصنوعی به درستی به کار گرفته شود، خودش میتواند راهحل بخشی از بحران انرژی باشد.
#هوش_مصنوعی #صنعت #مصرف_انرژی #تحول_دیجیتال #AI_industrial_news
@rss_ai_ir
💥 رشد سریع مراکز داده (Data Centers) برای آموزش و اجرای مدلهای هوش مصنوعی باعث شده قبضهای برق در ایالات متحده به شکل محسوسی بالا برود. شبکه بزرگ PJM که ۱۳ ایالت و واشنگتن دیسی را پوشش میدهد، با فشار سنگینی مواجه شده است.
📊 آمارها نشان میدهد:
🟢 در ۹ ایالت تحت پوشش PJM و همچنین واشنگتن دیسی، قبضهای برق بیش از میانگین کشوری و بالای ۶٪ رشد داشته است.
🟢 در نیوجرسی افزایش ۱۳.۳٪ و در نیویورک ۱۴.۴٪ ثبت شده است.
🟢 طبق گزارش Monitoring Analytics، حدود ۶۴٪ از هزینههای جدید مستقیماً به تقاضای فعلی و پیشبینیشده مراکز داده مرتبط است.
⚡ آموزش و استفاده از مدلهای هوش مصنوعی چندین برابر بیشتر از یک جستجوی اینترنتی عادی انرژی مصرف میکند.
هرچند اپراتورها به سمت بهبود بهرهوری انرژی حرکت کردهاند، اما بازار هنوز نیاز به زمان برای سازگاری دارد. تحلیلگران Bloomberg میگویند اگر هوش مصنوعی به درستی به کار گرفته شود، خودش میتواند راهحل بخشی از بحران انرژی باشد.
#هوش_مصنوعی #صنعت #مصرف_انرژی #تحول_دیجیتال #AI_industrial_news
@rss_ai_ir
👎1🥰1🙏1
⚡️ انویدیا نسل جدید پلتفرمهای محاسباتی برای رباتیک را معرفی کرد — Jetson Thor
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
👍2🔥1👏1
⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر میکند
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
👍3🔥1👏1
Media is too big
VIEW IN TELEGRAM
🌟 مدل MiniCPM-V 4.5؛ رقیب جمعوجور غولهای چندمودالی
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
👍3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!
این ظرفیت بالا میتواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمکرسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی
❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین رباتهایی در صنایع و شهرها خواهیم بود؟
#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
این ظرفیت بالا میتواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمکرسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی
❓ اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین رباتهایی در صنایع و شهرها خواهیم بود؟
#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
🎉11❤10👍10🔥9😁8
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍12❤9😁3👏1🙏1
🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents
🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیطهای یادگیری تقویتی (RL Environments) را معرفی کرد.
🌍 محیط RL همان دنیای مجازیای است که قوانین و سیستم پاداش آن تعریف میشود تا عاملها در آن آموزش ببینند.
✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامهنویس نیاز به:
✳️محیط شبیهسازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپلاین آموزش
✳️مجموعه دادههای واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاههای بزرگ میلیونها دلار هزینه دارد و در اوپنسورس تقریباً مشابهی وجود نداشت.
⚡ حالا Environments Hub این مشکل را حل میکند:
♻️اولین و تنها استور باز برای محیطهای آماده RL
♻️شامل محیطهایی برای آموزش عاملهای برنامهنویس، ریاضیدان، گیمر و بسیاری حوزههای دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL
💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عاملها دانسته است.
🔗 خودتان ببینید: Environments Hub
#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents
@rss_ai_ir
🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیطهای یادگیری تقویتی (RL Environments) را معرفی کرد.
🌍 محیط RL همان دنیای مجازیای است که قوانین و سیستم پاداش آن تعریف میشود تا عاملها در آن آموزش ببینند.
✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامهنویس نیاز به:
✳️محیط شبیهسازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپلاین آموزش
✳️مجموعه دادههای واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاههای بزرگ میلیونها دلار هزینه دارد و در اوپنسورس تقریباً مشابهی وجود نداشت.
⚡ حالا Environments Hub این مشکل را حل میکند:
♻️اولین و تنها استور باز برای محیطهای آماده RL
♻️شامل محیطهایی برای آموزش عاملهای برنامهنویس، ریاضیدان، گیمر و بسیاری حوزههای دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL
💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عاملها دانسته است.
🔗 خودتان ببینید: Environments Hub
#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents
@rss_ai_ir
😁10🔥6❤4🎉3👍1
⚡️ معرفی OLMoASR؛ مدلهای باز تشخیص گفتار از AI2
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
❤7👍6🔥6🎉6
🤯 پژوهش تازه درباره خلاقیت متن
🔎 دانشمندان نشان دادهاند: متنهای نوشتهشده توسط انسان از نظر نوآوری معنایی متنوعتر از متنهای تولیدشده توسط هوش مصنوعی هستند.
🧮 روش سنجش
آنها متریکی به نام *semantic novelty* معرفی کردند؛ فاصله کسینوسی بین جملات متوالی.
🧠 یافتههای کلیدی
❇️ متنهای انسانی در همه مدلهای امبدینگ (RoBERTa, DistilBERT, MPNet, MiniLM) امتیاز نوآوری بالاتری داشتند.
❇️ در دیتاست داستانگویی مشترک انسان-هوش مصنوعی، بخش انسانی تنوع معنایی بیشتری ایجاد کرد.
✨ نکته جالب
چیزی که در AI بهعنوان *hallucination* شناخته میشود، در داستانگویی تعاملی میتواند مفید باشد؛ چون پیچشهای غیرمنتظره به روایت اضافه میکند.
👉 نتیجهگیری:
انسانها خلاقتر و نوآورتر هستند، هوش مصنوعی پیشبینیپذیرتر است، اما در کنار همدیگر ترکیبی قدرتمند برای داستانسرایی میسازند.
🔗 جزئیات: [لینک پژوهش](https://idanvidra.github.io/playing_along_paper_site/)
@rss_ai_ir 🤖📚✨
#هوش_مصنوعی #خلاقیت #متن #تحقیق #AI_industrial_news
🔎 دانشمندان نشان دادهاند: متنهای نوشتهشده توسط انسان از نظر نوآوری معنایی متنوعتر از متنهای تولیدشده توسط هوش مصنوعی هستند.
🧮 روش سنجش
آنها متریکی به نام *semantic novelty* معرفی کردند؛ فاصله کسینوسی بین جملات متوالی.
🧠 یافتههای کلیدی
❇️ متنهای انسانی در همه مدلهای امبدینگ (RoBERTa, DistilBERT, MPNet, MiniLM) امتیاز نوآوری بالاتری داشتند.
❇️ در دیتاست داستانگویی مشترک انسان-هوش مصنوعی، بخش انسانی تنوع معنایی بیشتری ایجاد کرد.
✨ نکته جالب
چیزی که در AI بهعنوان *hallucination* شناخته میشود، در داستانگویی تعاملی میتواند مفید باشد؛ چون پیچشهای غیرمنتظره به روایت اضافه میکند.
👉 نتیجهگیری:
انسانها خلاقتر و نوآورتر هستند، هوش مصنوعی پیشبینیپذیرتر است، اما در کنار همدیگر ترکیبی قدرتمند برای داستانسرایی میسازند.
🔗 جزئیات: [لینک پژوهش](https://idanvidra.github.io/playing_along_paper_site/)
@rss_ai_ir 🤖📚✨
#هوش_مصنوعی #خلاقیت #متن #تحقیق #AI_industrial_news
😁15👏12👍11🔥9🥰8❤7🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
❤️🔥 PHD: Personalized 3D Humans ❤️🔥
🔹 محققان ETH و Meta رویکردی نوین به نام PHD معرفی کردند؛ روشی برای بازیابی مش سهبعدی انسان (HMR) و بدنه شخصیسازیشده که از اطلاعات اختصاصی شکل کاربر استفاده میکند.
✨ این روش دقت بالاتری در بازسازی بدن سهبعدی بهدست میدهد و برای کاربردهایی مثل واقعیت مجازی، بازیها و فیتنس دیجیتال بسیار کارآمد است.
🔗 منابع:
👉 Paper
👉 Project : https://phd-pose.github.io/
👉 Repo (بهزودی)
@rss_ai_ir 🤖💙
#هوش_مصنوعی #سه_بعدی #متا #ETH #BodyMesh #AI_industrial_news
🔹 محققان ETH و Meta رویکردی نوین به نام PHD معرفی کردند؛ روشی برای بازیابی مش سهبعدی انسان (HMR) و بدنه شخصیسازیشده که از اطلاعات اختصاصی شکل کاربر استفاده میکند.
✨ این روش دقت بالاتری در بازسازی بدن سهبعدی بهدست میدهد و برای کاربردهایی مثل واقعیت مجازی، بازیها و فیتنس دیجیتال بسیار کارآمد است.
🔗 منابع:
👉 Paper
👉 Project : https://phd-pose.github.io/
👉 Repo (بهزودی)
@rss_ai_ir 🤖💙
#هوش_مصنوعی #سه_بعدی #متا #ETH #BodyMesh #AI_industrial_news
🎉9❤7👍5👏5🔥3🥰3😁3
🔔 مدیرعامل انویدیا: هوش مصنوعی میتواند هفته کاری چهارروزه بسازد
جنسن هوانگ معتقد است بهرهوری ناشی از AI میتواند هفته کاری را به ۴ روز کاهش دهد؛ درست مثل انقلابهای صنعتی گذشته که سبک کار و زندگی را تغییر دادند.
⚡ به گفته او:
✅هوش مصنوعی کارهای تکراری را حذف میکند، اما به جای استراحت، فرصت بیشتری برای دنبالکردن ایدهها فراهم میشود.
✅آزمایشها در انگلیس، آمریکا و کانادا نشان دادند که هفته چهارروزه باعث ۲۴٪ افزایش بهرهوری و نصفشدن فرسودگی شغلی شد.
✅او این تحول را با گذار تاریخی از هفته ۷ روزه به ۵ روزه مقایسه کرد؛ و احتمال میدهد AI جهش بعدی را رقم بزند.
🗓 با این حال هشدار داد: شاید در نهایت حتی مشغولتر از قبل شویم.
❓ شما حاضرید هفته کاری کوتاهتر داشته باشید، اگر به معنی شدت بیشتر کار در هر روز باشد؟
@rss_ai_ir 🤖✨
#هوش_مصنوعی #Nvidia #بهرهوری #هفته_چهارروزه #AI_industrial_news
جنسن هوانگ معتقد است بهرهوری ناشی از AI میتواند هفته کاری را به ۴ روز کاهش دهد؛ درست مثل انقلابهای صنعتی گذشته که سبک کار و زندگی را تغییر دادند.
⚡ به گفته او:
✅هوش مصنوعی کارهای تکراری را حذف میکند، اما به جای استراحت، فرصت بیشتری برای دنبالکردن ایدهها فراهم میشود.
✅آزمایشها در انگلیس، آمریکا و کانادا نشان دادند که هفته چهارروزه باعث ۲۴٪ افزایش بهرهوری و نصفشدن فرسودگی شغلی شد.
✅او این تحول را با گذار تاریخی از هفته ۷ روزه به ۵ روزه مقایسه کرد؛ و احتمال میدهد AI جهش بعدی را رقم بزند.
🗓 با این حال هشدار داد: شاید در نهایت حتی مشغولتر از قبل شویم.
❓ شما حاضرید هفته کاری کوتاهتر داشته باشید، اگر به معنی شدت بیشتر کار در هر روز باشد؟
@rss_ai_ir 🤖✨
#هوش_مصنوعی #Nvidia #بهرهوری #هفته_چهارروزه #AI_industrial_news
🎉13🥰8👍6😁6👏4🔥3❤2