🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts
محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کردهاند که مشکل اصلی مدلها را حل میکند:
وقتی ویدئو طولانی میشود، توجه مدل بیش از حد «پف میکند»؛ محاسبات سنگینتر میشود، جزئیات از بین میرود، کاراکترها فراموش میشوند و تصویر «سر میخورد».
---
🔑 ایده اصلی: Mixture of Contexts
♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم میشود.
♻️هر کوئری فقط بخشهای مرتبط را انتخاب میکند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام میشود (مقایسه ویژگی بخشها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریمهای آینده را میبندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخشهای انتخابشده اعمال میشود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.
---
📊 نتایج
♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنههای طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.
---
🎥 جمعبندی
✳️در ویدئوهای کوتاه، کیفیت حفظ میشود.
✳️در ویدئوهای طولانی، صحنهها روانتر و کاراکترها پایدارتر هستند.
✳️زمان تولید بهطور محسوسی کاهش مییابد.
🔑 نکته مهم:
مدل خودش یاد میگیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا میکند.
🔖 لینک مقاله
#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کردهاند که مشکل اصلی مدلها را حل میکند:
وقتی ویدئو طولانی میشود، توجه مدل بیش از حد «پف میکند»؛ محاسبات سنگینتر میشود، جزئیات از بین میرود، کاراکترها فراموش میشوند و تصویر «سر میخورد».
---
🔑 ایده اصلی: Mixture of Contexts
♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم میشود.
♻️هر کوئری فقط بخشهای مرتبط را انتخاب میکند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام میشود (مقایسه ویژگی بخشها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریمهای آینده را میبندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخشهای انتخابشده اعمال میشود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.
---
📊 نتایج
♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنههای طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.
---
🎥 جمعبندی
✳️در ویدئوهای کوتاه، کیفیت حفظ میشود.
✳️در ویدئوهای طولانی، صحنهها روانتر و کاراکترها پایدارتر هستند.
✳️زمان تولید بهطور محسوسی کاهش مییابد.
🔑 نکته مهم:
مدل خودش یاد میگیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا میکند.
🔖 لینک مقاله
#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
🎉26👍25❤23🥰23😁22🔥18👏16
مفهوم دیپلوی در مدلهای زبانی بزرگ یعنی رساندن مدل از آزمایشگاه به محیط واقعیِ تولید، با تمرکز همزمان بر کیفیت، سرعت و هزینه 🚀
🧭 اهداف کلیدی در دیپلوی
❇️تضمین تأخیر پایین (Latency/SLA)، پایداری و مقیاسپذیری
❇️کنترل هزینه بهازای هر توکن و مصرف GPU/CPU
❇️پایش ایمنی محتوا و حفظ حریم خصوصی دادهها
🏗 الگوهای دیپلوی
✳️سرویس ابری مدیریتشده: راهاندازی سریع، اما وابستگی و هزینه متغیر
✳️استقرار خودمیزبان: کنترل کامل و بهینهسازی عمیق، اما نیازمند تخصص عملیاتی
✳️معماری هیبرید: استفاده از مزیت هر دو رویکرد برای سناریوهای حساس به داده
🧩 آمادهسازی مدل
❎انتخاب اندازه و کانتکستلِن مناسب نیاز کسبوکار
❎کوانتیزهسازی (INT8/4) و دیستیل برای کاهش حافظه و افزایش سرعت
❎فاینتیون سبک با LoRA/PEFT برای شخصیسازی کمهزینه
❎یکپارچهسازی با ابزارها و بازیگرها (توابع، جستجو، پایگاه دانش/RAG)
⚡️ سروینگ و بهینهسازی اجرا
✅بهرهگیری از فریمورکهای سروینگ (مانند vLLM، TGI، TensorRT-LLM) برای مدیریت همزمانی و صف درخواستها
✅استفاده از تکنیکهای Continuous Batching، KV-Cache، Flash-Attention، Speculative Decoding برای افزایش توکنبرثانیه
✅تنظیم طول پاسخ، دمای نمونهبرداری و حداکثر توکنها برای کنترل کیفیت/هزینه
🧮 ظرفیتسنجی و منابع
♨️برآورد حافظه وزنها متناسب با اندازه مدل و دقت عددی (مثلاً حدوداً: 7B با INT8 ≈ نزدیک 7–8GB؛ با FP16 ≈ حدود 14–16GB)
♨️درنظرگرفتن حافظه KV-Cache که با طول متن، تعداد درخواستهای همزمان و دقت عددی رشد میکند
♨️سنجش عملی با بار مصنوعی برای رسیدن به هدفهای Tokens/s و همزمانی
🔐 ایمنی، امنیت و انطباق
💢احراز هویت، ریتلیمیت و جداسازی محیط اجرا
💢فیلترینگ محتوایی، ممیزی لاگها و حذف دادههای حساس
💢پایبندی به مقررات (حریم خصوصی و نگهداری داده)
🧪 ارزیابی و تضمین کیفیت
❇️طراحی Golden Set از پرامپتها و پاسخهای مرجع
❇️اجرای ارزیابی خودکارِ کیفیّت، واقعنمایی RAG و آزمونهای رگرسیونی قبل از هر انتشار
❇️پایش پس از دیپلوی با A/B تست و تحلیل لاگ برای بهبود پرامپت و ریتونینگ
🧰 قابلیت مشاهده و نگهداری
🛑مانیتورینگ متریکها: زمان پاسخ، نرخ خطا، مصرف منابع، هزینه/درخواست
🛑ردیابی سرگذشت نسخهها (Model Registry) و انتشارِ ایمن با Canary/Blue-Green
🛑برنامه پشتیبانگیری، مقیاسگذاری خودکار و پلن بازیابی خرابی
📝 چکلیست پیش از استقرار
♻️تعریف SLA و بودجه هزینه
♻️انتخاب مدل، اندازه، کوانتیزیشن و کانتکستلِن
♻️آمادهسازی فاینتیون/LoRA و سناریوهای RAG
♻️انتخاب چارچوب سروینگ و کانفیگ همزمانی/Batching
♻️طراحی ارزیابی، لاگگذاری و داشبورد مانیتورینگ
♻️پیادهسازی ایمنی محتوا، احراز هویت و ریتلیمیت
♻️برنامه انتشار تدریجی و بازگشت امن (Rollback)
🔎 جمعبندی کاربردی
⛔️برای چتبات داخلی با دانش سازمانی، ترکیب RAG + مدل میانرده کوانتیزه، بهعلاوه vLLM و Continuous Batching معمولاً بهترین نسبت کارایی/هزینه را میدهد.
⛔️برای تولید انبوه متن با تأخیر پایین، تمرکز بر KV-Cache، Speculative Decoding و بهینهسازی سطح GPU بیشترین اثر را دارد.
@rss_ai_ir 🤖📈
#هوش_مصنوعی #LLM #دیپلوی #MLOps #مدل_زبان #RAG #بهینهسازی #Quantization #Inference
🧭 اهداف کلیدی در دیپلوی
❇️تضمین تأخیر پایین (Latency/SLA)، پایداری و مقیاسپذیری
❇️کنترل هزینه بهازای هر توکن و مصرف GPU/CPU
❇️پایش ایمنی محتوا و حفظ حریم خصوصی دادهها
🏗 الگوهای دیپلوی
✳️سرویس ابری مدیریتشده: راهاندازی سریع، اما وابستگی و هزینه متغیر
✳️استقرار خودمیزبان: کنترل کامل و بهینهسازی عمیق، اما نیازمند تخصص عملیاتی
✳️معماری هیبرید: استفاده از مزیت هر دو رویکرد برای سناریوهای حساس به داده
🧩 آمادهسازی مدل
❎انتخاب اندازه و کانتکستلِن مناسب نیاز کسبوکار
❎کوانتیزهسازی (INT8/4) و دیستیل برای کاهش حافظه و افزایش سرعت
❎فاینتیون سبک با LoRA/PEFT برای شخصیسازی کمهزینه
❎یکپارچهسازی با ابزارها و بازیگرها (توابع، جستجو، پایگاه دانش/RAG)
⚡️ سروینگ و بهینهسازی اجرا
✅بهرهگیری از فریمورکهای سروینگ (مانند vLLM، TGI، TensorRT-LLM) برای مدیریت همزمانی و صف درخواستها
✅استفاده از تکنیکهای Continuous Batching، KV-Cache، Flash-Attention، Speculative Decoding برای افزایش توکنبرثانیه
✅تنظیم طول پاسخ، دمای نمونهبرداری و حداکثر توکنها برای کنترل کیفیت/هزینه
🧮 ظرفیتسنجی و منابع
♨️برآورد حافظه وزنها متناسب با اندازه مدل و دقت عددی (مثلاً حدوداً: 7B با INT8 ≈ نزدیک 7–8GB؛ با FP16 ≈ حدود 14–16GB)
♨️درنظرگرفتن حافظه KV-Cache که با طول متن، تعداد درخواستهای همزمان و دقت عددی رشد میکند
♨️سنجش عملی با بار مصنوعی برای رسیدن به هدفهای Tokens/s و همزمانی
🔐 ایمنی، امنیت و انطباق
💢احراز هویت، ریتلیمیت و جداسازی محیط اجرا
💢فیلترینگ محتوایی، ممیزی لاگها و حذف دادههای حساس
💢پایبندی به مقررات (حریم خصوصی و نگهداری داده)
🧪 ارزیابی و تضمین کیفیت
❇️طراحی Golden Set از پرامپتها و پاسخهای مرجع
❇️اجرای ارزیابی خودکارِ کیفیّت، واقعنمایی RAG و آزمونهای رگرسیونی قبل از هر انتشار
❇️پایش پس از دیپلوی با A/B تست و تحلیل لاگ برای بهبود پرامپت و ریتونینگ
🧰 قابلیت مشاهده و نگهداری
🛑مانیتورینگ متریکها: زمان پاسخ، نرخ خطا، مصرف منابع، هزینه/درخواست
🛑ردیابی سرگذشت نسخهها (Model Registry) و انتشارِ ایمن با Canary/Blue-Green
🛑برنامه پشتیبانگیری، مقیاسگذاری خودکار و پلن بازیابی خرابی
📝 چکلیست پیش از استقرار
♻️تعریف SLA و بودجه هزینه
♻️انتخاب مدل، اندازه، کوانتیزیشن و کانتکستلِن
♻️آمادهسازی فاینتیون/LoRA و سناریوهای RAG
♻️انتخاب چارچوب سروینگ و کانفیگ همزمانی/Batching
♻️طراحی ارزیابی، لاگگذاری و داشبورد مانیتورینگ
♻️پیادهسازی ایمنی محتوا، احراز هویت و ریتلیمیت
♻️برنامه انتشار تدریجی و بازگشت امن (Rollback)
🔎 جمعبندی کاربردی
⛔️برای چتبات داخلی با دانش سازمانی، ترکیب RAG + مدل میانرده کوانتیزه، بهعلاوه vLLM و Continuous Batching معمولاً بهترین نسبت کارایی/هزینه را میدهد.
⛔️برای تولید انبوه متن با تأخیر پایین، تمرکز بر KV-Cache، Speculative Decoding و بهینهسازی سطح GPU بیشترین اثر را دارد.
@rss_ai_ir 🤖📈
#هوش_مصنوعی #LLM #دیپلوی #MLOps #مدل_زبان #RAG #بهینهسازی #Quantization #Inference
🎉10😁6❤5🥰5👍4🔥4👏2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
این سیستم هوش مصنوعی برای تحلیل ویدئویی طراحی شده و میتواند در ورودیها تعداد افراد و جنسیت و سن آنها را تشخیص دهد.
📊 آمار در تصویر:
شمار کل: ۵۷۵ نفر
مردان: ۳۴۸ نفر
زنان: ۲۲۱ نفر
@rss_ai_ir 🤖📹✨
📊 آمار در تصویر:
شمار کل: ۵۷۵ نفر
مردان: ۳۴۸ نفر
زنان: ۲۲۱ نفر
@rss_ai_ir 🤖📹✨
🥰13👍11🔥11😁11❤9🎉9👏6🤩4❤🔥4🙏1💯1
🤯 پژوهش تازه درباره خلاقیت متن
🔎 دانشمندان نشان دادهاند: متنهای نوشتهشده توسط انسان از نظر نوآوری معنایی متنوعتر از متنهای تولیدشده توسط هوش مصنوعی هستند.
🧮 روش سنجش
آنها متریکی به نام *semantic novelty* معرفی کردند؛ فاصله کسینوسی بین جملات متوالی.
🧠 یافتههای کلیدی
❇️ متنهای انسانی در همه مدلهای امبدینگ (RoBERTa, DistilBERT, MPNet, MiniLM) امتیاز نوآوری بالاتری داشتند.
❇️ در دیتاست داستانگویی مشترک انسان-هوش مصنوعی، بخش انسانی تنوع معنایی بیشتری ایجاد کرد.
✨ نکته جالب
چیزی که در AI بهعنوان *hallucination* شناخته میشود، در داستانگویی تعاملی میتواند مفید باشد؛ چون پیچشهای غیرمنتظره به روایت اضافه میکند.
👉 نتیجهگیری:
انسانها خلاقتر و نوآورتر هستند، هوش مصنوعی پیشبینیپذیرتر است، اما در کنار همدیگر ترکیبی قدرتمند برای داستانسرایی میسازند.
🔗 جزئیات: [لینک پژوهش](https://idanvidra.github.io/playing_along_paper_site/)
@rss_ai_ir 🤖📚✨
#هوش_مصنوعی #خلاقیت #متن #تحقیق #AI_industrial_news
🔎 دانشمندان نشان دادهاند: متنهای نوشتهشده توسط انسان از نظر نوآوری معنایی متنوعتر از متنهای تولیدشده توسط هوش مصنوعی هستند.
🧮 روش سنجش
آنها متریکی به نام *semantic novelty* معرفی کردند؛ فاصله کسینوسی بین جملات متوالی.
🧠 یافتههای کلیدی
❇️ متنهای انسانی در همه مدلهای امبدینگ (RoBERTa, DistilBERT, MPNet, MiniLM) امتیاز نوآوری بالاتری داشتند.
❇️ در دیتاست داستانگویی مشترک انسان-هوش مصنوعی، بخش انسانی تنوع معنایی بیشتری ایجاد کرد.
✨ نکته جالب
چیزی که در AI بهعنوان *hallucination* شناخته میشود، در داستانگویی تعاملی میتواند مفید باشد؛ چون پیچشهای غیرمنتظره به روایت اضافه میکند.
👉 نتیجهگیری:
انسانها خلاقتر و نوآورتر هستند، هوش مصنوعی پیشبینیپذیرتر است، اما در کنار همدیگر ترکیبی قدرتمند برای داستانسرایی میسازند.
🔗 جزئیات: [لینک پژوهش](https://idanvidra.github.io/playing_along_paper_site/)
@rss_ai_ir 🤖📚✨
#هوش_مصنوعی #خلاقیت #متن #تحقیق #AI_industrial_news
😁15👏12👍11🔥9🥰8❤7🎉5
🔥 چطور ChatGPT رو شبیهتر به انسان کنیم؟
خیلیها میگن جوابهای ChatGPT بیش از حد رسمی یا خشک به نظر میرسه. اما میتونی فقط با چند ثانیه تنظیم، لحن طبیعیتر و زندهتر بسازی — بدون هیچ ابزار اضافه!
🔧 راهکار:
1️⃣ ChatGPT رو باز کن
2️⃣ روی عکس پروفایل کلیک کن → گزینه Customize ChatGPT
3️⃣ در قسمت Traits این پرامپت رو قرار بده:
✅ بعد از این تغییر، خروجیها شفافتر، شخصیتر و طبیعیتر میشن
@rss_ai_ir 🤖✨
#هوش_مصنوعی #ChatGPT #پرامپت #بهینهسازی #تکنیک
خیلیها میگن جوابهای ChatGPT بیش از حد رسمی یا خشک به نظر میرسه. اما میتونی فقط با چند ثانیه تنظیم، لحن طبیعیتر و زندهتر بسازی — بدون هیچ ابزار اضافه!
🔧 راهکار:
1️⃣ ChatGPT رو باز کن
2️⃣ روی عکس پروفایل کلیک کن → گزینه Customize ChatGPT
3️⃣ در قسمت Traits این پرامپت رو قرار بده:
Write in natural, human-sounding English. Avoid the AI tone: overly formal, polished, or generic phrasing.
Do not use long dashes, excessive quotation marks, corporate jargon, or bureaucratic language.
Choose simple, clear wording. Conversational style is fine if it helps convey the idea.
Don’t repeat the same phrases or overcomplicate sentences without need.
Vary sentence length and rhythm so the text feels alive.
The priority is clarity of meaning, individual style, and practical value in every line.
Each sentence should feel intentional, not mechanically generated.
✅ بعد از این تغییر، خروجیها شفافتر، شخصیتر و طبیعیتر میشن
@rss_ai_ir 🤖✨
#هوش_مصنوعی #ChatGPT #پرامپت #بهینهسازی #تکنیک
👏8❤7😁6🎉6🔥5👍4🥰2
⚡️ تنسنت مدلهای متنباز Hunyuan-MT را معرفی کرد؛ نسل جدید سیستمهای قدرتمند ترجمه ماشینی 🌍
📦 شامل:
♻️Hunyuan-MT-7B و Hunyuan-MT-Chimera-7B
♻️پشتیبانی از ۳۳ زبان
♻️مدل Chimera-7B بهعنوان نخستین مدل ensemble متنباز در صنعت شناخته میشود
🏆 دستاوردها:
✳️رتبه نخست در ۳۰ از ۳۱ بخش رقابت بینالمللی WMT25 (بزرگترین کنفرانس ترجمه ماشینی جهان)
✳️همچنین Hunyuan-MT-7B بهترین عملکرد را در میان مدلهای همسایز خود دارد
🟠 مدلها در HuggingFace
🟠 مخزن کد در GitHub
🟠 دمو
@rss_ai_ir 🤖✨
#هوش_مصنوعی #NLP #ترجمه #Tencent #Hunyuan #WMT25
📦 شامل:
♻️Hunyuan-MT-7B و Hunyuan-MT-Chimera-7B
♻️پشتیبانی از ۳۳ زبان
♻️مدل Chimera-7B بهعنوان نخستین مدل ensemble متنباز در صنعت شناخته میشود
🏆 دستاوردها:
✳️رتبه نخست در ۳۰ از ۳۱ بخش رقابت بینالمللی WMT25 (بزرگترین کنفرانس ترجمه ماشینی جهان)
✳️همچنین Hunyuan-MT-7B بهترین عملکرد را در میان مدلهای همسایز خود دارد
🟠 مدلها در HuggingFace
🟠 مخزن کد در GitHub
🟠 دمو
@rss_ai_ir 🤖✨
#هوش_مصنوعی #NLP #ترجمه #Tencent #Hunyuan #WMT25
🔥5🎉5👏4👍3🥰3❤2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
❤️🔥 PHD: Personalized 3D Humans ❤️🔥
🔹 محققان ETH و Meta رویکردی نوین به نام PHD معرفی کردند؛ روشی برای بازیابی مش سهبعدی انسان (HMR) و بدنه شخصیسازیشده که از اطلاعات اختصاصی شکل کاربر استفاده میکند.
✨ این روش دقت بالاتری در بازسازی بدن سهبعدی بهدست میدهد و برای کاربردهایی مثل واقعیت مجازی، بازیها و فیتنس دیجیتال بسیار کارآمد است.
🔗 منابع:
👉 Paper
👉 Project : https://phd-pose.github.io/
👉 Repo (بهزودی)
@rss_ai_ir 🤖💙
#هوش_مصنوعی #سه_بعدی #متا #ETH #BodyMesh #AI_industrial_news
🔹 محققان ETH و Meta رویکردی نوین به نام PHD معرفی کردند؛ روشی برای بازیابی مش سهبعدی انسان (HMR) و بدنه شخصیسازیشده که از اطلاعات اختصاصی شکل کاربر استفاده میکند.
✨ این روش دقت بالاتری در بازسازی بدن سهبعدی بهدست میدهد و برای کاربردهایی مثل واقعیت مجازی، بازیها و فیتنس دیجیتال بسیار کارآمد است.
🔗 منابع:
👉 Paper
👉 Project : https://phd-pose.github.io/
👉 Repo (بهزودی)
@rss_ai_ir 🤖💙
#هوش_مصنوعی #سه_بعدی #متا #ETH #BodyMesh #AI_industrial_news
🎉9❤7👍5👏5🔥3🥰3😁3
برای تسریع شبکههای عصبی کانولوشنی (CNN) روشهای مختلفی وجود داره که معمولاً در سه دستهی اصلی خلاصه میشن:
---
🔹 ۱. بهینهسازی معماری (Architecture Optimization)
NAS (Neural Architecture Search):
♻️ جستجوی خودکار برای پیدا کردن معماری سبکتر و سریعتر.
طراحی دستی سبکها:
♻️مثل MobileNet، ShuffleNet یا EfficientNet که با کانولوشنهای سبکوزن (Depthwise, Pointwise) سرعت رو بالا میبرن.
---
🔹 ۲. فشردهسازی و کاهش پارامترها (Model Compression)
Pruning (هرس کردن):
♻️ حذف کانکشنها، نورونها یا فیلترهای کماهمیت.
Weight Sharing:
♻️ اشتراکگذاری وزنها بین فیلترها برای کاهش حافظه.
Knowledge Distillation:
♻️ آموزش یک مدل کوچک (Student) با کمک دانش مدل بزرگتر (Teacher).
---
🔹 ۳. کاهش دقت محاسبات (Quantization & Low-Precision)
Quantization:
♻️ استفاده از نمایش با بیت کمتر (FP16, INT8, حتی FP8) بهجای FP32.
Binarization / Ternarization:
♻️ محدود کردن وزنها و اکتیویشنها به مقادیر دودویی یا سهتایی.
Mixed Precision Training:
♻️استفاده ترکیبی از FP16 و FP32 برای تعادل بین سرعت و دقت.
---
🔹 ۴. بهینهسازی سختافزاری و نرمافزاری
Fused Operations:
♻️ ادغام چند عملیات (مثلاً Conv + BN + ReLU) در یک کرنل واحد.
CUDA / cuDNN Optimizations:
♻️ استفاده از کتابخانههای GPU بهینهشده.
Sparse Computation:
♻️ استفاده از ماتریسهای تنک برای حذف محاسبات بیفایده.
Hardware Accelerators:
♻️ استفاده از TPU، NPU یا FPGA برای اجرای سریعتر CNN.
---
🔹 ۵. روشهای سطح سیستم
Batching هوشمند:
♻️ پردازش همزمان چند ورودی برای استفاده بهینه از GPU.
Pipeline Parallelism / Model Parallelism:
♻️ تقسیم مدل یا داده بین چند پردازنده.
Caching و Reuse:
♻️ استفاده مجدد از ویژگیها یا نتایج محاسباتی.
---
👉 در عمل، ترکیبی از این روشها استفاده میشه. مثلاً:
یک CNN مثل MobileNetV2 که طراحی سبک داره، میتونه بعد از Pruning و Quantization به INT8 روی موبایل یا لبه (Edge) تا چند برابر سریعتر بشه بدون افت دقت چشمگیر.
@rss_ai_ir 🤖⚡
#هوش_مصنوعی #CNN #تسریع #کوانتیزیشن #Pruning #NAS #DeepLearning
---
🔹 ۱. بهینهسازی معماری (Architecture Optimization)
NAS (Neural Architecture Search):
♻️ جستجوی خودکار برای پیدا کردن معماری سبکتر و سریعتر.
طراحی دستی سبکها:
♻️مثل MobileNet، ShuffleNet یا EfficientNet که با کانولوشنهای سبکوزن (Depthwise, Pointwise) سرعت رو بالا میبرن.
---
🔹 ۲. فشردهسازی و کاهش پارامترها (Model Compression)
Pruning (هرس کردن):
♻️ حذف کانکشنها، نورونها یا فیلترهای کماهمیت.
Weight Sharing:
♻️ اشتراکگذاری وزنها بین فیلترها برای کاهش حافظه.
Knowledge Distillation:
♻️ آموزش یک مدل کوچک (Student) با کمک دانش مدل بزرگتر (Teacher).
---
🔹 ۳. کاهش دقت محاسبات (Quantization & Low-Precision)
Quantization:
♻️ استفاده از نمایش با بیت کمتر (FP16, INT8, حتی FP8) بهجای FP32.
Binarization / Ternarization:
♻️ محدود کردن وزنها و اکتیویشنها به مقادیر دودویی یا سهتایی.
Mixed Precision Training:
♻️استفاده ترکیبی از FP16 و FP32 برای تعادل بین سرعت و دقت.
---
🔹 ۴. بهینهسازی سختافزاری و نرمافزاری
Fused Operations:
♻️ ادغام چند عملیات (مثلاً Conv + BN + ReLU) در یک کرنل واحد.
CUDA / cuDNN Optimizations:
♻️ استفاده از کتابخانههای GPU بهینهشده.
Sparse Computation:
♻️ استفاده از ماتریسهای تنک برای حذف محاسبات بیفایده.
Hardware Accelerators:
♻️ استفاده از TPU، NPU یا FPGA برای اجرای سریعتر CNN.
---
🔹 ۵. روشهای سطح سیستم
Batching هوشمند:
♻️ پردازش همزمان چند ورودی برای استفاده بهینه از GPU.
Pipeline Parallelism / Model Parallelism:
♻️ تقسیم مدل یا داده بین چند پردازنده.
Caching و Reuse:
♻️ استفاده مجدد از ویژگیها یا نتایج محاسباتی.
---
👉 در عمل، ترکیبی از این روشها استفاده میشه. مثلاً:
یک CNN مثل MobileNetV2 که طراحی سبک داره، میتونه بعد از Pruning و Quantization به INT8 روی موبایل یا لبه (Edge) تا چند برابر سریعتر بشه بدون افت دقت چشمگیر.
@rss_ai_ir 🤖⚡
#هوش_مصنوعی #CNN #تسریع #کوانتیزیشن #Pruning #NAS #DeepLearning
👏8🥰7👍6😁6❤5🔥5🎉4
🔔 مدیرعامل انویدیا: هوش مصنوعی میتواند هفته کاری چهارروزه بسازد
جنسن هوانگ معتقد است بهرهوری ناشی از AI میتواند هفته کاری را به ۴ روز کاهش دهد؛ درست مثل انقلابهای صنعتی گذشته که سبک کار و زندگی را تغییر دادند.
⚡ به گفته او:
✅هوش مصنوعی کارهای تکراری را حذف میکند، اما به جای استراحت، فرصت بیشتری برای دنبالکردن ایدهها فراهم میشود.
✅آزمایشها در انگلیس، آمریکا و کانادا نشان دادند که هفته چهارروزه باعث ۲۴٪ افزایش بهرهوری و نصفشدن فرسودگی شغلی شد.
✅او این تحول را با گذار تاریخی از هفته ۷ روزه به ۵ روزه مقایسه کرد؛ و احتمال میدهد AI جهش بعدی را رقم بزند.
🗓 با این حال هشدار داد: شاید در نهایت حتی مشغولتر از قبل شویم.
❓ شما حاضرید هفته کاری کوتاهتر داشته باشید، اگر به معنی شدت بیشتر کار در هر روز باشد؟
@rss_ai_ir 🤖✨
#هوش_مصنوعی #Nvidia #بهرهوری #هفته_چهارروزه #AI_industrial_news
جنسن هوانگ معتقد است بهرهوری ناشی از AI میتواند هفته کاری را به ۴ روز کاهش دهد؛ درست مثل انقلابهای صنعتی گذشته که سبک کار و زندگی را تغییر دادند.
⚡ به گفته او:
✅هوش مصنوعی کارهای تکراری را حذف میکند، اما به جای استراحت، فرصت بیشتری برای دنبالکردن ایدهها فراهم میشود.
✅آزمایشها در انگلیس، آمریکا و کانادا نشان دادند که هفته چهارروزه باعث ۲۴٪ افزایش بهرهوری و نصفشدن فرسودگی شغلی شد.
✅او این تحول را با گذار تاریخی از هفته ۷ روزه به ۵ روزه مقایسه کرد؛ و احتمال میدهد AI جهش بعدی را رقم بزند.
🗓 با این حال هشدار داد: شاید در نهایت حتی مشغولتر از قبل شویم.
❓ شما حاضرید هفته کاری کوتاهتر داشته باشید، اگر به معنی شدت بیشتر کار در هر روز باشد؟
@rss_ai_ir 🤖✨
#هوش_مصنوعی #Nvidia #بهرهوری #هفته_چهارروزه #AI_industrial_news
🎉13🥰8👍6😁6👏4🔥3❤2
Media is too big
VIEW IN TELEGRAM
🧙♂️ توییتریها آموزش جالبی منتشر کردن: چطور با ترکیب مدلهای nano-banana و img2vid میتونی برای خودت یک سفر تصویری در سرزمین میانه (Middle-earth) بسازی! 🌋🌲🏞
🔹مدل nano-banana برای ساختن فریمها و فضاسازی اولیه استفاده میشه.
🔹مدل img2vid اون فریمها رو به ویدیو زنده و روان تبدیل میکنه.
در نتیجه چیزی شبیه یک ویدیوی شخصی از قدم زدن در لوکیشنهای ارباب حلقهها به دست میاد ✨
🔗 آموزش اینجا هست: لینک
@rss_ai_ir 🎥🧌✨
#هوش_مصنوعی #ویدیو #LOTR #nano_banana #img2vid
🔹مدل nano-banana برای ساختن فریمها و فضاسازی اولیه استفاده میشه.
🔹مدل img2vid اون فریمها رو به ویدیو زنده و روان تبدیل میکنه.
در نتیجه چیزی شبیه یک ویدیوی شخصی از قدم زدن در لوکیشنهای ارباب حلقهها به دست میاد ✨
🔗 آموزش اینجا هست: لینک
@rss_ai_ir 🎥🧌✨
#هوش_مصنوعی #ویدیو #LOTR #nano_banana #img2vid
🎉9❤6👍6🔥6🥰3👏2😁2🤩2💯2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
📽 رباتها در اجلاس سازمان همکاری شانگهای
دستاوردهای رباتیک به یکی از عناصر مهم اجلاس سازمان همکاری شانگهای در تیانجین چین تبدیل شده است 🇨🇳🤖
🔹 برگزارکنندگان در مرکز مطبوعاتی این اجلاس نشان دادند که تعامل بین انسانها و رباتها نهتنها هیجانانگیز و دیدنی است، بلکه میتواند کاربردی، راحت و مؤثر نیز باشد.
این نمایشگاه نشاندهنده رشد سریع فناوری رباتیک در عرصه بینالمللی و جایگاه پررنگ آن در آینده همکاریهای اقتصادی و فناورانه میان کشورهای عضو است. 🌍✨
@rss_ai_ir
#هوش_مصنوعی #رباتیک #فناوری #شانگهای #چین
دستاوردهای رباتیک به یکی از عناصر مهم اجلاس سازمان همکاری شانگهای در تیانجین چین تبدیل شده است 🇨🇳🤖
🔹 برگزارکنندگان در مرکز مطبوعاتی این اجلاس نشان دادند که تعامل بین انسانها و رباتها نهتنها هیجانانگیز و دیدنی است، بلکه میتواند کاربردی، راحت و مؤثر نیز باشد.
این نمایشگاه نشاندهنده رشد سریع فناوری رباتیک در عرصه بینالمللی و جایگاه پررنگ آن در آینده همکاریهای اقتصادی و فناورانه میان کشورهای عضو است. 🌍✨
@rss_ai_ir
#هوش_مصنوعی #رباتیک #فناوری #شانگهای #چین
👍9🥰9❤6🔥5👏5😁4🎉3
🧩 بنچمارک جدید برای LLM — Werewolf Benchmark
در ماههای اخیر بنچمارکهای خلاقانه و متفاوتی برای مدلهای زبانی بزرگ معرفی شدهاند. یکی از تازهترینها Werewolf Benchmark است که توانایی استدلال اجتماعی تحت فشار را میسنجد.
🎭 این تست بر اساس بازی «مافیا» ساخته شده (که در دانشگاه دولتی مسکو اختراع شد).
نقشها: شهروندان، گرگینهها، دکتر، غیبگو، شکارچی و …
شب گرگینهها قربانی انتخاب میکنند، روز همه رأی میدهند چه کسی گرگینه است.
⚙️ روش کار:
♻️فرض کنید ۶ بازیکن داریم.
♻️سه بازیکن توسط مدل A و سه بازیکن توسط مدل B کنترل میشوند.
♻️هر مدل فکر میکند با افراد مستقل روبهروست، در حالی که در واقع «مغز واحدی» پشت بازیکنان است.
💡 نتیجه این طراحی:
♻️امکان تشکیل اتحادها 🤝
♻️بلف زدن 🃏
♻️قربانی کردن اعضای خودی
♻️ساخت روایتهای دروغین و ایجاد دسیسه
📊 در جدول رتبهبندی فعلی، GPT-5 با اختلاف زیاد اول است. این یعنی نهتنها توانایی استدلال و استراتژی بالایی دارد، بلکه توانایی فریب دادن را هم نشان میدهد 😐
👉 این تست ابزاری جالب برای مطالعه الگوهای رفتاری مدلهای زبانی است.
🔗 جزئیات و لیدربورد: werewolf.foaster.ai
@rss_ai_ir 🐺🤖
#هوش_مصنوعی #LLM #بنچمارک #مافیا #گرگینه #استدلال_اجتماعی
در ماههای اخیر بنچمارکهای خلاقانه و متفاوتی برای مدلهای زبانی بزرگ معرفی شدهاند. یکی از تازهترینها Werewolf Benchmark است که توانایی استدلال اجتماعی تحت فشار را میسنجد.
🎭 این تست بر اساس بازی «مافیا» ساخته شده (که در دانشگاه دولتی مسکو اختراع شد).
نقشها: شهروندان، گرگینهها، دکتر، غیبگو، شکارچی و …
شب گرگینهها قربانی انتخاب میکنند، روز همه رأی میدهند چه کسی گرگینه است.
⚙️ روش کار:
♻️فرض کنید ۶ بازیکن داریم.
♻️سه بازیکن توسط مدل A و سه بازیکن توسط مدل B کنترل میشوند.
♻️هر مدل فکر میکند با افراد مستقل روبهروست، در حالی که در واقع «مغز واحدی» پشت بازیکنان است.
💡 نتیجه این طراحی:
♻️امکان تشکیل اتحادها 🤝
♻️بلف زدن 🃏
♻️قربانی کردن اعضای خودی
♻️ساخت روایتهای دروغین و ایجاد دسیسه
📊 در جدول رتبهبندی فعلی، GPT-5 با اختلاف زیاد اول است. این یعنی نهتنها توانایی استدلال و استراتژی بالایی دارد، بلکه توانایی فریب دادن را هم نشان میدهد 😐
👉 این تست ابزاری جالب برای مطالعه الگوهای رفتاری مدلهای زبانی است.
🔗 جزئیات و لیدربورد: werewolf.foaster.ai
@rss_ai_ir 🐺🤖
#هوش_مصنوعی #LLM #بنچمارک #مافیا #گرگینه #استدلال_اجتماعی
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
📚🤖 جشن آغاز سال تحصیلی با حضور ربات humanoid
برای نخستین بار در روسیه، در روز اول مدرسه (روز دانش) زنگ آغاز سال تحصیلی نه تنها توسط دانشآموزان، بلکه با کمک یک ربات انساننما Unitree G1 Edu Ultimate C به نام داشا نواخته شد.
🔹 ربات دasha با بهرهگیری از سیستم هوش مصنوعی بومی، به زبان روسی برای دانشآموزان و معلمان پانسیون وابسته به وزارت دفاع روسیه سخنرانی کرد. او توانست با تغییر لحن، شوخی کردن، واکنش به جملات مخاطب و حتی نشان دادن «احساسات»، فضایی شبیه گفتوگوی واقعی ایجاد کند.
🔹 نقطه اوج مراسم زمانی بود که دаша با استفاده از دستهای مکانیکی پیشرفته خود در زنگ مدرسه نواخت. هر انگشت این ربات موتور و سامانه حرکتی اختصاصی دارد که امکان انجام حرکات دقیق را فراهم میکند.
✨ این ربات علاوه بر توانایی گفتوگو، به لطف برنامهنویسی متخصصان روسی دارای قابلیتهای پیشرفتهای مانند تشخیص اشیاء و دنبال کردن هدف است؛ گامی مهم در ترکیب نوآوری، رباتیک و آموزش.
@rss_ai_ir ⚙️🇷🇺
#هوش_مصنوعی #رباتیک #آموزش #نوآوری #روبات_انساننما #فناوری
برای نخستین بار در روسیه، در روز اول مدرسه (روز دانش) زنگ آغاز سال تحصیلی نه تنها توسط دانشآموزان، بلکه با کمک یک ربات انساننما Unitree G1 Edu Ultimate C به نام داشا نواخته شد.
🔹 ربات دasha با بهرهگیری از سیستم هوش مصنوعی بومی، به زبان روسی برای دانشآموزان و معلمان پانسیون وابسته به وزارت دفاع روسیه سخنرانی کرد. او توانست با تغییر لحن، شوخی کردن، واکنش به جملات مخاطب و حتی نشان دادن «احساسات»، فضایی شبیه گفتوگوی واقعی ایجاد کند.
🔹 نقطه اوج مراسم زمانی بود که دаша با استفاده از دستهای مکانیکی پیشرفته خود در زنگ مدرسه نواخت. هر انگشت این ربات موتور و سامانه حرکتی اختصاصی دارد که امکان انجام حرکات دقیق را فراهم میکند.
✨ این ربات علاوه بر توانایی گفتوگو، به لطف برنامهنویسی متخصصان روسی دارای قابلیتهای پیشرفتهای مانند تشخیص اشیاء و دنبال کردن هدف است؛ گامی مهم در ترکیب نوآوری، رباتیک و آموزش.
@rss_ai_ir ⚙️🇷🇺
#هوش_مصنوعی #رباتیک #آموزش #نوآوری #روبات_انساننما #فناوری
❤2
🧩 زنجیره فکر (Chain-of-Thought) در مدلهای زبانی بزرگ
وقتی از یک مدل زبانی سوال میپرسیم، همیشه بهتر نیست فقط جواب نهایی را بدهد.
گاهی لازم است مدل مسیر استدلال خود را مرحلهبهمرحله بازگو کند؛ این همان چیزی است که به آن زنجیره فکر (CoT) میگوییم.
🔹 چرا مهم است؟
توانایی حل مسائل چندمرحلهای (ریاضی، منطقی، برنامهریزی).
کاهش خطاهای «پرش مستقیم به جواب».
شفافیت در نحوه رسیدن مدل به نتیجه.
🔹 مثال ساده
❓ علی ۳ سیب دارد، رضا ۲ سیب دارد. در مجموع چند سیب دارند؟
✅ پاسخ بدون زنجیره فکر: ۵
✅ پاسخ با زنجیره فکر: علی ۳ سیب دارد، رضا ۲ سیب دارد → ۳+۲=۵
📊 پژوهشها نشان دادهاند که استفاده از CoT باعث میشود مدلها در حل مسائل پیچیده عملکرد بسیار بهتری داشته باشند.
@rss_ai_ir 🤖🧠
#هوش_مصنوعی #LLM #زنجیره_فکر #Chain_of_Thought #مدل_زبان
وقتی از یک مدل زبانی سوال میپرسیم، همیشه بهتر نیست فقط جواب نهایی را بدهد.
گاهی لازم است مدل مسیر استدلال خود را مرحلهبهمرحله بازگو کند؛ این همان چیزی است که به آن زنجیره فکر (CoT) میگوییم.
🔹 چرا مهم است؟
توانایی حل مسائل چندمرحلهای (ریاضی، منطقی، برنامهریزی).
کاهش خطاهای «پرش مستقیم به جواب».
شفافیت در نحوه رسیدن مدل به نتیجه.
🔹 مثال ساده
❓ علی ۳ سیب دارد، رضا ۲ سیب دارد. در مجموع چند سیب دارند؟
✅ پاسخ بدون زنجیره فکر: ۵
✅ پاسخ با زنجیره فکر: علی ۳ سیب دارد، رضا ۲ سیب دارد → ۳+۲=۵
📊 پژوهشها نشان دادهاند که استفاده از CoT باعث میشود مدلها در حل مسائل پیچیده عملکرد بسیار بهتری داشته باشند.
@rss_ai_ir 🤖🧠
#هوش_مصنوعی #LLM #زنجیره_فکر #Chain_of_Thought #مدل_زبان
🌆 SAT-SKYLINES:
بازسازی سهبعدی ساختمانها از تصاویر ماهوارهای
پژوهش تازهای با نام SAT-SKYLINES منتشر شده که هدف آن تولید مشهای سهبعدی از ساختمانها بر اساس ترکیب:
تصاویر ماهوارهای 🛰️
هندسه تقریبی و دادههای بازی Cities: Skylines 🏙️
🔹 ایده اینجاست که تصاویر دوبعدی ماهوارهای به همراه دادههای شبهواقعی از بازی، برای بازسازی سهبعدی شهری استفاده شوند. نتیجه کار: مدلهایی نزدیک به واقعیت که میتوانند در شبیهسازیها، طراحی شهری و حتی متاورس بهکار گرفته شوند.
📄 جزئیات بیشتر: arXiv:2508.18531
@rss_ai_ir 🤖🏗️
#هوش_مصنوعی #بینایی_ماشین #مدل_سهبعدی #unrealneural #شهرهوشمند
بازسازی سهبعدی ساختمانها از تصاویر ماهوارهای
پژوهش تازهای با نام SAT-SKYLINES منتشر شده که هدف آن تولید مشهای سهبعدی از ساختمانها بر اساس ترکیب:
تصاویر ماهوارهای 🛰️
هندسه تقریبی و دادههای بازی Cities: Skylines 🏙️
🔹 ایده اینجاست که تصاویر دوبعدی ماهوارهای به همراه دادههای شبهواقعی از بازی، برای بازسازی سهبعدی شهری استفاده شوند. نتیجه کار: مدلهایی نزدیک به واقعیت که میتوانند در شبیهسازیها، طراحی شهری و حتی متاورس بهکار گرفته شوند.
📄 جزئیات بیشتر: arXiv:2508.18531
@rss_ai_ir 🤖🏗️
#هوش_مصنوعی #بینایی_ماشین #مدل_سهبعدی #unrealneural #شهرهوشمند