VIRSUN
14.2K subscribers
480 photos
272 videos
2 files
283 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🏓🤖 ربات پینگ‌پنگ‌باز خودران از برکلی

دانشجویان دانشگاه برکلی یک ربات انسان‌نما طراحی کرده‌اند که می‌تواند کاملاً خودکار در مسابقات پینگ‌پنگ شرکت کند. اگر سال گذشته در پروژه‌ی DeepMind فقط یک بازوی رباتیک دیدیم، این بار یک گومانوید کامل با توانایی حرکت و هماهنگی بدن وارد میدان شده است.

🔑 مکانیزم کار HITTER (HumanoId Table TEnnis Robot):

1️⃣ برنامه‌ریز سطح بالا (مغز)

✳️با کمک دوربین‌های خارجی، پرواز توپ را دنبال می‌کند.
✳️مسیر حرکت توپ را پیش‌بینی کرده و محاسبه می‌کند که در چه نقطه‌ای، با چه سرعت و در چه زمان باید ضربه بزند.


2️⃣ کنترلر سطح پایین (بدن)

✳️سیگنال‌های برنامه‌ریز را گرفته و آن‌ها را به حرکات واقعی دست، پا، تنه و مفاصل تبدیل می‌کند.
✳️این بخش با الگوریتم PPO روی داده‌های حرکت انسان آموزش داده شده است، بنابراین ضربات ربات طبیعی و شبیه انسان هستند: قدم برمی‌دارد، تنه می‌چرخاند و مثل بازیکن واقعی راکت را می‌چرخاند.


📊 نتایج عملکرد

✳️92.3٪ موفقیت در برگشت توپ‌ها (فقط یک خطا در هر 26 توپ).
✳️در یک آزمایش، ربات توانست 106 ضربه‌ی متوالی را بدون خطا ادامه دهد.
✳️زمان واکنش: 0.42 ثانیه از لحظه ضربه‌ی حریف تا پاسخ ربات.


🎯 در کل، این یک گام بزرگ در رباتیک ورزشی است. حالا سؤال اینجاست:
آیا روزی می‌توانیم چنین رباتی را برای یک آخر هفته اجاره کنیم و باهاش پینگ‌پنگ بازی کنیم؟ 😅

🔗 مشاهده مقاله
🔥1915👍14👏14😁13🥰12🎉12
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts

محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کرده‌اند که مشکل اصلی مدل‌ها را حل می‌کند:
وقتی ویدئو طولانی می‌شود، توجه مدل بیش از حد «پف می‌کند»؛ محاسبات سنگین‌تر می‌شود، جزئیات از بین می‌رود، کاراکترها فراموش می‌شوند و تصویر «سر می‌خورد».


---

🔑 ایده اصلی: Mixture of Contexts

♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم می‌شود.
♻️هر کوئری فقط بخش‌های مرتبط را انتخاب می‌کند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام می‌شود (مقایسه ویژگی بخش‌ها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریم‌های آینده را می‌بندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخش‌های انتخاب‌شده اعمال می‌شود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.



---

📊 نتایج

♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنه‌های طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.



---

🎥 جمع‌بندی

✳️در ویدئوهای کوتاه، کیفیت حفظ می‌شود.
✳️در ویدئوهای طولانی، صحنه‌ها روان‌تر و کاراکترها پایدارتر هستند.
✳️زمان تولید به‌طور محسوسی کاهش می‌یابد.


🔑 نکته مهم:
مدل خودش یاد می‌گیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا می‌کند.

🔖 لینک مقاله

#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
🎉26👍2523🥰23😁22🔥18👏16
مفهوم دیپلوی در مدل‌های زبانی بزرگ یعنی رساندن مدل از آزمایشگاه به محیط واقعیِ تولید، با تمرکز همزمان بر کیفیت، سرعت و هزینه 🚀

🧭 اهداف کلیدی در دیپلوی

❇️تضمین تأخیر پایین (Latency/SLA)، پایداری و مقیاس‌پذیری
❇️کنترل هزینه به‌ازای هر توکن و مصرف GPU/CPU
❇️پایش ایمنی محتوا و حفظ حریم خصوصی داده‌ها

🏗 الگوهای دیپلوی

✳️سرویس ابری مدیریت‌شده: راه‌اندازی سریع، اما وابستگی و هزینه متغیر
✳️استقرار خودمیزبان: کنترل کامل و بهینه‌سازی عمیق، اما نیازمند تخصص عملیاتی
✳️معماری هیبرید: استفاده از مزیت هر دو رویکرد برای سناریوهای حساس به داده

🧩 آماده‌سازی مدل

انتخاب اندازه و کانتکست‌لِن مناسب نیاز کسب‌وکار
کوانتیزه‌سازی (INT8/4) و دیستیل برای کاهش حافظه و افزایش سرعت
فاین‌تیون سبک با LoRA/PEFT برای شخصی‌سازی کم‌هزینه
یکپارچه‌سازی با ابزارها و بازیگرها (توابع، جستجو، پایگاه دانش/RAG)

⚡️ سروینگ و بهینه‌سازی اجرا

بهره‌گیری از فریم‌ورک‌های سروینگ (مانند vLLM، TGI، TensorRT-LLM) برای مدیریت هم‌زمانی و صف درخواست‌ها
استفاده از تکنیک‌های Continuous Batching، KV-Cache، Flash-Attention، Speculative Decoding برای افزایش توکن‌برثانیه
تنظیم طول پاسخ، دمای نمونه‌برداری و حداکثر توکن‌ها برای کنترل کیفیت/هزینه

🧮 ظرفیت‌سنجی و منابع

♨️برآورد حافظه وزن‌ها متناسب با اندازه مدل و دقت عددی (مثلاً حدوداً: 7B با INT8 ≈ نزدیک 7–8GB؛ با FP16 ≈ حدود 14–16GB)
♨️درنظرگرفتن حافظه KV-Cache که با طول متن، تعداد درخواست‌های هم‌زمان و دقت عددی رشد می‌کند
♨️سنجش عملی با بار مصنوعی برای رسیدن به هدف‌های Tokens/s و هم‌زمانی

🔐 ایمنی، امنیت و انطباق

💢احراز هویت، ریت‌لیمیت و جداسازی محیط اجرا
💢فیلترینگ محتوایی، ممیزی لاگ‌ها و حذف داده‌های حساس
💢پایبندی به مقررات (حریم خصوصی و نگهداری داده)

🧪 ارزیابی و تضمین کیفیت

❇️طراحی Golden Set از پرامپت‌ها و پاسخ‌های مرجع
❇️اجرای ارزیابی خودکارِ کیفیّت، واقع‌نمایی RAG و آزمون‌های رگرسیونی قبل از هر انتشار
❇️پایش پس از دیپلوی با A/B تست و تحلیل لاگ برای بهبود پرامپت و ریتونینگ

🧰 قابلیت مشاهده و نگه‌داری

🛑مانیتورینگ متریک‌ها: زمان پاسخ، نرخ خطا، مصرف منابع، هزینه/درخواست
🛑ردیابی سرگذشت نسخه‌ها (Model Registry) و انتشارِ ایمن با Canary/Blue-Green
🛑برنامه پشتیبان‌گیری، مقیاس‌گذاری خودکار و پلن بازیابی خرابی

📝 چک‌لیست پیش از استقرار

♻️تعریف SLA و بودجه هزینه
♻️انتخاب مدل، اندازه، کوانتیزیشن و کانتکست‌لِن
♻️آماده‌سازی فاین‌تیون/LoRA و سناریوهای RAG
♻️انتخاب چارچوب سروینگ و کانفیگ هم‌زمانی/Batching
♻️طراحی ارزیابی، لاگ‌گذاری و داشبورد مانیتورینگ
♻️پیاده‌سازی ایمنی محتوا، احراز هویت و ریت‌لیمیت
♻️برنامه انتشار تدریجی و بازگشت امن (Rollback)

🔎 جمع‌بندی کاربردی

⛔️برای چت‌بات داخلی با دانش سازمانی، ترکیب RAG + مدل میان‌رده کوانتیزه، به‌علاوه vLLM و Continuous Batching معمولاً بهترین نسبت کارایی/هزینه را می‌دهد.
⛔️برای تولید انبوه متن با تأخیر پایین، تمرکز بر KV-Cache، Speculative Decoding و بهینه‌سازی سطح GPU بیشترین اثر را دارد.

@rss_ai_ir 🤖📈

#هوش_مصنوعی #LLM #دیپلوی #MLOps #مدل_زبان #RAG #بهینه‌سازی #Quantization #Inference
🎉10😁65🥰5👍4🔥4👏2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
این سیستم هوش مصنوعی برای تحلیل ویدئویی طراحی شده و می‌تواند در ورودی‌ها تعداد افراد و جنسیت و سن آن‌ها را تشخیص دهد.

📊 آمار در تصویر:

شمار کل: ۵۷۵ نفر

مردان: ۳۴۸ نفر

زنان: ۲۲۱ نفر


@rss_ai_ir 🤖📹
🥰13👍11🔥11😁119🎉9👏6🤩4❤‍🔥4🙏1💯1
🤯 پژوهش تازه درباره خلاقیت متن

🔎 دانشمندان نشان داده‌اند: متن‌های نوشته‌شده توسط انسان از نظر نوآوری معنایی متنوع‌تر از متن‌های تولیدشده توسط هوش مصنوعی هستند.

🧮 روش سنجش
آن‌ها متریکی به نام *semantic novelty* معرفی کردند؛ فاصله کسینوسی بین جملات متوالی.

🧠 یافته‌های کلیدی

❇️ متن‌های انسانی در همه مدل‌های امبدینگ (RoBERTa, DistilBERT, MPNet, MiniLM) امتیاز نوآوری بالاتری داشتند.
❇️ در دیتاست داستان‌گویی مشترک انسان-هوش مصنوعی، بخش انسانی تنوع معنایی بیشتری ایجاد کرد.

نکته جالب
چیزی که در AI به‌عنوان *hallucination* شناخته می‌شود، در داستان‌گویی تعاملی می‌تواند مفید باشد؛ چون پیچش‌های غیرمنتظره به روایت اضافه می‌کند.

👉 نتیجه‌گیری:
انسان‌ها خلاق‌تر و نوآورتر هستند، هوش مصنوعی پیش‌بینی‌پذیرتر است، اما در کنار همدیگر ترکیبی قدرتمند برای داستان‌سرایی می‌سازند.

🔗 جزئیات: [لینک پژوهش](https://idanvidra.github.io/playing_along_paper_site/)

@rss_ai_ir 🤖📚

#هوش_مصنوعی #خلاقیت #متن #تحقیق #AI_industrial_news
😁15👏12👍11🔥9🥰87🎉5
🔥 چطور ChatGPT رو شبیه‌تر به انسان کنیم؟

خیلی‌ها می‌گن جواب‌های ChatGPT بیش از حد رسمی یا خشک به نظر می‌رسه. اما می‌تونی فقط با چند ثانیه تنظیم، لحن طبیعی‌تر و زنده‌تر بسازی — بدون هیچ ابزار اضافه!

🔧 راهکار:
1️⃣ ChatGPT رو باز کن
2️⃣ روی عکس پروفایل کلیک کن → گزینه Customize ChatGPT
3️⃣ در قسمت Traits این پرامپت رو قرار بده:
Write in natural, human-sounding English. Avoid the AI tone: overly formal, polished, or generic phrasing.
Do not use long dashes, excessive quotation marks, corporate jargon, or bureaucratic language.
Choose simple, clear wording. Conversational style is fine if it helps convey the idea.
Don’t repeat the same phrases or overcomplicate sentences without need.
Vary sentence length and rhythm so the text feels alive.
The priority is clarity of meaning, individual style, and practical value in every line.
Each sentence should feel intentional, not mechanically generated.

بعد از این تغییر، خروجی‌ها شفاف‌تر، شخصی‌تر و طبیعی‌تر می‌شن

@rss_ai_ir 🤖

#هوش_مصنوعی #ChatGPT #پرامپت #بهینه‌سازی #تکنیک
👏87😁6🎉6🔥5👍4🥰2
⚡️ تنسنت مدل‌های متن‌باز Hunyuan-MT را معرفی کرد؛ نسل جدید سیستم‌های قدرتمند ترجمه ماشینی 🌍

📦 شامل:

♻️Hunyuan-MT-7B و Hunyuan-MT-Chimera-7B
♻️پشتیبانی از ۳۳ زبان
♻️مدل Chimera-7B به‌عنوان نخستین مدل ensemble متن‌باز در صنعت شناخته می‌شود


🏆 دستاوردها:

✳️رتبه نخست در ۳۰ از ۳۱ بخش رقابت بین‌المللی WMT25 (بزرگ‌ترین کنفرانس ترجمه ماشینی جهان)

✳️همچنین Hunyuan-MT-7B بهترین عملکرد را در میان مدل‌های هم‌سایز خود دارد


🟠 مدل‌ها در HuggingFace
🟠 مخزن کد در GitHub
🟠 دمو

@rss_ai_ir 🤖

#هوش_مصنوعی #NLP #ترجمه #Tencent #Hunyuan #WMT25
🔥5🎉5👏4👍3🥰32😁2
This media is not supported in your browser
VIEW IN TELEGRAM
❤️‍🔥 PHD: Personalized 3D Humans ❤️‍🔥

🔹 محققان ETH و Meta رویکردی نوین به نام PHD معرفی کردند؛ روشی برای بازیابی مش سه‌بعدی انسان (HMR) و بدنه شخصی‌سازی‌شده که از اطلاعات اختصاصی شکل کاربر استفاده می‌کند.

این روش دقت بالاتری در بازسازی بدن سه‌بعدی به‌دست می‌دهد و برای کاربردهایی مثل واقعیت مجازی، بازی‌ها و فیتنس دیجیتال بسیار کارآمد است.

🔗 منابع:

👉 Paper
👉 Project : https://phd-pose.github.io/
👉 Repo (به‌زودی)

@rss_ai_ir 🤖💙

#هوش_مصنوعی #سه_بعدی #متا #ETH #BodyMesh #AI_industrial_news
🎉97👍5👏5🔥3🥰3😁3
برای تسریع شبکه‌های عصبی کانولوشنی (CNN) روش‌های مختلفی وجود داره که معمولاً در سه دسته‌ی اصلی خلاصه می‌شن:


---

🔹 ۱. بهینه‌سازی معماری (Architecture Optimization)

NAS (Neural Architecture Search):
♻️ جستجوی خودکار برای پیدا کردن معماری سبک‌تر و سریع‌تر.

طراحی دستی سبک‌ها:
♻️مثل MobileNet، ShuffleNet یا EfficientNet که با کانولوشن‌های سبک‌وزن (Depthwise, Pointwise) سرعت رو بالا می‌برن.



---

🔹 ۲. فشرده‌سازی و کاهش پارامترها (Model Compression)

Pruning (هرس کردن):
♻️ حذف کانکشن‌ها، نورون‌ها یا فیلترهای کم‌اهمیت.

Weight Sharing:
♻️ اشتراک‌گذاری وزن‌ها بین فیلترها برای کاهش حافظه.

Knowledge Distillation:
♻️ آموزش یک مدل کوچک (Student) با کمک دانش مدل بزرگ‌تر (Teacher).



---

🔹 ۳. کاهش دقت محاسبات (Quantization & Low-Precision)

Quantization:
♻️ استفاده از نمایش با بیت کمتر (FP16, INT8, حتی FP8) به‌جای FP32.

Binarization / Ternarization:
♻️ محدود کردن وزن‌ها و اکتیویشن‌ها به مقادیر دودویی یا سه‌تایی.

Mixed Precision Training:
♻️استفاده ترکیبی از FP16 و FP32 برای تعادل بین سرعت و دقت.



---

🔹 ۴. بهینه‌سازی سخت‌افزاری و نرم‌افزاری

Fused Operations:
♻️ ادغام چند عملیات (مثلاً Conv + BN + ReLU) در یک کرنل واحد.

CUDA / cuDNN Optimizations:
♻️ استفاده از کتابخانه‌های GPU بهینه‌شده.

Sparse Computation:
♻️ استفاده از ماتریس‌های تنک برای حذف محاسبات بی‌فایده.

Hardware Accelerators:
♻️ استفاده از TPU، NPU یا FPGA برای اجرای سریع‌تر CNN.



---

🔹 ۵. روش‌های سطح سیستم

Batching هوشمند:
♻️ پردازش هم‌زمان چند ورودی برای استفاده بهینه از GPU.

Pipeline Parallelism / Model Parallelism:
♻️ تقسیم مدل یا داده بین چند پردازنده.

Caching و Reuse:
♻️ استفاده مجدد از ویژگی‌ها یا نتایج محاسباتی.



---

👉 در عمل، ترکیبی از این روش‌ها استفاده می‌شه. مثلاً:
یک CNN مثل MobileNetV2 که طراحی سبک داره، می‌تونه بعد از Pruning و Quantization به INT8 روی موبایل یا لبه (Edge) تا چند برابر سریع‌تر بشه بدون افت دقت چشمگیر.

@rss_ai_ir 🤖

#هوش_مصنوعی #CNN #تسریع #کوانتیزیشن #Pruning #NAS #DeepLearning
👏8🥰7👍6😁65🔥5🎉4
🔔 مدیرعامل انویدیا: هوش مصنوعی می‌تواند هفته کاری چهارروزه بسازد

جنسن هوانگ معتقد است بهره‌وری ناشی از AI می‌تواند هفته کاری را به ۴ روز کاهش دهد؛ درست مثل انقلاب‌های صنعتی گذشته که سبک کار و زندگی را تغییر دادند.

به گفته او:

هوش مصنوعی کارهای تکراری را حذف می‌کند، اما به جای استراحت، فرصت بیشتری برای دنبال‌کردن ایده‌ها فراهم می‌شود.

آزمایش‌ها در انگلیس، آمریکا و کانادا نشان دادند که هفته چهارروزه باعث ۲۴٪ افزایش بهره‌وری و نصف‌شدن فرسودگی شغلی شد.

او این تحول را با گذار تاریخی از هفته ۷ روزه به ۵ روزه مقایسه کرد؛ و احتمال می‌دهد AI جهش بعدی را رقم بزند.


🗓 با این حال هشدار داد: شاید در نهایت حتی مشغول‌تر از قبل شویم.

شما حاضرید هفته کاری کوتاه‌تر داشته باشید، اگر به معنی شدت بیشتر کار در هر روز باشد؟

@rss_ai_ir 🤖

#هوش_مصنوعی #Nvidia #بهره‌وری #هفته_چهارروزه #AI_industrial_news
🎉13🥰8👍6😁6👏4🔥32
Media is too big
VIEW IN TELEGRAM
🧙‍♂️ توییتری‌ها آموزش جالبی منتشر کردن: چطور با ترکیب مدل‌های nano-banana و img2vid می‌تونی برای خودت یک سفر تصویری در سرزمین میانه (Middle-earth) بسازی! 🌋🌲🏞

🔹مدل nano-banana برای ساختن فریم‌ها و فضاسازی اولیه استفاده می‌شه.
🔹مدل img2vid اون فریم‌ها رو به ویدیو زنده و روان تبدیل می‌کنه.

در نتیجه چیزی شبیه یک ویدیوی شخصی از قدم زدن در لوکیشن‌های ارباب حلقه‌ها به دست میاد

🔗 آموزش اینجا هست: لینک

@rss_ai_ir 🎥🧌

#هوش_مصنوعی #ویدیو #LOTR #nano_banana #img2vid
🎉86👍6🔥6🥰3👏2😁2🤩2💯2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
📽 ربات‌ها در اجلاس سازمان همکاری شانگهای

دستاوردهای رباتیک به یکی از عناصر مهم اجلاس سازمان همکاری شانگهای در تیانجین چین تبدیل شده است 🇨🇳🤖

🔹 برگزارکنندگان در مرکز مطبوعاتی این اجلاس نشان دادند که تعامل بین انسان‌ها و ربات‌ها نه‌تنها هیجان‌انگیز و دیدنی است، بلکه می‌تواند کاربردی، راحت و مؤثر نیز باشد.

این نمایشگاه نشان‌دهنده رشد سریع فناوری رباتیک در عرصه بین‌المللی و جایگاه پررنگ آن در آینده همکاری‌های اقتصادی و فناورانه میان کشورهای عضو است. 🌍

@rss_ai_ir

#هوش_مصنوعی #رباتیک #فناوری #شانگهای #چین
👍9🥰96🔥5👏5😁4🎉3