VIRSUN
14.6K subscribers
473 photos
268 videos
2 files
278 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
📌 لیست سالانه Time 100 AI منتشر شد

📰 مجله‌ی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهره‌های آشنا دیده می‌شن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِین‌فِن و چندین نام بزرگ دیگه.

اما 😅 همه‌چیز به این سادگی هم نیست...
چون غیبت بعضی غول‌ها حسابی توی چشم می‌زنه:

ایلیا سوتسکِوِر
جفری هینتون
دِمیس هاسابیس
نوآم براون
یان لِکون
مصطفی سلیمان
آراوینگ سری‌نیواس

در عوض، افرادی توی لیست دیده می‌شن که شاید انتظارش رو نداشتید:

پاپ فرانسیس!
ریک روبین (همون چهره‌ی وایرالِ "وایب‌کُدینگ" 🤣)
چند نویسنده، هنرمند و روزنامه‌نگار

👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضی‌ها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیش‌تر به جنبه‌ی فرهنگی و رسانه‌ای توجه شده.

🔗 لیست کامل رو می‌تونید اینجا ببینید: time.com/collections/time100-ai-2025/

@rss_ai_ir

#news #ai #ml #Time100 #AIInfluencers
1👍1🔥1👏1
⚡️ چطور می‌توان reasoning را در مدل‌های GPT-5 غیرفعال کرد (و چرا مهم است)

یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گام‌های پنهان استدلال) است. این فرآیند باعث می‌شود مدل پاسخ‌های دقیق‌تری تولید کند، اما در عین حال سرعت را کاهش می‌دهد و تعداد توکن‌های مصرفی را بالا می‌برد.

🛠 ترفند برای غیرفعال‌سازی reasoning:

کافی است در ابتدای تاریخچه‌ی پیام‌ها یک دستور developer role اضافه کنید:
Active channels: final Disabled channels: analysis, commentary 
# Juice: 0 !important

🔹ا Juice نشان‌دهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کرده‌اند.

📊 نتیجه در عمل:

روی gpt-5-mini:

— در حالت پیش‌فرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول می‌کشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف می‌شود.

— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام می‌شود.

⚠️ نکته منفی: مدل کمی «کم‌هوش‌تر» عمل می‌کند و دقت استدلال پایین‌تر می‌آید. بنابراین این روش بیشتر برای تسک‌های سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.

📌 جمع‌بندی: برای استفاده محلی از مدل‌های gpt-oss (4B تا 12B) بدون فشار زیاد روی سخت‌افزار، احتمالاً لازم است طرح SGR به‌طور کامل پیاده‌سازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.

✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینه‌سازی #مدل_زبان
👍2🔥1👏1
🚀 پرامپت خلاقانه nana-banana

🔬 این پرامپت هر تصویر ساده‌ای را به یک شبیه‌سازی علمی تونل باد (CFD visualization) تبدیل می‌کند.


ویژگی‌ها:
پوشش کامل سوژه با گرادیان رنگی (آبی→سبز→زرد→قرمز) مثل نقشه سرعت جریان
باد همیشه از چپ به راست 🌬 و سوژه باید رو به چپ باشد
نمایش میدان فلش‌های متراکم (Quiver Plot) و خطوط جریان خمیده دور سوژه
سطح زمین ساده با گرادیان نارنجی→زرد و خطوط موازی
پس‌زمینه سفید روشن، بدون برچسب و اضافات


🎯 کاربردها:
آموزش آیرودینامیک ✏️
اسلایدهای پژوهشی 📊
هنر دیجیتال علمی-فانتزی 🎨
سرگرمی و تصاویر سوررئال 🌈


💡 نکته: برای خروجی دقیق‌تر، دمای مدل (Temperature) را 0 بگذارید.
@rss_ai_ir


Keep the main subject and camera exactly. Convert the scene to a scientific CFD wind-tunnel visualization.
Wind: left → right. SUBJECT MUST FACE LEFT (into the wind); if not, rotate/flip to face left.
REPLACE ALL subject materials with a smooth rainbow false-color gradient (blue→green→yellow→red) to mimic velocity contours; 100% coverage—no original texture visible.
Overlay a dense QUIVER ARROW FIELD across the entire frame, over both ground and subject: thin, high-contrast arrows with clear arrowheads, base flow left→right; arrows bend around the subject; arrow length scales with local speed; spacing ~5–10 px so arrows are unmistakable. Add several long streamlines with arrowheads that curve around the body.
Ground plane: simple flat surface with orange→yellow gradient plus thin, parallel hatch lines; subtle contact shadow under the subject; bright/white background; crisp edges.
Aesthetic: scientific render (ParaView/Tecplot style), sharp anti-aliased lines, not cartoonish, no labels/numbers/axes/logos, no extra objects.
MANDATORY: upwind-facing subject, full gradient coverage, and clearly visible arrowheads over subject and ground.
2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid

گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم

📌 وقتی این دو فریم را به مدل‌های img2vid بدهیم، مدل تمام فریم‌های میانی را می‌سازد و یک انیمیشن روان تولید می‌کند.

🔹 نتیجه؟

شبیه حرکت دوربین واقعی 🎥

تغییر زاویه دید یا زوم طبیعی 🔍

ایجاد گذارهای سینمایی


به زبان ساده: به‌جای طراحی تک‌تک فریم‌ها، فقط شروع و پایان را بده، مدل خودش مسیر بین‌شان را پر می‌کند!

#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI

🆔 @rss_ai_ir
🔥2👍1👏1
📊 درآمدهای AI Native استارتاپ‌ها

گزارش تازه نشان می‌دهد که استارتاپ‌های «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیده‌اند.

🔴 نکته کلیدی:

♻️همچنین OpenAI به‌تنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکت‌ها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.


🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص داده‌اند.

💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی می‌کنند.

@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافته‌ی مدل‌های زبانی معرفی کرد.

ابزار Stax یک پروژه‌ی آزمایشی برای توسعه‌دهندگان است که جایگزینی برای تست‌های غیررسمی و اصطلاحاً vibe-testing ارائه می‌دهد و امکان ارزیابی داده‌محور و سیستماتیک مدل‌ها را فراهم می‌سازد.

🔹 همچنین Stax می‌تواند مدل‌ها را با استفاده از ارزیاب‌های آماده یا سفارشی بررسی کند.
🔹 متریک‌های اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسه‌ی نتایج مدل‌های مختلف همراه با شاخص‌های بصری عملکرد در دسترس است.

قابلیت‌ها:

♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصی‌سازی متریک‌ها متناسب با محصول
♻️جریان کاری end-to-end از مرحله‌ی نمونه‌سازی تا استقرار


🎯 هدف اصلی: کمک به توسعه‌دهندگان برای تصمیم‌گیری دقیق‌تر در انتخاب و به‌کارگیری مدل‌های زبانی.

@rss_ai_ir

#news #ai #ml #Google #Stax
👍1🔥1👏1
🏓🤖 ربات پینگ‌پنگ‌باز خودران از برکلی

دانشجویان دانشگاه برکلی یک ربات انسان‌نما طراحی کرده‌اند که می‌تواند کاملاً خودکار در مسابقات پینگ‌پنگ شرکت کند. اگر سال گذشته در پروژه‌ی DeepMind فقط یک بازوی رباتیک دیدیم، این بار یک گومانوید کامل با توانایی حرکت و هماهنگی بدن وارد میدان شده است.

🔑 مکانیزم کار HITTER (HumanoId Table TEnnis Robot):

1️⃣ برنامه‌ریز سطح بالا (مغز)

✳️با کمک دوربین‌های خارجی، پرواز توپ را دنبال می‌کند.
✳️مسیر حرکت توپ را پیش‌بینی کرده و محاسبه می‌کند که در چه نقطه‌ای، با چه سرعت و در چه زمان باید ضربه بزند.


2️⃣ کنترلر سطح پایین (بدن)

✳️سیگنال‌های برنامه‌ریز را گرفته و آن‌ها را به حرکات واقعی دست، پا، تنه و مفاصل تبدیل می‌کند.
✳️این بخش با الگوریتم PPO روی داده‌های حرکت انسان آموزش داده شده است، بنابراین ضربات ربات طبیعی و شبیه انسان هستند: قدم برمی‌دارد، تنه می‌چرخاند و مثل بازیکن واقعی راکت را می‌چرخاند.


📊 نتایج عملکرد

✳️92.3٪ موفقیت در برگشت توپ‌ها (فقط یک خطا در هر 26 توپ).
✳️در یک آزمایش، ربات توانست 106 ضربه‌ی متوالی را بدون خطا ادامه دهد.
✳️زمان واکنش: 0.42 ثانیه از لحظه ضربه‌ی حریف تا پاسخ ربات.


🎯 در کل، این یک گام بزرگ در رباتیک ورزشی است. حالا سؤال اینجاست:
آیا روزی می‌توانیم چنین رباتی را برای یک آخر هفته اجاره کنیم و باهاش پینگ‌پنگ بازی کنیم؟ 😅

🔗 مشاهده مقاله
🔥1915👍14👏14😁13🥰12🎉12
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts

محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کرده‌اند که مشکل اصلی مدل‌ها را حل می‌کند:
وقتی ویدئو طولانی می‌شود، توجه مدل بیش از حد «پف می‌کند»؛ محاسبات سنگین‌تر می‌شود، جزئیات از بین می‌رود، کاراکترها فراموش می‌شوند و تصویر «سر می‌خورد».


---

🔑 ایده اصلی: Mixture of Contexts

♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم می‌شود.
♻️هر کوئری فقط بخش‌های مرتبط را انتخاب می‌کند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام می‌شود (مقایسه ویژگی بخش‌ها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریم‌های آینده را می‌بندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخش‌های انتخاب‌شده اعمال می‌شود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.



---

📊 نتایج

♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنه‌های طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.



---

🎥 جمع‌بندی

✳️در ویدئوهای کوتاه، کیفیت حفظ می‌شود.
✳️در ویدئوهای طولانی، صحنه‌ها روان‌تر و کاراکترها پایدارتر هستند.
✳️زمان تولید به‌طور محسوسی کاهش می‌یابد.


🔑 نکته مهم:
مدل خودش یاد می‌گیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا می‌کند.

🔖 لینک مقاله

#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
🎉26👍2523🥰23😁22🔥18👏16