VIRSUN
14.6K subscribers
472 photos
267 videos
2 files
278 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.

🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایش‌های چندمرحله‌ای (multi-turn edits) به‌صورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini

آیا این ابزار می‌تواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨

#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍129😁3👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ویدئو‌سازی همزمان با Krea.ai

استارتاپ Krea ثبت‌نام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.

مشخصات:

♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی می‌تواند شامل پرامپت متنی، تصویر، اسکرین‌شات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً به‌صورت همزمان ساخته می‌شود


🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر می‌خواهد ایجاد کند.

🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video

📌 به نظر می‌رسد این قابلیت بتواند انقلابی در طراحی، بازی‌سازی و تولید محتوا به وجود بیاورد.

#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI

@rss_ai_ir
7👍6🎉6🔥4😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌈 ردیابی سه‌بعدی چندنما (Multi-View 3D Tracking) 🌈

🔹 پروژه MVTracker به‌عنوان اولین سیستم داده‌محور برای ردیابی نقاط سه‌بعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم می‌کند.

📊 دسترسی‌ها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)

#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین

@rss_ai_ir
🔥9🎉9👍51😁1🙏1👌1
📉 شوک بازار کار؛ بیکاری جوانان در حوزه نرم‌افزار و خدمات مشتری

🔹 در ابتدا تصور می‌شد افزایش بیکاری میان توسعه‌دهندگان نرم‌افزار ناشی از استخدام بیش‌ازحد در سال‌های قبل است.
🔹 اما داده‌های جدید نشان می‌دهد موضوع فراتر از این است: بخش‌هایی مانند Junior Software Developers (22–25 ساله) و خدمات مشتری بیشترین ضربه را خورده‌اند.
🔹 اشتغال جوانان توسعه‌دهنده نرم‌افزار نسبت به اوج سال ۲۰۲۲ حدود ۲۰٪ کاهش یافته، در حالی که برای گروه‌های سنی بالاتر روند استخدام همچنان صعودی است.
🔹 الگوی مشابهی در خدمات مشتری دیده می‌شود؛ حوزه‌ای که به شدت در معرض جایگزینی با هوش مصنوعی قرار دارد.

⚠️ به بیان ساده، تقاضا برای نیروهای تازه‌وارد در این صنایع تقریبا از بین رفته است.
داریو آمودئی نیز پیش‌تر نسبت به این موج بیکاری هشدار داده بود.

@rss_ai_ir

#بیکاری #بازارکار #هوش_مصنوعی #AI #Software #CustomerService
👍9🔥5😁5🎉52
📌 خبر مهم از Anthropic

🔻 شرکت Anthropic رسماً اعلام کرده که قصد دارد مدل‌های خود (مثل Claude) را روی داده‌های کاربران هم آموزش دهد. این داده‌ها شامل تاریخچه چت‌ها و سشن‌های کدنویسی می‌شود.

🗓️ همه کاربران تا تاریخ ۲۸ سپتامبر ۲۰۲۵ باید تصمیم بگیرند که آیا اجازه استفاده از داده‌هایشان برای آموزش داده شود یا خیر.

🔑 جزئیات مهم:

♻️به صورت پیش‌فرض داده‌های شما استفاده نمی‌شوند. برای اشتراک‌گذاری باید حتماً روی گزینه Accept کلیک کنید.

♻️این سیاست فقط شامل چت‌های جدید یا دوباره شروع‌شده می‌شود. داده‌های قدیمی مشمول آن نخواهند بود.

♻️اگر قبول کنید، داده‌هایتان می‌توانند تا ۵ سال ذخیره شوند.

♻️این تغییر فقط برای کاربران عادی (Free, Pro, Max) اعمال می‌شود. API، Claude for Work، Gov و Education شامل آن نیستند.

♻️همچنین Anthropic تأکید کرده که کاربران حق انتخاب دارند و داده‌های حساس فیلتر یا ماسک می‌شوند.


⚡️ جمع‌بندی: این موضوع دیر یا زود اتفاق می‌افتاد، اما حداقل Anthropic به‌طور شفاف اطلاع‌رسانی کرده و به کاربران اختیار داده است.

🔗 متن کامل خبر

#AI_news #Claude #Anthropic #حریم_خصوصی

@rss_ai_ir
👍9🎉74😁4🔥2
🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents

🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیط‌های یادگیری تقویتی (RL Environments) را معرفی کرد.

🌍 محیط RL همان دنیای مجازی‌ای است که قوانین و سیستم پاداش آن تعریف می‌شود تا عامل‌ها در آن آموزش ببینند.

✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامه‌نویس نیاز به:

✳️محیط شبیه‌سازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپ‌لاین آموزش
✳️مجموعه داده‌های واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاه‌های بزرگ میلیون‌ها دلار هزینه دارد و در اوپن‌سورس تقریباً مشابهی وجود نداشت.

حالا Environments Hub این مشکل را حل می‌کند:

♻️اولین و تنها استور باز برای محیط‌های آماده RL
♻️شامل محیط‌هایی برای آموزش عامل‌های برنامه‌نویس، ریاضی‌دان، گیمر و بسیاری حوزه‌های دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL


💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عامل‌ها دانسته است.

🔗 خودتان ببینید: Environments Hub

#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents

@rss_ai_ir
😁10🔥64🎉3👍1
⚡️ معرفی OLMoASR؛ مدل‌های باز تشخیص گفتار از AI2

مؤسسه هوش مصنوعی آلن (AI2) خانواده‌ای از مدل‌های تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.

🎙️ مدل‌ها:

🟢 OLMoASR-tiny.en (۳۹M)

🟢 OLMoASR-base.en (۷۴M)

🟢 OLMoASR-small.en (۲۴۴M)

🟢 OLMoASR-medium.en (۷۶۹M)

🟠 OLMoASR-large.en-v1
(۱.۵B، آموزش‌دیده بر روی ۴۴۰ هزار ساعت صوت)

🟠 OLMoASR-large.en-v2
(۱.۵B، آموزش‌دیده بر روی ۶۸۰ هزار ساعت صوت)


📊 در تست روی ۲۱ دیتاست، عملکرد این مدل‌ها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، به‌ویژه روی فایل‌های صوتی طولانی، حتی از آن هم بهتر عمل کرده‌اند.

🔓 پروژه کاملاً اپن‌سورس است:

♻️انتشار وزن مدل‌ها
♻️دیتاست و کد پردازش داده‌ها
♻️اسکریپت‌های آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.


📌 لایسنس: Apache 2.0

🟡 مقاله
🟡 مجموعه مدل‌ها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub

#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news

@rss_ai_ir
7👍6🔥6🎉6
💡 یکی از جالب‌ترین کاربردهای Nano-Banana همین مینی‌اپ تازه‌دستکاری‌شده است:

📌 کافیست تصویر یک شیء را از کلیپ‌بورد وارد کنید؛ برنامه به‌صورت خودکار آن را به ایزومتریک تبدیل می‌کند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️

🔧 تغییرات جدید:

♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی


🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63

@rss_ai_ir

#nano_banana #isometric #SimCity #AItools #AI
👍1🔥1👏1
📌 لیست سالانه Time 100 AI منتشر شد

📰 مجله‌ی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهره‌های آشنا دیده می‌شن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِین‌فِن و چندین نام بزرگ دیگه.

اما 😅 همه‌چیز به این سادگی هم نیست...
چون غیبت بعضی غول‌ها حسابی توی چشم می‌زنه:

ایلیا سوتسکِوِر
جفری هینتون
دِمیس هاسابیس
نوآم براون
یان لِکون
مصطفی سلیمان
آراوینگ سری‌نیواس

در عوض، افرادی توی لیست دیده می‌شن که شاید انتظارش رو نداشتید:

پاپ فرانسیس!
ریک روبین (همون چهره‌ی وایرالِ "وایب‌کُدینگ" 🤣)
چند نویسنده، هنرمند و روزنامه‌نگار

👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضی‌ها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیش‌تر به جنبه‌ی فرهنگی و رسانه‌ای توجه شده.

🔗 لیست کامل رو می‌تونید اینجا ببینید: time.com/collections/time100-ai-2025/

@rss_ai_ir

#news #ai #ml #Time100 #AIInfluencers
1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid

گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم

📌 وقتی این دو فریم را به مدل‌های img2vid بدهیم، مدل تمام فریم‌های میانی را می‌سازد و یک انیمیشن روان تولید می‌کند.

🔹 نتیجه؟

شبیه حرکت دوربین واقعی 🎥

تغییر زاویه دید یا زوم طبیعی 🔍

ایجاد گذارهای سینمایی


به زبان ساده: به‌جای طراحی تک‌تک فریم‌ها، فقط شروع و پایان را بده، مدل خودش مسیر بین‌شان را پر می‌کند!

#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI

🆔 @rss_ai_ir
🔥2👍1👏1
📊 درآمدهای AI Native استارتاپ‌ها

گزارش تازه نشان می‌دهد که استارتاپ‌های «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیده‌اند.

🔴 نکته کلیدی:

♻️همچنین OpenAI به‌تنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکت‌ها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.


🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص داده‌اند.

💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی می‌کنند.

@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافته‌ی مدل‌های زبانی معرفی کرد.

ابزار Stax یک پروژه‌ی آزمایشی برای توسعه‌دهندگان است که جایگزینی برای تست‌های غیررسمی و اصطلاحاً vibe-testing ارائه می‌دهد و امکان ارزیابی داده‌محور و سیستماتیک مدل‌ها را فراهم می‌سازد.

🔹 همچنین Stax می‌تواند مدل‌ها را با استفاده از ارزیاب‌های آماده یا سفارشی بررسی کند.
🔹 متریک‌های اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسه‌ی نتایج مدل‌های مختلف همراه با شاخص‌های بصری عملکرد در دسترس است.

قابلیت‌ها:

♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصی‌سازی متریک‌ها متناسب با محصول
♻️جریان کاری end-to-end از مرحله‌ی نمونه‌سازی تا استقرار


🎯 هدف اصلی: کمک به توسعه‌دهندگان برای تصمیم‌گیری دقیق‌تر در انتخاب و به‌کارگیری مدل‌های زبانی.

@rss_ai_ir

#news #ai #ml #Google #Stax
👍1🔥1👏1
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts

محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کرده‌اند که مشکل اصلی مدل‌ها را حل می‌کند:
وقتی ویدئو طولانی می‌شود، توجه مدل بیش از حد «پف می‌کند»؛ محاسبات سنگین‌تر می‌شود، جزئیات از بین می‌رود، کاراکترها فراموش می‌شوند و تصویر «سر می‌خورد».


---

🔑 ایده اصلی: Mixture of Contexts

♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم می‌شود.
♻️هر کوئری فقط بخش‌های مرتبط را انتخاب می‌کند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام می‌شود (مقایسه ویژگی بخش‌ها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریم‌های آینده را می‌بندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخش‌های انتخاب‌شده اعمال می‌شود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.



---

📊 نتایج

♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنه‌های طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.



---

🎥 جمع‌بندی

✳️در ویدئوهای کوتاه، کیفیت حفظ می‌شود.
✳️در ویدئوهای طولانی، صحنه‌ها روان‌تر و کاراکترها پایدارتر هستند.
✳️زمان تولید به‌طور محسوسی کاهش می‌یابد.


🔑 نکته مهم:
مدل خودش یاد می‌گیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا می‌کند.

🔖 لینک مقاله

#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
👍2🔥2👏1