This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ویدئوسازی همزمان با Krea.ai
استارتاپ Krea ثبتنام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.
⚡ مشخصات:
♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی میتواند شامل پرامپت متنی، تصویر، اسکرینشات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً بهصورت همزمان ساخته میشود
🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر میخواهد ایجاد کند.
🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video
📌 به نظر میرسد این قابلیت بتواند انقلابی در طراحی، بازیسازی و تولید محتوا به وجود بیاورد.
#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI
@rss_ai_ir
استارتاپ Krea ثبتنام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.
⚡ مشخصات:
♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی میتواند شامل پرامپت متنی، تصویر، اسکرینشات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً بهصورت همزمان ساخته میشود
🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر میخواهد ایجاد کند.
🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video
📌 به نظر میرسد این قابلیت بتواند انقلابی در طراحی، بازیسازی و تولید محتوا به وجود بیاورد.
#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI
@rss_ai_ir
❤7👍6🎉6🔥4😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌈 ردیابی سهبعدی چندنما (Multi-View 3D Tracking) 🌈
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔥9🎉9👍5❤1😁1🙏1👌1
📉 شوک بازار کار؛ بیکاری جوانان در حوزه نرمافزار و خدمات مشتری
🔹 در ابتدا تصور میشد افزایش بیکاری میان توسعهدهندگان نرمافزار ناشی از استخدام بیشازحد در سالهای قبل است.
🔹 اما دادههای جدید نشان میدهد موضوع فراتر از این است: بخشهایی مانند Junior Software Developers (22–25 ساله) و خدمات مشتری بیشترین ضربه را خوردهاند.
🔹 اشتغال جوانان توسعهدهنده نرمافزار نسبت به اوج سال ۲۰۲۲ حدود ۲۰٪ کاهش یافته، در حالی که برای گروههای سنی بالاتر روند استخدام همچنان صعودی است.
🔹 الگوی مشابهی در خدمات مشتری دیده میشود؛ حوزهای که به شدت در معرض جایگزینی با هوش مصنوعی قرار دارد.
⚠️ به بیان ساده، تقاضا برای نیروهای تازهوارد در این صنایع تقریبا از بین رفته است.
داریو آمودئی نیز پیشتر نسبت به این موج بیکاری هشدار داده بود.
@rss_ai_ir
#بیکاری #بازارکار #هوش_مصنوعی #AI #Software #CustomerService
🔹 در ابتدا تصور میشد افزایش بیکاری میان توسعهدهندگان نرمافزار ناشی از استخدام بیشازحد در سالهای قبل است.
🔹 اما دادههای جدید نشان میدهد موضوع فراتر از این است: بخشهایی مانند Junior Software Developers (22–25 ساله) و خدمات مشتری بیشترین ضربه را خوردهاند.
🔹 اشتغال جوانان توسعهدهنده نرمافزار نسبت به اوج سال ۲۰۲۲ حدود ۲۰٪ کاهش یافته، در حالی که برای گروههای سنی بالاتر روند استخدام همچنان صعودی است.
🔹 الگوی مشابهی در خدمات مشتری دیده میشود؛ حوزهای که به شدت در معرض جایگزینی با هوش مصنوعی قرار دارد.
⚠️ به بیان ساده، تقاضا برای نیروهای تازهوارد در این صنایع تقریبا از بین رفته است.
داریو آمودئی نیز پیشتر نسبت به این موج بیکاری هشدار داده بود.
@rss_ai_ir
#بیکاری #بازارکار #هوش_مصنوعی #AI #Software #CustomerService
👍9🔥5😁5🎉5❤2
📌 خبر مهم از Anthropic
🔻 شرکت Anthropic رسماً اعلام کرده که قصد دارد مدلهای خود (مثل Claude) را روی دادههای کاربران هم آموزش دهد. این دادهها شامل تاریخچه چتها و سشنهای کدنویسی میشود.
🗓️ همه کاربران تا تاریخ ۲۸ سپتامبر ۲۰۲۵ باید تصمیم بگیرند که آیا اجازه استفاده از دادههایشان برای آموزش داده شود یا خیر.
🔑 جزئیات مهم:
♻️به صورت پیشفرض ❌ دادههای شما استفاده نمیشوند. برای اشتراکگذاری باید حتماً روی گزینه Accept کلیک کنید.
♻️این سیاست فقط شامل چتهای جدید یا دوباره شروعشده میشود. دادههای قدیمی مشمول آن نخواهند بود.
♻️اگر قبول کنید، دادههایتان میتوانند تا ۵ سال ذخیره شوند.
♻️این تغییر فقط برای کاربران عادی (Free, Pro, Max) اعمال میشود. API، Claude for Work، Gov و Education شامل آن نیستند.
♻️همچنین Anthropic تأکید کرده که کاربران حق انتخاب دارند و دادههای حساس فیلتر یا ماسک میشوند.
⚡️ جمعبندی: این موضوع دیر یا زود اتفاق میافتاد، اما حداقل Anthropic بهطور شفاف اطلاعرسانی کرده و به کاربران اختیار داده است.
🔗 متن کامل خبر
#AI_news #Claude #Anthropic #حریم_خصوصی
@rss_ai_ir
🔻 شرکت Anthropic رسماً اعلام کرده که قصد دارد مدلهای خود (مثل Claude) را روی دادههای کاربران هم آموزش دهد. این دادهها شامل تاریخچه چتها و سشنهای کدنویسی میشود.
🗓️ همه کاربران تا تاریخ ۲۸ سپتامبر ۲۰۲۵ باید تصمیم بگیرند که آیا اجازه استفاده از دادههایشان برای آموزش داده شود یا خیر.
🔑 جزئیات مهم:
♻️به صورت پیشفرض ❌ دادههای شما استفاده نمیشوند. برای اشتراکگذاری باید حتماً روی گزینه Accept کلیک کنید.
♻️این سیاست فقط شامل چتهای جدید یا دوباره شروعشده میشود. دادههای قدیمی مشمول آن نخواهند بود.
♻️اگر قبول کنید، دادههایتان میتوانند تا ۵ سال ذخیره شوند.
♻️این تغییر فقط برای کاربران عادی (Free, Pro, Max) اعمال میشود. API، Claude for Work، Gov و Education شامل آن نیستند.
♻️همچنین Anthropic تأکید کرده که کاربران حق انتخاب دارند و دادههای حساس فیلتر یا ماسک میشوند.
⚡️ جمعبندی: این موضوع دیر یا زود اتفاق میافتاد، اما حداقل Anthropic بهطور شفاف اطلاعرسانی کرده و به کاربران اختیار داده است.
🔗 متن کامل خبر
#AI_news #Claude #Anthropic #حریم_خصوصی
@rss_ai_ir
👍9🎉7❤4😁4🔥2
🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents
🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیطهای یادگیری تقویتی (RL Environments) را معرفی کرد.
🌍 محیط RL همان دنیای مجازیای است که قوانین و سیستم پاداش آن تعریف میشود تا عاملها در آن آموزش ببینند.
✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامهنویس نیاز به:
✳️محیط شبیهسازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپلاین آموزش
✳️مجموعه دادههای واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاههای بزرگ میلیونها دلار هزینه دارد و در اوپنسورس تقریباً مشابهی وجود نداشت.
⚡ حالا Environments Hub این مشکل را حل میکند:
♻️اولین و تنها استور باز برای محیطهای آماده RL
♻️شامل محیطهایی برای آموزش عاملهای برنامهنویس، ریاضیدان، گیمر و بسیاری حوزههای دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL
💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عاملها دانسته است.
🔗 خودتان ببینید: Environments Hub
#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents
@rss_ai_ir
🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیطهای یادگیری تقویتی (RL Environments) را معرفی کرد.
🌍 محیط RL همان دنیای مجازیای است که قوانین و سیستم پاداش آن تعریف میشود تا عاملها در آن آموزش ببینند.
✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامهنویس نیاز به:
✳️محیط شبیهسازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپلاین آموزش
✳️مجموعه دادههای واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاههای بزرگ میلیونها دلار هزینه دارد و در اوپنسورس تقریباً مشابهی وجود نداشت.
⚡ حالا Environments Hub این مشکل را حل میکند:
♻️اولین و تنها استور باز برای محیطهای آماده RL
♻️شامل محیطهایی برای آموزش عاملهای برنامهنویس، ریاضیدان، گیمر و بسیاری حوزههای دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL
💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عاملها دانسته است.
🔗 خودتان ببینید: Environments Hub
#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents
@rss_ai_ir
😁10🔥6❤4🎉3👍1
⚡️ معرفی OLMoASR؛ مدلهای باز تشخیص گفتار از AI2
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
❤7👍6🔥6🎉6
💡 یکی از جالبترین کاربردهای Nano-Banana همین مینیاپ تازهدستکاریشده است:
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
👍1🔥1👏1
📌 لیست سالانه Time 100 AI منتشر شد
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
❤1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
🔥2👍1👏1
📊 درآمدهای AI Native استارتاپها
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافتهی مدلهای زبانی معرفی کرد.
ابزار Stax یک پروژهی آزمایشی برای توسعهدهندگان است که جایگزینی برای تستهای غیررسمی و اصطلاحاً vibe-testing ارائه میدهد و امکان ارزیابی دادهمحور و سیستماتیک مدلها را فراهم میسازد.
🔹 همچنین Stax میتواند مدلها را با استفاده از ارزیابهای آماده یا سفارشی بررسی کند.
🔹 متریکهای اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسهی نتایج مدلهای مختلف همراه با شاخصهای بصری عملکرد در دسترس است.
✨ قابلیتها:
♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصیسازی متریکها متناسب با محصول
♻️جریان کاری end-to-end از مرحلهی نمونهسازی تا استقرار
🎯 هدف اصلی: کمک به توسعهدهندگان برای تصمیمگیری دقیقتر در انتخاب و بهکارگیری مدلهای زبانی.
@rss_ai_ir
#news #ai #ml #Google #Stax
ابزار Stax یک پروژهی آزمایشی برای توسعهدهندگان است که جایگزینی برای تستهای غیررسمی و اصطلاحاً vibe-testing ارائه میدهد و امکان ارزیابی دادهمحور و سیستماتیک مدلها را فراهم میسازد.
🔹 همچنین Stax میتواند مدلها را با استفاده از ارزیابهای آماده یا سفارشی بررسی کند.
🔹 متریکهای اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسهی نتایج مدلهای مختلف همراه با شاخصهای بصری عملکرد در دسترس است.
✨ قابلیتها:
♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصیسازی متریکها متناسب با محصول
♻️جریان کاری end-to-end از مرحلهی نمونهسازی تا استقرار
🎯 هدف اصلی: کمک به توسعهدهندگان برای تصمیمگیری دقیقتر در انتخاب و بهکارگیری مدلهای زبانی.
@rss_ai_ir
#news #ai #ml #Google #Stax
👍1🔥1👏1
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts
محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کردهاند که مشکل اصلی مدلها را حل میکند:
وقتی ویدئو طولانی میشود، توجه مدل بیش از حد «پف میکند»؛ محاسبات سنگینتر میشود، جزئیات از بین میرود، کاراکترها فراموش میشوند و تصویر «سر میخورد».
---
🔑 ایده اصلی: Mixture of Contexts
♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم میشود.
♻️هر کوئری فقط بخشهای مرتبط را انتخاب میکند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام میشود (مقایسه ویژگی بخشها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریمهای آینده را میبندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخشهای انتخابشده اعمال میشود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.
---
📊 نتایج
♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنههای طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.
---
🎥 جمعبندی
✳️در ویدئوهای کوتاه، کیفیت حفظ میشود.
✳️در ویدئوهای طولانی، صحنهها روانتر و کاراکترها پایدارتر هستند.
✳️زمان تولید بهطور محسوسی کاهش مییابد.
🔑 نکته مهم:
مدل خودش یاد میگیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا میکند.
🔖 لینک مقاله
#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کردهاند که مشکل اصلی مدلها را حل میکند:
وقتی ویدئو طولانی میشود، توجه مدل بیش از حد «پف میکند»؛ محاسبات سنگینتر میشود، جزئیات از بین میرود، کاراکترها فراموش میشوند و تصویر «سر میخورد».
---
🔑 ایده اصلی: Mixture of Contexts
♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم میشود.
♻️هر کوئری فقط بخشهای مرتبط را انتخاب میکند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام میشود (مقایسه ویژگی بخشها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریمهای آینده را میبندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخشهای انتخابشده اعمال میشود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.
---
📊 نتایج
♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنههای طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.
---
🎥 جمعبندی
✳️در ویدئوهای کوتاه، کیفیت حفظ میشود.
✳️در ویدئوهای طولانی، صحنهها روانتر و کاراکترها پایدارتر هستند.
✳️زمان تولید بهطور محسوسی کاهش مییابد.
🔑 نکته مهم:
مدل خودش یاد میگیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا میکند.
🔖 لینک مقاله
#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
👍2🔥2👏1