⚡️ معرفی OLMoASR؛ مدلهای باز تشخیص گفتار از AI2
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
❤7👍6🔥6🎉6
💡 یکی از جالبترین کاربردهای Nano-Banana همین مینیاپ تازهدستکاریشده است:
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
👍1🔥1👏1
📌 لیست سالانه Time 100 AI منتشر شد
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
❤1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
🔥3👍1👏1
📊 درآمدهای AI Native استارتاپها
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافتهی مدلهای زبانی معرفی کرد.
ابزار Stax یک پروژهی آزمایشی برای توسعهدهندگان است که جایگزینی برای تستهای غیررسمی و اصطلاحاً vibe-testing ارائه میدهد و امکان ارزیابی دادهمحور و سیستماتیک مدلها را فراهم میسازد.
🔹 همچنین Stax میتواند مدلها را با استفاده از ارزیابهای آماده یا سفارشی بررسی کند.
🔹 متریکهای اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسهی نتایج مدلهای مختلف همراه با شاخصهای بصری عملکرد در دسترس است.
✨ قابلیتها:
♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصیسازی متریکها متناسب با محصول
♻️جریان کاری end-to-end از مرحلهی نمونهسازی تا استقرار
🎯 هدف اصلی: کمک به توسعهدهندگان برای تصمیمگیری دقیقتر در انتخاب و بهکارگیری مدلهای زبانی.
@rss_ai_ir
#news #ai #ml #Google #Stax
ابزار Stax یک پروژهی آزمایشی برای توسعهدهندگان است که جایگزینی برای تستهای غیررسمی و اصطلاحاً vibe-testing ارائه میدهد و امکان ارزیابی دادهمحور و سیستماتیک مدلها را فراهم میسازد.
🔹 همچنین Stax میتواند مدلها را با استفاده از ارزیابهای آماده یا سفارشی بررسی کند.
🔹 متریکهای اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسهی نتایج مدلهای مختلف همراه با شاخصهای بصری عملکرد در دسترس است.
✨ قابلیتها:
♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصیسازی متریکها متناسب با محصول
♻️جریان کاری end-to-end از مرحلهی نمونهسازی تا استقرار
🎯 هدف اصلی: کمک به توسعهدهندگان برای تصمیمگیری دقیقتر در انتخاب و بهکارگیری مدلهای زبانی.
@rss_ai_ir
#news #ai #ml #Google #Stax
👍1🔥1👏1