⚡️ معرفی OLMoASR؛ مدلهای باز تشخیص گفتار از AI2
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
❤7👍6🔥6🎉6