VIRSUN

🗣️ علی‌بابا با MoDA برگشت به صحنه!

یک معماری چندوجهی مبتنی بر Diffusion برای ساخت آواتارهای متحرک و talking head generation معرفی شده که کاملاً اپن‌سورس منتشر شده.

🔑 نکته جالب اینجاست که بعد از مدت‌ها انتظار برای کد پروژه‌هایی مثل EMO، بالاخره یک کد باز و آماده تست در اختیار داریم.

📌 پروژه: MoDA
📂 کد: GitHub

👀 در صفحه‌ی پروژه دموهایی از مقالات قدیمی و جدید ترکیب شده‌اند، و در بخش acknowledgements هم لیستی از منابع و پروژه‌های مرتبط مثل:
LivePortrait, EchoMimic, JoyVasa, Ditto, Open Facevid2vid, InsightFace, X-Pose, DiffPoseTalk, Hallo, wav2vec 2.0, Q-Align, Syncnet

⚡ نتیجه: یک فرصت عالی برای علاقه‌مندان به lip-sync و آواتارهای متحرک. کد را تست کنید، چون معلوم نیست همیشه در دسترس بماند!

#LipSync #MoDA #Alibaba #Diffusion
@rss_ai_ir

👍6🔥5🥰5👏5🎉5😁4❤3

3.06K views17:10

VIRSUN

🚀 متا با هوش مصنوعی، زبان ویدئوها را حذف می‌کند!

این هفته، شرکت متا (مالک اینستاگرام و فیسبوک) از یک قابلیت جدید و شگفت‌انگیز رونمایی کرد که می‌تواند نحوه تعامل ما با محتوای ویدئویی را برای همیشه تغییر دهد: ترجمه و دوبله صوتی آنی با هوش مصنوعی!

✅ این قابلیت دقیقاً چه کاری انجام می‌دهد؟

تصور کنید در حال تماشای یک ویدئوی آموزشی به زبان ژاپنی یا یک استندآپ کمدی به زبان آلمانی در اینستاگرام هستید. با این قابلیت جدید:

۱. ترجمه خودکار: هوش مصنوعی متا به صورت خودکار صدای اصلی ویدئو را به زبان شما (مثلاً فارسی) ترجمه می‌کند.
۲. تولید صدای جدید: سپس، یک صدای جدید با زبان ترجمه‌شده تولید می‌کند که جایگزین صدای اصلی می‌شود.
۳. هماهنگ‌سازی لب (Lip-sync): بخش جالب ماجرا اینجاست! هوش مصنوعی به صورت اختیاری می‌تواند حرکات لب گوینده را طوری تغییر دهد که با صدای دوبله‌شده هماهنگ به نظر برسد. انگار که آن شخص از ابتدا به زبان شما صحبت می‌کرده است!

❌ چرا این خبر اینقدر مهم است؟

✳️ شکستن barreiras زبانی: این بزرگترین مانع برای تولیدکنندگان محتوا و مخاطبان در سراسر جهان است. با این فناوری، محتوای شما می‌تواند بدون هیچ زحمتی به یک مخاطب جهانی دست پیدا کند.
✳️ افزایش دسترسی‌پذیری: افرادی که با زبان‌های دیگر مشکل دارند یا کم‌شنوا هستند، می‌توانند از محتوای بیشتری بهره‌مند شوند.
✳️ نمایش قدرت هوش مصنوعی مولد: این یک مثال عملی و فوق‌العاده از قدرت هوش مصنوعی مولد (Generative AI) در دنیای واقعی است که فراتر از تولید متن و عکس رفته و وارد حوزه صدا و ویدئو شده است.

⛔️ نگرانی‌ها و چالش‌ها

البته این فناوری چالش‌های خود را نیز دارد؛ از جمله احتمال ساخت ویدئوهای جعلی (Deepfake) و نگرانی در مورد حفظ اصالت و لحن اصلی گوینده. متا اعلام کرده که برای جلوگیری از سوءاستفاده، راهکارهایی را در نظر گرفته است.

نتیجه‌گیری:
این گام بزرگ متا نشان می‌دهد که آینده محتوا، جهانی و بدون مرزهای زبانی خواهد بود. به زودی، تماشای هر ویدئویی از هر کجای دنیا به زبان مادری خودمان، به یک امر عادی تبدیل خواهد شد.

#خبر_هوش_مصنوعی #متا #اینستاگرام #فیسبوک #ترجمه_صوتی #دوبله_هوشمند #هوش_مصنوعی_مولد #فناوری #آینده_محتوا #AI_News #Meta #LipSync

👍8😁8🔥7👏7❤4🥰3🎉3

200 views04:25

About

Blog

Apps

Platform