This media is not supported in your browser
VIEW IN TELEGRAM
🗣️ علیبابا با MoDA برگشت به صحنه!
یک معماری چندوجهی مبتنی بر Diffusion برای ساخت آواتارهای متحرک و talking head generation معرفی شده که کاملاً اپنسورس منتشر شده.
🔑 نکته جالب اینجاست که بعد از مدتها انتظار برای کد پروژههایی مثل EMO، بالاخره یک کد باز و آماده تست در اختیار داریم.
📌 پروژه: MoDA
📂 کد: GitHub
👀 در صفحهی پروژه دموهایی از مقالات قدیمی و جدید ترکیب شدهاند، و در بخش acknowledgements هم لیستی از منابع و پروژههای مرتبط مثل:
LivePortrait, EchoMimic, JoyVasa, Ditto, Open Facevid2vid, InsightFace, X-Pose, DiffPoseTalk, Hallo, wav2vec 2.0, Q-Align, Syncnet
⚡ نتیجه: یک فرصت عالی برای علاقهمندان به lip-sync و آواتارهای متحرک. کد را تست کنید، چون معلوم نیست همیشه در دسترس بماند!
#LipSync #MoDA #Alibaba #Diffusion
@rss_ai_ir
یک معماری چندوجهی مبتنی بر Diffusion برای ساخت آواتارهای متحرک و talking head generation معرفی شده که کاملاً اپنسورس منتشر شده.
🔑 نکته جالب اینجاست که بعد از مدتها انتظار برای کد پروژههایی مثل EMO، بالاخره یک کد باز و آماده تست در اختیار داریم.
📌 پروژه: MoDA
📂 کد: GitHub
👀 در صفحهی پروژه دموهایی از مقالات قدیمی و جدید ترکیب شدهاند، و در بخش acknowledgements هم لیستی از منابع و پروژههای مرتبط مثل:
LivePortrait, EchoMimic, JoyVasa, Ditto, Open Facevid2vid, InsightFace, X-Pose, DiffPoseTalk, Hallo, wav2vec 2.0, Q-Align, Syncnet
⚡ نتیجه: یک فرصت عالی برای علاقهمندان به lip-sync و آواتارهای متحرک. کد را تست کنید، چون معلوم نیست همیشه در دسترس بماند!
#LipSync #MoDA #Alibaba #Diffusion
@rss_ai_ir
👍6🔥5🥰5👏5🎉5😁4❤3
🚀 متا با هوش مصنوعی، زبان ویدئوها را حذف میکند!
این هفته، شرکت متا (مالک اینستاگرام و فیسبوک) از یک قابلیت جدید و شگفتانگیز رونمایی کرد که میتواند نحوه تعامل ما با محتوای ویدئویی را برای همیشه تغییر دهد: ترجمه و دوبله صوتی آنی با هوش مصنوعی!
✅ این قابلیت دقیقاً چه کاری انجام میدهد؟
تصور کنید در حال تماشای یک ویدئوی آموزشی به زبان ژاپنی یا یک استندآپ کمدی به زبان آلمانی در اینستاگرام هستید. با این قابلیت جدید:
۱. ترجمه خودکار: هوش مصنوعی متا به صورت خودکار صدای اصلی ویدئو را به زبان شما (مثلاً فارسی) ترجمه میکند.
۲. تولید صدای جدید: سپس، یک صدای جدید با زبان ترجمهشده تولید میکند که جایگزین صدای اصلی میشود.
۳. هماهنگسازی لب (Lip-sync): بخش جالب ماجرا اینجاست! هوش مصنوعی به صورت اختیاری میتواند حرکات لب گوینده را طوری تغییر دهد که با صدای دوبلهشده هماهنگ به نظر برسد. انگار که آن شخص از ابتدا به زبان شما صحبت میکرده است!
❌ چرا این خبر اینقدر مهم است؟
✳️ شکستن barreiras زبانی: این بزرگترین مانع برای تولیدکنندگان محتوا و مخاطبان در سراسر جهان است. با این فناوری، محتوای شما میتواند بدون هیچ زحمتی به یک مخاطب جهانی دست پیدا کند.
✳️ افزایش دسترسیپذیری: افرادی که با زبانهای دیگر مشکل دارند یا کمشنوا هستند، میتوانند از محتوای بیشتری بهرهمند شوند.
✳️ نمایش قدرت هوش مصنوعی مولد: این یک مثال عملی و فوقالعاده از قدرت هوش مصنوعی مولد (Generative AI) در دنیای واقعی است که فراتر از تولید متن و عکس رفته و وارد حوزه صدا و ویدئو شده است.
⛔️ نگرانیها و چالشها
البته این فناوری چالشهای خود را نیز دارد؛ از جمله احتمال ساخت ویدئوهای جعلی (Deepfake) و نگرانی در مورد حفظ اصالت و لحن اصلی گوینده. متا اعلام کرده که برای جلوگیری از سوءاستفاده، راهکارهایی را در نظر گرفته است.
نتیجهگیری:
این گام بزرگ متا نشان میدهد که آینده محتوا، جهانی و بدون مرزهای زبانی خواهد بود. به زودی، تماشای هر ویدئویی از هر کجای دنیا به زبان مادری خودمان، به یک امر عادی تبدیل خواهد شد.
#خبر_هوش_مصنوعی #متا #اینستاگرام #فیسبوک #ترجمه_صوتی #دوبله_هوشمند #هوش_مصنوعی_مولد #فناوری #آینده_محتوا #AI_News #Meta #LipSync
این هفته، شرکت متا (مالک اینستاگرام و فیسبوک) از یک قابلیت جدید و شگفتانگیز رونمایی کرد که میتواند نحوه تعامل ما با محتوای ویدئویی را برای همیشه تغییر دهد: ترجمه و دوبله صوتی آنی با هوش مصنوعی!
✅ این قابلیت دقیقاً چه کاری انجام میدهد؟
تصور کنید در حال تماشای یک ویدئوی آموزشی به زبان ژاپنی یا یک استندآپ کمدی به زبان آلمانی در اینستاگرام هستید. با این قابلیت جدید:
۱. ترجمه خودکار: هوش مصنوعی متا به صورت خودکار صدای اصلی ویدئو را به زبان شما (مثلاً فارسی) ترجمه میکند.
۲. تولید صدای جدید: سپس، یک صدای جدید با زبان ترجمهشده تولید میکند که جایگزین صدای اصلی میشود.
۳. هماهنگسازی لب (Lip-sync): بخش جالب ماجرا اینجاست! هوش مصنوعی به صورت اختیاری میتواند حرکات لب گوینده را طوری تغییر دهد که با صدای دوبلهشده هماهنگ به نظر برسد. انگار که آن شخص از ابتدا به زبان شما صحبت میکرده است!
❌ چرا این خبر اینقدر مهم است؟
✳️ شکستن barreiras زبانی: این بزرگترین مانع برای تولیدکنندگان محتوا و مخاطبان در سراسر جهان است. با این فناوری، محتوای شما میتواند بدون هیچ زحمتی به یک مخاطب جهانی دست پیدا کند.
✳️ افزایش دسترسیپذیری: افرادی که با زبانهای دیگر مشکل دارند یا کمشنوا هستند، میتوانند از محتوای بیشتری بهرهمند شوند.
✳️ نمایش قدرت هوش مصنوعی مولد: این یک مثال عملی و فوقالعاده از قدرت هوش مصنوعی مولد (Generative AI) در دنیای واقعی است که فراتر از تولید متن و عکس رفته و وارد حوزه صدا و ویدئو شده است.
⛔️ نگرانیها و چالشها
البته این فناوری چالشهای خود را نیز دارد؛ از جمله احتمال ساخت ویدئوهای جعلی (Deepfake) و نگرانی در مورد حفظ اصالت و لحن اصلی گوینده. متا اعلام کرده که برای جلوگیری از سوءاستفاده، راهکارهایی را در نظر گرفته است.
نتیجهگیری:
این گام بزرگ متا نشان میدهد که آینده محتوا، جهانی و بدون مرزهای زبانی خواهد بود. به زودی، تماشای هر ویدئویی از هر کجای دنیا به زبان مادری خودمان، به یک امر عادی تبدیل خواهد شد.
#خبر_هوش_مصنوعی #متا #اینستاگرام #فیسبوک #ترجمه_صوتی #دوبله_هوشمند #هوش_مصنوعی_مولد #فناوری #آینده_محتوا #AI_News #Meta #LipSync
👍8😁8🔥7👏7❤4🥰3🎉3