Hummingbird-0
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
👍9😐2
Media is too big
VIEW IN TELEGRAM
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis
Говорящий аватар / оживлятор портретов от Alibaba с контролем интенсивности движения. работает с разными крупностями кадра и позами, с разными типами персонажей
Сравнение с конкурентами впечатляет.
Построен на базе Wan2.1
Код
#portraitanimation #image2video #speech2video #humananimation #lipsync #talkinghead
Говорящий аватар / оживлятор портретов от Alibaba с контролем интенсивности движения. работает с разными крупностями кадра и позами, с разными типами персонажей
Сравнение с конкурентами впечатляет.
Построен на базе Wan2.1
Код
#portraitanimation #image2video #speech2video #humananimation #lipsync #talkinghead
👍9
Heygen Avatar IV
Сервис Heygen запустил обновленную функцию оживления портретов.
Достаточно закинуть фото и текст.
А также создали MCP сервер
Доки
Гитхаб
#postrainanimation #lipsync #text2speech #tts #image2video #mcp
Сервис Heygen запустил обновленную функцию оживления портретов.
Достаточно закинуть фото и текст.
А также создали MCP сервер
Доки
Гитхаб
#postrainanimation #lipsync #text2speech #tts #image2video #mcp
👍7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔2❤1👎1
Bob Interactive character playground
Липсинк трех персонажей в браузере. Не трех одновременно, а всего на выбор три персонажа. Голос у каждого свой. Но почему-то девчачий голос из моего не получается даже из фальцета. Enjoy
#lipsync
Липсинк трех персонажей в браузере. Не трех одновременно, а всего на выбор три персонажа. Голос у каждого свой. Но почему-то девчачий голос из моего не получается даже из фальцета. Enjoy
#lipsync
👍5❤1😁1
HunyuanPortrait
Аниматор-оживлятор портретов от Tencent.
Переносит на портрет мимику и движения головы с референсного видео
Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM
Код
Веса
#portrainanimation #lipsync #characteranimation #motion2video
Аниматор-оживлятор портретов от Tencent.
Переносит на портрет мимику и движения головы с референсного видео
Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM
Код
Веса
#portrainanimation #lipsync #characteranimation #motion2video
👍7😁2🤔2❤1
Hunyuan Video Avatar
Видеоаватар с контролем эмоций от Tencent
Оживляет персонажа по голосу. Речь может сгенерить сам по тексту. На выбор несколько голосов
Модель прожорливая: минимум 24 ГБ VRAM для 704x768, а для плавного 4K рекомендуют GPU на 96 ГБ.
Код
Попробовать - на китайском офсайте. Одна секунда Илона Маска генерилась несколько минут
Веса
#lipsync #characteranimation #speech2video #talkinghead #portrainanimation
Видеоаватар с контролем эмоций от Tencent
Оживляет персонажа по голосу. Речь может сгенерить сам по тексту. На выбор несколько голосов
Модель прожорливая: минимум 24 ГБ VRAM для 704x768, а для плавного 4K рекомендуют GPU на 96 ГБ.
Код
Попробовать - на китайском офсайте. Одна секунда Илона Маска генерилась несколько минут
Веса
#lipsync #characteranimation #speech2video #talkinghead #portrainanimation
👍5😁2
This media is not supported in your browser
VIEW IN TELEGRAM
PlayDiffusion
Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...
Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.
Принимает на вход аудио до 50 секунд, файл до 50Мб
Попробовать на офсайте
Демо на HF
Веса
Код
Еще из новинок сервиса: липсинк
#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech
Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...
Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.
Принимает на вход аудио до 50 секунд, файл до 50Мб
Попробовать на офсайте
Демо на HF
Веса
Код
Еще из новинок сервиса: липсинк
#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech
👍8❤1
SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers
Оживлятор портретов по аудиофайлу речи от SkyReels
Умеет делать липсинк видео
Похоже что код и веса публиковать не собираются
Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов
#lipsync #portraitanimation #speech2video #image2video
Оживлятор портретов по аудиофайлу речи от SkyReels
Умеет делать липсинк видео
Похоже что код и веса публиковать не собираются
Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов
#lipsync #portraitanimation #speech2video #image2video
👍4👎4
HeyGem
Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться
- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +
Код
#lipsync #humanavatar #vocecloning #avatar #
Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться
- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +
Код
#lipsync #humanavatar #vocecloning #avatar #
😐8🔥7👍3
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
MultiTalk: Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation
Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.
- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи
Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.
- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи
Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
👍9❤3😁2💩1
Появился демоспейс липсинка MultiTalk
Демо
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
Демо
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
❤8
OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation
Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать
Есть веса для WAN 1.3B и WAN 14B
Код
#portraitanimation #characteranimation #lipsync
Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать
Есть веса для WAN 1.3B и WAN 14B
Код
#portraitanimation #characteranimation #lipsync
👍9👎2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Опубликован код / веса оживлятора портретов FLOAT
Код
Веса
#talkinghead #speech2video #facialanimation #lipsync
Код
Веса
#talkinghead #speech2video #facialanimation #lipsync
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс оживлятора персонажей OmniAvatar.
Сейчас ему плохо, можно чекнуть чуть позже
Демо
#portraitanimation #characteranimation #lipsync
Сейчас ему плохо, можно чекнуть чуть позже
Демо
#portraitanimation #characteranimation #lipsync
1👍10
This media is not supported in your browser
VIEW IN TELEGRAM
У кого не работает демоспейс OmniAvatar попробуйте зайти с другого браузера.
К сожалению бесплатного тарифа хватает всего на 6 секунд оживляжа, мы так и не узнаем о каких триллионах говорил Трамп
#portraitanimation #characteranimation #lipsync #neuronaut_art
К сожалению бесплатного тарифа хватает всего на 6 секунд оживляжа, мы так и не узнаем о каких триллионах говорил Трамп
#portraitanimation #characteranimation #lipsync #neuronaut_art
😁8👍1
SkyReels-A3
Анонсировали (или релизнули - непонятно) новый "непревзойденный" оживлятор персонажей по речи / пению.
И зачем-то дали ссылку на пустой репозиторий.
И ссылку на свой сервис где непонятно где искать новую модель.
Умеет создавать длинные ("неограниченно длинные") видео, несколько минут, сохраняя идентичность персонажа.
Умеет создавать профессиональное движение камеры
Гитхаб (пусто)
Попробовать видимо здесь
[UPDATE] Мне показали где он прячется, картинка в коментах. Он только для платных пользователей
#lipsync #portraitanimation #characteranimation #speech2video
Анонсировали (или релизнули - непонятно) новый "непревзойденный" оживлятор персонажей по речи / пению.
И зачем-то дали ссылку на пустой репозиторий.
И ссылку на свой сервис где непонятно где искать новую модель.
Умеет создавать длинные ("неограниченно длинные") видео, несколько минут, сохраняя идентичность персонажа.
Умеет создавать профессиональное движение камеры
Гитхаб (пусто)
Попробовать видимо здесь
[UPDATE] Мне показали где он прячется, картинка в коментах. Он только для платных пользователей
#lipsync #portraitanimation #characteranimation #speech2video
👍5👎2❤1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
EchoMimicV3
Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.
Что-то там про мультимодальность и мультизадачность в архитектуре говорят.
Умеет делать взаимодействие с объектами, пение.
Выглядит несколько деревянно, но весит всего 3Гб с хвостиком
Код
Веса
#lipsync #portraitanimation #characteranimation #speech2video
Оживлятор персонажей по голосу на 1.3B параметров на основе Wan 2.1 1.3B.
Что-то там про мультимодальность и мультизадачность в архитектуре говорят.
Умеет делать взаимодействие с объектами, пение.
Выглядит несколько деревянно, но весит всего 3Гб с хвостиком
Код
Веса
#lipsync #portraitanimation #characteranimation #speech2video
👎6🔥2🤔2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Pika audio-driven performance model
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
👍2
StableAvatar: Infinite-Length Audio-Driven Avatar Video Generation
🥁🥁🥁 барабанная дробь
И у нас еще один оживлятор картинок по звуку от Microsoft Research Asia, Hunyuan, Tencent
Много примеров с пением, видимо фокус на эту нишу. Но есть и просто речь.
Обещают неограниченный по длительности оживляж с сохранением идентичности персонажа.
Мне кажется или липсинк не такой уж и синк, не попадает в речь?
Ну и конечно есть видео превосходства над #SOTA моделями-конкурентами
Построен на базе Wan2.1-1.3B
Разрешение: 512x512, 480x832, 832x480
5-секундное видео (480x832, fps=25) генерируется 3 минуты на 4090 и требует 18GB VRAM
Код
#lipsync #portraitanimation #characteranimation #speech2video #avatar
🥁🥁🥁 барабанная дробь
И у нас еще один оживлятор картинок по звуку от Microsoft Research Asia, Hunyuan, Tencent
Много примеров с пением, видимо фокус на эту нишу. Но есть и просто речь.
Обещают неограниченный по длительности оживляж с сохранением идентичности персонажа.
Мне кажется или липсинк не такой уж и синк, не попадает в речь?
Ну и конечно есть видео превосходства над #SOTA моделями-конкурентами
Построен на базе Wan2.1-1.3B
Разрешение: 512x512, 480x832, 832x480
5-секундное видео (480x832, fps=25) генерируется 3 минуты на 4090 и требует 18GB VRAM
Код
#lipsync #portraitanimation #characteranimation #speech2video #avatar
👍6🔥4❤1