Media is too big
VIEW IN TELEGRAM
ThinkSound
Модель от Tongyi Lab (авторов InspireMusic и много чего еще) создаёт реалистичный звук для видео. Архитектура - цепочка рассуждений (#CoT). Необычно для генерилки звука, да? Скоро достижения языковых моделей будут везде, к этому все идет.
Модель сначала генерирует общий звуковой фон, затем улучшает качество звука конкретных объектов на экране и, наконец, редактирует всё это по текстовым указаниям пользователя
Код
Демо
Спасибо @p0lygon
#Video2sfx #foley #sfx #audioediting #video2audio #text2sfx
Модель от Tongyi Lab (авторов InspireMusic и много чего еще) создаёт реалистичный звук для видео. Архитектура - цепочка рассуждений (#CoT). Необычно для генерилки звука, да? Скоро достижения языковых моделей будут везде, к этому все идет.
Модель сначала генерирует общий звуковой фон, затем улучшает качество звука конкретных объектов на экране и, наконец, редактирует всё это по текстовым указаниям пользователя
Код
Демо
Спасибо @p0lygon
#Video2sfx #foley #sfx #audioediting #video2audio #text2sfx
🔥14👍1🤔1
Для рассуждающего генератора звука ThinkSound опубликован код обучения/файнтюна
Модель облегчили, оптимизировали расход памяти и GPU? упростили установку
Код
Демо
#Video2sfx #foley #sfx #audioediting #video2audio #text2sfx #any2audio
Модель облегчили, оптимизировали расход памяти и GPU? упростили установку
Код
Демо
#Video2sfx #foley #sfx #audioediting #video2audio #text2sfx #any2audio
👍5
Media is too big
VIEW IN TELEGRAM
HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation
Генератор звука к видео с текстовыми подсказками от Hunyuan
По ссылке в заголовке тонна примеров
Офсайт
Код
HF
Демо
#foley #video2audio #video2sound #sfx #video2sfx
Генератор звука к видео с текстовыми подсказками от Hunyuan
По ссылке в заголовке тонна примеров
Офсайт
Код
HF
Демо
#foley #video2audio #video2sound #sfx #video2sfx
❤6👍1🔥1
ComfyUI HunyuanVideo-Foley
Подвезли ноду озвучивалки видео HunyuanVideo-Foley
#comfyUI #foley #video2audio #video2sound #sfx #video2sfx
Подвезли ноду озвучивалки видео HunyuanVideo-Foley
#comfyUI #foley #video2audio #video2sound #sfx #video2sfx
🔥6👍1
Нейронавт | Нейросети в творчестве
Video
Media is too big
VIEW IN TELEGRAM
Стало мне любопытно на каком языке озвучивает HunyuanVideo-Foley
Мне звучит как смесь китайского и немецкого.
Пихнул озвученный им самый драматичный эпизод русских сериалов в разные нейродубляжки. Мало кто умеет автоматически определять язык исходника. Rask.ai - один из тех кто умеет. Короче все кто умеет, определили эту речь как английскую. Ну и неудивительно, шотландцы например порой разговаривают на таком английском который мало кто из носителей языка в силах понять.
Ну и дубляж на русский с нейросетевого - вашему вниманию.
Хвастайтесь в коментах своими экспериментами
#humor #foley #video2audio #video2sound #sfx #video2sfx
Мне звучит как смесь китайского и немецкого.
Пихнул озвученный им самый драматичный эпизод русских сериалов в разные нейродубляжки. Мало кто умеет автоматически определять язык исходника. Rask.ai - один из тех кто умеет. Короче все кто умеет, определили эту речь как английскую. Ну и неудивительно, шотландцы например порой разговаривают на таком английском который мало кто из носителей языка в силах понять.
Ну и дубляж на русский с нейросетевого - вашему вниманию.
Хвастайтесь в коментах своими экспериментами
#humor #foley #video2audio #video2sound #sfx #video2sfx
😁21😭2👍1🔥1