Нейронавт | Нейросети в творчестве
Elevenlabs прислали мне ранний доступ к своей новой фиче - генерация звуковых эффектов по текстовому описанию. На старте дают 10000 токенов. Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки Проверьте не открылся ли у вас доступ…
This media is not supported in your browser
VIEW IN TELEGRAM
🔥20👍1
Stable Audio Open
Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.
Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.
В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.
Код/веса
Демо
#text2audio #music2music #text2music
Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.
Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.
В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.
Код/веса
Демо
#text2audio #music2music #text2music
❤7👍4
EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
🔥5❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Director
Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.
Код
Попробовать онлайн первые 50 видео - бесплатно
#videoediting #online #text2video #text2audio #text2movie
Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.
Код
Попробовать онлайн первые 50 видео - бесплатно
#videoediting #online #text2video #text2audio #text2movie
👍3❤1🔥1
Media is too big
VIEW IN TELEGRAM
MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
👍10❤1🔥1
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization
Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.
Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды
Код
Демо
#text2audio #text2sfx #foley
Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.
Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды
Код
Демо
#text2audio #text2sfx #foley
👍5❤1🔥1
ComfyUI-TangoFlux
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
GitHub
GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…
ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...
👍6🔥4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation
Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке
Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий
Демо
Код
Колаб ноутбуки
#text2audio #tta #audio2audio #audioinpainting
Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке
Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий
Демо
Код
Колаб ноутбуки
#text2audio #tta #audio2audio #audioinpainting
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Lumina-Video-f24R960
Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту
#text2video #text2audio #multimodal
Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту
#text2video #text2audio #multimodal
😁13😭8🔥4
Stable Audio Open Small
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
🤔2👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Minimax Lifelike Audio
Речь по тексту, клонирование голоса, создание голоса. Музыку тоже может но это неточно
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
Дизайн голоса - прорыв в области создания голоса:
Любой промпт, любой голос, любая эмоция
Полностью настраиваемый и многоязычный интерфейс
Речь по тексту, клонирование голоса, создание голоса. Музыку тоже может но это неточно
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
🔥10😐3👍1
Minimax Voice Design завезли на fal.ai
Если есть кредиты, использовать здесь
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
Если есть кредиты, использовать здесь
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
👍2