This media is not supported in your browser
VIEW IN TELEGRAM
WavJourney: Compositional Audio Creation withLarge Language Models
Еще один интересный генератор звука, который я почему-то забыл запостить на прошлой неделе.
Интересен он тем что генерирует полную звуковую последовательность по сценарию. Скармиливаете ему сценарий с таймкодами (можно и без них) - на выходе получаете полноценную радиопрограмму или подкаст. Сценарий, кстати, тоже можете не писать, в демо реализован генератор сценария по текстовому запросу.
На видео генерация по запросу
Демо
#text2audio
Еще один интересный генератор звука, который я почему-то забыл запостить на прошлой неделе.
Интересен он тем что генерирует полную звуковую последовательность по сценарию. Скармиливаете ему сценарий с таймкодами (можно и без них) - на выходе получаете полноценную радиопрограмму или подкаст. Сценарий, кстати, тоже можете не писать, в демо реализован генератор сценария по текстовому запросу.
На видео генерация по запросу
Марсианские новости о запуске зонда к Альфа Центавра
КодДемо
#text2audio
👍6
Для генератора речи Bark появился демоспейс, можно клонировать голос по 20-секундному образцу.
Демо
#text2audio #tts #voicecloning #text2speech
Демо
#text2audio #tts #voicecloning #text2speech
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Audio
Генератор музыки по текстовому запросу от Stability AI.
На бесплатном тарифе до 20 некоммерческих треков в месяц по 45 секунд.
Можено генерировать как готовые треки, так и отдельные инструменты и немузыкальные звуковые эффекты.
Загружается с трудом, видимо, там аншлаг.
Объявляю парад вашей генеративной музыки в комментариях
#text2music #text2audio
Генератор музыки по текстовому запросу от Stability AI.
На бесплатном тарифе до 20 некоммерческих треков в месяц по 45 секунд.
Можено генерировать как готовые треки, так и отдельные инструменты и немузыкальные звуковые эффекты.
Загружается с трудом, видимо, там аншлаг.
Объявляю парад вашей генеративной музыки в комментариях
#text2music #text2audio
👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Riffusion
Генератор песен, звучит офигительно, работает быстро.
Из минусов - продолжительность трека всего 12 секунд.
Запилил для вас пару цитат Бендера.
Кидайте творчество в коменты.
В коментах есть лайфхак
#text2music #text2song #text2audio
Генератор песен, звучит офигительно, работает быстро.
Из минусов - продолжительность трека всего 12 секунд.
Запилил для вас пару цитат Бендера.
Кидайте творчество в коменты.
В коментах есть лайфхак
#text2music #text2song #text2audio
🔥4
Вот несколько важных штук о которых я вам не успевал рассказать. Текст честно с@$&дил у Олега. И тегов насыплю чтобы можно было найти по поиску
— Alibaba представили виртуальную примерку OutfitAnyone, загружаете фото и примеры одежды, получаете фото в одежде или даже анимацию 🕺💃 Демо, Сайт проекта.
— В Open-Source появилась модель Mistral 8x7b, превосходящая результаты GPT 3.5 при низких требованиях к железу 🔥 Подробнее, Попробовать.
— Разработчики выпустили Dobb-E: open-source framework для обучения домашних роботов 🤖 Сайт, Клип.
— Meta выпустила Foundation Model для генерации звука: голоса, музыки, спецэффектов и т.д 🎶 Ссылка.
— Google выпустили новый генератор музыки MusicFX. Работает для Штатов, Австралии и Кении 🎹 Слушать, Проверить здесь.
— RunwayML представили "text-to-speech" для генерации закадрового голоса и диалогов на несколько разных голосов 🎙 Ссылка.
— DeepMind представили FunSearch - метод исследования с использованием больших языковых моделей для открытия новых решений в математике и информатике 🌐 Блог-пост, Статья в Nature.
— Google выпустили новый генератор text2video 📽 Демо, Статья.
— StabilityAI выпустили Stable Zero123 для генерации 3D 🧊 Новость, Код.
— WonderJourney: модульный фреймворк с использованием LLM для генерации 3D-сцен и формирования "чудесных путешествий" 🌅 Сайт.
— PowerPaint: модель для редактирования изображений через инпейтинг, аутпейтинг и ControlNet 🖌 Сайт.
#inpainting #outpainting #textto3D #text2video #text2speech #text2music #voicecloning #text2audio #text2sound
— Alibaba представили виртуальную примерку OutfitAnyone, загружаете фото и примеры одежды, получаете фото в одежде или даже анимацию 🕺💃 Демо, Сайт проекта.
— В Open-Source появилась модель Mistral 8x7b, превосходящая результаты GPT 3.5 при низких требованиях к железу 🔥 Подробнее, Попробовать.
— Разработчики выпустили Dobb-E: open-source framework для обучения домашних роботов 🤖 Сайт, Клип.
— Meta выпустила Foundation Model для генерации звука: голоса, музыки, спецэффектов и т.д 🎶 Ссылка.
— Google выпустили новый генератор музыки MusicFX. Работает для Штатов, Австралии и Кении 🎹 Слушать, Проверить здесь.
— RunwayML представили "text-to-speech" для генерации закадрового голоса и диалогов на несколько разных голосов 🎙 Ссылка.
— DeepMind представили FunSearch - метод исследования с использованием больших языковых моделей для открытия новых решений в математике и информатике 🌐 Блог-пост, Статья в Nature.
— Google выпустили новый генератор text2video 📽 Демо, Статья.
— StabilityAI выпустили Stable Zero123 для генерации 3D 🧊 Новость, Код.
— WonderJourney: модульный фреймворк с использованием LLM для генерации 3D-сцен и формирования "чудесных путешествий" 🌅 Сайт.
— PowerPaint: модель для редактирования изображений через инпейтинг, аутпейтинг и ControlNet 🖌 Сайт.
#inpainting #outpainting #textto3D #text2video #text2speech #text2music #voicecloning #text2audio #text2sound
Telegram
КиберОлег 🦄🤖🙌
Привет, я Олег - ml engineer и основатель в tatradev.com и https://insomnia.land. В канале пишу простыми словами об искусственном интеллекте и стартапах. Welcome!
По вопросам сотрудничества:
t.me/cyber_oleg
По вопросам сотрудничества:
t.me/cyber_oleg
🔥9❤2👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
MAGNeT: Masked Audio Generation using a Single Non-Autoregressive Transformer
Генератор музыки/звука от Еврейского Университета Иерусалима
Код
Демо
Колаб
#text2music #text2audio
Генератор музыки/звука от Еврейского Университета Иерусалима
Код
Демо
Колаб
#text2music #text2audio
👍4❤2
Stable Audio 2.0
Обновился генератор коммерческой музыки по промпту от Stability AI
В блоге написано что модель доступна на сайте, но при попытке ею воспользоваться мне показывают условия использования январской Version 1.2. Что это,наипало обман или забыли обновить текст?
На вход можно подать просто текстовое описание или аудиофайл. Продолжительность трека до 3 минут.
Заявлена генерация структурно полноценных инструментальных композиций с интро, развитием и финалом.
10 треков в месяц бесплатно.
Обещают доступ по API
Попробовать
бесконечный стрим
#text2music #text2audio #music2music #audio2music
Обновился генератор коммерческой музыки по промпту от Stability AI
В блоге написано что модель доступна на сайте, но при попытке ею воспользоваться мне показывают условия использования январской Version 1.2. Что это,
На вход можно подать просто текстовое описание или аудиофайл. Продолжительность трека до 3 минут.
Заявлена генерация структурно полноценных инструментальных композиций с интро, развитием и финалом.
10 треков в месяц бесплатно.
Обещают доступ по API
Попробовать
бесконечный стрим
#text2music #text2audio #music2music #audio2music
🔥3
Нейронавт | Нейросети в творчестве
Elevenlabs прислали мне ранний доступ к своей новой фиче - генерация звуковых эффектов по текстовому описанию. На старте дают 10000 токенов. Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки Проверьте не открылся ли у вас доступ…
This media is not supported in your browser
VIEW IN TELEGRAM
🔥20👍1
Stable Audio Open
Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.
Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.
В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.
Код/веса
Демо
#text2audio #music2music #text2music
Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.
Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.
В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.
Код/веса
Демо
#text2audio #music2music #text2music
❤7👍4
EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм
Код ждем
Демо
#text2audio
🔥5❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Director
Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.
Код
Попробовать онлайн первые 50 видео - бесплатно
#videoediting #online #text2video #text2audio #text2movie
Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.
Код
Попробовать онлайн первые 50 видео - бесплатно
#videoediting #online #text2video #text2audio #text2movie
👍3❤1🔥1
Media is too big
VIEW IN TELEGRAM
MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
👍10❤1🔥1
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization
Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.
Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды
Код
Демо
#text2audio #text2sfx #foley
Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.
Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды
Код
Демо
#text2audio #text2sfx #foley
👍5❤1🔥1
ComfyUI-TangoFlux
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
GitHub
GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…
ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...
👍6🔥4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation
Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке
Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий
Демо
Код
Колаб ноутбуки
#text2audio #tta #audio2audio #audioinpainting
Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке
Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий
Демо
Код
Колаб ноутбуки
#text2audio #tta #audio2audio #audioinpainting
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Lumina-Video-f24R960
Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту
#text2video #text2audio #multimodal
Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту
#text2video #text2audio #multimodal
😁13😭8🔥4
Stable Audio Open Small
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
🤔2👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Minimax Lifelike Audio
Речь по тексту, клонирование голоса, создание голоса. Музыку тоже может но это неточно
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
Дизайн голоса - прорыв в области создания голоса:
Любой промпт, любой голос, любая эмоция
Полностью настраиваемый и многоязычный интерфейс
Речь по тексту, клонирование голоса, создание голоса. Музыку тоже может но это неточно
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
🔥10😐3👍1
Minimax Voice Design завезли на fal.ai
Если есть кредиты, использовать здесь
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
Если есть кредиты, использовать здесь
#voicecloning #tts #text2speech #voicedesign #text2audio #text2music
👍2