Нейронавт | Нейросети в творчестве – Telegram

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

9.25K subscribers

3.54K photos

3.05K videos

40 files

4.02K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

9.25K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

WavJourney: Compositional Audio Creation withLarge Language Models

Еще один интересный генератор звука, который я почему-то забыл запостить на прошлой неделе.

Интересен он тем что генерирует полную звуковую последовательность по сценарию. Скармиливаете ему сценарий с таймкодами (можно и без них) - на выходе получаете полноценную радиопрограмму или подкаст. Сценарий, кстати, тоже можете не писать, в демо реализован генератор сценария по текстовому запросу.

На видео генерация по запросу

Марсианские новости о запуске зонда к Альфа Центавра

Код
Демо

#text2audio

👍6

839 views07:43

Нейронавт | Нейросети в творчестве

Для генератора речи Bark появился демоспейс, можно клонировать голос по 20-секундному образцу.

Демо

#text2audio #tts #voicecloning #text2speech

1K views07:59

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Audio
Генератор музыки по текстовому запросу от Stability AI.
На бесплатном тарифе до 20 некоммерческих треков в месяц по 45 секунд.
Можено генерировать как готовые треки, так и отдельные инструменты и немузыкальные звуковые эффекты.
Загружается с трудом, видимо, там аншлаг.

Объявляю парад вашей генеративной музыки в комментариях

#text2music #text2audio

👍3🔥1

2.27K viewsedited 11:34

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Riffusion

Генератор песен, звучит офигительно, работает быстро.
Из минусов - продолжительность трека всего 12 секунд.

Запилил для вас пару цитат Бендера.
Кидайте творчество в коменты.

В коментах есть лайфхак

#text2music #text2song #text2audio

🔥4

1.01K viewsedited 06:30

Нейронавт | Нейросети в творчестве

Вот несколько важных штук о которых я вам не успевал рассказать. Текст честно с@$&дил у Олега. И тегов насыплю чтобы можно было найти по поиску

— Alibaba представили виртуальную примерку OutfitAnyone, загружаете фото и примеры одежды, получаете фото в одежде или даже анимацию 🕺💃 Демо, Сайт проекта.

— В Open-Source появилась модель Mistral 8x7b, превосходящая результаты GPT 3.5 при низких требованиях к железу 🔥 Подробнее, Попробовать.

— Разработчики выпустили Dobb-E: open-source framework для обучения домашних роботов 🤖 Сайт, Клип.

— Meta выпустила Foundation Model для генерации звука: голоса, музыки, спецэффектов и т.д 🎶 Ссылка.

— Google выпустили новый генератор музыки MusicFX. Работает для Штатов, Австралии и Кении 🎹 Слушать, Проверить здесь.

— RunwayML представили "text-to-speech" для генерации закадрового голоса и диалогов на несколько разных голосов 🎙 Ссылка.

— DeepMind представили FunSearch - метод исследования с использованием больших языковых моделей для открытия новых решений в математике и информатике 🌐 Блог-пост, Статья в Nature.

— Google выпустили новый генератор text2video 📽 Демо, Статья.

— StabilityAI выпустили Stable Zero123 для генерации 3D 🧊 Новость, Код.

— WonderJourney: модульный фреймворк с использованием LLM для генерации 3D-сцен и формирования "чудесных путешествий" 🌅 Сайт.

— PowerPaint: модель для редактирования изображений через инпейтинг, аутпейтинг и ControlNet 🖌 Сайт.

#inpainting #outpainting #textto3D #text2video #text2speech #text2music #voicecloning #text2audio #text2sound

КиберОлег 🦄🤖🙌

Привет, я Олег - ml engineer и основатель в tatradev.com и https://insomnia.land. В канале пишу простыми словами об искусственном интеллекте и стартапах. Welcome!

По вопросам сотрудничества:
t.me/cyber_oleg

🔥9❤2👍1👎1

1.86K viewsedited 10:54

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MAGNeT: Masked Audio Generation using a Single Non-Autoregressive Transformer

Генератор музыки/звука от Еврейского Университета Иерусалима

Код
Демо
Колаб

#text2music #text2audio

👍4❤2

1.34K viewsedited 07:06

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Stable Audio 2.0

Обновился генератор коммерческой музыки по промпту от Stability AI

В блоге написано что модель доступна на сайте, но при попытке ею воспользоваться мне показывают условия использования январской Version 1.2. Что это, ~~наипало~~ обман или забыли обновить текст?

На вход можно подать просто текстовое описание или аудиофайл. Продолжительность трека до 3 минут.

Заявлена генерация структурно полноценных инструментальных композиций с интро, развитием и финалом.

10 треков в месяц бесплатно.

Обещают доступ по API

Попробовать
бесконечный стрим

#text2music #text2audio #music2music #audio2music

🔥3

1.52K views16:31

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Elevenlabs прислали мне ранний доступ к своей новой фиче - генерация звуковых эффектов по текстовому описанию. На старте дают 10000 токенов. Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки Проверьте не открылся ли у вас доступ…

This media is not supported in your browser

VIEW IN TELEGRAM

Elevenlabs раскатали фичу генерации звуковых эффектов для всех

Elevenlabs Sound Effects

#text2audio

🔥20👍1

1.83K views05:50

Нейронавт | Нейросети в творчестве

Stable Audio Open

Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.

Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.

В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.

Код/веса
Демо

#text2audio #music2music #text2music

❤7👍4

1.41K views06:13

Нейронавт | Нейросети в творчестве

EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer|

Генератор звука по тексту. Заданные фразы от него будет трудно получить, а звуковые эффекты - норм

Код ждем
Демо

#text2audio

🔥5❤1👍1

1.71K views08:14

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Director

Думайте о Director как о ChatGPT для видео. Это платформа для создания видеоагентов, которые могут решать сложные видео-задачи, такие как поиск, редактирование, компиляция, генерация и т.д., и мгновенно транслировать результаты.

Код
Попробовать онлайн первые 50 видео - бесплатно

#videoediting #online #text2video #text2audio #text2movie

👍3❤1🔥1

1.71K views07:47

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Генератор звука по видео или текстовому описанию

Код
Демо
Колаб

#video2audio #video2sound #text2audio

👍10❤1🔥1

2.13K views08:11

Нейронавт | Нейросети в творчестве

Появились ноды для генератора звука MMAudio
Спасибо @p0lygon

ComfyUI-MMAudio

#ComfyUI

Нейронавт | Нейросети в творчестве

MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Генератор звука по видео или текстовому описанию

Код
Демо
Колаб

#video2audio #video2sound #text2audio

🔥11❤1

2.3K views07:54

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization

Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.

Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды

Код
Демо

#text2audio #text2sfx #foley

👍5❤1🔥1

1.75K views12:18

Нейронавт | Нейросети в творчестве

ComfyUI-TangoFlux

Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux

#text2audio #text2sfx #foley

GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…

ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...

👍6🔥4❤1

1.81K views10:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation

Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке

Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий

Демо
Код
Колаб ноутбуки

#text2audio #tta #audio2audio #audioinpainting

👍6

1.8K views14:25

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Lumina-Video-f24R960

Новая модель убийцы всего
Генератор видео со звуком (без звука тоже может) по тексту

#text2video #text2audio #multimodal

😁13😭8🔥4

2.1K views17:29

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Audio Open Small

Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM

До 11 секунд 44.1kHz стерео по тексту локально на мобилках

Веса
Гитхаб

#news #mobile #text2audio

🤔2👍1👏1

1.61K views11:34

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Minimax Lifelike Audio

Дизайн голоса - прорыв в области создания голоса:
Любой промпт, любой голос, любая эмоция
Полностью настраиваемый и многоязычный интерфейс

Речь по тексту, клонирование голоса, создание голоса. Музыку тоже может но это неточно

#voicecloning #tts #text2speech #voicedesign #text2audio #text2music

🔥10😐3👍1

2K views10:13

Нейронавт | Нейросети в творчестве

Minimax Voice Design завезли на fal.ai

Если есть кредиты, использовать здесь

#voicecloning #tts #text2speech #voicedesign #text2audio #text2music

👍2

1.8K views18:09