Нейронавт | Нейросети в творчестве

AudioPaLM
A Large Language Model That Can Speak and Listen

Google представил модель понимания и генерации речи, способную переводить речь на разные языки. В основе архитектуры текстовая модель PALM-2 и речевая AudioLM
При переводе AudioPaLM сохраняет индивидуальные характеристики и интонации оригинального голоса.
На сайте множество примеров.

Кода нет

#audio2audio #speech2speech

619 views07:13

0:20

ai-coustics

У Adobe podcast появляются конкуренты. Сервис для улучшения звука на аудио. Можно записывать свой микрофон прямо на сайте.

#audio2audio #audiodenoise #enhance

❤1

754 views11:29

Eleanor_wide_trim_720p_auphonic.webm

1.9 MB

Auphonic

Еще один мощный улучшайзер звука. Но тут уже есть ограничение: бесплатно обрабатывает только два часа материала в месяц. Зато возможности великолепные

- удаление шума/эха
- удаление нежелательных частот (деессер)
- автоуровень - автоматически выравнивает громкость микса
- Стандарты громкости. Можно задать целевую громкость, true peak limit, MaxLRA
- разбивает на главы
- мультитрековые алгоритмы (ducking, crosstalk removal, noise gate)

И все это делается буквально в несколько кликов

Для сравнения закинул в него демку от ai-coustics
Вычистил радикальнее, но уже слышны искажения. Зато есть несколько опций с которыми можно поиграть

#audio2audio #audiodenoise #audioprocessing #audiomixing #enhance

776 viewsedited 11:47

Emad: А если все — суперы программисты, то никто не программист. О том что программистов, по его мнению, через 5 лет не будет твиттер

https://youtu.be/9i0MVSwIivE

Split Audio Tracks to MusicGen

Смотрите какой демоспейс.
Загружаете в него музыкальный трек, он распиливает его на инструменты как Vocalremover или Fadr.
Сразу выбираете какой трек хотите использовать и жмете Load your chosen track. Теперь можно отдельную вырезанную из песни партию использовать как затравку для MusicGen.

Пишем промт, черрипикаем, черрипикаем, черрипикаем. Понравившееся можно перемиксовать с оригиналом в любимой DAW или видеоредакторе. Вуаля, вы кавермейкер.

Важно: Чтобы получить правильный темп и тональность, надо прописать их в промте. В моем примере было "113 BPM, G#m key" И после этого вероятно, придется темп еще немного скорректировать при сборке.

Чуть не забыл. Это демка, и максимально можно сгенерить 30 секунд за раз.

#aicover #music2music #audio2audio #Nuronaut_art

YouTube

Neuro Rickroll

Кавер сделан нейросетью.
Если хотите туториал, оставьте комментарий, желательно из 4 или более слов.
Подробности в телеграм: https://yangx.top/GreenNeuralRobots

#aicovers #rickroll #нейрокавер

🔥5👍2

815 viewsedited 11:36

1:07

VampNet: Music Generation via Masked Acoustic Token Modeling

Качественный генератор музыки с уклоном в экспериментальную, конкурент MusicGen
Только без текстовой подсказки. Может делать вариации и продолжить музыку из затравки.

Код найден благодаря @tech_wizart
Примеры
Примеры с LoRA дообучением
Демо

#music2music #audio2audio

👍5

765 viewsedited 10:43

Бонус
Аудиоредактор Audacity с интергрированным доступом к нейросеткам с HuggingFace от авторов VampNet (предыдущий пост). Это неофициальная пока сборка в статусе Pull request на гитхабе Audacity

#audio2audio #tools

🔥6

612 viewsedited 10:51

VampNet: Music Generation via Masked Acoustic Token Modeling Качественный генератор музыки с уклоном в экспериментальную, конкурент MusicGen Только без текстовой подсказки. Может делать вариации и продолжить музыку из затравки. Код найден благодаря @tech_wizart…

0:53

Подъехал демоспейс VampNet

#music2music #audio2audio

657 views07:44

1:18

Unloop

ИИ-лупер для музыкантов c VampNet под капотом. Придумывает на лету свои вариации сыгранных вами фрагментов.

Unloop представляет собой патч для MAX. Надеюсь, музыканты знают что это такое, потому что я не знаю. Инструкция по установке по ссылке:

Код

#music2music #audio2audio #AImusic

👍1

660 views08:16

2:18

Голландский диджей Уммет Озкан показывает как превращать свой голос в любые музыкальные инструменты с помощью Musicfy (от $7.99 в месяц).

Можно напеть мелодию и получить полноценный инструментальный трек.

Полная инструкция

#voice2music #audio2audio #sound2music #music2music

2.9K views07:28

0:23

AudioSR: Versatile Audio Super-resolution at Scale

Улучшение качества звука на основе диффузии. Музыка, речь - все улучшит.
На примерах звучит волшебно.
AudioSR может преобразовать любой входной аудиосигнал в диапазоне частот от 2 кГц до 16 кГц в аудиосигнал высокого разрешения с полосой пропускания 24 кГц и частотой дискретизации 48 кГц.
Одно из применений - улучшение результатов генераторов музыки и речи.

Код

#audio2audio #upsample #audioenhance #audiodenoise

😱2

1.23K viewsedited 08:25

1:33

AudioSep: Separate Anything You Describe

Конкурент VAST. Отделяет заданный звук из микса по тестовому запросу

Код
Демо
Колаб

#audio2audio #audioseparation #unmix

❤1

940 views09:55

3:15

Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing

Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps

Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.

Кода пока нет

#LLM #text2music #music2music #audio2audio

1.07K viewsedited 15:31

1:35

Semantic hearing

В Университете Вашингтона сконструировали наушники, которые позволяют слышать лишь то что хотите, отсекая нежелательные источники звука

Статья [ENG]

#news #audio2audio #segmentation

👍6🔥1😁1

1.72K views14:29

0:32

Resemble Enhance: Open Source Speech Super Resolution AI Model

Наконец достойный опенсорсный конкурент чистки звука Nvidia Broadcast/Adobe enhance

Код
Демо
Колаб

#audio2audio #audiodenoise #audioenhance

👍12❤1

1.76K views10:47

0:14

Voice isolator

Изоляция голоса от Elevenlabs

#audio2audio #voice #unmix #audio2stem

🔥24

1.55K viewsedited 07:17

0:58

1:12

Hertz-dev

Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена

Код
Демо
Веса
Hallucinator - Pinokio/Github

#audio2audio #speech #audioextension

🔥11🤯3❤1👍1😐1

1.58K views08:06

0:17

Fast Music Remover

Удаление фонового шума с аудиозаписи

Код

#noisereduction #audio2audio #audio2stem #audioseparation #voiceisolation

👍15🔥2❤1

1.95K views09:12

0:35

Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation

Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке

Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий

Демо
Код
Колаб ноутбуки

#text2audio #tta #audio2audio #audioinpainting

👍6

1.81K views14:25

1:07