Нейронавт | Нейросети в творчестве

Chatterbox TTS

Генератор речи в опенсорсе от Resemble AI

#SOTA в клонировании голоса без обучения? клонирует по 5-секундному образцу

Под капотом 0.5B Llama.
Уникальный контроль выразительности.
Водяные знаки на выходе.
Легкий скрипт для конверсии голоса.
Превосходит ElevenLabs.

Есть в Pinokio

Код
Демо - по русски не понимает, генерирует эльфийский
Веса

#tts #text2speech #voicecloning

👍7❤3👎1

1.77K views12:46

Нейронавт | Нейросети в творчестве

3:54

Media is too big

VIEW IN TELEGRAM

ElevenLabs v3

Пользоваться этим сервисом - слишком попоболь, но вдруг вы мазохист или не россиянин - для вас выкатили самую выразительную модель озвучки текста.

- Поддерживает 70+ языков
- многоголосовой режим
- аудио-теги, которые задают интонацию, эмоции и паузы в речи.
- Считывает эмоциональные переходы, реагирует на контекст, меняет тон в процессе речи.

Весь июнь дают 80% скидки на генерацию.

Промпт-гайд для v3

#tts #text2pseech

👍2

1.57K views09:42

Нейронавт | Нейросети в творчестве

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

fluxions AI vui

Небольшие разговорные модели речи, которые могут запускаться на устройстве

Это опенсорсный конкурент notebooklm

Голосовая модель 100М параметров

Умеет клонировать голос

модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат

Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.

Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.

Vui.COHOST - диалоговая модель двух собеседников

Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов

Код
Веса
Демо - здесь будет HF демоспейс

#tts #text2speech #voicecloning #conversation #mobile

🔥8❤2

2.04K views12:41

Нейронавт | Нейросети в творчестве

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

Chatterbox Audiobook Generator

По Chatterbox уже много свистоперделок вышло, вот одна из них. Мультиголосовой генератор аудиокниг / подкастов

Код

#audiobook #tts #text2audiobook #podcast #text2podcast

👍9

1.73K views07:43

Нейронавт | Нейросети в творчестве

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Minimax Lifelike Audio

Дизайн голоса - прорыв в области создания голоса:
Любой промпт, любой голос, любая эмоция
Полностью настраиваемый и многоязычный интерфейс

Речь по тексту, клонирование голоса, создание голоса. Музыку тоже может но это неточно

#voicecloning #tts #text2speech #voicedesign #text2audio #text2music

🔥10😐3👍1

2.03K views10:13

Нейронавт | Нейросети в творчестве

заработал демоспейс мобильного генератора речи и подкастов vui

По-русски ни бельмес

Демо

#tts #text2speech #voicecloning #conversation #mobile #podcast

0:24

Нейронавт | Нейросети в творчестве

fluxions AI vui

Небольшие разговорные модели речи, которые могут запускаться на устройстве

Это опенсорсный конкурент notebooklm

Голосовая модель 100М параметров

Умеет клонировать голос

модели могут издавать различные неречевые звуки. Добавляйте в текст…

🔥5🎃1

1.58K views07:07

Нейронавт | Нейросети в творчестве

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

Kyutai TTS

Генератор речи в реальном времени. Выдает аудиопоток начиная с первых текстовых токенов, без необходимости знать весь текст заранее.

Клонирует голоса на основе 10-секундного аудиообразца. Эта функция сейчас недоступна

Предоставляет таймкоды для каждого генерируемого слова. Это позволяет использовать модель для создания субтитров в реальном времени

Но на данный момент знает только английский и французский языки

Код
Веса
Колаб

#tts #text2speech #voicecloning #realtime

👍11

1.77K views08:11

Нейронавт | Нейросети в творчестве

1:04

This media is not supported in your browser

VIEW IN TELEGRAM

Hume EVI 3

Модель от Hume AI клонирует не только голос, но язык и манеру говорить.
Может работать в связке с разными LLM

Обещают в ближайшем будущем поддержку многих языков

Для доступа притворитесь что вы не в РФ

Попробовать
Попробовать в Playground

#tts #text2speech #voicecloning

👍10

1.76K viewsedited 09:11

Нейронавт | Нейросети в творчестве

Русский F5‑TTS

Голосовая модель дообученная на русский язык на 5000+ часов.
Есть сравнение с X‑TTS и FishSpeech

для изменения ударения поставьте символ + перед ударной гласной (молок+о → молокó).
Для автоматической расстановки ударений можно использовать модель RUAccent

веса

#tts #russian #text2speech

GitHub

GitHub - Den4ikAI/ruaccent: Простой расстановщик ударений с обработкой омографов

Простой расстановщик ударений с обработкой омографов - Den4ikAI/ruaccent

🔥16👍7😁2

1.99K views09:12

Нейронавт | Нейросети в творчестве

Русский F5‑TTS Голосовая модель дообученная на русский язык на 5000+ часов. Есть сравнение с X‑TTS и FishSpeech для изменения ударения поставьте символ + перед ударной гласной (молок+о → молокó). Для автоматической расстановки ударений можно использовать…

RUaccent портативная сборка от подписчика @muxastarikov

#tts #russian #text2speech

GitHub

GitHub - mikheys/ruaccent_portable

Contribute to mikheys/ruaccent_portable development by creating an account on GitHub.

👍9🤯1