Нейронавт | Нейросети в творчестве
9.38K subscribers
3.62K photos
3.12K videos
40 files
4.09K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.

Код
Демо

#assistant #voiceassistant #speech
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Talk to Claude

Демоспейс для поболтать с Claude голосом

Вам понадобится Anthropic API Key, а также логин и API Key от PlayHT

#voicechat #voiceassistant
👍3
fish.audio

Быстрый и качественный опенсорсный голосовой движок!

Состоит из модели голоса Fish Speech и агента Fish Agent
В команде - разработчики RVC, So-VITS-SVC
Клонирует голос по отрывку речи 10-30 секунд.
Есть готовые голоса на офсайте.
Помимо клонирования много другого умеет.
Увы, русского пока нет в числе поддерживаемых языков.

Демо на HF - текст в речь
Демо на офсайте с выбором голоса
Демо агента на HF - загружаете аудио и даете агенту задания
Голосовой чат
Гитхаб

#voicecloning #text2speech #tts #agent #voiceassistant
🔥9
Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
Blocky: AI-Powered Agent Builder (Beta)

Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.

Ultravox n8n
Примеры на гитхабе

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
👍2