This media is not supported in your browser
VIEW IN TELEGRAM
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.
Код
Демо
#assistant #voiceassistant #speech
Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.
Код
Демо
#assistant #voiceassistant #speech
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Talk to Claude
Демоспейс для поболтать с Claude голосом
Вам понадобится Anthropic API Key, а также логин и API Key от PlayHT
#voicechat #voiceassistant
Демоспейс для поболтать с Claude голосом
Вам понадобится Anthropic API Key, а также логин и API Key от PlayHT
#voicechat #voiceassistant
👍3
fish.audio
Быстрый и качественный опенсорсный голосовой движок!
Состоит из модели голоса Fish Speech и агента Fish Agent
В команде - разработчики RVC, So-VITS-SVC
Клонирует голос по отрывку речи 10-30 секунд.
Есть готовые голоса на офсайте.
Помимо клонирования много другого умеет.
Увы, русского пока нет в числе поддерживаемых языков.
Демо на HF - текст в речь
Демо на офсайте с выбором голоса
Демо агента на HF - загружаете аудио и даете агенту задания
Голосовой чат
Гитхаб
#voicecloning #text2speech #tts #agent #voiceassistant
Быстрый и качественный опенсорсный голосовой движок!
Состоит из модели голоса Fish Speech и агента Fish Agent
В команде - разработчики RVC, So-VITS-SVC
Клонирует голос по отрывку речи 10-30 секунд.
Есть готовые голоса на офсайте.
Помимо клонирования много другого умеет.
Увы, русского пока нет в числе поддерживаемых языков.
Демо на HF - текст в речь
Демо на офсайте с выбором голоса
Демо агента на HF - загружаете аудио и даете агенту задания
Голосовой чат
Гитхаб
#voicecloning #text2speech #tts #agent #voiceassistant
🔥9
Ultravox
Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!
Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API
Гитхаб
Веса
Демо
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!
Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API
Гитхаб
Веса
Демо
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
Blocky: AI-Powered Agent Builder (Beta)
Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.
Ultravox n8n
Примеры на гитхабе
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.
Ultravox n8n
Примеры на гитхабе
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
👍2