Нейронавт | Нейросети в творчестве

Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.

Код
Демо

#assistant #voiceassistant #speech

👍9

1.59K views12:46

0:58

This media is not supported in your browser

VIEW IN TELEGRAM

1:12

This media is not supported in your browser

VIEW IN TELEGRAM

Hertz-dev

Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена

Код
Демо
Веса
Hallucinator - Pinokio/Github

#audio2audio #speech #audioextension

🔥11🤯3❤1👍1😐1

1.58K views08:06

Нейронавт | Нейросети в творчестве

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

Voice-Pro: The best gradio web-ui for transcription, translation and text-to-speech

Приложение для работы с речью - транскрибация, перевод и генерация речи по тексту.

Под капотом Whisper, Google Translator, Edge TTS. Поддерживает 100 языков. С учетом начинки можно рассчитывать на поддержку русского языка.

Умеет скачивать видео с ютуба, конвертировать в аудио, отделять речь из микса. Есть пакетная обработка и рилтайм

‼️Будьте осторожны. Уже есть пострадавшие. Устанавливайте если знаете что делаете

это говно снесло мне Nvidia app при конфигурации и видуха тупо перестала работать

#tts #stt #dubbing #text2speech #speech2 text #speech

👍9🤔5🤯2

1.94K viewsedited 10:13

About

Blog

Apps

Platform