Нейронавт | Нейросети в творчестве
9.27K subscribers
3.55K photos
3.06K videos
40 files
4.03K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

Языковая модель для голосового общения. По русски не умеет.Может слышать и говорить, одновременно думая.

Код
Демо

#assistant #voiceassistant #speech
👍9
Hertz-dev

Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена

Код
Демо
Веса
Hallucinator - Pinokio/Github

#audio2audio #speech #audioextension
🔥11🤯31👍1😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Voice-Pro: The best gradio web-ui for transcription, translation and text-to-speech

Приложение для работы с речью - транскрибация, перевод и генерация речи по тексту.

Под капотом Whisper, Google Translator, Edge TTS. Поддерживает 100 языков. С учетом начинки можно рассчитывать на поддержку русского языка.

Умеет скачивать видео с ютуба, конвертировать в аудио, отделять речь из микса. Есть пакетная обработка и рилтайм

‼️Будьте осторожны. Уже есть пострадавшие. Устанавливайте если знаете что делаете
это говно снесло мне Nvidia app при конфигурации и видуха тупо перестала работать


#tts #stt #dubbing #text2speech #speech2 text #speech
👍9🤔5🤯2