Нейронавт | Нейросети в творчестве
9.29K subscribers
3.56K photos
3.07K videos
40 files
4.03K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Sesame CSM 1B

На прошлой неделе Sesame AI Labs показали интерактивную демку крышесносной голосовой модели, вам еще предлагали практиковать на ней английский.

Сейчас уже доступны веса и код

Модель генерирует RVQ аудио коды по входному тексту и аудио. Плюс, под капотом помогает Llama с декодером

Возможен файнтюн на разные голоса

На русский из коробки не стоит рассчитывать. В датасете был в основном английский.

Код
Веса

#voicemode #text2speech #csm
10🔥1