Hertz-dev
Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена
Код
Демо
Веса
Hallucinator - Pinokio/Github
#audio2audio #speech #audioextension
Первая опенсорсная базовая модель для генерации разговорного звука.
Полный дуплеккс, то есть может генерить одновременно два голоса диалога, каждый в отдельном латентном канале генерации.
Основная способность модели - продолжение входного аудио.
Работает в 16 кГц
Поддержка русского силами подписчиков не обнаружена
Код
Демо
Веса
Hallucinator - Pinokio/Github
#audio2audio #speech #audioextension
🔥11🤯3❤1👍1😐1