This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
StreamDiT: Real-Time Streaming Text-to-Video Generation
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
👍11
Media is too big
VIEW IN TELEGRAM
Проактивного ИИ-агента Proactor уже можно потестить
На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки
Попробовать
#agent #realtime
На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки
Попробовать
#agent #realtime
👍3🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
SpatialTrackerV2: 3D Point Tracking Made Easy
Ура, новый трекер. Создан при участии ByteDance
Определяет движение камеры, геометрию сцены и траектории точек в пространстве. Работает в режиме реального времени
Код
Демо
#tracking #realtime
Ура, новый трекер. Создан при участии ByteDance
Определяет движение камеры, геометрию сцены и траектории точек в пространстве. Работает в режиме реального времени
Код
Демо
#tracking #realtime
🔥11👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MirageLSD
Стилизация видеопотока
Попробовал - устаревшая шляпа какая-то на уровне SD. Зато на деньги Андрея Карпаты.
На вход принимает текстом описание стиля. Но кладет болт на ваш текст в 70% случаев.
Попробовать - ждете очереди играете минут 5. Можно стилизовать видео с вебки, видеофайл
#stylize #video2video #realtime #online
Стилизация видеопотока
Попробовал - устаревшая шляпа какая-то на уровне SD. Зато на деньги Андрея Карпаты.
На вход принимает текстом описание стиля. Но кладет болт на ваш текст в 70% случаев.
Попробовать - ждете очереди играете минут 5. Можно стилизовать видео с вебки, видеофайл
#stylize #video2video #realtime #online
👍5😁1
Hedra Live Avatars
Аватары в реальном времени от Hedra
За болтовню на том конце отвечают Gemini, ElevenLabs или OpenAI
Попробовать если у вас есть кредиты
#avatar #realtime #voicemode #image2avatar
Аватары в реальном времени от Hedra
За болтовню на том конце отвечают Gemini, ElevenLabs или OpenAI
Попробовать если у вас есть кредиты
#avatar #realtime #voicemode #image2avatar
👍3❤1👎1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Kitten TTS
#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма
По языкам нет информации. Должна завестись даже на Raspberry Pi
Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!
Код
Веса
#tts #text2speech #realtime
#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма
По языкам нет информации. Должна завестись даже на Raspberry Pi
Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!
Код
Веса
#tts #text2speech #realtime
🔥12😱2🤔1
Matrix-Game 2.0: An Open-Source, Real-Time, and Streaming Interactive World Model
Вторая версия интерактивного генератора игровых миров от Skywork
Работает в реальном времени, 25 fps на A100 / H100, 24ГБ VRAM. Управление клавиатурой и мышью.
Опенсоросный ответ Genie 3
Основан на WanX, но без текстовой ветки, предсказывает следующие кадры только на основе визуала и действий.
Моделирует динамику сцен и создавать длительные видео
Код
HF
#image2world #image2game #realtime
Вторая версия интерактивного генератора игровых миров от Skywork
Работает в реальном времени, 25 fps на A100 / H100, 24ГБ VRAM. Управление клавиатурой и мышью.
Опенсоросный ответ Genie 3
Основан на WanX, но без текстовой ветки, предсказывает следующие кадры только на основе визуала и действий.
Моделирует динамику сцен и создавать длительные видео
Код
HF
#image2world #image2game #realtime
🔥5👍3👎2👨💻1
Self-Forcing: Making AI Video Generation Endless
Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing
Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.
В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации
И выложил все в опенсорс
Требования: 24Gb VRAM, 64Gb RAM, Linux
Гитхаб
Реддит
#optimization #video2video #videoediting #realtime #text2video
Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing
Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.
В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации
И выложил все в опенсорс
Требования: 24Gb VRAM, 64Gb RAM, Linux
Гитхаб
Реддит
#optimization #video2video #videoediting #realtime #text2video
🔥7👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Локальный Qwen 2.5 Omni распознает аккорды по звуку с микрофона
Сделано в Gabber - Real-time AI Engine
Реддит
#assistant #music2text #realtime
Сделано в Gabber - Real-time AI Engine
Реддит
#assistant #music2text #realtime
👍11
Mirage 2
Новая версия генератора игровых миров игрового движка от Dynamycs Lab
Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.
Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.
Если персонаж затупил жмем Shift
Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc
Подрезал у @cgevent
#game #realtime #world #text2world
Новая версия генератора игровых миров игрового движка от Dynamycs Lab
Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.
Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.
Если персонаж затупил жмем Shift
Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc
Подрезал у @cgevent
#game #realtime #world #text2world
👍8
Media is too big
VIEW IN TELEGRAM
Blocky: AI-Powered Agent Builder (Beta)
Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.
Ultravox n8n
Примеры на гитхабе
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.
Ultravox n8n
Примеры на гитхабе
#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Realtime Video
Krea запускает генерацию видео в реальном времени (12+ fps). На вход принимает рисование, текстовые подсказки, веб-камеру или стрим экрана
Под капотом подход основан на современных идеях “модели мира”: системах, которые изучают, как развиваются события и как меняются действия во времени.
Записаться в вейтлист
Спасибо @Colorental
#realtime #video2video #sketch2video
Krea запускает генерацию видео в реальном времени (12+ fps). На вход принимает рисование, текстовые подсказки, веб-камеру или стрим экрана
Под капотом подход основан на современных идеях “модели мира”: системах, которые изучают, как развиваются события и как меняются действия во времени.
Записаться в вейтлист
Спасибо @Colorental
#realtime #video2video #sketch2video
🔥8👍3
❤7👍2