Нейронавт | Нейросети в творчестве
9.44K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Media is too big
VIEW IN TELEGRAM
Проактивного ИИ-агента Proactor уже можно потестить

На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки

Попробовать

#agent #realtime
👍3🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
SpatialTrackerV2: 3D Point Tracking Made Easy

Ура, новый трекер. Создан при участии ByteDance

Определяет движение камеры, геометрию сцены и траектории точек в пространстве. Работает в режиме реального времени

Код
Демо

#tracking #realtime
🔥11👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MirageLSD

Стилизация видеопотока

Попробовал - устаревшая шляпа какая-то на уровне SD. Зато на деньги Андрея Карпаты.
На вход принимает текстом описание стиля. Но кладет болт на ваш текст в 70% случаев.

Попробовать - ждете очереди играете минут 5. Можно стилизовать видео с вебки, видеофайл

#stylize #video2video #realtime #online
👍5😁1
Hedra Live Avatars

Аватары в реальном времени от Hedra
За болтовню на том конце отвечают Gemini, ElevenLabs или OpenAI

Попробовать если у вас есть кредиты

#avatar #realtime #voicemode #image2avatar
👍31👎1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Kitten TTS

#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма

По языкам нет информации. Должна завестись даже на Raspberry Pi

Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!

Код
Веса

#tts #text2speech #realtime
🔥12😱2🤔1
Matrix-Game 2.0: An Open-Source, Real-Time, and Streaming Interactive World Model

Вторая версия интерактивного генератора игровых миров от Skywork
Работает в реальном времени, 25 fps на A100 / H100, 24ГБ VRAM. Управление клавиатурой и мышью.
Опенсоросный ответ Genie 3

Основан на WanX, но без текстовой ветки, предсказывает следующие кадры только на основе визуала и действий.

Моделирует динамику сцен и создавать длительные видео

Код
HF

#image2world #image2game #realtime
🔥5👍3👎2👨‍💻1
Self-Forcing: Making AI Video Generation Endless

Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing

Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.

В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации

И выложил все в опенсорс

Требования: 24Gb VRAM, 64Gb RAM, Linux

Гитхаб
Реддит

#optimization #video2video #videoediting #realtime #text2video
🔥7👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Локальный Qwen 2.5 Omni распознает аккорды по звуку с микрофона

Сделано в Gabber - Real-time AI Engine

Реддит

#assistant #music2text #realtime
👍11
Mirage 2

Новая версия генератора игровых миров игрового движка от Dynamycs Lab

Можно загрузить свою картинку с описанием или без описания - создаст игру в вашей картинке.

Помимо направления движения можно крутить камеру курсорами, прыгать, атаковать. Ну и потом скачать видео игрового процесса.

Если персонаж затупил жмем Shift

Ну и можно делиться ссылкой на свой мир https://demo.dynamicslab.ai/chaos?init_id=aec81151-9a6b-48db-9c9a-2debd6ea7cbc

Подрезал у @cgevent

#game #realtime #world #text2world
👍8
Media is too big
VIEW IN TELEGRAM
Blocky: AI-Powered Agent Builder (Beta)

Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.

Ultravox n8n
Примеры на гитхабе

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Realtime Video

Krea запускает генерацию видео в реальном времени (12+ fps). На вход принимает рисование, текстовые подсказки, веб-камеру или стрим экрана

Под капотом подход основан на современных идеях “модели мира”: системах, которые изучают, как развиваются события и как меняются действия во времени.

Записаться в вейтлист

Спасибо @Colorental

#realtime #video2video #sketch2video
🔥8👍3
FastVLM: Efficient Vision Encoding for Vision Language Models

Семейство быстрых и легких #VLM от Apple
0.5B, 1.5B и 7B параметров
Способна работать на смартфоне

Гитхаб
HF

#assistant #realtime #mobile
7👍2