Нейронавт | Нейросети в творчестве

Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency

Создает 4D-сцены на гауссианах из одного изображения, управляемый рендер в реальном времени.

Код

#image2gaussian #image2video #imageto4d #gaussian #nivelview #realtime #4d

🔥7

1.79K viewsedited 11:14

0:32

Media is too big

VIEW IN TELEGRAM

TesserAct: Learning 4D Embodied World Models

Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.

За глубину отвечает Marigold, обещают прикрутить NormalCrafter

Код
Веса

#imageto4d #4d #image2video #image2scene #image2normal #image2depth

🔥6❤2

1.74K viewsedited 13:41

Нейронавт | Нейросети в творчестве

3:08

Media is too big

VIEW IN TELEGRAM

HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation

Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты

Код

#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d

👍6😱3

1.74K viewsedited 09:35

Нейронавт | Нейросети в творчестве

2:30

Media is too big

VIEW IN TELEGRAM

4D-LRM: Large Space-Time Reconstruction Model From and To Any View at Any Time

И тут же подобная работа от Adobe С КОДОМ‼️

Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.

Объединяет пространство и время, представляя объект как облако 4D гауссиан

Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100

Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)

Код должен быть, проверить не могу

#4D #videoto4D #gaussian #novelview #rendering #imageto4d

👍3🤯2

1.44K viewsedited 08:11

Нейронавт | Нейросети в творчестве

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

0:36

This media is not supported in your browser

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

Генератор 4D-сцен (динамические 3D-сцены) из одного изображения или видео. Позволяет смотреть на изображение или видео с новых ракурсов/

Под капотом затюненный диффузный видеогенератор

Работает с единым 6D-представлением видео - для каждой RGB точки известны ее XYZ координаты

Код ждем

#4d #imageto4d #videoto4d #image2depth #video2depth

👍6❤2👎2

1.49K views05:08

About

Blog

Apps

Platform