Нейронавт | Нейросети в творчестве

MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview

👍4🔥1

1.65K views15:19

Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator

И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения

Код
Демо

#image2depth

👍14🔥3

2.15K views05:33

0:19

LBM: Latent Bridge Matching for Fast Image-to-Image Translation

Универсальный метод преобразования изображений

Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение

Код
Демо (релайтинг)

#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration

❤5👍1🔥1

1.9K views11:18

0:19

Immersity 4.0

Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой

Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:

3D Motion
3D Image
3D Video Simple

#image2depth #image2video #monoculardepth #parallax

👍4

1.69K viewsedited 14:09

DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation

👍10

1.91K views08:00

0:32

Media is too big

TesserAct: Learning 4D Embodied World Models

Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.

За глубину отвечает Marigold, обещают прикрутить NormalCrafter

Код
Веса

#imageto4d #4d #image2video #image2scene #image2normal #image2depth

🔥6❤2

1.74K viewsedited 13:41

0:05

0:05

Matrix3D: Large Photogrammetry Model All-in-One

Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса

Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами

Код

#photogrammetry #novelview #image2depth

👍5

1.71K views15:48

ComfyUI wrapper nodes for Latent Bridge Matching (LBM)

Подвезли #ComfyUI преобразователя изображений LBM

воркфлоу
туториал

Спасибо @kostyanchik_94

#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration

👍12🔥1👀1

2.16K views13:37

0:16

Marigold: Generative Computer Vision

Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.

Есть в Diffusers, гайд

Код
Демо глубина
Демо нормали
Демо интринсик

#image2depth #image2normal #image2albedo

🔥11❤2👍1

1.87K views14:47

0:37

Depth Anything At Any Condition (DepthAnything-AC)

Генератор глубины изображения. Работает в различных условиях, включая изменения освещения, снег-дождь. Успешно справляется когда есть искажения, вызванные сенсорами.

Представляет собой зафантюненный DepthAnything-V2

Код
Демо
Веса

#video2depth #depth #image2depth

❤9👍5

1.73K views07:10

1:25

DINOv3: Self-supervised learning for vision at unprecedented scale

Новая версия модели от запрещенной в РФ Meta AI

Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности

Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.

Благодаря этому превосходит даже специализированные модели

Есть несколько вариантов весов под разные вычислительные мощности

Гитхаб
HF

#image2depth #segmentation #video2mask #video2depth

🔥8👍2❤1

2.12K views06:16

0:32

0:36