Нейронавт | Нейросети в творчестве

Для Sapiens появился демоспейс

Для видео удалось запустить только самую младшую модель 0.3b, остальные выдавали ошибку, а потом токены кончились

Демо

#image2pose #segmentation #image2mask #image2depth #image2normal #video2normal

👍4🤔2❤1

1.61K views10:57

diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think

Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.

Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня

Код
Демо глубина
Демо нормали

#image2normal #image2depth

🔥7❤4

1.57K viewsedited 08:04

Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction

Генератор глубины и нормалей. Где вы еще видели такую детализацию?

Код ждем на днях
Демо ждем на днях

#image2depth #image2normal

👍8🔥7

1.72K views06:59

Опубликован код и демо генератора глубины и нормалей Lotus
+можно запускать на replicate по API

Код
Демо глубина
Демо нормали
API

#image2depth #image2normal

🔥12❤1

1.61K views05:03

Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

И сразу конкурент от Apple
Генерирует карту глубины с нативным выходным разрешением 1536×1536 за 0,3 секунды на V100

Код

#image2depth

🔥13🤯2👍1

1.68K views05:23

0:53

Помните Cuebric?

Они навертели обновок

- Увеличили разрешение генерации изображений до 1080p с возможностью апскейла до 8K

- Улучшили кисть для инпейнтинга.

- Gen Mesh - генератор 3D по изображению. Поддержка стандартных отраслевых 3D-форматов, включая .fbx и .usd

Неудобно что не посмотреть меш перед экспортом, генерация 3D модели начинается после выбора формата и нажатия кнопки экспорт, после этого вы получаете архив с моделькой и картами глубины. ДА, кстати, она создает 3D через карту глубины. И называется это у них 2.75D

#imageto3d #tools #upscale #inpainting #segmentation #image2depth #text2image

🔥4🤮3🤯2💩2

1.91K views15:21

Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Генератор глубины по изображению. Хвастаются песпрецедентным качеством и скоростью - 0.3 секунды на 2.25МПикс картинку на потребительском GPU

Код
Веса
Демо

#image2depth

🔥9

1.54K views09:05

1:25

0:06

0:06

0:06

DepthLab: From Partial to Complete

инпейнт карт глубины на основе диффузионных моделей.

Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.

Код
Веса

#inpainting #image2depth

🔥5👍2❤1

2.16K views19:18

0:40

Media is too big

MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision

Подгон от Microsoft. Преобразует изображение в меш через карту глубины.

На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2

Код
Демо

#image2depth #video2depth #image2mesh #video2mesh

🔥13❤1

2.07K views14:18

0:15

MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview

👍4🔥1

1.64K views15:19

Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator

И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения

Код
Демо

#image2depth

👍14🔥3

2.14K views05:33

0:19

LBM: Latent Bridge Matching for Fast Image-to-Image Translation

Универсальный метод преобразования изображений

Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение

Код
Демо (релайтинг)

#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration

❤5👍1🔥1

1.89K views11:18

0:19

Immersity 4.0

Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой

Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:

3D Motion
3D Image
3D Video Simple

#image2depth #image2video #monoculardepth #parallax

👍4

1.69K viewsedited 14:09

DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation

👍10

1.89K views08:00

0:32

Media is too big

TesserAct: Learning 4D Embodied World Models

Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.

За глубину отвечает Marigold, обещают прикрутить NormalCrafter

Код
Веса

#imageto4d #4d #image2video #image2scene #image2normal #image2depth

🔥6❤2

1.74K viewsedited 13:41

0:05

0:05

Matrix3D: Large Photogrammetry Model All-in-One

Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса

Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами

Код

#photogrammetry #novelview #image2depth

👍5

1.7K views15:48

ComfyUI wrapper nodes for Latent Bridge Matching (LBM)

Подвезли #ComfyUI преобразователя изображений LBM

воркфлоу
туториал

Спасибо @kostyanchik_94

#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration

👍12🔥1👀1

2.14K views13:37

0:16

Marigold: Generative Computer Vision

Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.

Есть в Diffusers, гайд

Код
Демо глубина
Демо нормали
Демо интринсик

#image2depth #image2normal #image2albedo

🔥11❤2👍1

1.86K views14:47

0:37