Нейронавт | Нейросети в творчестве

0:02

0:09

SegAnyMo: Code for Segment Any Motion in Videos

Сегментирование движущихся объектов на видео без человеческих аннотаций

Под капотом DINO и SAM2

Видео с отслеживанием точек это как раз промежуточная работа DINO

Код

#segmentation #video2mask #tracking

👍3❤1

2.36K views07:51

DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation

👍10

1.91K views08:00

0:06

0:30

PartField: Learning 3D Feature Fields for Part Segmentation and Beyond

Сегментация 3D объектов на составляющие от Nvidia. Работает CAD моделями, сгенерированными моделями, реконструкциями на гауссианах

Код

#segmentation #gaussian #3dsegmentation

🔥5

1.65K views14:38

Inpaint Anything for Stable Diffusion Web UI Forge

Адепты Comfy, скипайте эту новость.

расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)

#extension #inpainting #segmentation

❤8👍2👌1

1.84K views11:33

gen2seg: Generative Models Enable Generalizable Instance Segmentation

Stable Diffusion 2 научили сегментировать объекты на картинках

Код
Веса
Демо
Колаб

#segmentation #iamge2mask

👍8🔥1

1.83K views13:36

2:57

LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS

Модель умеет быстро обрабатывать и понимать изображения в трёхмерном пространстве, используя язык. Находит объекты на картинках и определяет их местоположение с высокой точностью.

Был похожий проект

Код

#video2mask #segmentation #gaussian

👍10🔥1

1.79K views12:16

MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second

Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance

Умеет:
- видео с нового ракурса

- реконструкция геометрии сцены

- отслеживание 3D-точек

- оценка потока сцены (не знаю о чем речь)

- сегментация движущихся объектов

Код ждем

#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth

👍12

1.69K viewsedited 08:11

3:46

SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction

Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm

На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.

Код
Веса ~15Гб

#segmentation #video2mask

👍13😱1

1.79K views08:12

0:20

0:10

DAViD: Data-efficient and Accurate Vision Models from Synthetic Data
Модель от Microsoft, обученная на синтетическом датасете людей.

Умеет:
- глубину
- нормали
- отделяет людей от фона

Гитхаб
Jupiter / Colab

#video2normal #video2depth #segmentation #bgremoval #normal #depth

👍8🤔7🔥2❤1😁1

1.57K views16:19

4:18

BANG: Dividing 3D Assets via Generative Exploded Dynamics

Рассуждающий сегментный 3D генератор

Позволяет точно контролировать процесс разложения объекта на части с помощью пространственных подсказок (например, ограничивающих рамок и областей поверхности)

Генерирует детализированную геометрию на уровне деталей и связывает части с функциональными описаниями.

Кода нет
Демо ждем. Угадайте куда ведет ссылка. Ага

#3D #3dto3d #segmentation

👍3😁3

1.49K viewsedited 10:13

1:25

DINOv3: Self-supervised learning for vision at unprecedented scale

Новая версия модели от запрещенной в РФ Meta AI

Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности

Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.

Благодаря этому превосходит даже специализированные модели

Есть несколько вариантов весов под разные вычислительные мощности

Гитхаб
HF

#image2depth #segmentation #video2mask #video2depth

🔥8👍2❤1

2.11K views06:16

2:16