Нейронавт | Нейросети в творчестве
9.45K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
SegAnyMo: Code for Segment Any Motion in Videos

Сегментирование движущихся объектов на видео без человеческих аннотаций

Под капотом DINO и SAM2

Видео с отслеживанием точек это как раз промежуточная работа DINO

Код

#segmentation #video2mask #tracking
👍31
DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10
PartField: Learning 3D Feature Fields for Part Segmentation and Beyond

Сегментация 3D объектов на составляющие от Nvidia. Работает CAD моделями, сгенерированными моделями, реконструкциями на гауссианах

Код

#segmentation #gaussian #3dsegmentation
🔥5
Inpaint Anything for Stable Diffusion Web UI Forge

Адепты Comfy, скипайте эту новость.

расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)

#extension #inpainting #segmentation
8👍2👌1
Media is too big
VIEW IN TELEGRAM
LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS

Модель умеет быстро обрабатывать и понимать изображения в трёхмерном пространстве, используя язык. Находит объекты на картинках и определяет их местоположение с высокой точностью.

Был похожий проект

Код

#video2mask #segmentation #gaussian
👍10🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second

Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance

Умеет:
- видео с нового ракурса

- реконструкция геометрии сцены

- отслеживание 3D-точек

- оценка потока сцены (не знаю о чем речь)

- сегментация движущихся объектов

Код ждем

#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
👍12
Media is too big
VIEW IN TELEGRAM
SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction

Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm

На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.

Код
Веса ~15Гб

#segmentation #video2mask
👍13😱1
Media is too big
VIEW IN TELEGRAM
BANG: Dividing 3D Assets via Generative Exploded Dynamics

Рассуждающий сегментный 3D генератор

Позволяет точно контролировать процесс разложения объекта на части с помощью пространственных подсказок (например, ограничивающих рамок и областей поверхности)

Генерирует детализированную геометрию на уровне деталей и связывает части с функциональными описаниями.

Кода нет
Демо ждем. Угадайте куда ведет ссылка. Ага

#3D #3dto3d #segmentation
👍3😁3
DINOv3: Self-supervised learning for vision at unprecedented scale

Новая версия модели от запрещенной в РФ Meta AI

Модель универсальная, подходит почти для любых задач компьютерного зрения: детекция, сегментация, предсказание глубины, плотности

Использует метод самообучения (SSL) без необходимости в данных с метками, что позволяет ей обучаться на огромных объёмах изображений без человеческого участия.

Благодаря этому превосходит даже специализированные модели

Есть несколько вариантов весов под разные вычислительные мощности

Гитхаб
HF

#image2depth #segmentation #video2mask #video2depth
🔥8👍21
Media is too big
VIEW IN TELEGRAM
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation

Сегментатор 3D моделей от VAST

Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)

Код ждем

#segmentation #3d
👍4🔥2