DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding
Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API
Playground (попробовать)
Гитхаб (там старая версия)
#segmentation #detection #image2pose
Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API
Playground (попробовать)
Гитхаб (там старая версия)
#segmentation #detection #image2pose
👍5
SAMURAI Nodes for ComfyUI
Подписчик создал ноды SAMURAI для #ComfyUI
@takemetosiberia
#segmentation #video2mask
Подписчик создал ноды SAMURAI для #ComfyUI
@takemetosiberia
#segmentation #video2mask
GitHub
GitHub - takemetosiberia/ComfyUI-SAMURAI--SAM2-: This is my version of nodes based on SAMURAI project. The project is made for…
This is my version of nodes based on SAMURAI project. The project is made for entertainment purposes, I will not be engaged in further development and improvement. The project is based on official...
🔥11❤1
This media is not supported in your browser
VIEW IN TELEGRAM
EfficientTAM: Efficient Track Anything
Запрещенная Meta конкурирует с самураем на поле сегментации видео.
За основу взяли SAM2 Video Predictor
Код
Демо
#segmentation #image2mask #video2mask #tracking
Запрещенная Meta конкурирует с самураем на поле сегментации видео.
За основу взяли SAM2 Video Predictor
Код
Демо
#segmentation #image2mask #video2mask #tracking
🔥5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
SAMURAI for NUKE
Сегментатор SAMURAI прикрутили к #Nuke
Теперь можно создавать маски в привычной рабочей среде
Пока только Ubuntu
#segmentation #video2mask
Сегментатор SAMURAI прикрутили к #Nuke
Теперь можно создавать маски в привычной рабочей среде
Пока только Ubuntu
#segmentation #video2mask
❤6🔥3
Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos
Поженили SAM2 с Llava
Модель сегметрирует картинки и видео по текстовому запросу
Код
Демо
#segmentation #image2mask #video2mask
Поженили SAM2 с Llava
Модель сегметрирует картинки и видео по текстовому запросу
Код
Демо
#segmentation #image2mask #video2mask
👍10
MatAnyone: Stable Video Matting with Consistent Memory Propagation
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь станет подспорьем в композе
Код и демо ждем на следующей неделе
#segmentation #matting #video2matte #video2mask
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь станет подспорьем в композе
Код и демо ждем на следующей неделе
#segmentation #matting #video2matte #video2mask
🔥10❤1
Авторы MatAnyone запустили демоспейс, можно тестить
Демо
#segmentation #matting #video2matte #video2mask
Демо
#segmentation #matting #video2matte #video2mask
Telegram
Нейронавт | Нейросети в творчестве
MatAnyone: Stable Video Matting with Consistent Memory Propagation
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
🔥11👍2
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DAM4SAM (SAM2.1++): A Distractor-Aware Memory for Visual Object Tracking with SAM2
К сегментатору SAM2.1 прикрутили технологию запоминания отвлекающих факторов - получился SAM2.1++. Прямые руки, очевидно, смогут прикрутить и к другому сегментатору
Код
#segmentation #image2mask #video2mask
К сегментатору SAM2.1 прикрутили технологию запоминания отвлекающих факторов - получился SAM2.1++. Прямые руки, очевидно, смогут прикрутить и к другому сегментатору
Код
#segmentation #image2mask #video2mask
🔥10👍5❤1
Опубликован код MatAnyone + есть #ComfyUI
Код
ComfyUI_MatAnyone_Kytra
#segmentation #matting #video2matte #video2mask
Код
ComfyUI_MatAnyone_Kytra
#segmentation #matting #video2matte #video2mask
Telegram
Нейронавт | Нейросети в творчестве
MatAnyone: Stable Video Matting with Consistent Memory Propagation
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
🔥12
4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models
Слыхали про 4D-языковые поля? Я не слыхал, а они есть.
Служат, по видимому, для сегментации объектов на видео
Код
#video2mask #segmentation #gaussian
Слыхали про 4D-языковые поля? Я не слыхал, а они есть.
Служат, по видимому, для сегментации объектов на видео
Код
#video2mask #segmentation #gaussian
👍7❤1
SegAnyMo: Code for Segment Any Motion in Videos
Сегментирование движущихся объектов на видео без человеческих аннотаций
Под капотом DINO и SAM2
Видео с отслеживанием точек это как раз промежуточная работа DINO
Код
#segmentation #video2mask #tracking
Сегментирование движущихся объектов на видео без человеческих аннотаций
Под капотом DINO и SAM2
Видео с отслеживанием точек это как раз промежуточная работа DINO
Код
#segmentation #video2mask #tracking
👍3❤1
DICEPTION: A Generalist Diffusion Model for Vision Perception
Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.
Сохраняет мелкие детали сегментации, такие как волосы.
Код ждем
Демо
Спасибо @m_franz
#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.
Сохраняет мелкие детали сегментации, такие как волосы.
Код ждем
Демо
Спасибо @m_franz
#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10
PartField: Learning 3D Feature Fields for Part Segmentation and Beyond
Сегментация 3D объектов на составляющие от Nvidia. Работает CAD моделями, сгенерированными моделями, реконструкциями на гауссианах
Код
#segmentation #gaussian #3dsegmentation
Сегментация 3D объектов на составляющие от Nvidia. Работает CAD моделями, сгенерированными моделями, реконструкциями на гауссианах
Код
#segmentation #gaussian #3dsegmentation
🔥5
Inpaint Anything for Stable Diffusion Web UI Forge
Адепты Comfy, скипайте эту новость.
расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)
#extension #inpainting #segmentation
Адепты Comfy, скипайте эту новость.
расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)
#extension #inpainting #segmentation
❤8👍2👌1
gen2seg: Generative Models Enable Generalizable Instance Segmentation
Stable Diffusion 2 научили сегментировать объекты на картинках
Код
Веса
Демо
Колаб
#segmentation #iamge2mask
Stable Diffusion 2 научили сегментировать объекты на картинках
Код
Веса
Демо
Колаб
#segmentation #iamge2mask
👍8🔥1
Media is too big
VIEW IN TELEGRAM
LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS
Модель умеет быстро обрабатывать и понимать изображения в трёхмерном пространстве, используя язык. Находит объекты на картинках и определяет их местоположение с высокой точностью.
Был похожий проект
Код
#video2mask #segmentation #gaussian
Модель умеет быстро обрабатывать и понимать изображения в трёхмерном пространстве, используя язык. Находит объекты на картинках и определяет их местоположение с высокой точностью.
Был похожий проект
Код
#video2mask #segmentation #gaussian
👍10🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second
Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance
Умеет:
- видео с нового ракурса
- реконструкция геометрии сцены
- отслеживание 3D-точек
- оценка потока сцены (не знаю о чем речь)
- сегментация движущихся объектов
Код ждем
#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance
Умеет:
- видео с нового ракурса
- реконструкция геометрии сцены
- отслеживание 3D-точек
- оценка потока сцены (не знаю о чем речь)
- сегментация движущихся объектов
Код ждем
#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
👍12
Media is too big
VIEW IN TELEGRAM
SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction
Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm
На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.
Код
Веса ~15Гб
#segmentation #video2mask
Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm
На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.
Код
Веса ~15Гб
#segmentation #video2mask
👍13😱1
DAViD: Data-efficient and Accurate Vision Models from Synthetic Data
Модель от Microsoft, обученная на синтетическом датасете людей.
Умеет:
- глубину
- нормали
- отделяет людей от фона
Гитхаб
Jupiter / Colab
#video2normal #video2depth #segmentation #bgremoval #normal #depth
Модель от Microsoft, обученная на синтетическом датасете людей.
Умеет:
- глубину
- нормали
- отделяет людей от фона
Гитхаб
Jupiter / Colab
#video2normal #video2depth #segmentation #bgremoval #normal #depth
👍8🤔7🔥2❤1😁1
Media is too big
VIEW IN TELEGRAM
BANG: Dividing 3D Assets via Generative Exploded Dynamics
Рассуждающий сегментный 3D генератор
Позволяет точно контролировать процесс разложения объекта на части с помощью пространственных подсказок (например, ограничивающих рамок и областей поверхности)
Генерирует детализированную геометрию на уровне деталей и связывает части с функциональными описаниями.
Кода нет
Демо ждем. Угадайте куда ведет ссылка. Ага
#3D #3dto3d #segmentation
Рассуждающий сегментный 3D генератор
Позволяет точно контролировать процесс разложения объекта на части с помощью пространственных подсказок (например, ограничивающих рамок и областей поверхности)
Генерирует детализированную геометрию на уровне деталей и связывает части с функциональными описаниями.
Кода нет
Демо ждем. Угадайте куда ведет ссылка. Ага
#3D #3dto3d #segmentation
👍3😁3