Media is too big
VIEW IN TELEGRAM
Sapiens: Foundation for Human Vision Models
Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:
- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей
Код
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal
Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:
- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей
Код
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal
❤10🔥5
Нейронавт | Нейросети в творчестве
Sapiens: Foundation for Human Vision Models Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков: - оценка 2D-позы - сегментация частей тела - карта глубины - карта нормалей Код Демо #image2pose #segmentation #image2mask…
Для Sapiens появился демоспейс
Для видео удалось запустить только самую младшую модель 0.3b, остальные выдавали ошибку, а потом токены кончились
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal #video2normal
Для видео удалось запустить только самую младшую модель 0.3b, остальные выдавали ошибку, а потом токены кончились
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal #video2normal
👍4🤔2❤1
GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers
Реконструкция полной позы/формы человека вместе с одеждой и рендер новых ракурсов. Под капотом гауссианы.
На вход нужно всего лишь одно фото
Рендер выглядит максимально шакально. Зато хвастаются скоростью 50 кадров в секунду.
Код ждем завтра
#image2pose #gaussian #novelview #realtime #imageto3d
Реконструкция полной позы/формы человека вместе с одеждой и рендер новых ракурсов. Под капотом гауссианы.
На вход нужно всего лишь одно фото
Рендер выглядит максимально шакально. Зато хвастаются скоростью 50 кадров в секунду.
Код ждем завтра
#image2pose #gaussian #novelview #realtime #imageto3d
😁6👍1👎1🔥1
DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding
Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API
Playground (попробовать)
Гитхаб (там старая версия)
#segmentation #detection #image2pose
Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API
Playground (попробовать)
Гитхаб (там старая версия)
#segmentation #detection #image2pose
👍5
ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
👍5🔥1
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Есть 4 ключевых фактора, которые делают его точным и надежным:
1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.
2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.
3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.
4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.
Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍7🔥1💩1
Reconstructing Humans with a Biomechanically Accurate Skeleton
Метод реконструкции человека в 3D по одному изображению с использованием биомеханически точной модели скелета (а не этого вашего плоского OpenPose)
Код
Колаб
Демо
#HMR #HSMR #humanrecontrustion #image2pose #image2mesh #imageto3d
Метод реконструкции человека в 3D по одному изображению с использованием биомеханически точной модели скелета (а не этого вашего плоского OpenPose)
Код
Колаб
Демо
#HMR #HSMR #humanrecontrustion #image2pose #image2mesh #imageto3d
👍10🔥8👎3😁1
DICEPTION: A Generalist Diffusion Model for Vision Perception
Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.
Сохраняет мелкие детали сегментации, такие как волосы.
Код ждем
Демо
Спасибо @m_franz
#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.
Сохраняет мелкие детали сегментации, такие как волосы.
Код ждем
Демо
Спасибо @m_franz
#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10