Нейронавт | Нейросети в творчестве
9.24K subscribers
3.53K photos
3.05K videos
40 files
4.02K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Помните проект ICON?

Довольно давно уже авторы на замену ему сотворили ECON - следующий шаг эволюции в восстановлении 3D модели человека по одному изображению.
Ну круто, и что?

А то что уже есть плагин для Блендера
Держите туториал
Надеюсь, поделитесь результатами

Код
Демо на hf

#imageto3D #videoavatar #image2avatar #image2pose
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
DWPose: Effective Whole-body Pose Estimation with Two-stages Distillation

Определение позы от IDEA Research
Говорят, лучше чем Openpose. Сравнение закину в комментарии

Код
Демо (в выпадающей менюшке выбрать wholebody)

#image2pose #video2pose #poseestimation
3
This media is not supported in your browser
VIEW IN TELEGRAM
From Skin to Skeleton: Towards Biomechanically Accurate 3D Digital Humans

Биомеханически корректное восстановление позы, скелета, меша по видео.
Код там же, три ссылки внизу

#video2pose #videoto3D #image2pose
🔥8👍3
Media is too big
VIEW IN TELEGRAM
ScoreHMR:Score-Guided Diffusion for 3D Human Recovery

Диффузное восстановление позы и фигуры человека по одному или нескольким ракурсам. Пока еще неидеально, как минимум беда с ногами

Код
Колаб

#image2pose #video2pose #image2mesh #imageto3D #videoto3D
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.

Код

#tracking #poseestimation #image2pose #video2pose
👍13
VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads

Реконструкция 3d сетки головы по изображению.
Вообще-то это датасет, но присутствует и код, и демо, и контролнет. То есть, генерить головы тоже можно, должно быть точнее чем с OpenPose.
Я только не понял как из него получить собственно меш, а не картинку меша

Код
Демо
ControlNet Head Mesh SDXL

#controlnet #imageto3D #image2pose #image2head #pose2image
👍82🔥1😁1
Media is too big
VIEW IN TELEGRAM
Sapiens: Foundation for Human Vision Models

Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:

- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей

Код
Демо

#image2pose #segmentation #image2mask #image2depth #image2normal
10🔥5
GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers

Реконструкция полной позы/формы человека вместе с одеждой и рендер новых ракурсов. Под капотом гауссианы.
На вход нужно всего лишь одно фото

Рендер выглядит максимально шакально. Зато хвастаются скоростью 50 кадров в секунду.

Код ждем завтра

#image2pose #gaussian #novelview #realtime #imageto3d
😁6👍1👎1🔥1
DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding

Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API

Playground (попробовать)
Гитхаб (там старая версия)

#segmentation #detection #image2pose
👍5
ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Оценка позы по изображению и по видео

Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб

#poseestimation #image2pose #video2pose
👍5🔥1
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective

Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры

Есть 4 ключевых фактора, которые делают его точным и надежным:

1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.

2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.

3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.

4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.

Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.


Код

#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍7🔥1💩1
Reconstructing Humans with a Biomechanically Accurate Skeleton

Метод реконструкции человека в 3D по одному изображению с использованием биомеханически точной модели скелета (а не этого вашего плоского OpenPose)

Код
Колаб
Демо

#HMR #HSMR #humanrecontrustion #image2pose #image2mesh #imageto3d
👍10🔥8👎3😁1
DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10