Нейронавт | Нейросети в творчестве
9.23K subscribers
3.53K photos
3.04K videos
40 files
4.02K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
GVHMR: World-Grounded Human Motion Recovery viaGravity-View Coordinates

Реконструкция позы человека в динамике по одному видео. При расчете учитывается направление гравитации

Код
Демо
Колаб

#video2pose #videoto3d #video2mesh
🔥72
Media is too big
VIEW IN TELEGRAM
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision

Подгон от Microsoft. Преобразует изображение в меш через карту глубины.

На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2

Код
Демо

#image2depth #video2depth #image2mesh #video2mesh
🔥131
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective

Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры

Есть 4 ключевых фактора, которые делают его точным и надежным:

1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.

2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.

3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.

4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.

Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.


Код

#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍7🔥1💩1
GSTAR: Gaussian Surface Tracking and Reconstruction

Реконструкция динамичных 3D сцен на гауссианах по видео, с фотореалистичным рендером и 3D-трекином

GSTAR адаптируется к изменениям топологии с помощью двух механизмов: последовательного отслеживания стабильных поверхностей (красные кружочки) и динамической генерации поверхности для вновь появляющейся геометрии (оранжевые кружочки).

Код ждем

#video2scene #video2gaussian #videoto3d #videoto4D #video2mesh #gaussian
👍5🔥2
VGGT: Visual Geometry Grounded Transformer

Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.

На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.

Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях

Код
Демо

#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth
👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians

Реконструкция головы по монокулярному видео от Toyota

Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку

Кода нет 🤩

Спасибо @m_franz

#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
CoMotion: Concurrent Multi-person 3D Motion

Отслеживание и реконструкция 3D поз нескольких человек на видео от Apple

Код
Веса

#video2pose #humanreconstruction #video2mesh
👍6