Нейронавт | Нейросети в творчестве – Telegram

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

9.24K subscribers

3.53K photos

3.05K videos

40 files

4.02K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

9.24K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Помните проект ICON?

Довольно давно уже авторы на замену ему сотворили ECON - следующий шаг эволюции в восстановлении 3D модели человека по одному изображению.
Ну круто, и что?

А то что уже есть плагин для Блендера
Держите туториал
Надеюсь, поделитесь результатами

Код
Демо на hf

#imageto3D #videoavatar #image2avatar #image2pose

👍5🔥1

570 viewsedited 11:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Humans in 4D:Reconstructing and Tracking Humans with Transformers (HMR 2.0)

Восстановление 3D модели человеков в движении.
Получше чем PyMAF-X (см второе видео), но не идеально

Код
Демо - только статичное фото
Колаб

#image2pose #imageto3D #video2pose #videoto3D #humananmation

566 views08:25

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DWPose: Effective Whole-body Pose Estimation with Two-stages Distillation

Определение позы от IDEA Research
Говорят, лучше чем Openpose. Сравнение закину в комментарии

Код
Демо (в выпадающей менюшке выбрать wholebody)

#image2pose #video2pose #poseestimation

❤3

884 viewsedited 14:48

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DWPose можно попробовать в колабе

Колаб

#image2pose #video2pose #poseestimation

👍6

870 views10:34

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

From Skin to Skeleton: Towards Biomechanically Accurate 3D Digital Humans

Биомеханически корректное восстановление позы, скелета, меша по видео.
Код там же, три ссылки внизу

#video2pose #videoto3D #image2pose

🔥8👍3

1.4K views07:40

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation

Определение 3D позы по одному ракурсу

Код
Демо

#image2pose #video2pose #poseestimation

🔥4👍2

1.33K views15:25

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

ScoreHMR:Score-Guided Diffusion for 3D Human Recovery

Диффузное восстановление позы и фигуры человека по одному или нескольким ракурсам. Пока еще неидеально, как минимум беда с ногами

Код
Колаб

#image2pose #video2pose #image2mesh #imageto3D #videoto3D

👍3❤1

1.67K views07:52

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

NVIDIA. Трекер положения любого объекта. Чтобы задать объект для отслеживания надо показать несколько референсных его изображений или CAD модель.

Код

#tracking #poseestimation #image2pose #video2pose

👍13

1.46K viewsedited 07:41

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

MMPose

Набор инструментов для определения позы

#image2pose #video2pose #poseestimation

👍10

1.4K views08:28

Нейронавт | Нейросети в творчестве

VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads

Реконструкция 3d сетки головы по изображению.
Вообще-то это датасет, но присутствует и код, и демо, и контролнет. То есть, генерить головы тоже можно, должно быть точнее чем с OpenPose.
Я только не понял как из него получить собственно меш, а не картинку меша

Код
Демо
ControlNet Head Mesh SDXL

#controlnet #imageto3D #image2pose #image2head #pose2image

👍8❤2🔥1😁1

2.02K views05:03

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Sapiens: Foundation for Human Vision Models

Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:

- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей

Код
Демо

#image2pose #segmentation #image2mask #image2depth #image2normal

❤10🔥5

2.57K viewsedited 09:05

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Sapiens: Foundation for Human Vision Models Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков: - оценка 2D-позы - сегментация частей тела - карта глубины - карта нормалей Код Демо #image2pose #segmentation #image2mask…

This media is not supported in your browser

VIEW IN TELEGRAM

Для Sapiens появился демоспейс

Для видео удалось запустить только самую младшую модель 0.3b, остальные выдавали ошибку, а потом токены кончились

Демо

#image2pose #segmentation #image2mask #image2depth #image2normal #video2normal

👍4🤔2❤1

1.61K views10:57

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers

Реконструкция полной позы/формы человека вместе с одеждой и рендер новых ракурсов. Под капотом гауссианы.
На вход нужно всего лишь одно фото

Рендер выглядит максимально шакально. Зато хвастаются скоростью 50 кадров в секунду.

Код ждем завтра

#image2pose #gaussian #novelview #realtime #imageto3d

😁6👍1👎1🔥1

1.8K views13:27

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding

Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API

Playground (попробовать)
Гитхаб (там старая версия)

#segmentation #detection #image2pose

👍5

1.41K views06:41

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Оценка позы по изображению и по видео

Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб

#poseestimation #image2pose #video2pose

👍5🔥1

1.78K views10:13

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

CameraHMR: Aligning People with Perspective

Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры

Есть 4 ключевых фактора, которые делают его точным и надежным:

1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.

2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.

3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.

4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.

Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.

Код

#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction

👍7🔥1💩1

1.58K views10:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Reconstructing Humans with a Biomechanically Accurate Skeleton

Метод реконструкции человека в 3D по одному изображению с использованием биомеханически точной модели скелета (а не этого вашего плоского OpenPose)

Код
Колаб
Демо

#HMR #HSMR #humanrecontrustion #image2pose #image2mesh #imageto3d

👍10🔥8👎3😁1

1.78K views08:18

Нейронавт | Нейросети в творчестве

DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation

👍10

1.89K views08:00