Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Есть 4 ключевых фактора, которые делают его точным и надежным:
1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.
2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.
3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.
4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.
Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍7🔥1💩1
Go with the Flow
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
👍11🔥4🍾2
Gemini 2.0 Flash Thinking
Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro
В топе на арене
Уже в AnyChat
Попробовать (не для российских IP)
#reasining #assistant
Гугл обновил свою рассуждалку. Контекст 1 миллион токенов - впятеро больше, чем o1 Pro
В топе на арене
Уже в AnyChat
Попробовать (не для российских IP)
#reasining #assistant
👍8❤2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DiffuEraser: A Diffusion Model for Video Inpainting
Слишком долго у Propainter не было конкурентов в опенсорсе.
Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера
Потребление видеопамяти - на скрине
Код
Демо
#videoinpainting #inpainting
Слишком долго у Propainter не было конкурентов в опенсорсе.
Это инпейнтинг видео по маске. И на черрипиках он заметно лучше пропейнтера
Потребление видеопамяти - на скрине
Код
Демо
#videoinpainting #inpainting
🔥7👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
EMO2: End-Effector Guided Audio-Driven Avatar Video Generation
Оживлятор портретов звуком от Alibaba. Пение, речь, танцы рук
Напоминаю, что кода EMO за прошедший год мы так и не дождались
Код ждем
#audio2video #speech2video #talkinghead #portrainanimation
Оживлятор портретов звуком от Alibaba. Пение, речь, танцы рук
Напоминаю, что кода EMO за прошедший год мы так и не дождались
Код ждем
#audio2video #speech2video #talkinghead #portrainanimation
😁7👍6❤2