Gigapixel AI Recover & Enhance
Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore
При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке
Халявная ли локальная обработка - непонятно 🤷
Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита
#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore
При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке
Халявная ли локальная обработка - непонятно 🤷
Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита
#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
👍4👎2
Hunyuan3D 2.0
Генератор текстурированных 3D моделей от Tencent
Hunyuan3D-DiT отвечает за меш
Hunyuan3D-Paint - за текстуры
Hunyuan3D-Studio - удобная платформа для создания 3D ассетов
Код
Демо
Сайт - вход через китайский телефон/wechat
ComfyUI
#textto3d #imageto3d #ComfyUI
Генератор текстурированных 3D моделей от Tencent
Hunyuan3D-DiT отвечает за меш
Hunyuan3D-Paint - за текстуры
Hunyuan3D-Studio - удобная платформа для создания 3D ассетов
Код
Демо
Сайт - вход через китайский телефон/wechat
ComfyUI
#textto3d #imageto3d #ComfyUI
👍5❤3🔥2
Media is too big
VIEW IN TELEGRAM
GameFactory
по текстовому описанию создает генеративные миры на видео, с управлением действиями в игре (движения персонажа, использование предметов) с помощью клавиатуры и мыши
Код
#text2world #game
по текстовому описанию создает генеративные миры на видео, с управлением действиями в игре (движения персонажа, использование предметов) с помощью клавиатуры и мыши
Код
#text2world #game
👍6
Опубликован код реконструктора 3D сцен на гауссианах VideoLifter
Код
#gaussian #videoto3d #video2gaussian
Код
#gaussian #videoto3d #video2gaussian
Telegram
Нейронавт | Нейросети в творчестве
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment
Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно
Код ждем
#gaussian #videoto3d #video2gaussian
Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно
Код ждем
#gaussian #videoto3d #video2gaussian
👍5🔥1
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
Генератор консистентной глубины для длинных видео. На черрипиках бьет конкурентов, в том числе DepthCrafter.
Код
Демо
#video2depth
Генератор консистентной глубины для длинных видео. На черрипиках бьет конкурентов, в том числе DepthCrafter.
Код
Демо
#video2depth
🔥8🤯1
Hunyuan3D-2GP: 3D Generation for the GPU Poor
Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM
#textto3d #imageto3d
Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM
#textto3d #imageto3d
GitHub
GitHub - deepbeepmeep/Hunyuan3D-2GP: GPU Poor Version of Hunyuan3D-2
GPU Poor Version of Hunyuan3D-2. Contribute to deepbeepmeep/Hunyuan3D-2GP development by creating an account on GitHub.
❤3🔥1
UI-TARS
Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance
В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.
умеет находить информацию, выполнять действия в приложениях и веб-сайтах
UI-TARS Desktop
#agent #gui #vlm
Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance
В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.
умеет находить информацию, выполнять действия в приложениях и веб-сайтах
UI-TARS Desktop
#agent #gui #vlm
👍9🔥3
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры
Есть 4 ключевых фактора, которые делают его точным и надежным:
1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.
2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.
3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.
4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.
Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.
Код
#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍7🔥1💩1
Go with the Flow
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
Контроль движения на генерации видео за счет геометрического искажения шума
Код
Веса
Видео (4 минуты)
Видео туториал
#motioncontrol #motiontransfer #cameracontrol
👍11🔥4🍾2