Media is too big
VIEW IN TELEGRAM
Sapiens: Foundation for Human Vision Models
Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:
- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей
Код
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal
Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:
- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей
Код
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal
❤10🔥5
Нейронавт | Нейросети в творчестве
Sapiens: Foundation for Human Vision Models Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков: - оценка 2D-позы - сегментация частей тела - карта глубины - карта нормалей Код Демо #image2pose #segmentation #image2mask…
Для Sapiens появился демоспейс
Для видео удалось запустить только самую младшую модель 0.3b, остальные выдавали ошибку, а потом токены кончились
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal #video2normal
Для видео удалось запустить только самую младшую модель 0.3b, остальные выдавали ошибку, а потом токены кончились
Демо
#image2pose #segmentation #image2mask #image2depth #image2normal #video2normal
👍4🤔2❤1
diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think
Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.
Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня
Код
Демо глубина
Демо нормали
#image2normal #image2depth
Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.
Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня
Код
Демо глубина
Демо нормали
#image2normal #image2depth
🔥7❤4
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction
Генератор глубины и нормалей. Где вы еще видели такую детализацию?
Код ждем на днях
Демо ждем на днях
#image2depth #image2normal
Генератор глубины и нормалей. Где вы еще видели такую детализацию?
Код ждем на днях
Демо ждем на днях
#image2depth #image2normal
👍8🔥7
Опубликован код и демо генератора глубины и нормалей Lotus
+можно запускать на replicate по API
Код
Демо глубина
Демо нормали
API
#image2depth #image2normal
+можно запускать на replicate по API
Код
Демо глубина
Демо нормали
API
#image2depth #image2normal
🔥12❤1
Depth Pro: Sharp Monocular Metric Depth in Less Than a Second
И сразу конкурент от Apple
Генерирует карту глубины с нативным выходным разрешением 1536×1536 за 0,3 секунды на V100
Код
#image2depth
И сразу конкурент от Apple
Генерирует карту глубины с нативным выходным разрешением 1536×1536 за 0,3 секунды на V100
Код
#image2depth
🔥13🤯2👍1
Помните Cuebric?
Они навертели обновок
- Увеличили разрешение генерации изображений до 1080p с возможностью апскейла до 8K
- Улучшили кисть для инпейнтинга.
- Gen Mesh - генератор 3D по изображению. Поддержка стандартных отраслевых 3D-форматов, включая .fbx и .usd
Неудобно что не посмотреть меш перед экспортом, генерация 3D модели начинается после выбора формата и нажатия кнопки экспорт, после этого вы получаете архив с моделькой и картами глубины. ДА, кстати, она создает 3D через карту глубины. И называется это у них 2.75D
#imageto3d #tools #upscale #inpainting #segmentation #image2depth #text2image
Они навертели обновок
- Увеличили разрешение генерации изображений до 1080p с возможностью апскейла до 8K
- Улучшили кисть для инпейнтинга.
- Gen Mesh - генератор 3D по изображению. Поддержка стандартных отраслевых 3D-форматов, включая .fbx и .usd
Неудобно что не посмотреть меш перед экспортом, генерация 3D модели начинается после выбора формата и нажатия кнопки экспорт, после этого вы получаете архив с моделькой и картами глубины. ДА, кстати, она создает 3D через карту глубины. И называется это у них 2.75D
#imageto3d #tools #upscale #inpainting #segmentation #image2depth #text2image
🔥4🤮3🤯2💩2
Depth Pro: Sharp Monocular Metric Depth in Less Than a Second
Генератор глубины по изображению. Хвастаются песпрецедентным качеством и скоростью - 0.3 секунды на 2.25МПикс картинку на потребительском GPU
Код
Веса
Демо
#image2depth
Генератор глубины по изображению. Хвастаются песпрецедентным качеством и скоростью - 0.3 секунды на 2.25МПикс картинку на потребительском GPU
Код
Веса
Демо
#image2depth
🔥9
DepthLab: From Partial to Complete
инпейнт карт глубины на основе диффузионных моделей.
Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.
Код
Веса
#inpainting #image2depth
инпейнт карт глубины на основе диффузионных моделей.
Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.
Код
Веса
#inpainting #image2depth
🔥5👍2❤1
Media is too big
VIEW IN TELEGRAM
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision
Подгон от Microsoft. Преобразует изображение в меш через карту глубины.
На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2
Код
Демо
#image2depth #video2depth #image2mesh #video2mesh
Подгон от Microsoft. Преобразует изображение в меш через карту глубины.
На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2
Код
Демо
#image2depth #video2depth #image2mesh #video2mesh
🔥13❤1
MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion
Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.
Код ждем
#image2depth #novelview
Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.
Код ждем
#image2depth #novelview
👍4🔥1
Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator
И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения
Код
Демо
#image2depth
И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения
Код
Демо
#image2depth
👍14🔥3
LBM: Latent Bridge Matching for Fast Image-to-Image Translation
Универсальный метод преобразования изображений
Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение
Код
Демо (релайтинг)
#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration
Универсальный метод преобразования изображений
Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение
Код
Демо (релайтинг)
#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration
❤5👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Immersity 4.0
Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой
Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:
3D Motion
3D Image
3D Video Simple
#image2depth #image2video #monoculardepth #parallax
Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой
Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:
3D Motion
3D Image
3D Video Simple
#image2depth #image2video #monoculardepth #parallax
👍4
DICEPTION: A Generalist Diffusion Model for Vision Perception
Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.
Сохраняет мелкие детали сегментации, такие как волосы.
Код ждем
Демо
Спасибо @m_franz
#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.
Сохраняет мелкие детали сегментации, такие как волосы.
Код ждем
Демо
Спасибо @m_franz
#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10
Media is too big
VIEW IN TELEGRAM
TesserAct: Learning 4D Embodied World Models
Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.
За глубину отвечает Marigold, обещают прикрутить NormalCrafter
Код
Веса
#imageto4d #4d #image2video #image2scene #image2normal #image2depth
Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.
За глубину отвечает Marigold, обещают прикрутить NormalCrafter
Код
Веса
#imageto4d #4d #image2video #image2scene #image2normal #image2depth
🔥6❤2
Matrix3D: Large Photogrammetry Model All-in-One
Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса
Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами
Код
#photogrammetry #novelview #image2depth
Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса
Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами
Код
#photogrammetry #novelview #image2depth
👍5
ComfyUI wrapper nodes for Latent Bridge Matching (LBM)
Подвезли #ComfyUI преобразователя изображений LBM
воркфлоу
туториал
Спасибо @kostyanchik_94
#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration
Подвезли #ComfyUI преобразователя изображений LBM
воркфлоу
туториал
Спасибо @kostyanchik_94
#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration
👍12🔥1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Marigold: Generative Computer Vision
Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.
Есть в Diffusers, гайд
Код
Демо глубина
Демо нормали
Демо интринсик
#image2depth #image2normal #image2albedo
Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.
Есть в Diffusers, гайд
Код
Демо глубина
Демо нормали
Демо интринсик
#image2depth #image2normal #image2albedo
🔥11❤2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Depth Anything At Any Condition (DepthAnything-AC)
Генератор глубины изображения. Работает в различных условиях, включая изменения освещения, снег-дождь. Успешно справляется когда есть искажения, вызванные сенсорами.
Представляет собой зафантюненный DepthAnything-V2
Код
Демо
Веса
#video2depth #depth #image2depth
Генератор глубины изображения. Работает в различных условиях, включая изменения освещения, снег-дождь. Успешно справляется когда есть искажения, вызванные сенсорами.
Представляет собой зафантюненный DepthAnything-V2
Код
Демо
Веса
#video2depth #depth #image2depth
❤9👍5