Нейронавт | Нейросети в творчестве
9.23K subscribers
3.53K photos
3.04K videos
40 files
4.02K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
SwitchLight
Релайтинг. Сервис выдает карты нормалей, альбедо. Есть режим релайтинга видео, но в этом режиме на выходе не будет нормалей и альбедо. На старте дают 100 кредитов на обработку.

Небольшой видеотуториал

#relighting #normal #video2normal #image2normal
👍3🤔2
GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image

Похоже, крутой генератор глубины и нормалей по изображению. На сайте сравнение с DepthAnything и Marigold

Код
Демо
ComfyUI

#image2depth #image2normal
6👍2🔥1
DSINE: Rethinking Inductive Biases for Surface Normal Estimation

Генератор нормалей. Требует на два порядка меньше данных для обучения чем Omnidata v2 и независим от разрешения и соотношения сторон. Приятно что работает на уличных сценах/сценах реального мира, значит может пригодиться в композе.

Код

#image2normal #video2normal
🔥9
Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention

Генератор новых ракурсов объекта в высоком качестве (512х512) по одному изображению. Да еще и с нормалями.
И прицепом можно получить тексутированный меш.

Генерация по тексту тоже возможна.

В демоспейсе только ракурсы в растре и с нормалями.

Код
Демо

#novelview #image2image #image2normal #imageto3D
🔥141
Media is too big
VIEW IN TELEGRAM
Sapiens: Foundation for Human Vision Models

Семейство моделей от Meta Reality Labs для выполнения четырех задач на изображениях человеков:

- оценка 2D-позы
- сегментация частей тела
- карта глубины
- карта нормалей

Код
Демо

#image2pose #segmentation #image2mask #image2depth #image2normal
10🔥5
StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal

Генератор нормалей по изображению. Должен быть крутой. У меня к сожалению галерея сравнений не прогружается чтобы посмотреть.

Код
Демо

#image2normal #video2normal
🔥10👍3🤯2
diffusion-e2e-ft: Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think

Тут придумали как эффективно файнтюнить диффузные генераторы на кондиционные задачи типа предсказания глубины или нормалей в один шаг.
Показывают на примере Marigold, заявляют что дообученная версия работает в 200 раз быстрее.

Я перечитал описание несколько раз и так и не уверен что понял все правильно, если что поправьте меня

Код
Демо глубина
Демо нормали

#image2normal #image2depth
🔥74
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction

Генератор глубины и нормалей. Где вы еще видели такую детализацию?

Код ждем на днях
Демо ждем на днях

#image2depth #image2normal
👍8🔥7
Опубликован код и демо генератора глубины и нормалей Lotus
+можно запускать на replicate по API

Код
Демо глубина
Демо нормали
API

#image2depth #image2normal
🔥121
LBM: Latent Bridge Matching for Fast Image-to-Image Translation

Универсальный метод преобразования изображений

Примеры применения: удаление объекта, генерация карт нормалей и глубины, релайтинг, реставрация/улучшение

Код
Демо (релайтинг)

#image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #imagerestoration
5👍1🔥1
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging

Генератор 3D моделей по изображению через оценку нормалей

Файнтюн Trellis

Код ждем
Демо

#imageto3d #image2normal
👍8🔥5
DICEPTION: A Generalist Diffusion Model for Vision Perception

Единая модель создает технические карты на уровне SOTA. Умеет делать глубину, нормали, позу? разные виды сегментации.

Сохраняет мелкие детали сегментации, такие как волосы.

Код ждем
Демо

Спасибо @m_franz

#conditioning #image2mask #image2normal #image2depth #image2pose #segmentation
👍10
Media is too big
VIEW IN TELEGRAM
TesserAct: Learning 4D Embodied World Models

Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.

За глубину отвечает Marigold, обещают прикрутить NormalCrafter

Код
Веса

#imageto4d #4d #image2video #image2scene #image2normal #image2depth
🔥62
This media is not supported in your browser
VIEW IN TELEGRAM
Marigold: Generative Computer Vision

Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.

Есть в Diffusers, гайд

Код
Демо глубина
Демо нормали
Демо интринсик

#image2depth #image2normal #image2albedo
🔥112👍1
Pixel3DMM: Versatile Screen-Space Priors for Single-Image 3D Face Reconstruction

Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.

Но выходе можно получить:

- нормали

- uv-координаты

- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)

- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях

Код

#imageto3d #head #image2normal #image2uv #uv
👍5🔥1
Media is too big
VIEW IN TELEGRAM
Light of Normals: Unified Feature Representation for Universal Photometric Stereo (LINO-UniPS)

Высококачественное восстановление нормалей поверхности объектов при произвольных условиях освещения, не полагаясь на конкретные модели освещения

Разрешение 4K, уровень точности 3D сканера

Код
Демо

#normal #relighting #image2normal
👍61🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Генератор 3D моделей Hi3DGen принят в программу ICCV2025

А код опубликован если кто не знал

#imageto3d #image2normal
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
LangScene-X

Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности

В основе - CogVideoX, а также SAM2 и гауссианы

Код

#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
7🔥2😐2