Нейронавт | Нейросети в творчестве

Stability.ai опубликовали пейпер Stable Diffusion 3

Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту

Блог
Пейпер

#news #SD

🔥9👍1😁1

1.39K views08:08

Нейронавт | Нейросети в творчестве

Auto 1111 SDK: Stable Diffusion Python library

В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.

Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта

Колаб

#tools #coding

👍7

1.34K viewsedited 08:22

Нейронавт | Нейросети в творчестве

TripoSR: Fast 3D Object Generation from Single Images

Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai

Генерация меньше чем за секунду. Работает даже без GPU. Революция?

Код/веса
Демо

#textto3D

🔥8

2.69K viewsedited 08:51

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

1.31K views08:51

Нейронавт | Нейросети в творчестве

ComfyUI-Flowty-TripoSR

А вот и нода для ComfyUI.
Говорят, видеопамяти жрет 1.6 GB

#textto3D

🔥12😁6

1.38K views12:32

Нейронавт | Нейросети в творчестве

ResAdapter : Domain Consistent Resolution Adapter for Diffusion Models

Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA

Код

#text2image

👍13

1.42K views06:54

Нейронавт | Нейросети в творчестве

Trajectory Consistency Distillation

Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.

Ускорение инференса при высоком качестве и детальности.

Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma

Код
Демо

#text2image

🔥6

1.47K views07:26

Нейронавт | Нейросети в творчестве

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos

На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)

Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду

Код ожидается в июне 2024, но это неточно

#novelveiw #rendering #stabilization #video2video #video2scene #FVV

👍2👏2

1.3K views07:49

Нейронавт | Нейросети в творчестве

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

AtomoVideo:High Fidelity Image-to-Video Generation

Генератор видео по картинке с претензией на высокое качество. По начеррипиканным сравнениям движение лучше чем у конкурентов. С Sora они себя, естественно, не сравнивают. О доступе ничего неизвестно. Кода нет

#image2video

👍4

1.49K views08:07

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models

Консистентная генерация изображения с разных ракурсов

Код

#text2image #consistency #multiview

👍5

1.49K views08:22

Нейронавт | Нейросети в творчестве

2:08

Media is too big

VIEW IN TELEGRAM

SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation

Определение 3D позы по одному ракурсу

Код
Демо

#image2pose #video2pose #poseestimation

🔥4👍2

1.33K views15:25

Нейронавт | Нейросети в творчестве

0:29

Media is too big

VIEW IN TELEGRAM

VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction

Реконструкция больших сцен гауссианами. Бьет всех конкурентов, с которыми решил померяться. Рендерит в реальном времени. Под капотом дробление сцены на ячейки.

Код ждем

#gaussian #rendering #nivelview #realtime

👍9🔥5😱1

1.48K viewsedited 16:24

Нейронавт | Нейросети в творчестве