Stability.ai опубликовали пейпер Stable Diffusion 3
Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту
Блог
Пейпер
#news #SD
Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту
Блог
Пейпер
#news #SD
🔥9👍1😁1
Auto 1111 SDK: Stable Diffusion Python library
В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.
Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта
Колаб
#tools #coding
В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.
Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта
Колаб
#tools #coding
👍7
TripoSR: Fast 3D Object Generation from Single Images
Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai
Генерация меньше чем за секунду. Работает даже без GPU. Революция?
Код/веса
Демо
#textto3D
Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai
Генерация меньше чем за секунду. Работает даже без GPU. Революция?
Код/веса
Демо
#textto3D
🔥8
ResAdapter : Domain Consistent Resolution Adapter for Diffusion Models
Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA
Код
#text2image
Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA
Код
#text2image
👍13
Trajectory Consistency Distillation
Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.
Ускорение инференса при высоком качестве и детальности.
Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma
Код
Демо
#text2image
Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.
Ускорение инференса при высоком качестве и детальности.
Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma
Код
Демо
#text2image
🔥6
3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos
На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)
Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду
Код ожидается в июне 2024, но это неточно
#novelveiw #rendering #stabilization #video2video #video2scene #FVV
На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)
Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду
Код ожидается в июне 2024, но это неточно
#novelveiw #rendering #stabilization #video2video #video2scene #FVV
👍2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
AtomoVideo:High Fidelity Image-to-Video Generation
Генератор видео по картинке с претензией на высокое качество. По начеррипиканным сравнениям движение лучше чем у конкурентов. С Sora они себя, естественно, не сравнивают. О доступе ничего неизвестно. Кода нет
#image2video
Генератор видео по картинке с претензией на высокое качество. По начеррипиканным сравнениям движение лучше чем у конкурентов. С Sora они себя, естественно, не сравнивают. О доступе ничего неизвестно. Кода нет
#image2video
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models
Консистентная генерация изображения с разных ракурсов
Код
#text2image #consistency #multiview
Консистентная генерация изображения с разных ракурсов
Код
#text2image #consistency #multiview
👍5
SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation
Определение 3D позы по одному ракурсу
Код
Демо
#image2pose #video2pose #poseestimation
Определение 3D позы по одному ракурсу
Код
Демо
#image2pose #video2pose #poseestimation
🔥4👍2
Media is too big
VIEW IN TELEGRAM
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
Реконструкция больших сцен гауссианами. Бьет всех конкурентов, с которыми решил померяться . Рендерит в реальном времени. Под капотом дробление сцены на ячейки.
Код ждем
#gaussian #rendering #nivelview #realtime
Реконструкция больших сцен гауссианами. Бьет всех конкурентов
Код ждем
#gaussian #rendering #nivelview #realtime
👍9🔥5😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI_NetDist
Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.
#tools #SD
Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.
#tools #SD
👏13🔥10👍1