This media is not supported in your browser
VIEW IN TELEGRAM
божечки, это прекрасно
This media is not supported in your browser
VIEW IN TELEGRAM
Должен сказать, это офигительный инструмент для накидывания музыкальных идей. Нужно чтобы оно умело продолжать заданный отрывок
Media is too big
VIEW IN TELEGRAM
LAMP: Learn A Motion Pattern for Few-Shot-Based Video Generation
генератор видео по тексту. Генерит в два этапа: сначала генерит первый кадр, потом предсказывает движение. (А разве не все генераторы так делают?)
Редактировать видео тоже умеет, но при замене фона искажает и передний план, примеры на сайте
Код, пока без весов. Но особо буйные смогут обучить свой претрейн
#text2video
генератор видео по тексту. Генерит в два этапа: сначала генерит первый кадр, потом предсказывает движение. (А разве не все генераторы так делают?)
Редактировать видео тоже умеет, но при замене фона искажает и передний план, примеры на сайте
Код, пока без весов. Но особо буйные смогут обучить свой претрейн
#text2video
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
YandexART и Video-Kandiskiy
Яндекс и Сбер выкатили по генератору видео.
YandexART работает в приложении Шедеврум и Яндекс.Бизнес, Кандинский - в телеге
Не буду рассусоливать, пробуйте сами по ссылкам выше. Котики из Шедеврума
#text2video
Яндекс и Сбер выкатили по генератору видео.
YandexART работает в приложении Шедеврум и Яндекс.Бизнес, Кандинский - в телеге
Не буду рассусоливать, пробуйте сами по ссылкам выше. Котики из Шедеврума
#text2video
👎6🔥1🤔1
ScaleCrafter: Tuning-free Higher-Resolution Visual Generationwith Diffusion Models
А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые
Код
#text2image #text2video
А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые
Код
#text2image #text2video
🔥5👍3
DA-CLIP: Controlling Vision-Language Models for Universal Image Restoration
Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.
Код
Демо
#image2image #imagerestoration #deblur #denoise #restoration
Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.
Код
Демо
#image2image #imagerestoration #deblur #denoise #restoration
🤔3
4K4D: Real-Time 4D View Synthesis at 4K Resolution
Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU
Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео
Код
#rendering
Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU
Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео
Код
#rendering
Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference
Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5
Код
Модель
Демо
Колаб
#text2image
Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5
Код
Модель
Демо
Колаб
#text2image
🔥9👍1
FreeU : Free Lunch in Diffusion U-Net
Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.
Код
Демо
#text2image #text2video #optimization
Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.
Код
Демо
#text2image #text2video #optimization
👍4❤2
Forwarded from Neurogen
Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.
Скачать само расширение можно тут: Github
По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM
Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
Скачать само расширение можно тут: Github
По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM
Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
❤4
Кто-то собрал неофициальную имплементацию RealFill
Код (неофициальный)
#image2image #inpainting #outpainting
Код (неофициальный)
#image2image #inpainting #outpainting
Telegram
Нейронавт | Нейросети в творчестве
RealFillReference-Driven Generation for Authentic Image Completion
Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…
Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS
Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.
Кода пока нет
#text2scene #textto3D
Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.
Кода пока нет
#text2scene #textto3D