Нейронавт | Нейросети в творчестве
9.49K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Должен сказать, это офигительный инструмент для накидывания музыкальных идей. Нужно чтобы оно умело продолжать заданный отрывок
Media is too big
VIEW IN TELEGRAM
LAMP: Learn A Motion Pattern for Few-Shot-Based Video Generation

генератор видео по тексту. Генерит в два этапа: сначала генерит первый кадр, потом предсказывает движение. (А разве не все генераторы так делают?)

Редактировать видео тоже умеет, но при замене фона искажает и передний план, примеры на сайте

Код, пока без весов. Но особо буйные смогут обучить свой претрейн

#text2video
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
YandexART и Video-Kandiskiy

Яндекс и Сбер выкатили по генератору видео.
YandexART работает в приложении Шедеврум и Яндекс.Бизнес, Кандинский - в телеге
Не буду рассусоливать, пробуйте сами по ссылкам выше. Котики из Шедеврума

#text2video
👎6🔥1🤔1
ScaleCrafter: Tuning-free Higher-Resolution Visual Generationwith Diffusion Models

А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые

Код

#text2image #text2video
🔥5👍3
DA-CLIP: Controlling Vision-Language Models for Universal Image Restoration

Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.

Код
Демо

#image2image #imagerestoration #deblur #denoise #restoration
🤔3
4K4D: Real-Time 4D View Synthesis at 4K Resolution

Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU

Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео

Код

#rendering
Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference

Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5

Код
Модель
Демо
Колаб

#text2image
🔥9👍1
FreeU : Free Lunch in Diffusion U-Net

Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.

Код
Демо

#text2image #text2video #optimization
👍42
Forwarded from Neurogen
Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.

Скачать само расширение можно тут: Github

По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM

Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
4
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS

Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.

Кода пока нет

#text2scene #textto3D