Нейронавт | Нейросети в творчестве
9.33K subscribers
3.58K photos
3.09K videos
40 files
4.06K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Ускоритель видеогенерации Radial Attention теперь совместим с SageAttention version 1

А также поддерживает Wan2.1_14B_FusionX LoRA

Это означает генерацию за 8 шагов (90 секунд на H100)

Гитхаб

#optimization #text2video
👍12😁1🤯1
SageAttention3 - ранний доступ

Для раннего доступа к ускорятору генерации заполните анкету на HF.
Доступ дают владельцам GPU Blackwell (серия 50xx)

#optimization #news
👍5😱1
VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip

Улучшает обработку негативных промптов генераторами
Существующие методы (CFG) либо работают плохо, либо требуют серьезных изменений в модели (NegationCLIP).

VSF переворачивает вектор значений негативных вложений подсказок во время внимания.

- Поддерживает SD3.5, Flux, Wan
- Работает в томи числе с малошаговыми и одношаговыми моделями
- Не требует переобучения
- Отсутствует усиление незапрашиваемых концепций
- Маскирование внимания и дупликация токенов для изоляции влияния в заданных областях

На видео - Flux, позитивный промпт a canadian winter landscape in the style of a 19th century painting и негативный промпт snow с возрастающей силой от 1 до 8.9

Примеры работы с WAN 2.1 тут

Код
Демо Wan 2.1

#optimization #text2image #negativeprompt
👍7🔥3
Value Sign Flip for ComfyUI (Wan 2.1)

VSF нода для WAN 2.1 подъехала!
Бежим писать негативные промпты

#ComfyUI #optimization #text2video #negativeprompt
4👍4🤷‍♂2
FastWan

Kijai вытряхнул лору из FastVideo и вонзил в Wan, пишут что выдает прекрасные результаты в связке с LightX2V за 2 шага!

Реддит

#optimization #text2video #image2video
🔥3👍1
FastWan

Kijai вытряхнул лору из FastVideo и вонзил в Wan, пишут что выдает прекрасные результаты в связке с LightX2V за 2 шага!

Реддит

#optimization #text2video #image2video
👍71
SADA: Stability-guided Adaptive Diffusion Acceleration

Ускорение диффузии в одну строку кода в HF diffusers.

Стабильное ускорение в 1.8-2 раза в SD2, SDXL, FLUX с минимальной потерей качества

Код

#text2image #optimization
👍41
Day 1 4-Bit FLUX.1-Krea-dev Support with Nunchaku

В nunchaku добавлена поддержка 4-битногоt FLUX.1-Krea-dev

Веса
Скрипт
Гитхаб
реддит

#text2image #optimization
12👍4😱1
FLUX-Krea-Blaze

Ускоренная 4-шаговая версия FLUX.1-Krea.DEV

~8.30s на rtx 3090 (1280x560)

Рекомендованные настройки:
4 Steps Res2 - Bong Tangent
8 Steps UniPc - sgm_uniform


Там же в папке LoRas - лоры 32, 64 and 128 Rank

воркфлоу 8 Step-1920x1080

#optimization #lora #workflow #text2image
1👍14🔥3
FastWan: Generating a 5-Second Video in 5 Seconds via Sparse Distillation

Ускоритель FastVideo официально прикрутили к WAN2.1 (1.3B, 14B) и к #WAN22 (пока только 5B. Ждем 14B)

FastWan2.1-1.3B генерирует 5-секундное видео в формате 480P за 5 секунд (время денойза - 1 секунда) на одном H200 и 21 секунду (время денойза - 2,8 секунды) на одном RTX 4090.

FastWan2.2-5B создает 5-секундное видео в формате 720P за 16 секунд на одном H200

Демо

Веса 2.2
Веса 2.1

#text2iomage #optimization
👍7🔥3
lightx2v LoRA обновились

Добавлены
Wan2.2-T2V-A14B-4steps-lora-rank64-Seko-V1.1
И
Wan2.2-I2V-A14B-4steps-lora-rank64-Seko-V1

Kijai тоже обновил свой репо

#text2video #optimization #image2video #wan22 #lora
14👍3🔥2
Qwen-Image-EliGen

Контролнет для Qwen-Image

Работает в DiffSynth-Studio
————————

Qwen-Image-Distill-Full

Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз.

Работает в DiffSynth-Studio

#controlnet #text2image #optimization
1🔥8👍3👨‍💻1
Qwen-Image-Lightning

Еще одна ускоренная модель, на 8 шагов.
На 4 шага - ждем

Протестировано на модели bf16 со стандартной нодой Lora

Гитхаб
Веса
Воркфлоу

#workflow #text2image #optimization
👍8
Self-Forcing: Making AI Video Generation Endless

Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing

Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.

В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации

И выложил все в опенсорс

Требования: 24Gb VRAM, 64Gb RAM, Linux

Гитхаб
Реддит

#optimization #video2video #videoediting #realtime #text2video
🔥7👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Raylight

МультиGPU в #ComfyUI

Поддерживаются некоторые модели Wan (например, Wan 1.3B T2V и Wan 14B T2V), а также есть частичная поддержка других моделей (Flux, Qwen, Hunyuan). Для работы требуется FlashAttention. Есть известные проблемы, например, ошибки OOM при работе с большими моделями
Нет поддержки Non-DiT моделей

Не тестировано на Windows

спасибо @nightkraw13r

#optimization #gpu
🔥6👍2