Нейронавт | Нейросети в творчестве

0:20

VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip

Улучшает обработку негативных промптов генераторами
Существующие методы (CFG) либо работают плохо, либо требуют серьезных изменений в модели (NegationCLIP).

VSF переворачивает вектор значений негативных вложений подсказок во время внимания.

- Поддерживает SD3.5, Flux, Wan
- Работает в томи числе с малошаговыми и одношаговыми моделями
- Не требует переобучения
- Отсутствует усиление незапрашиваемых концепций
- Маскирование внимания и дупликация токенов для изоляции влияния в заданных областях

На видео - Flux, позитивный промпт a canadian winter landscape in the style of a 19th century painting и негативный промпт snow с возрастающей силой от 1 до 8.9

Примеры работы с WAN 2.1 тут

Код
Демо Wan 2.1

#optimization #text2image #negativeprompt

👍7🔥3

1.81K views14:07

Value Sign Flip for ComfyUI (Wan 2.1)

VSF нода для WAN 2.1 подъехала!
Бежим писать негативные промпты

#ComfyUI #optimization #text2video #negativeprompt

❤4👍4🤷‍♂2

1.73K views07:11

FastWan

Kijai вытряхнул лору из FastVideo и вонзил в Wan, пишут что выдает прекрасные результаты в связке с LightX2V за 2 шага!

Реддит

#optimization #text2video #image2video

🔥3👍1

1.35K views07:41

0:03

👍7❤1

1.41K views07:41

0:13

Ускоряющая четырехшаговая лора WAN2.1-lightx2v работает с WAN2.2!

воркфлоу
лора

#text2video #lora #image2video #optimization #workflow

❤6👍2🔥2🤔1

2.05K views06:22

SADA: Stability-guided Adaptive Diffusion Acceleration

Ускорение диффузии в одну строку кода в HF diffusers.

Стабильное ускорение в 1.8-2 раза в SD2, SDXL, FLUX с минимальной потерей качества

Код

#text2image #optimization

👍4❤1

1.83K viewsedited 09:41

Day 1 4-Bit FLUX.1-Krea-dev Support with Nunchaku

В nunchaku добавлена поддержка 4-битногоt FLUX.1-Krea-dev

Веса
Скрипт
Гитхаб
реддит

#text2image #optimization

❤12👍4😱1

1.75K views11:14

FLUX-Krea-Blaze

Ускоренная 4-шаговая версия FLUX.1-Krea.DEV

~8.30s на rtx 3090 (1280x560)

Рекомендованные настройки:

4 Steps Res2 - Bong Tangent
8 Steps UniPc - sgm_uniform

Там же в папке LoRas - лоры 32, 64 and 128 Rank

воркфлоу 8 Step-1920x1080

#optimization #lora #workflow #text2image

1👍14🔥3

2.04K views07:11

Wan2.2-Lightning
Как понимаю, низкошаговый форк #Wan22

lightx2v Wan2.2-Lightning Лоры
Kijai Wan2.2-Lightning Лоры

Воркфлоу искать у Kijai

Спасибо @muxastarikov

#text2video #optimization

👍12🔥1

1.94K views05:56

FastWan: Generating a 5-Second Video in 5 Seconds via Sparse Distillation

Ускоритель FastVideo официально прикрутили к WAN2.1 (1.3B, 14B) и к #WAN22 (пока только 5B. Ждем 14B)

FastWan2.1-1.3B генерирует 5-секундное видео в формате 480P за 5 секунд (время денойза - 1 секунда) на одном H200 и 21 секунду (время денойза - 2,8 секунды) на одном RTX 4090.

FastWan2.2-5B создает 5-секундное видео в формате 720P за 16 секунд на одном H200

Демо

Веса 2.2
Веса 2.1

#text2iomage #optimization

👍7🔥3

1.81K views07:41

lightx2v LoRA обновились

Добавлены
Wan2.2-T2V-A14B-4steps-lora-rank64-Seko-V1.1
И
Wan2.2-I2V-A14B-4steps-lora-rank64-Seko-V1

Kijai тоже обновил свой репо

#text2video #optimization #image2video #wan22 #lora

1❤4👍3🔥2

2.05K views16:36

Qwen-Image-EliGen

Контролнет для Qwen-Image

Работает в DiffSynth-Studio
————————

Qwen-Image-Distill-Full

Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз.

Работает в DiffSynth-Studio

#controlnet #text2image #optimization

1🔥8👍3👨‍💻1

1.65K views06:09

Qwen-Image-EliGen Контролнет для Qwen-Image Работает в DiffSynth-Studio ———————— Qwen-Image-Distill-Full Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз. Работает в DiffSynth-Studio #controlnet…

+ Qwen-Image_ComfyUI

Дистиллированный qwen в репо Comfy-Org присутствует

Спасибо @GorillaFrame

И #gguf
https://huggingface.co/QuantStack/Qwen-Image-Distill-GGUF

Спасибо @ArtNeiroDz

#text2image #optimization

👍6

1.64K viewsedited 06:39

Qwen-Image-Lightning

Еще одна ускоренная модель, на 8 шагов.
На 4 шага - ждем

Протестировано на модели bf16 со стандартной нодой Lora

Гитхаб
Веса
Воркфлоу

#workflow #text2image #optimization

👍8

1.73K views08:11

Qwen-Image-Lightning-4steps-V1.0

А вот и четырехшаговая лора Qwen-Image

Гитхаб
Воркфлоу

#workflow #text2image #optimization #lora

🔥6👍3😁1👨‍💻1

1.71K views10:13

nunchaku-qwen-image

Квантизованный #qwenimage под nunchaku

Скрипт

#text2image #optimization

👍8🔥2

1.67K viewsedited 15:18

Self-Forcing: Making AI Video Generation Endless

Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing

Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.

В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации

И выложил все в опенсорс

Требования: 24Gb VRAM, 64Gb RAM, Linux

Гитхаб
Реддит

#optimization #video2video #videoediting #realtime #text2video

🔥7👍5

1.56K views11:14

0:25