Нейронавт | Нейросети в творчестве

Qwen-Image: Crafting with Native Text Rendering

Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование

Гитхаб
HF ~42GB + 16GB
Демо

спасибо постоянному спонсору новостей @iNevestenko

#text2image #image2image #imageediting

👍15❤1👎1🔥1😁1

2K views16:35

Рабочий демоспейс Qwen-Image (официальный пыжится но не работает, ни разу мне не сделал картинку). Да еще и с негативным промптом и guidance scale.
Быстрый как саморазборка ракеты Маска в верхних слоях атмосферы

guidance scale пришлось скрутить до 2.5 для получения рыбочеловеков

В общем пока не прорыв, непонятно как навалить реализма. А в сложные сцены, похоже, мастак. Но кредиты кончились увы

Демо

#text2image

🔥3👍1

1.44K views07:11

Нейронавт | Нейросети в творчестве

Qwen-Image-DF11

Пишут что DF11 это сжатие без потерь. Веса на 28Гб, пиковая загрузка VRAM с GPU Offloading - 16.68 GB

Не ради создания а ради редактирования!

Реддит
————————

ComfyUI Initial support for qwen image model
Начальная поддержка qwen-Image в #ComfyUI

Веса
воркфлоу (WIP)
————————

Бонусом новость:

.safetensors не такой уж "safe"

Вчера после выхода Qwen-Image появился репозиторий Qwen-Image NF4 с весами в формате .safetensors, который HF пометил как опасные. Я своими глазами видел эту кроваво-красную метку

Что именно они там нашли неизвестно. Сейчас репозиторий удален.

Обсуждение на реддит -там отписался и автор формата .safetensors

#news #text2image #imageediting

👍4🔥2

1.55K viewsedited 08:41

Нейронавт | Нейросети в творчестве

qwen-image-gguf-test

а вот и #GGUF под Qwen-Image

Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке

реддит

#text2image

huggingface.co

lym00/qwen-image-gguf-test · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥5👍2❤1🍾1

1.78K views11:13

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art

👍4😁3❤1

2.52K views18:22

Нейронавт | Нейросети в творчестве

qwen-image-gguf-test а вот и #GGUF под Qwen-Image Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке реддит #text2image

city96/Qwen-Image-gguf

Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда

Если не запускается, попробуйте обновить ComfyUI-GGUF

Альтернативные GGUF спасибо @ArtNeiroDz

ворклоу

#text2image #workflow

huggingface.co

city96/Qwen-Image-gguf at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

1👍6😈1

1.82K viewsedited 06:41

Нейронавт | Нейросети в творчестве

LoRA Training for Qwen-Image

Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?

Инструмент для обучения подогнали FlyMy.ai

А также опубликовали лору реализм

qwen-image-realism-lora

#TEXT2IMAGE #LORA #FINETUNING

👍8❤4

1.74K views10:13

Нейронавт | Нейросети в творчестве

Instagirl v1 WAN 2.2/WAN 2.1 Начались первые приношения богу лор 2.2 #lora

Instagirl 2.0

Там обновилась лора для скуфов-онлифанщиков

#lora #wan22 #text2image

👍8😁6👎2

1.73K views12:49

Нейронавт | Нейросети в творчестве

Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation

Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям

1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM

Код
Веса
Демо

#vlm #imageediting #text2image

👍7

1.64K viewsedited 06:09

Нейронавт | Нейросети в творчестве

Арена видеогенераторов запущена. Даже две

Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo

Text-to-Video Arena

Image-to-Video Arena

#text2image #image2image #arena #leaderboard

👍7🤔1

1.75K views08:45

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Qwen-Image завезли на Krea.ai

#text2image #online

👍9

1.8K viewsedited 19:22

Нейронавт | Нейросети в творчестве

Qwen-Image-EliGen

Контролнет для Qwen-Image

Работает в DiffSynth-Studio
————————

Qwen-Image-Distill-Full

Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз.

Работает в DiffSynth-Studio

#controlnet #text2image #optimization

1🔥8👍3👨‍💻1

1.49K views06:09

Нейронавт | Нейросети в творчестве

Qwen-Image-EliGen Контролнет для Qwen-Image Работает в DiffSynth-Studio ———————— Qwen-Image-Distill-Full Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз. Работает в DiffSynth-Studio #controlnet…

+ Qwen-Image_ComfyUI

Дистиллированный qwen в репо Comfy-Org присутствует

Спасибо @GorillaFrame

И #gguf
https://huggingface.co/QuantStack/Qwen-Image-Distill-GGUF

Спасибо @ArtNeiroDz

#text2image #optimization

👍6

1.51K viewsedited 06:39

Нейронавт | Нейросети в творчестве

Qwen-Image-Lightning

Еще одна ускоренная модель, на 8 шагов.
На 4 шага - ждем

Протестировано на модели bf16 со стандартной нодой Lora

Гитхаб
Веса
Воркфлоу

#workflow #text2image #optimization

👍8

1.58K views08:11

Нейронавт | Нейросети в творчестве

Крутанские лоры Qwen-Image от нашего подписчика @Danrisi

Воркфлоу там же

Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту

Реддит - не скупитесь на лайки

#text2image #lora #workflow

🔥22👍5❤4👎1

1.6K views08:41

Нейронавт | Нейросети в творчестве

Qwen-Image-Lightning-4steps-V1.0

А вот и четырехшаговая лора Qwen-Image

Гитхаб
Воркфлоу

#workflow #text2image #optimization #lora

🔥6👍3😁1👨‍💻1

1.48K views10:13

Нейронавт | Нейросети в творчестве

Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting

👍4🔥3

1.17K views06:47

Нейронавт | Нейросети в творчестве

Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image

👍3👎3

992 views07:38

Нейронавт | Нейросети в творчестве

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale

Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)

#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)

Офсайт не прогружается
Гитхаб
HF

#text2image #imageediting

❤5👀3👎1🤔1😱1

821 views14:17

Нейронавт | Нейросети в творчестве

nunchaku-qwen-image

Квантизованный #qwenimage под nunchaku

#text2image #optimization

👍8🔥2

819 views15:18

About

Blog

Apps

Platform