Qwen-Image: Crafting with Native Text Rendering
Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование
Гитхаб
HF ~42GB + 16GB
Демо
спасибо постоянному спонсору новостей @iNevestenko
#text2image #image2image #imageediting
Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование
Гитхаб
HF ~42GB + 16GB
Демо
спасибо постоянному спонсору новостей @iNevestenko
#text2image #image2image #imageediting
👍15❤1👎1🔥1😁1
Рабочий демоспейс Qwen-Image (официальный пыжится но не работает, ни разу мне не сделал картинку). Да еще и с негативным промптом и guidance scale.
Быстрый как саморазборка ракеты Маска в верхних слоях атмосферы
guidance scale пришлось скрутить до 2.5 для получения рыбочеловеков
В общем пока не прорыв, непонятно как навалить реализма. А в сложные сцены, похоже, мастак. Но кредиты кончились увы
Демо
#text2image
Быстрый как саморазборка ракеты Маска в верхних слоях атмосферы
guidance scale пришлось скрутить до 2.5 для получения рыбочеловеков
В общем пока не прорыв, непонятно как навалить реализма. А в сложные сцены, похоже, мастак. Но кредиты кончились увы
Демо
#text2image
🔥3👍1
Qwen-Image-DF11
Пишут что DF11 это сжатие без потерь. Веса на 28Гб, пиковая загрузка VRAM с GPU Offloading - 16.68 GB
Не ради создания а ради редактирования!
Реддит
————————
ComfyUI Initial support for qwen image model
Начальная поддержка qwen-Image в #ComfyUI
Веса
воркфлоу (WIP)
————————
Бонусом новость:
.safetensors не такой уж "safe"
Вчера после выхода Qwen-Image появился репозиторий Qwen-Image NF4 с весами в формате .safetensors, который HF пометил как опасные. Я своими глазами видел эту кроваво-красную метку
Что именно они там нашли неизвестно. Сейчас репозиторий удален.
Обсуждение на реддит -там отписался и автор формата .safetensors
#news #text2image #imageediting
Пишут что DF11 это сжатие без потерь. Веса на 28Гб, пиковая загрузка VRAM с GPU Offloading - 16.68 GB
Не ради создания а ради редактирования!
Реддит
————————
ComfyUI Initial support for qwen image model
Начальная поддержка qwen-Image в #ComfyUI
Веса
воркфлоу (WIP)
————————
Бонусом новость:
.safetensors не такой уж "safe"
Вчера после выхода Qwen-Image появился репозиторий Qwen-Image NF4 с весами в формате .safetensors, который HF пометил как опасные. Я своими глазами видел эту кроваво-красную метку
Что именно они там нашли неизвестно. Сейчас репозиторий удален.
Обсуждение на реддит -там отписался и автор формата .safetensors
#news #text2image #imageediting
👍4🔥2
qwen-image-gguf-test
а вот и #GGUF под Qwen-Image
Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке
реддит
#text2image
а вот и #GGUF под Qwen-Image
Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке
реддит
#text2image
huggingface.co
lym00/qwen-image-gguf-test · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥5👍2❤1🍾1
Wan2.2 Image | Krea
Все, генерацию картинок силами #WAN22 завезли на Krea.ai
Бесплатных кредитов хватило на две генерации
#text2image #image2image #neuronaut_art
Все, генерацию картинок силами #WAN22 завезли на Krea.ai
Бесплатных кредитов хватило на две генерации
#text2image #image2image #neuronaut_art
👍4😁3❤1
Нейронавт | Нейросети в творчестве
qwen-image-gguf-test а вот и #GGUF под Qwen-Image Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке реддит #text2image
city96/Qwen-Image-gguf
Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда
Если не запускается, попробуйте обновить ComfyUI-GGUF
Альтернативные GGUF спасибо @ArtNeiroDz
ворклоу
#text2image #workflow
Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда
Если не запускается, попробуйте обновить ComfyUI-GGUF
Альтернативные GGUF спасибо @ArtNeiroDz
ворклоу
#text2image #workflow
huggingface.co
city96/Qwen-Image-gguf at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
1👍6😈1
LoRA Training for Qwen-Image
Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?
Инструмент для обучения подогнали FlyMy.ai
А также опубликовали лору реализм
qwen-image-realism-lora
#TEXT2IMAGE #LORA #FINETUNING
Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?
Инструмент для обучения подогнали FlyMy.ai
А также опубликовали лору реализм
qwen-image-realism-lora
#TEXT2IMAGE #LORA #FINETUNING
👍8❤4
Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation
Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям
1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM
Код
Веса
Демо
#vlm #imageediting #text2image
Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям
1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM
Код
Веса
Демо
#vlm #imageediting #text2image
👍7
Арена видеогенераторов запущена. Даже две
Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo
Text-to-Video Arena
Image-to-Video Arena
#text2image #image2image #arena #leaderboard
Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo
Text-to-Video Arena
Image-to-Video Arena
#text2image #image2image #arena #leaderboard
👍7🤔1
Qwen-Image-EliGen
Контролнет для Qwen-Image
Работает в DiffSynth-Studio
————————
Qwen-Image-Distill-Full
Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз.
Работает в DiffSynth-Studio
#controlnet #text2image #optimization
Контролнет для Qwen-Image
Работает в DiffSynth-Studio
————————
Qwen-Image-Distill-Full
Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз.
Работает в DiffSynth-Studio
#controlnet #text2image #optimization
1🔥8👍3👨💻1
Нейронавт | Нейросети в творчестве
Qwen-Image-EliGen Контролнет для Qwen-Image Работает в DiffSynth-Studio ———————— Qwen-Image-Distill-Full Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз. Работает в DiffSynth-Studio #controlnet…
+ Qwen-Image_ComfyUI
Дистиллированный qwen в репо Comfy-Org присутствует
Спасибо @GorillaFrame
И #gguf
https://huggingface.co/QuantStack/Qwen-Image-Distill-GGUF
Спасибо @ArtNeiroDz
#text2image #optimization
Дистиллированный qwen в репо Comfy-Org присутствует
Спасибо @GorillaFrame
И #gguf
https://huggingface.co/QuantStack/Qwen-Image-Distill-GGUF
Спасибо @ArtNeiroDz
#text2image #optimization
👍6
Qwen-Image-Lightning
Еще одна ускоренная модель, на 8 шагов.
На 4 шага - ждем
Протестировано на модели bf16 со стандартной нодой Lora
Гитхаб
Веса
Воркфлоу
#workflow #text2image #optimization
Еще одна ускоренная модель, на 8 шагов.
На 4 шага - ждем
Протестировано на модели bf16 со стандартной нодой Lora
Гитхаб
Веса
Воркфлоу
#workflow #text2image #optimization
👍8
Крутанские лоры Qwen-Image от нашего подписчика @Danrisi
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
Воркфлоу там же
Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту
Реддит - не скупитесь на лайки
#text2image #lora #workflow
🔥22👍5❤4👎1
Qwen-Image-Lightning-4steps-V1.0
А вот и четырехшаговая лора Qwen-Image
Гитхаб
Воркфлоу
#workflow #text2image #optimization #lora
А вот и четырехшаговая лора Qwen-Image
Гитхаб
Воркфлоу
#workflow #text2image #optimization #lora
🔥6👍3😁1👨💻1
Nano Banana
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
👍4🔥3
Skywork-UniPic
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
👍3👎3
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale
Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)
#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)
Офсайт не прогружается
Гитхаб
HF
#text2image #imageediting
Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)
#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)
Офсайт не прогружается
Гитхаб
HF
#text2image #imageediting
❤5👀3👎1🤔1😱1