Нейронавт | Нейросети в творчестве
9.41K subscribers
3.62K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art
👍4😁31
LoRA Training for Qwen-Image

Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?

Инструмент для обучения подогнали FlyMy.ai

А также опубликовали лору реализм

qwen-image-realism-lora

#TEXT2IMAGE #LORA #FINETUNING
👍84
Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation

Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям

1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM

Код
Веса
Демо

#vlm #imageediting #text2image
👍7
Арена видеогенераторов запущена. Даже две

Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo

Text-to-Video Arena


Image-to-Video Arena

#text2image #image2image #arena #leaderboard
👍7🤔1
Qwen-Image-EliGen

Контролнет для Qwen-Image

Работает в DiffSynth-Studio
————————

Qwen-Image-Distill-Full

Дистилляция Qwen-Image, хорошо работает на 15 шагах вместо 80, нет необходимости включать CFG, ускорение ~в 5 раз.

Работает в DiffSynth-Studio

#controlnet #text2image #optimization
1🔥8👍3👨‍💻1
Qwen-Image-Lightning

Еще одна ускоренная модель, на 8 шагов.
На 4 шага - ждем

Протестировано на модели bf16 со стандартной нодой Lora

Гитхаб
Веса
Воркфлоу

#workflow #text2image #optimization
👍8
Крутанские лоры Qwen-Image от нашего подписчика @Danrisi

Воркфлоу там же

Lenovo_Qwen - бустер реализма, ждем версию под Chrome
adorablegirls_qwen - с фокусом на женскую красоту

Реддит
- не скупитесь на лайки

#text2image #lora #workflow
🔥22👍54👎1
Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting
👍6🔥3
Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image
👍3👎3
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale

Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)

#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)

Офсайт не прогружается
Гитхаб
HF

#text2image #imageediting
5👀3👎2🤔1😱1
Заработал демоспейс редактора картинок от Stepfun NextStep-1-Large-Edit

Но похоже что даже на всего один прогон нужно больше кредитов чем выдают на бесплатном тарифе

Демо

#text2image #imageediting
😭2👍1
Обучение Chroma (чекпойнт на базе Flux Schnell) завершено, семейство моделей доступно для использования.

Модели можно дообучать под конкретные задачи.

Chroma1-Base (базовая модель 512x512)

Chroma1-HD (модель с высоким разрешением 1024x1024)

Chroma1-Flash (экспериментальная версия для ускорения работы моделей)

Chroma1-Radiance [WIP] (модель, работающая напрямую с пикселями, а не с латентным пространством, что должно устранить некоторые артефакты).

Базовые модели универсальны и дают больше возможностей для дальнейшей настройки, в отличие от моделей, заточенных под определённый стиль.

На примерах черрипики с flash и HD

Реддит
Fictional.ai - говорят, в мобильной аппке есть Chroma. Дают ли попробовать бесплатно не заню

#text2image #mobile #ios #android
👍10
Waver 1.0

Единая модель от ByteDance для генерации видео и изображений

3 место на T2V leaderboard & I2V leaderboard

— поддерживает создание видео по тексту и изображениям;

— генерирует видео длиной 5 и 10 секунд;

— работает с разрешением 720p и 1080p;

— создаёт видео с реалистичными движениями, особенно в масштабных сценах с людьми и животными;

— позволяет создавать нарративные видео с несколькими последовательными кадрами, сохраняя при этом согласованность сюжета, визуального стиля и атмосферы;

— поддерживает генерацию видео в различных художественных стилях, включая гиперреализм, анимацию, плюшевые игрушки и другие;

— способна отображать сложные и масштабные движения, например, в спортивных сценах;

— может создавать видео с многокамерным повествованием, обеспечивая согласованность основного объекта, визуального стиля и общей атмосферы при переключении кадров.

Гитхаб без кода
Дискорд - попробовать предлагают здесь

#text2image #image2video #text2video
👍9🤷‍♂11
Обновки в #ComfyUI

Nano-banana via ComfyUI API Nodes!

Поддержка нанобанана через API nodes
———————————

Day-1 Support of Qwen-Image InstantX ControlNet

Речь о поддержке Qwen-Image-ControlNet-Union вышедшем на прошлой неделе

воркфлоу

Обновляем комфи и пользуемся

#imageediting #text2image #controlnet #workflow
4👍4