Нейронавт | Нейросети в творчестве
9.49K subscribers
3.67K photos
3.17K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation

Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям

1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM

Код
Веса
Демо

#vlm #imageediting #text2image
👍7
Автор Flux Omini Kontext выпустил две лоры - для персонажа и для объекта.
На гитхабе у него большой To-do список, будем следить

Гитхаб - ссылки на лоры там

#referencing #inpainting #imageediting #kontext
🔥8👍4
Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting
👍6🔥3
Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image
👍3👎3
Нейронавт | Нейросети в творчестве
Skywork-UniPic И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки UniPic-1 - авторегрессионная модель с нуля UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M…
А тут и Гигачат подтянулся с редактированием картинок. Ну и чего тянуть, я его затестил. Все что он смог - надеть на Форреста шлем. Скафандр - нивкакую. И лягушонка Пепе не знает

Но это бесплатно, быстро и прямо в телеграме

Пользуйтесь @gigachat_bot

#imageediting #bot
👎10👍4😐2🤷‍♂1🌚1
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale

Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)

#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)

Офсайт не прогружается
Гитхаб
HF

#text2image #imageediting
5👀3👎2🤔1😱1
LIA-X: Interpretable Latent Portrait Animator

Оживлятор портретов по видеообразцу.
Позволяет также редактировать изображения и видео.
Умеет менять ракурс на персонажа в 3D пространстве.
Разбирает движения лица на простые элементы.
Контроль глаз, рта.

Похоже что проект на своей модели, нет упоминаний ни WAN, ни CogVideo, ничего такого

Код
Демо
Веса - 3.6 Gb

#portrainanimation #motion2video #imageediting #videoediting
1🔥8👍3🥴1
Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency

Редактирующая модель #qwenimage опубликована

Семантическое и визуальное редактирование: модель поддерживает как низкоуровневое редактирование внешнего вида (добавление, удаление или изменение элементов с сохранением остальных частей изображения), так и высокоуровневое семантическое редактирование (создание интеллектуальной собственности, поворот объектов, перенос стиля).

Точное редактирование текста: возможность добавлять, удалять и изменять текст на изображениях на китайском и английском языках с сохранением шрифта, размера и стиля.

Гитхаб
HF ~57 Gb, смотрите не надорвитесь
Попробовать в чате

#imageediting
👍12🔥6😁21🤯1
Заработал демоспейс редактора картинок от Stepfun NextStep-1-Large-Edit

Но похоже что даже на всего один прогон нужно больше кредитов чем выдают на бесплатном тарифе

Демо

#text2image #imageediting
😭2👍1
Оказывается у Qwen-Image-Edit чтото сломалось. Вчера разработчики починили и просят попробовать все заново.

Ну я и попробовал.
А заодно сравнил с nano-banana и Flux Kontext на арене.
Qwen понимает и слушается лучше контекста. Но похоже что банан еще круче

Промпт:

Give him an alike-looking sister wearing the same outfit, standing next to him, standing straight, hands in pockets, serious face. Keep the man unchanged, maintain his original pose, maintain original framing


Попробовать в чате - раньше он у меня даже не прогружался, сегодня даже выдает картинки

#imageediting #QWENIMAGE #shootout #comparison
😁10👍4😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Made by Google ‘25

Идет презентация Google.
—————————

Google Photos внедряет новую функцию редактирования изображений с помощью ИИ. Пользователи смогут описывать желаемые изменения текстом или голосом, а Gemini будет вносить правки автоматически. Сначала функция появится на Pixel 10 в США. Также в Google Photos добавят поддержку C2PA Content Credentials — это позволит видеть, как изображение было отредактировано с помощью ИИ. Редизайн редактора уже упрощает редактирование, предлагая AI-подсказки и объединяя инструменты в одном месте. С новой функцией можно будет делать как корректирующие правки (например, убрать отвлекающие элементы или исправить освещение), так и более креативные изменения (поменять фон, добавить предметы и т. д.).

#news #imageediting
3👀2
Nano-banana только что релизнули в Gemini 2.5 Flash

Доступно для граждан правильной страны в gemini app и Google AI Studio

Бежим творить у кого есть доступ. Притворитесь что вы в США и ломитесь в студию

Спасибо @iNevestenko

#imageediting #sota
🔥121👍1
Обновки в #ComfyUI

Nano-banana via ComfyUI API Nodes!

Поддержка нанобанана через API nodes
———————————

Day-1 Support of Qwen-Image InstantX ControlNet

Речь о поддержке Qwen-Image-ControlNet-Union вышедшем на прошлой неделе

воркфлоу

Обновляем комфи и пользуемся

#imageediting #text2image #controlnet #workflow
4👍4