Нейронавт | Нейросети в творчестве
9.25K subscribers
3.53K photos
3.05K videos
40 files
4.02K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
flux1-kontext-dev-fp8

Немасштабированные веса Контекст fp8
На 40% меньше оригинальных весов
Поддерживает E4M3FN и E5M2 форматы

#optimization #imageediting
🔥6👍2
FLUX.1-Kontext-dev-onnx

TensorRT версия Контекста

В репозитории BF16, FP8 и FP4 (SVDQuant)

Спасибо @iNevestenko

#optimization #imageediting
🔥10👍2
This media is not supported in your browser
VIEW IN TELEGRAM
BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing

проект от DeepMind, который объединяет точное управление геометрией в 3D с помощью Blender и генеративную композитинг-модель на основе предварительно обученной Stable Diffusion v2

Кода нет, кросивое

#imageediting #research
🔥8👍31
This media is not supported in your browser
VIEW IN TELEGRAM
Kontext Komposer + Kontext-powered Presets

Инструменты от Black Forest Labs, которые позволяют пользователям преобразовывать изображения без письменных подсказок, предлагая такие функции, как новые локации, пересветы, размещение товаров и создание киноплакатов.

На реддите уже надергали системных промптов из новых инструментов

спасибо @asleephidden

#imageediting
12👍7😱1
Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models

Добавление объектов на изображение от NVIDIA
По текстовому описанию

Код
Демо

#imageediting #inpainting
8👍4
HiDream-E1.1

Редактор картинок текстовыми указаниями HiDream-E1 обновили и выпустили в опенсорс

И есть bf16

#imageediting
👍12
ObjectClear ComfyUI от подписчика!

Заходим в директорию ComfyUI\custom_nodes
Открываем PowerShell и клонируем туда оригинальный репозиторий:
git clone https://github.com/zjx0101/ObjectClear.git
После успешного клонирования там появится папка ObjectClear
Закидываем в нее файлы __init__.py и object_clear_nodes.py

В воркфлоу ноду TranslateNodeBeta можно заменить на стандартную Prompt

Проверял - работает

Благодарим @GorillaFrame

#workflow #ComfyUI #inpainting #objectremoval #imageediting
👍121
This media is not supported in your browser
VIEW IN TELEGRAM
ObjectClear можно попробовать запустить в колабе если Comfy для вас не вариант

Jupiter / Colab

#inpainting #objectremoval #imageediting
👍4
Harmonize

В фотошопе обновки.
Во-первых конечно Harmonize. Этот инструмент вписывает объект в фон по свету. В прошлом году его представили под названием Project Perfect Blend

Generative Upscale увеличивает разрешение изображений до 8 мегапикселей без потери качества.

Инструмент Remove тоже обновили.

#relighting #upscale #inpainting #objectremoval #imageediting
👍81
Flux Omini Kontext

Фреймворк и лора для под #kontext для интеграциии персонажа в картинку с контролем положения и масштаба

Вдохновлено и на основе OminiControl

Гитхаб

#referencing #inpainting #imageediting
👍95
Qwen-Image: Crafting with Native Text Rendering

Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование

Гитхаб
HF ~42GB + 16GB
Демо

спасибо постоянному спонсору новостей @iNevestenko

#text2image #image2image #imageediting
👍151👎1🔥1😁1
Qwen-Image-DF11

Пишут что DF11 это сжатие без потерь. Веса на 28Гб, пиковая загрузка VRAM с GPU Offloading - 16.68 GB

Не ради создания а ради редактирования!

Реддит
————————

ComfyUI Initial support for qwen image model
Начальная поддержка qwen-Image в #ComfyUI

Веса
воркфлоу (WIP)
————————

Бонусом новость:

.safetensors не такой уж "safe"

Вчера после выхода Qwen-Image появился репозиторий Qwen-Image NF4 с весами в формате .safetensors, который HF пометил как опасные. Я своими глазами видел эту кроваво-красную метку

Что именно они там нашли неизвестно. Сейчас репозиторий удален.

Обсуждение на реддит -там отписался и автор формата .safetensors

#news #text2image #imageediting
👍4🔥2
Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation

Генератор-пониматор-редактор картинок на авторегрессии.
Редактирует по текстовым указаниям

1.5B параметров.
На создание изображения 1024х1024 расходует меньше 15Гб VRAM

Код
Веса
Демо

#vlm #imageediting #text2image
👍7
Автор Flux Omini Kontext выпустил две лоры - для персонажа и для объекта.
На гитхабе у него большой To-do список, будем следить

Гитхаб - ссылки на лоры там

#referencing #inpainting #imageediting #kontext
🔥7👍4
Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting
👍4🔥3
Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image
👍3👎3
Нейронавт | Нейросети в творчестве
Skywork-UniPic И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки UniPic-1 - авторегрессионная модель с нуля UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M…
А тут и Гигачат подтянулся с редактированием картинок. Ну и чего тянуть, я его затестил. Все что он смог - надеть на Форреста шлем. Скафандр - нивкакую. И лягушонка Пепе не знает

Но это бесплатно, быстро и прямо в телеграме

Пользуйтесь @gigachat_bot

#imageediting #bot
👎10👍4😐2🤷‍♂1🌚1
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale

Новая модель от Степана (Stepfun). Генератор-редактор картинок на авторегрессии (картинка создается последовательно, пиксель за пикселем, а не итеративно как в диффузии)

#sota авторегресии на генерации изображений. 14B параметров, 60Гб весов. Результаты трудно разглядеть. Предположительно, качество на уровне SD1.5. Астрологи объявили эру неподъемных моделей с незаметным качеством, но послушных (но это неточно)

Офсайт не прогружается
Гитхаб
HF

#text2image #imageediting
5👀3👎1🤔1😱1