Нейронавт | Нейросети в творчестве
9.46K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Flux Kontext Character Turnaround Sheet LoRA

Лора #kontext на рабочий лист персонажа

HF
Civitai

#lora #image2image
👍171
MVAR: Auto-Regressively Generating Multi-View Consistent Images

Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии

Код

#multiview #novelview #text2image #image2image
👍6
Higgsfield Steal

Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.

Работает это все через браузерное расширение

Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.

Спасибо @asleephidden

#referencing #image2video #image2image
👍17👎51
kontext-make-person-real

Лора под #Kontext для нормальной непластиковой кожи

Промпт для активации: make this person look real
Настройки: 30 steps, CFG 2.5

#lora #image2image
🔥17😁6👍2
Media is too big
VIEW IN TELEGRAM
Ideogram Character

Персонализатор от Ideogram.
Обещают высокое сходство.
Бесплатно 10 генераций

#personalization #referencing #image2image #text2image
👍5
Veo3 бесплатно

lmarena запустили Video Arena, правда пока только в дискорде

На арене Veo 3, Seedance, Kling, Hailuo и Pika и что-то еще

1️⃣ Вам нужно зайти в Discord
2️⃣ Использовать команду /video или /image-to-video в каналах ⁠video-arena-1,2,3.
3️⃣ Написать промпт
4️⃣ Получить результат и проголосовать за лучший вариант.

Бот будет генерировать два видео из доступных 7 моделей и часто среди них veo3.

Если в промпте указать, чтобы в ролике говорили, то бот сгенерирует видео veo3.

В день дают 8 генераций

Подрезал у @tips_ai

#text2image #image2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1116🔥5👍4👨‍💻2
Qwen-Image: Crafting with Native Text Rendering

Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование

Гитхаб
HF ~42GB + 16GB
Демо

спасибо постоянному спонсору новостей @iNevestenko

#text2image #image2image #imageediting
👍151👎1🔥1😁1
Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art
👍4😁31
Арена видеогенераторов запущена. Даже две

Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo

Text-to-Video Arena


Image-to-Video Arena

#text2image #image2image #arena #leaderboard
👍7🤔1
Помните думающий инпейнтер картинок LanPaint?
В него добавили поддержку Qwen-Image

Гитхаб
воркфлоу

#inpainting #image2image #workflow
👍61
Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting
👍6🔥3
Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image
👍3👎3
USO: Unified Style and Subject-Driven Generation via Disentangled and Reward Learning

Модель от ByteDance, наследник UNO.
Позволяет свободно комбинировать любые предметы с любыми стилями в различных сценариях

Есть режим Low VRAM, пиковое потребление 16GB (один референс) и ~18GB (мультиреференс)

Сама модель представляет собой лору для Flux.dev, так что и на 8Gb можно будет завести

Код
Демо
HF

#personalization #referencing #text2image #image2image
1👍111🔥1