Нейронавт | Нейросети в творчестве
9.23K subscribers
3.53K photos
3.04K videos
40 files
4.02K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Это Flux Fill обученный на матрицах входных изображений.

Получает на вход матрицу картинок, например 2 ряда, 2 столбца и понимает какую задачу надо выполнить. Задач можно придумать много от переноса стиля до смены времени года и генерации технических карт.

Разрешение входных изображений в матрицах при обучении 384x384 пикселя

Много примеров на гитхабе и в демоспейсе

Очень интересно какое применение вы ему найдете?

Поломал голову пока понял что он делает и как это описать. Теперь не знаю какие теги придумать.
В коментах подсказывают что это близнец In-Context-LoRA

Код
Демо
HF

#referencing #image2image #conditioning #text2image
👍5
Мобильное приложение видеогенератора Vidu

Вы вообще генерируете видео на мобилах?

iOS
Android

#ios #android #mobile #text2image #image2image
👍1
Опубликован код инструмента для работы с изображениями ZenCtrl

Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном

Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.

Код

#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Predict2

Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.

2B и 14B

Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼

Код
Демо
Веса
воркфлоу

#text2image #text2video #image2image #image2video #world #physics
👍6
Media is too big
VIEW IN TELEGRAM
OmniGen2: Exploration to Advanced Multimodal Generation

Новая версия редактора-генератора-персонализатора изображений

Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.

Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их

Код

Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/

С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/

#personalization #imageediting #text2image #image2image #referencing
4👍3🔥1
Flux Kontext Character Turnaround Sheet LoRA

Лора #kontext на рабочий лист персонажа

HF
Civitai

#lora #image2image
👍171
MVAR: Auto-Regressively Generating Multi-View Consistent Images

Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии

Код

#multiview #novelview #text2image #image2image
👍6
Higgsfield Steal

Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.

Работает это все через браузерное расширение

Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.

Спасибо @asleephidden

#referencing #image2video #image2image
👍17👎5
kontext-make-person-real

Лора под #Kontext для нормальной непластиковой кожи

Промпт для активации: make this person look real
Настройки: 30 steps, CFG 2.5

#lora #image2image
🔥17😁6👍2
Media is too big
VIEW IN TELEGRAM
Ideogram Character

Персонализатор от Ideogram.
Обещают высокое сходство.
Бесплатно 10 генераций

#personalization #referencing #image2image #text2image
👍5
Veo3 бесплатно

lmarena запустили Video Arena, правда пока только в дискорде

На арене Veo 3, Seedance, Kling, Hailuo и Pika и что-то еще

1️⃣ Вам нужно зайти в Discord
2️⃣ Использовать команду /video или /image-to-video в каналах ⁠video-arena-1,2,3.
3️⃣ Написать промпт
4️⃣ Получить результат и проголосовать за лучший вариант.

Бот будет генерировать два видео из доступных 7 моделей и часто среди них veo3.

Если в промпте указать, чтобы в ролике говорили, то бот сгенерирует видео veo3.

В день дают 8 генераций

Подрезал у @tips_ai

#text2image #image2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1116🔥5👍4👨‍💻2
Qwen-Image: Crafting with Native Text Rendering

Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование

Гитхаб
HF ~42GB + 16GB
Демо

спасибо постоянному спонсору новостей @iNevestenko

#text2image #image2image #imageediting
👍151👎1🔥1😁1
Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art
👍4😁31
Арена видеогенераторов запущена. Даже две

Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo

Text-to-Video Arena


Image-to-Video Arena

#text2image #image2image #arena #leaderboard
👍7🤔1
Помните думающий инпейнтер картинок LanPaint?
В него добавили поддержку Qwen-Image

Гитхаб
воркфлоу

#inpainting #image2image #workflow
👍61
Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting
👍4🔥3
Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image
👍3👎3