Нейронавт | Нейросети в творчестве
9.44K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
FLUX.1-dev-ControlNet-Union-Pro-2.0

Поддерживает разные режимы включая canny, soft edge, depth, pose, gray

Обучен на 512x512

Демо

#controlnet #conditioning @text2image #image2image
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Это Flux Fill обученный на матрицах входных изображений.

Получает на вход матрицу картинок, например 2 ряда, 2 столбца и понимает какую задачу надо выполнить. Задач можно придумать много от переноса стиля до смены времени года и генерации технических карт.

Разрешение входных изображений в матрицах при обучении 384x384 пикселя

Много примеров на гитхабе и в демоспейсе

Очень интересно какое применение вы ему найдете?

Поломал голову пока понял что он делает и как это описать. Теперь не знаю какие теги придумать.
В коментах подсказывают что это близнец In-Context-LoRA

Код
Демо
HF

#referencing #image2image #conditioning #text2image
👍5
Мобильное приложение видеогенератора Vidu

Вы вообще генерируете видео на мобилах?

iOS
Android

#ios #android #mobile #text2image #image2image
👍1
Опубликован код инструмента для работы с изображениями ZenCtrl

Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном

Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.

Код

#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Predict2

Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.

2B и 14B

Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼

Код
Демо
Веса
воркфлоу

#text2image #text2video #image2image #image2video #world #physics
👍6
Media is too big
VIEW IN TELEGRAM
OmniGen2: Exploration to Advanced Multimodal Generation

Новая версия редактора-генератора-персонализатора изображений

Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.

Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их

Код

Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/

С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/

#personalization #imageediting #text2image #image2image #referencing
4👍3🔥1