This media is not supported in your browser
VIEW IN TELEGRAM
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning
Это Flux Fill обученный на матрицах входных изображений.
Получает на вход матрицу картинок, например 2 ряда, 2 столбца и понимает какую задачу надо выполнить. Задач можно придумать много от переноса стиля до смены времени года и генерации технических карт.
Разрешение входных изображений в матрицах при обучении 384x384 пикселя
Много примеров на гитхабе и в демоспейсе
Очень интересно какое применение вы ему найдете?
Поломал голову пока понял что он делает и как это описать. Теперь не знаю какие теги придумать.
В коментах подсказывают что это близнец In-Context-LoRA
Код
Демо
HF
#referencing #image2image #conditioning #text2image
Это Flux Fill обученный на матрицах входных изображений.
Получает на вход матрицу картинок, например 2 ряда, 2 столбца и понимает какую задачу надо выполнить. Задач можно придумать много от переноса стиля до смены времени года и генерации технических карт.
Разрешение входных изображений в матрицах при обучении 384x384 пикселя
Много примеров на гитхабе и в демоспейсе
Очень интересно какое применение вы ему найдете?
Поломал голову пока понял что он делает и как это описать. Теперь не знаю какие теги придумать.
В коментах подсказывают что это близнец In-Context-LoRA
Код
Демо
HF
#referencing #image2image #conditioning #text2image
👍5
Мобильное приложение видеогенератора Vidu
Вы вообще генерируете видео на мобилах?
iOS
Android
#ios #android #mobile #text2image #image2image
Вы вообще генерируете видео на мобилах?
iOS
Android
#ios #android #mobile #text2image #image2image
👍1
Опубликован код инструмента для работы с изображениями ZenCtrl
Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном
Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.
Код
#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном
Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.
Код
#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
👍5
ComfyUI wrapper nodes for Latent Bridge Matching (LBM)
Подвезли #ComfyUI преобразователя изображений LBM
воркфлоу
туториал
Спасибо @kostyanchik_94
#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration
Подвезли #ComfyUI преобразователя изображений LBM
воркфлоу
туториал
Спасибо @kostyanchik_94
#workflow #image2image #imageediting #inpainting #objectremoval #relighting #image2depth #image2normal #enhance #tutorial #imagerestoration
👍12🔥1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Predict2
Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.
2B и 14B
Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼
Код
Демо
Веса
воркфлоу
#text2image #text2video #image2image #image2video #world #physics
Семейство моделей от NVIDIA для создания изображений, видео и состояний мира с учетом физики - на основе текста, картинок или видеовходов.
2B и 14B
Про 2B пишут что хорошо, хотя втрое медленее SDXL при своей маленькости 😼
Код
Демо
Веса
воркфлоу
#text2image #text2video #image2image #image2video #world #physics
👍6
Media is too big
VIEW IN TELEGRAM
OmniGen2: Exploration to Advanced Multimodal Generation
Новая версия редактора-генератора-персонализатора изображений
Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.
Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их
Код
Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/
С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/
#personalization #imageediting #text2image #image2image #referencing
Новая версия редактора-генератора-персонализатора изображений
Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.
Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их
Код
Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/
С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/
#personalization #imageediting #text2image #image2image #referencing
❤4👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DRA-Ctrl: Dimension-Reduction Attack! Video Generative Models are Experts on Controllable Image Synthesis
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
❤8🔥4
ComfyUI-OmniGen2
Большое упущение с моей стороны что не опубликовал до сих пор. Бежим играть с омнигеном2
#personalization #imageediting #text2image #image2image #referencing #comfyui
Большое упущение с моей стороны что не опубликовал до сих пор. Бежим играть с омнигеном2
#personalization #imageediting #text2image #image2image #referencing #comfyui
GitHub
GitHub - neverbiasu/ComfyUI-OmniGen2: A ComfyUI extension for OmniGen2
A ComfyUI extension for OmniGen2. Contribute to neverbiasu/ComfyUI-OmniGen2 development by creating an account on GitHub.
🔥8
Flux Kontext Character Turnaround Sheet LoRA
Лора #kontext на рабочий лист персонажа
HF
Civitai
#lora #image2image
Лора #kontext на рабочий лист персонажа
HF
Civitai
#lora #image2image
👍17❤1
MVAR: Auto-Regressively Generating Multi-View Consistent Images
Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии
Код
#multiview #novelview #text2image #image2image
Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии
Код
#multiview #novelview #text2image #image2image
👍6
Higgsfield Steal
Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.
Работает это все через браузерное расширение
Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.
Спасибо @asleephidden
#referencing #image2video #image2image
Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.
Работает это все через браузерное расширение
Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.
Спасибо @asleephidden
#referencing #image2video #image2image
👍17👎5
kontext-make-person-real
Лора под #Kontext для нормальной непластиковой кожи
Промпт для активации:
Настройки: 30 steps, CFG 2.5
#lora #image2image
Лора под #Kontext для нормальной непластиковой кожи
Промпт для активации:
make this person look real
Настройки: 30 steps, CFG 2.5
#lora #image2image
🔥17😁6👍2
Media is too big
VIEW IN TELEGRAM
Ideogram Character
Персонализатор от Ideogram.
Обещают высокое сходство.
Бесплатно 10 генераций
#personalization #referencing #image2image #text2image
Персонализатор от Ideogram.
Обещают высокое сходство.
Бесплатно 10 генераций
#personalization #referencing #image2image #text2image
👍5
Veo3 бесплатно
lmarena запустили Video Arena, правда пока только в дискорде
На арене Veo 3, Seedance, Kling, Hailuo и Pika и что-то еще
1️⃣ Вам нужно зайти в Discord
2️⃣ Использовать команду /video или /image-to-video в каналах video-arena-1,2,3.
3️⃣ Написать промпт
4️⃣ Получить результат и проголосовать за лучший вариант.
Бот будет генерировать два видео из доступных 7 моделей и часто среди них veo3.
Если в промпте указать, чтобы в ролике говорили, то бот сгенерирует видео veo3.
В день дают 8 генераций
Подрезал у @tips_ai
#text2image #image2image
lmarena запустили Video Arena, правда пока только в дискорде
На арене Veo 3, Seedance, Kling, Hailuo и Pika и что-то еще
Бот будет генерировать два видео из доступных 7 моделей и часто среди них veo3.
Если в промпте указать, чтобы в ролике говорили, то бот сгенерирует видео veo3.
В день дают 8 генераций
Подрезал у @tips_ai
#text2image #image2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11❤16🔥5👍4👨💻2
Qwen-Image: Crafting with Native Text Rendering
Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование
Гитхаб
HF ~42GB + 16GB
Демо
спасибо постоянному спонсору новостей @iNevestenko
#text2image #image2image #imageediting
Новый генератор картинок от Qwen с фокусом на изображение текста и консистентное редактирование
Гитхаб
HF ~42GB + 16GB
Демо
спасибо постоянному спонсору новостей @iNevestenko
#text2image #image2image #imageediting
👍15❤1👎1🔥1😁1
Wan2.2 Image | Krea
Все, генерацию картинок силами #WAN22 завезли на Krea.ai
Бесплатных кредитов хватило на две генерации
#text2image #image2image #neuronaut_art
Все, генерацию картинок силами #WAN22 завезли на Krea.ai
Бесплатных кредитов хватило на две генерации
#text2image #image2image #neuronaut_art
👍4😁3❤1
Арена видеогенераторов запущена. Даже две
Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo
Text-to-Video Arena
Image-to-Video Arena
#text2image #image2image #arena #leaderboard
Добавили еще 4 модели:
Hailuo-02-pro
Hailuo-02-fast
Sora
Runway-Gen4-turbo
Text-to-Video Arena
Image-to-Video Arena
#text2image #image2image #arena #leaderboard
👍7🤔1
Помните думающий инпейнтер картинок LanPaint?
В него добавили поддержку Qwen-Image
Гитхаб
воркфлоу
#inpainting #image2image #workflow
В него добавили поддержку Qwen-Image
Гитхаб
воркфлоу
#inpainting #image2image #workflow
👍6❤1
Nano Banana
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
👍4🔥3
Skywork-UniPic
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
👍3👎3