This media is not supported in your browser
VIEW IN TELEGRAM
Insert Anything: Image Insertion via In-Context Editing in DiT
Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить
Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev
Код
Демо
ComfyUI
#inpainting #personalization #imageediting
Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить
Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev
Код
Демо
ComfyUI
#inpainting #personalization #imageediting
👍10😁2🔥1
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
👍11🔥1
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
👍7❤1
👍14❤1🔥1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Код и веса персонализатора-кастомизатора DreamEngine опубликованы (давно)
Код
Веса
#text2image #vlm #personalization
Код
Веса
#text2image #vlm #personalization
👍6
Wan2.1-VACE, All-in-One Video Creation and Editing model
WAN релизнули код и веса модели создания и редактирования видео.
Прежде была опубликована превью модель 1.3B
Теперь же доступны 1.3B и 14B
- видео по референсу
- видео по видео
- видео по видео с маской
Гитхаб
Веса
API
Ждем на wan.video
#text2video #video2video #personalization #videoediting #referencing
WAN релизнули код и веса модели создания и редактирования видео.
Прежде была опубликована превью модель 1.3B
Теперь же доступны 1.3B и 14B
- видео по референсу
- видео по видео
- видео по видео с маской
Гитхаб
Веса
API
Ждем на wan.video
#text2video #video2video #personalization #videoediting #referencing
👍13🤯9❤1👌1
Персонализатор-кастомизатор изображений
DreamO завезли в Pinokio на вкладку Community Scripts
Должно работать на 16ГБ VRAM
Спасибо @Bolserge
#personalization #referenceing #tex2image
DreamO завезли в Pinokio на вкладку Community Scripts
Должно работать на 16ГБ VRAM
Спасибо @Bolserge
#personalization #referenceing #tex2image
👍9
🚀HunyuanCustom ComfyUI
Ждать пришлось недолго. Киджай сделал тестовый воркфлоу
1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите
#text2video #image2video #audio2video #video2video #personalization #multisubject
Ждать пришлось недолго. Киджай сделал тестовый воркфлоу
1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите
cfg = 7.5
, отключите use_cfg_zero_star
и выставьте разрешение 720p
#text2video #image2video #audio2video #video2video #personalization #multisubject
Telegram
Нейронавт | Нейросети в творчестве
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно…
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно…
👍8
petermg InfiniteYou
Форк InfiniteYou с добавленными фуекциями
best_face:
Анализирует каждое загруженное изображение с использованием модели распознавания лиц и выбирает изображение с наибольшим показателем достоверности для обнаруженного лица. Этот режим идеален, когда вы хотите получить максимально четкое отдельное изображение, отражающее индивидуальность, отдавая приоритет качеству и четкости.
averaged_face:
Выравнивает все загруженные изображения на основе ориентиров лица (например, глаз и носа) по эталонному изображению, затем усредняет значения пикселей для создания усредненного лица
#imageediting #personalization
Форк InfiniteYou с добавленными фуекциями
best_face:
Анализирует каждое загруженное изображение с использованием модели распознавания лиц и выбирает изображение с наибольшим показателем достоверности для обнаруженного лица. Этот режим идеален, когда вы хотите получить максимально четкое отдельное изображение, отражающее индивидуальность, отдавая приоритет качеству и четкости.
averaged_face:
Выравнивает все загруженные изображения на основе ориентиров лица (например, глаз и носа) по эталонному изображению, затем усредняет значения пикселей для создания усредненного лица
#imageediting #personalization
❤4🔥2👍1
WAN2.1 VACE14B GGUF
Квантизованная версия Wan2.1-VACE
воркфлоу
#text2video #video2video #personalization #videoediting #referencing #gguf
Квантизованная версия Wan2.1-VACE
воркфлоу
#text2video #video2video #personalization #videoediting #referencing #gguf
huggingface.co
QuantStack/Wan2.1_14B_VACE-GGUF at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍4❤1🥴1
Форк персонализатора-кастомизатора DreamO с поддержкой лор и квантизацией
petermg DreamO
#personalization #referenceing #tex2image #lora
petermg DreamO
#personalization #referenceing #tex2image #lora
Telegram
Нейронавт | Нейросети в творчестве
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
👍7❤2
SkyReels-V2-T2V-14B-720P-VACE-GGUF
квантизованная версия универсального видеогенератора-редактора
воркфлоу
#text2video #image2video #videoediting #personalization #gguf #workflow
квантизованная версия универсального видеогенератора-редактора
воркфлоу
#text2video #image2video #videoediting #personalization #gguf #workflow
huggingface.co
QuantStack/SkyReels-V2-T2V-14B-720P-VACE-GGUF · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data
Плагин для улучшение качества стилизации изображений с помощью диффузионных моделей.
Для каждого стиля сначала независимо тренируются модули LoRA , а затем уже обученный модуль согласованности применяется к стилизованным изображениям
Код
Демо
Веса - в том числе пачка лор
#personalization #styletrasfer #stylization #lora #plugin
Плагин для улучшение качества стилизации изображений с помощью диффузионных моделей.
Для каждого стиля сначала независимо тренируются модули LoRA , а затем уже обученный модуль согласованности применяется к стилизованным изображениям
Код
Демо
Веса - в том числе пачка лор
#personalization #styletrasfer #stylization #lora #plugin
🔥5❤2
Media is too big
VIEW IN TELEGRAM
OmniGen2: Exploration to Advanced Multimodal Generation
Новая версия редактора-генератора-персонализатора изображений
Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.
Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их
Код
Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/
С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/
#personalization #imageediting #text2image #image2image #referencing
Новая версия редактора-генератора-персонализатора изображений
Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.
Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их
Код
Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/
С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/
#personalization #imageediting #text2image #image2image #referencing
❤4👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DRA-Ctrl: Dimension-Reduction Attack! Video Generative Models are Experts on Controllable Image Synthesis
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
❤8🔥4
ComfyUI-OmniGen2
Большое упущение с моей стороны что не опубликовал до сих пор. Бежим играть с омнигеном2
#personalization #imageediting #text2image #image2image #referencing #comfyui
Большое упущение с моей стороны что не опубликовал до сих пор. Бежим играть с омнигеном2
#personalization #imageediting #text2image #image2image #referencing #comfyui
GitHub
GitHub - neverbiasu/ComfyUI-OmniGen2: A ComfyUI extension for OmniGen2
A ComfyUI extension for OmniGen2. Contribute to neverbiasu/ComfyUI-OmniGen2 development by creating an account on GitHub.
🔥8
Media is too big
VIEW IN TELEGRAM
Ideogram Character
Персонализатор от Ideogram.
Обещают высокое сходство.
Бесплатно 10 генераций
#personalization #referencing #image2image #text2image
Персонализатор от Ideogram.
Обещают высокое сходство.
Бесплатно 10 генераций
#personalization #referencing #image2image #text2image
👍5
wan2.2 I2V
воркфлоу генерации видео по нескольким исходным объектам
Инструкции от автора на реддите
#wan22 #image2video #referencing #personalization #multireference
воркфлоу генерации видео по нескольким исходным объектам
Инструкции от автора на реддите
#wan22 #image2video #referencing #personalization #multireference
❤7🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation
Персонализация на видео от Tencent
генерация видео по текстовому описанию с сохранением идентичности персонажей (Identity-Preserving Text-to-Video Generation); 1
- создание видео с нечеловеческими субъектами
- генерация стилизованных видео
- замена лиц на видео
- генерация видео на основе заданной позы
Прикручено к WAN2.1. Ждем WAN2.2
Kijai уже интегрировал его в WanVideoWrapper, но имплементация отличается от оригинала, что может сказаться на результате. Авторы выпустили ноду препроцессора.
Код
HF
Stand-In Official Preprocessor ComfyUI Nodes
Kijai HF
воркфлоу
#workflow @comfyUI #personalization #referencing #faceswap #stylize
Персонализация на видео от Tencent
генерация видео по текстовому описанию с сохранением идентичности персонажей (Identity-Preserving Text-to-Video Generation); 1
- создание видео с нечеловеческими субъектами
- генерация стилизованных видео
- замена лиц на видео
- генерация видео на основе заданной позы
Прикручено к WAN2.1. Ждем WAN2.2
Kijai уже интегрировал его в WanVideoWrapper, но имплементация отличается от оригинала, что может сказаться на результате. Авторы выпустили ноду препроцессора.
Код
HF
Stand-In Official Preprocessor ComfyUI Nodes
Kijai HF
воркфлоу
#workflow @comfyUI #personalization #referencing #faceswap #stylize
🔥6❤1👍1