Опубликован код инструмента для работы с изображениями ZenCtrl
Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном
Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.
Код
#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном
Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.
Код
#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Insert Anything: Image Insertion via In-Context Editing in DiT
Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить
Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev
Код
Демо
ComfyUI
#inpainting #personalization #imageediting
Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить
Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev
Код
Демо
ComfyUI
#inpainting #personalization #imageediting
👍10😁2🔥1
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
👍11🔥1
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
👍7❤1
👍14❤1🔥1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Код и веса персонализатора-кастомизатора DreamEngine опубликованы (давно)
Код
Веса
#text2image #vlm #personalization
Код
Веса
#text2image #vlm #personalization
👍6
Wan2.1-VACE, All-in-One Video Creation and Editing model
WAN релизнули код и веса модели создания и редактирования видео.
Прежде была опубликована превью модель 1.3B
Теперь же доступны 1.3B и 14B
- видео по референсу
- видео по видео
- видео по видео с маской
Гитхаб
Веса
API
Ждем на wan.video
#text2video #video2video #personalization #videoediting #referencing
WAN релизнули код и веса модели создания и редактирования видео.
Прежде была опубликована превью модель 1.3B
Теперь же доступны 1.3B и 14B
- видео по референсу
- видео по видео
- видео по видео с маской
Гитхаб
Веса
API
Ждем на wan.video
#text2video #video2video #personalization #videoediting #referencing
👍13🤯9❤1👌1
Персонализатор-кастомизатор изображений
DreamO завезли в Pinokio на вкладку Community Scripts
Должно работать на 16ГБ VRAM
Спасибо @Bolserge
#personalization #referenceing #tex2image
DreamO завезли в Pinokio на вкладку Community Scripts
Должно работать на 16ГБ VRAM
Спасибо @Bolserge
#personalization #referenceing #tex2image
👍9
🚀HunyuanCustom ComfyUI
Ждать пришлось недолго. Киджай сделал тестовый воркфлоу
1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите
#text2video #image2video #audio2video #video2video #personalization #multisubject
Ждать пришлось недолго. Киджай сделал тестовый воркфлоу
1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите
cfg = 7.5
, отключите use_cfg_zero_star
и выставьте разрешение 720p
#text2video #image2video #audio2video #video2video #personalization #multisubject
Telegram
Нейронавт | Нейросети в творчестве
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно…
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно…
👍8
petermg InfiniteYou
Форк InfiniteYou с добавленными фуекциями
best_face:
Анализирует каждое загруженное изображение с использованием модели распознавания лиц и выбирает изображение с наибольшим показателем достоверности для обнаруженного лица. Этот режим идеален, когда вы хотите получить максимально четкое отдельное изображение, отражающее индивидуальность, отдавая приоритет качеству и четкости.
averaged_face:
Выравнивает все загруженные изображения на основе ориентиров лица (например, глаз и носа) по эталонному изображению, затем усредняет значения пикселей для создания усредненного лица
#imageediting #personalization
Форк InfiniteYou с добавленными фуекциями
best_face:
Анализирует каждое загруженное изображение с использованием модели распознавания лиц и выбирает изображение с наибольшим показателем достоверности для обнаруженного лица. Этот режим идеален, когда вы хотите получить максимально четкое отдельное изображение, отражающее индивидуальность, отдавая приоритет качеству и четкости.
averaged_face:
Выравнивает все загруженные изображения на основе ориентиров лица (например, глаз и носа) по эталонному изображению, затем усредняет значения пикселей для создания усредненного лица
#imageediting #personalization
❤4🔥2👍1