Нейронавт | Нейросети в творчестве

0:40

0:05

HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation

Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa

Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами

Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем

#text2video #image2video #audio2video #video2video #personalization #multisubject

👍7❤1

2.13K views13:16

ComfyUI-DreamO

Подвезли #ComfyUI враппер персонализатора-кастомизатора изображений

#personalization #referenceing #tex2image

👍14❤1🔥1👌1

2.11K views08:38

0:27

Код и веса персонализатора-кастомизатора DreamEngine опубликованы (давно)

Код
Веса

#text2image #vlm #personalization

👍6

1.85K views13:20

Wan2.1-VACE, All-in-One Video Creation and Editing model

WAN релизнули код и веса модели создания и редактирования видео.

Прежде была опубликована превью модель 1.3B

Теперь же доступны 1.3B и 14B

- видео по референсу
- видео по видео
- видео по видео с маской

Гитхаб
Веса
API
Ждем на wan.video

#text2video #video2video #personalization #videoediting #referencing

👍13🤯9❤1👌1

2.31K views14:22

Персонализатор-кастомизатор изображений
DreamO завезли в Pinokio на вкладку Community Scripts

Должно работать на 16ГБ VRAM

Спасибо @Bolserge

#personalization #referenceing #tex2image

👍9

1.58K views09:07

🚀HunyuanCustom ComfyUI

Ждать пришлось недолго. Киджай сделал тестовый воркфлоу

1️⃣ Скачать модель fp8_scaled
2️⃣ Обновить #ComfyUI, ComfyUI-HunyuanVideoWrapper и ComfyUI-KJNodes до последней версии
3️⃣ настройте параметры воркфлоу: включите cfg = 7.5, отключите use_cfg_zero_star и выставьте разрешение 720p

#text2video #image2video #audio2video #video2video #personalization #multisubject

0:40

👍8

2.12K views09:37

petermg InfiniteYou

Форк InfiniteYou с добавленными фуекциями

best_face:
Анализирует каждое загруженное изображение с использованием модели распознавания лиц и выбирает изображение с наибольшим показателем достоверности для обнаруженного лица. Этот режим идеален, когда вы хотите получить максимально четкое отдельное изображение, отражающее индивидуальность, отдавая приоритет качеству и четкости.

averaged_face:
Выравнивает все загруженные изображения на основе ориентиров лица (например, глаз и носа) по эталонному изображению, затем усредняет значения пикселей для создания усредненного лица

#imageediting #personalization

❤4🔥2👍1

1.49K views11:17

QuantStack/Wan2.1_14B_VACE-GGUF at main

WAN2.1 VACE14B GGUF

Квантизованная версия Wan2.1-VACE

воркфлоу

#text2video #video2video #personalization #videoediting #referencing #gguf

huggingface.co

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍4❤1🥴1

1.55K viewsedited 13:42

Форк персонализатора-кастомизатора DreamO с поддержкой лор и квантизацией

petermg DreamO

#personalization #referenceing #tex2image #lora

DreamO: A Unified Framework for Image Customization

Персонализатор-кастомизатор изображений от ByteDance на базе Flux

Kод
Демо
HF

#personalization #referenceing #tex2image

👍7❤2

1.79K views08:41

QuantStack/SkyReels-V2-T2V-14B-720P-VACE-GGUF · Hugging Face

SkyReels-V2-T2V-14B-720P-VACE-GGUF

квантизованная версия универсального видеогенератора-редактора

воркфлоу

#text2video #image2video #videoediting #personalization #gguf #workflow

huggingface.co

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥4👍1

1.67K views09:23

0:29

OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

Плагин для улучшение качества стилизации изображений с помощью диффузионных моделей.

Для каждого стиля сначала независимо тренируются модули LoRA , а затем уже обученный модуль согласованности применяется к стилизованным изображениям

Код
Демо
Веса - в том числе пачка лор

#personalization #styletrasfer #stylization #lora #plugin

🔥5❤2

1.87K viewsedited 11:06

1:28

Media is too big

OmniGen2: Exploration to Advanced Multimodal Generation

Новая версия редактора-генератора-персонализатора изображений

Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.

Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их

Код

Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/

С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/

#personalization #imageediting #text2image #image2image #referencing

❤4👍3🔥1

1.66K viewsedited 09:42