Нейронавт | Нейросети в творчестве
9.49K subscribers
3.67K photos
3.17K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
ComfyUI Wan2.2 Fun Native Support

Нативная поддержка Wan2.2-Fun (контролнет для видео) в #ComfyUI

+ поддержка Wan2.2 Fun InP - генерация видео от начального к конечному кадру

+поддержка LightX2V 4-Step LoRA

Ссылки на воркфлоу в статье

#controlnet #text2video #image2video #flf
🔥11👍4
Wan2.2-Fun-A14B-Control-GGUF

#gguf от QuantStack

Спасибо неизвестному подписчику

#wan22 #text2video #image2video
4👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield Draw-to-Video

У Higgsfield очередная обновка. Задаем промпт не текстом, а визуальными пометками на первом (и не только) кадре.

Работает с MiniMax, Veo 3 & Seedance Pro. За ваши деньги, разумеется.

#sketch2video #image2video #online
👍16
Context as Memory: Scene-Consistent Interactive Long Video Generation with Memory Retrieval

Генератор интерактивных длинных видео с сохранением согласованности сцены. Иначе говоря, генератор игровых миров с хорошей памятью что где стояло. Про интерактивное управление речь не идет, но видимо предполагается использование в интерактивных системах (умничаю. В играх). Траектория камеры задается прямо координатами, а не размытыми направо-налево.

Умеет генерировать сцены по одной картинке

Код ждем

#text2world #image2world #image2video
👍72
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

Видеопримерочная на VideoX-Fun / Wan2.1-I2V-14B
Для описания одежды используют Qwen2.5-VL-7B-Instruct.
Ну и еще там под капотом openpose, densepose и прочее.

Короче если ктото хотел затюнить WAN 2.1 под примерку то вот оно

Код

#tryon #image2video
👍72
This media is not supported in your browser
VIEW IN TELEGRAM
InfiniteTalk: Audio-driven Video Generation for Sparse-Frame Video Dubbing

Бесконечная болталка на основе Wan2.1. Ну и там еще kokoro под капотом.

Модель для дублирования видео с редкими ключевыми кадрами. Создает новые видео на основе исходного видео и аудиодорожки, синхронизируя не только губы, но и движения головы, позу тела и выражение лица с аудио.
Умеет оживлять картинку по звуку и без входного звука - так написано в гитхабе.

Более точная синхронизация губ и меньше искажений рук и тела по сравнению с MultiTalk.

Ребята поленились сделать сайт проекта с примерами, но похоже проект стоящий. На видео пример с реддита

Гитхаб
HF
Kijai
ComfyUI wrapper nodes for InfiniteTalk

#imageanimation #speech2video #chracteranimation #video2video #lipsync #dubbing #image2video
👍112
Аттракцион невиданной щедрости 🚩

Всем бесплатно дают аж 3 генерации в VEO 3 до конца выходных

У вас есть три желания, не продешевите!

Я сказал всем? Не забудьте спрятаться за три буквы и заходить с американского гуглоаккаунта

Забрать 3 бесплатных видео

#text2video #image2video #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101😁1
Waver 1.0

Единая модель от ByteDance для генерации видео и изображений

3 место на T2V leaderboard & I2V leaderboard

— поддерживает создание видео по тексту и изображениям;

— генерирует видео длиной 5 и 10 секунд;

— работает с разрешением 720p и 1080p;

— создаёт видео с реалистичными движениями, особенно в масштабных сценах с людьми и животными;

— позволяет создавать нарративные видео с несколькими последовательными кадрами, сохраняя при этом согласованность сюжета, визуального стиля и атмосферы;

— поддерживает генерацию видео в различных художественных стилях, включая гиперреализм, анимацию, плюшевые игрушки и другие;

— способна отображать сложные и масштабные движения, например, в спортивных сценах;

— может создавать видео с многокамерным повествованием, обеспечивая согласованность основного объекта, визуального стиля и общей атмосферы при переключении кадров.

Гитхаб без кода
Дискорд - попробовать предлагают здесь

#text2image #image2video #text2video
👍9🤷‍♂11
Wan-S2V: Audio-Driven Cinematic Video Generation

Релиз обещанного видеогенератора, который принимает на вход картинку и звук

Архитектурно - совет экспертов ( #MoE )

Как видим, умеет работать с диалогами и пением

Гитхаб
HF
Демо
Офсайт - пока не вижу его там, ждем

До появления компактных версий и обновок от Kijai 5... 4... 3...

Спасибо @iNevestenko

#image2video #audio2video #referencing #wan22
🔥15👍21😁1
Wan 2.2 First/Last Frame Video Fast

Демоспейс #wan22 с генерацией от первого к последнему кадру.
На бесплатном аккаунте сработал

#image2video
😁12👍61