Нейронавт | Нейросети в творчестве
9.49K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Humva: Your Easiest Go-To Avatar Tool

Простейший, как заявлено в названии, инструмент для создания аватара. Хорошо говорит по-русски

В топе на Producthunt

Проверил, он довольно капризный. Аватар создается за 5-10 минут. Если создастся вообще. Закидываем фото, выбираем тему и окружение, голос и ждем.
Или можно выбрать один из готовых аватаров.

При попытке создать аватар из фото знаменитостей может выдать ошибку, и второго шанса создать свой аватар не даст. Но Юра Борисов, видимо не настолько знаменит

И не факт что ваш аватар сможет быть полезен. Мой кастомный аватар долго не мог ничего сказать на русском все время ошибка. Хотя голос стандартный, с библиотечными аватарами работает. Видимо, текст слишком длинный

Бесплатно можно создать 4 говорящих видео по 30 секунд. На вход можно подать текст, а можно готовое аудио с речью

#voicecloning #humanavatar #talkinghead #portraitanimation #facialanimation #text2speech #tts #image2avatar
👍4👎1😱1
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

ByteDance снова что-то анимируют

Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.

На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация

Выглядит круто,
Кода нет

#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥216👍4🥴1👀1
Video Motion Graphs

Переанимация видео.
Модель берет кадры вашего видео и переставляет их чтобы получить нужное движение под заданную музыку. А недостающие достраивает.
Можно задать конкретные движения.

Работает как с танцами, так и с говорящей головой с руками. В этом случае на вход подается речь как я понял.

Код ждем. Кстати, это Adobe

#video2video #pose2video #talkinghead #music2video #speech2video
8🔥5👍3
Sparrow-0: Advancing Conversational Responsiveness in Video Agents with Transformer-Based Turn-Taking

Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы

Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica

Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.

Есть бесплатный тариф

#assistant #voicemode #talkinghead #humanavatar
👍3🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Dreamina

В генератор картинок и видео от Capcut добавили оживлятор портретов с липсинком. Работает он на базе OmniHuman который мы смотрели в феврале без кода.

Загружаем фото, пишем текст для озвучки или загружаем аудио до 15 секунд, выбираем голос.

На выходе получаем анимацию с неплохой мимикой, жестами, движениями головы, глаз и тела.

Нужен аккаунт CapCut и веб-локация в США

Попробовать

#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
🔥121🤯1😭1
This media is not supported in your browser
VIEW IN TELEGRAM
Avat3r: Large Animatable Gaussian Reconstruction Model for High-fidelity 3D Head Avatars

Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.

Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU

Код ждем

Спасибо @m_franz

#head #image2avatar #talkinghead #gaussian
👍4🔥3
Media is too big
VIEW IN TELEGRAM
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis

Говорящий аватар / оживлятор портретов от Alibaba с контролем интенсивности движения. работает с разными крупностями кадра и позами, с разными типами персонажей

Сравнение с конкурентами впечатляет.

Построен на базе Wan2.1

Код

#portraitanimation #image2video #speech2video #humananimation #lipsync #talkinghead
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head

Анимируемые аватары по одному изображению на гауссианах от Alibaba.

Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах

Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить

#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔21👎1
Hunyuan Video Avatar

Видеоаватар с контролем эмоций от Tencent
Оживляет персонажа по голосу. Речь может сгенерить сам по тексту. На выбор несколько голосов

Модель прожорливая: минимум 24 ГБ VRAM для 704x768, а для плавного 4K рекомендуют GPU на 96 ГБ.

Код
Попробовать - на китайском офсайте. Одна секунда Илона Маска генерилась несколько минут
Веса

#lipsync #characteranimation #speech2video #talkinghead #portrainanimation
👍5😁2