Нейронавт | Нейросети в творчестве

Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot

Реконструкция 3D моделей нескольких людей по одному ракурсу.
Восстанавливает без одежды. Нет, не поэтому

Код
Демо

#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction

🔥5🤯1

1.53K views07:48

Нейронавт | Нейросети в творчестве

1:20

This media is not supported in your browser

VIEW IN TELEGRAM

SwiftEdit: Lightning Fast Text-guided Image Editing via One-step Diffusion

Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo

Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100

Код ждем

#imageediting #image2image

👍5

1.59K views08:11

Нейронавт | Нейросети в творчестве

Есть код и демо OneDiffusion - генератора/пониматора картинок

Код
Демо сейчас 404 - ждем
Веса на HF

#text2image #image2image #conditioning #personalization #multiview

Нейронавт | Нейросети в творчестве

OneDiffusion

Единая модель для разных задач, связанных с генерацией и пониманием изображений

- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация…

👍4🔥2

1.72K views08:42

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ChatGTP Canvas обновили.
Это инструмент для совместного редактирования вместе с ChatGPT

Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s

#coding

👍1🤯1

1.53K views09:45

Нейронавт | Нейросети в творчестве

Youtube auto dubbing

Youtube прикрутил автоматический дубляж видео. Привет @yabrowser

Чтобы видео было продублировано на другой язык, автор должен включить эту опцию

Пример дулбяж с французского на английский

#news #dubbing #speech2speech

👍10🔥4❤1

1.73K views12:26

Нейронавт | Нейросети в творчестве

2:30

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini 2.0

Гугл объявил эру агентов.
Мультимодальный ассистент

- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете

И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP

Попробовать

#news #agent

👍6💯3

1.87K viewsedited 07:25

Нейронавт | Нейросети в творчестве

DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation

Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.

Под капотом дообученный SDXL

- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей

Код

#text2image #comics

❤13

1.66K views07:49

Нейронавт | Нейросети в творчестве

1:03

Media is too big

VIEW IN TELEGRAM

MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Генератор звука по видео или текстовому описанию

Код
Демо
Колаб

#video2audio #video2sound #text2audio

👍10❤1🔥1

2.14K views08:11

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)