Нейронавт | Нейросети в творчестве
9.4K subscribers
3.62K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Демоспейс Flex.1-alpha потыркать не скачивая

Демо

#finetuning #text2image
👍9
Gigapixel AI Recover & Enhance

Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore

При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке

Халявная ли локальная обработка - непонятно 🤷

Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита

#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
👍4👎2
Hunyuan3D 2.0

Генератор текстурированных 3D моделей от Tencent

Hunyuan3D-DiT отвечает за меш

Hunyuan3D-Paint - за текстуры

Hunyuan3D-Studio - удобная платформа для создания 3D ассетов

Код
Демо
Сайт - вход через китайский телефон/wechat
ComfyUI

#textto3d #imageto3d #ComfyUI
👍53🔥2
Media is too big
VIEW IN TELEGRAM
GameFactory

по текстовому описанию создает генеративные миры на видео, с управлением действиями в игре (движения персонажа, использование предметов) с помощью клавиатуры и мыши

Код

#text2world #game
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
audio input

В Suno v4 появилась функция превращающая ваш голос в трек

#voice2music #audio2music
👍9💩1
UI-TARS

Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance

В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.

умеет находить информацию, выполнять действия в приложениях и веб-сайтах

UI-TARS Desktop

#agent #gui #vlm
👍9🔥3
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective

Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры

Есть 4 ключевых фактора, которые делают его точным и надежным:

1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.

2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.

3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.

4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.

Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.


Код

#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍7🔥1💩1
Go with the Flow

Контроль движения на генерации видео за счет геометрического искажения шума

Код
Веса
Видео (4 минуты)
Видео туториал

#motioncontrol #motiontransfer #cameracontrol
👍11🔥4🍾2