Нейронавт | Нейросети в творчестве – Telegram

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

9.4K subscribers

3.62K photos

3.14K videos

40 files

4.1K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

9.4K subscribers

Нейронавт | Нейросети в творчестве

Демоспейс Flex.1-alpha потыркать не скачивая

Демо

#finetuning #text2image

👍9

1.86K views08:48

Нейронавт | Нейросети в творчестве

Gigapixel AI Recover & Enhance

Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore

При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке

Халявная ли локальная обработка - непонятно 🤷

Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита

#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration

👍4👎2

1.88K views21:05

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Hunyuan3D 2.0

Генератор текстурированных 3D моделей от Tencent

Hunyuan3D-DiT отвечает за меш

Hunyuan3D-Paint - за текстуры

Hunyuan3D-Studio - удобная платформа для создания 3D ассетов

Код
Демо
Сайт - вход через китайский телефон/wechat
ComfyUI

#textto3d #imageto3d #ComfyUI

👍5❤3🔥2

2.52K views07:04

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

GameFactory

по текстовому описанию создает генеративные миры на видео, с управлением действиями в игре (движения персонажа, использование предметов) с помощью клавиатуры и мыши

Код

#text2world #game

👍6

1.76K views07:37

Нейронавт | Нейросети в творчестве

Опубликован код реконструктора 3D сцен на гауссианах VideoLifter

Код

#gaussian #videoto3d #video2gaussian

Нейронавт | Нейросети в творчестве

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment

Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно

Код ждем

#gaussian #videoto3d #video2gaussian

👍5🔥1

1.65K views08:13

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Video Depth Anything: Consistent Depth Estimation for Super-Long Videos

Генератор консистентной глубины для длинных видео. На черрипиках бьет конкурентов, в том числе DepthCrafter.

Код
Демо

#video2depth

🔥8🤯1

1.87K views08:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

audio input

В Suno v4 появилась функция превращающая ваш голос в трек

#voice2music #audio2music

👍9💩1

1.92K views09:12

Нейронавт | Нейросети в творчестве

Hunyuan3D-2GP: 3D Generation for the GPU Poor

Это Hunyuan3D-2 для бедных. Генерация за одну минуту на 6ГБ VRAM

#textto3d #imageto3d

GitHub - deepbeepmeep/Hunyuan3D-2GP: GPU Poor Version of Hunyuan3D-2

GPU Poor Version of Hunyuan3D-2. Contribute to deepbeepmeep/Hunyuan3D-2GP development by creating an account on GitHub.

❤3🔥1

1.63K views09:42

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

UI-TARS

Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance

В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.

умеет находить информацию, выполнять действия в приложениях и веб-сайтах

UI-TARS Desktop

#agent #gui #vlm

👍9🔥3

1.56K views10:13

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

CameraHMR: Aligning People with Perspective

Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры

Есть 4 ключевых фактора, которые делают его точным и надежным:

1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.

2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.

3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.

4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.

Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.

Код

#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction

👍7🔥1💩1

1.6K views10:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Go with the Flow

Контроль движения на генерации видео за счет геометрического искажения шума

Код
Веса
Видео (4 минуты)
Видео туториал

#motioncontrol #motiontransfer #cameracontrol

👍11🔥4🍾2

1.59K views11:14