Нейронавт | Нейросети в творчестве
9.32K subscribers
3.58K photos
3.08K videos
40 files
4.05K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Text2Room: Extracting Textured 3D Meshes from 2D Text-to-Image Models

Генератор целых интерьеров по тексту. На выходе текстурированный меш. На сайте есть интерактивный меш вьюер.

Код

#textto3D #text2scene #rendering
👍41
Media is too big
VIEW IN TELEGRAM
VideoDirectorGPT: Consistent Multi-SceneVideo Generation via LLM-Guided Planning

Многоплановый генератор видео по тексту. Взяли простую идею прогонять текстовый промт через GPT-4 чтобы получить план-сценарий. Далее за дело берется собственно генератор видео, который они назвали Layout2Vid. В результате можно генераить не отдельные кусочки видео, а многоплановые сцены, где соблюдается согласованнность от сцены к сцене (от шота к шоту)

Код обещают выложить

#text2video #text2scene
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS

Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.

Кода пока нет

#text2scene #textto3D
Media is too big
VIEW IN TELEGRAM
InseRF: Text-Driven Generative Object Insertion in Neural 3D Scenes

#nerf становятся ближе к народу. InseRF генерирует новый объект в nerf-сцене в заданном месте

Кода нет

#3Dto3D #text2scene #textto3D
5
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin Gen-1

Генерация 3D объектов по тексту и блокам в реальном времени.
Работает на наборе 3D-ControlNet'ов
Авторы планируют сделать крупнейший 3D генератор общедоступным

твиттер

#imageto3D #tetxtto3D #text2scene #realtime
🔥17
This media is not supported in your browser
VIEW IN TELEGRAM
Обновился генератор 3D объектов Rodin Gen-1
На видео сравнение с предыдущей версией. Авторы претендуют ни много ни мало на роль Sora в 3D. Уже можно

записаться в вейтлист

#tetxtto3D #text2scene #realtime
🔥12
Нейронавт | Нейросети в творчестве
Обновился генератор 3D объектов Rodin Gen-1 На видео сравнение с предыдущей версией. Авторы претендуют ни много ни мало на роль Sora в 3D. Уже можно записаться в вейтлист #tetxtto3D #text2scene #realtime
Пришло приглашение в бету 3D генератора Rodin Gen-1
Вернее, письмо о том что меня выбрали для бета теста, но перед этим надо пройти опросник. Внимательно читайте условия в опроснике чтобы вас не кикнули с беты.

Ну а если вы еще не вписались, попробуйте:

записаться в вейтлист

#tetxtto3D #text2scene #realtime
1
Нейронавт | Нейросети в творчестве
Народ, у меня сегодня будет ознакомительная демо-сессия с представителем Rodin Gen-1 Накидайте срочно картинок для теста генерации 3D объектов! [UPDATE] Спасибо, картинки отправил #imageto3D #tetxtto3D #text2scene #realtime
Впечатления о Rodin Gen-1 со вчерашней демосессии.

Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь

- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации

Теперь о слабых местах

- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.

- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то член, оставив пустоту вместо щек

- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.

Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.

Стол, пистолет, мозг получились отлично.

Обещают сначала открыть web-версию, потом API

#imageto3D #tetxtto3D #text2scene #test #inpainting
17🤔4🤯1
CLAY: A Controllable Large-scale Generative Model for Creating High-quality 3D Assets

Срыв покровов. Это внутрянка Rodin Gen-1

ControlNet и LoRA управляют изображением, вокселями облаком точек и баундинг боксом

Обещают релизнуть плагин для блендера

Код ждем
Демо

#imageto3D #tetxtto3D #text2scene #realtime
🔥6👍2
HoloDreamer: Holistic 3D Panoramic World Generation from Text Descriptions

Генерация 3D сцен по текстовому описанию. Первым шагом генерируется 360-градусная панорама. Ну а дальше на нее напускают гауссианы.

Код ждем

#gaussian #text2scene #textto3d #panorama
🔥10👍1
Sketch2Scene: Automatic Generation of Interactive 3D Game Scenes from User's Casual Sketches

Генерация интерактивных 3D-игровых сцен по нарисованным от руки эскизам и текстовым описаниям.

Под капотом генератор картинок, ControlNet, LoRa на SDXL-Inpaint, Grounded Segment Anything.


Для процедурного синтеза 3D-сцены используется игровой движок Unity

Кода нет, есть понимание чего ожидать в играх

#sketch2scene #text2scene #news
6👍1
Chat Edit 3D: Interactive 3D Scene Editing via Text Prompts

Это вообще законно?
Оно через ChatGPT рулит 30+ диффузионными нейронками для работы с 3D сценами.
Загляните на сайт. Там еще вагончик примеров того что оно может

Код

#3dediting #text2scene #nerf #textto3d #assistant #3dassistant
👍51
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Stage

У Krea AI опять обновка.
Добавили функцию генерации 3D сцен

#image2scene #imageto3d #text2scene #textto3d
👍112
This media is not supported in your browser
VIEW IN TELEGRAM
spAItial

Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику

Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео

Записаться в вейтлист

#textto3d #text2scene #gaussian
👍9😱31
ImmerseGen: Agent-Guided Immersive World Generation with Alpha-Textured Proxies

Разработка ByteDance.
Создаёт 3D-миры по текстовым описаниям для виртуальной реальности. Сначала формируется базовая местность, а затем добавляются объекты.

Под капотом агенты, работающие на основе визуальных языковых моделей

Код ждем

#VR #vlm #text2scene #text2world
👍9🤯64
HunyuanWorld-1.0

"Первый опенсорсный генератор 3D миров, полностью совместимый с графическими пайплайнами"


Создает сцены и 360-градусные панорамы по тексту и по картинке.

В основе работы модели - алгоритм представления и генерации 3D-сцен с семантической иерархией.

В интерактивной демке панорамы на сайте проекта при попытке погулять в генерации очень быстро наталкиваешься на границу, за которую не пускают, как будто там не честное 3D, а картинка натянутая на карту глубины. Так что не вижу в чем он тут "первый", разве что в том что опенсорс. Ну да ладно, это первое впечатление.

Предлагают использовать в VR, геймдеве, физической симуляции, задачах с взаимодействием с объектами

Код
Веса
Попробовать - вход через WeChat. Я залогинился, но дальше сайт не прогружается

Спасибо @iNevestenko

#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
👍1021😱1
3D сцены HunyuanWorld 1.0 полностью редактируемые
(ну они так и написали - совместимые с 3D пайплайнами)

Можно попробовать запустить его в Google Colab Pro (нужно 22ГБ VRAM)

Jupiter / Colab

#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
👍7🔥2
Hunyuan World Model 1.0-Lite

Облегченная версия генератора 3D миров HunyuanWorld-1.0

Требования к VRAM снизили с 26 до 17 ГБ благодаря FP8-квантованию. Ну могли бы и до 16 уж дотянуть 🤩

SageAttention уже прикручен.

Гитхаб
Hugging Face
Демо

#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101😁1