Нейронавт | Нейросети в творчестве

VideoDirectorGPT: Consistent Multi-SceneVideo Generation via LLM-Guided Planning

Многоплановый генератор видео по тексту. Взяли простую идею прогонять текстовый промт через GPT-4 чтобы получить план-сценарий. Далее за дело берется собственно генератор видео, который они назвали Layout2Vid. В результате можно генераить не отдельные кусочки видео, а многоплановые сцены, где соблюдается согласованнность от сцены к сцене (от шота к шоту)

Код обещают выложить

#text2video #text2scene

927 views11:17

0:02

0:04

3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS

Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.

Кода пока нет

#text2scene #textto3D

1.26K views09:08

1:40

Media is too big

InseRF: Text-Driven Generative Object Insertion in Neural 3D Scenes

#nerf становятся ближе к народу. InseRF генерирует новый объект в nerf-сцене в заданном месте

Кода нет

#3Dto3D #text2scene #textto3D

❤5

1.38K views11:36

1:22

Rodin Gen-1

Генерация 3D объектов по тексту и блокам в реальном времени.
Работает на наборе 3D-ControlNet'ов
Авторы планируют сделать крупнейший 3D генератор общедоступным

твиттер

#imageto3D #tetxtto3D #text2scene #realtime

🔥17

1.86K viewsedited 14:14

GALA3D: Towards Text-to-3D Complex Scene Generation via Layout-guidedGenerative Gaussian Splatting

Генерация комплексных 3D сцен на гауссианах

Код ждем

#textto3d #text2scene

👍5

1.36K views07:42

0:28

Обновился генератор 3D объектов Rodin Gen-1
На видео сравнение с предыдущей версией. Авторы претендуют ни много ни мало на роль Sora в 3D. Уже можно

записаться в вейтлист

#tetxtto3D #text2scene #realtime

🔥12

2.01K views07:15

Обновился генератор 3D объектов Rodin Gen-1 На видео сравнение с предыдущей версией. Авторы претендуют ни много ни мало на роль Sora в 3D. Уже можно записаться в вейтлист #tetxtto3D #text2scene #realtime

Пришло приглашение в бету 3D генератора Rodin Gen-1
Вернее, письмо о том что меня выбрали для бета теста, но перед этим надо пройти опросник. Внимательно читайте условия в опроснике чтобы вас не кикнули с беты.

Ну а если вы еще не вписались, попробуйте:

записаться в вейтлист

#tetxtto3D #text2scene #realtime

❤1

1.47K viewsedited 11:01

Народ, у меня сегодня будет ознакомительная демо-сессия с представителем Rodin Gen-1

Накидайте срочно картинок для теста генерации 3D объектов!

[UPDATE] Спасибо, картинки отправил

#imageto3D #tetxtto3D #text2scene #realtime

1:22

🔥7😱2

1.49K viewsedited 15:28

Народ, у меня сегодня будет ознакомительная демо-сессия с представителем Rodin Gen-1 Накидайте срочно картинок для теста генерации 3D объектов! [UPDATE] Спасибо, картинки отправил #imageto3D #tetxtto3D #text2scene #realtime

Впечатления о Rodin Gen-1 со вчерашней демосессии.

Признаю, он неидеален, но впечатляет! Лучше всего что я видел до сих пор. Для иллюстрации прилагаю ваши картинки, о которых речь

- Генерит объекты по тексту и по изображению
- генерит текстуры
- может смешивать два и более объектов, есть рулька смешивания. Гибрид Бендера с автомобилем вышел бесполезный но смешной
- Я в 3D дилетант, по мне сетка хорошая в сравнении с остальными генераторами, даже отличная для железки. Есть три варианта поликаунта для чистового прохода- 5000, 10000, 30000 полигонов
- умеет генерить воксели из геометрии и геометрию из вокселей. Для меня юзкейсы тут неочевидны были. Короче, так можно делать вариации геометрии или что-то детальное из грубого 3D наброска.
- умеет генерить объект из облака точек. Чую, это будет отличная замена нюковому генератору меша из облака точек
- Крышесносная фича - 3D инпейнтинг - можно на модельке выделить боксом область под замену. Правда, не знаю насколько полезная
- ну и конечно генерация сцены по боксам как было в изначальной презентации

Теперь о слабых местах

- не справляется с нестандартными позами персонажей. Бендера со скрещенными на груди руками не смог. Вернее, Бендер вышел отлично, а руки слились в один шланг. Игривого котэ смог, но в другой позе, с лапками поставленными вместе. Но было бы и странно, кому нужны статичные персонажи в странных позах? Думаю, с Т-позой для бипеда и стандартной позой для квадрапеда все будет ок.

- не справляется с мелкими детальными структурами. Эйфелеву башню порвал на кусочки. Из вот этого мелкоструктурного лица вообще сделал какой-то член, оставив пустоту вместо щек

- не справился с очками на жабе, оптические эффекты тяжеловато ему даются. Со второй или третьей попытки почти справился.

Ну и опять же, то что не получилось - экстремальные случаи, мне трудно себе представить кейсы когда такие вещи потребуется сделать с нуля.

Стол, пистолет, мозг получились отлично.

Обещают сначала открыть web-версию, потом API

#imageto3D #tetxtto3D #text2scene #test #inpainting

❤17🤔4🤯1

1.54K views07:26

CLAY: A Controllable Large-scale Generative Model for Creating High-quality 3D Assets

Срыв покровов. Это внутрянка Rodin Gen-1

ControlNet и LoRA управляют изображением, вокселями облаком точек и баундинг боксом

Обещают релизнуть плагин для блендера

Код ждем
Демо

#imageto3D #tetxtto3D #text2scene #realtime

🔥6👍2

1.46K views11:58

0:23

0:36

HoloDreamer: Holistic 3D Panoramic World Generation from Text Descriptions

Генерация 3D сцен по текстовому описанию. Первым шагом генерируется 360-градусная панорама. Ну а дальше на нее напускают гауссианы.

Код ждем

#gaussian #text2scene #textto3d #panorama

🔥10👍1

1.44K views11:27

Sketch2Scene: Automatic Generation of Interactive 3D Game Scenes from User's Casual Sketches

Генерация интерактивных 3D-игровых сцен по нарисованным от руки эскизам и текстовым описаниям.

Под капотом генератор картинок, ControlNet, LoRa на SDXL-Inpaint, Grounded Segment Anything.

Для процедурного синтеза 3D-сцены используется игровой движок Unity

Кода нет, есть понимание чего ожидать в играх

#sketch2scene #text2scene #news

❤6👍1

1.95K views08:09

0:34

Chat Edit 3D: Interactive 3D Scene Editing via Text Prompts

Это вообще законно?
Оно через ChatGPT рулит 30+ диффузионными нейронками для работы с 3D сценами.
Загляните на сайт. Там еще вагончик примеров того что оно может

Код

#3dediting #text2scene #nerf #textto3d #assistant #3dassistant

👍5❤1

1.66K views13:36

0:30

Krea Stage

У Krea AI опять обновка.
Добавили функцию генерации 3D сцен

#image2scene #imageto3d #text2scene #textto3d

👍11❤2

2.12K viewsedited 15:20

0:56

spAItial

Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику

Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео

Записаться в вейтлист

#textto3d #text2scene #gaussian

👍9😱3❤1

2.05K views06:34

0:12

0:25

0:28

ImmerseGen: Agent-Guided Immersive World Generation with Alpha-Textured Proxies

Разработка ByteDance.
Создаёт 3D-миры по текстовым описаниям для виртуальной реальности. Сначала формируется базовая местность, а затем добавляются объекты.

Под капотом агенты, работающие на основе визуальных языковых моделей

Код ждем

#VR #vlm #text2scene #text2world

👍9🤯6❤4

2.1K views15:48

"Первый опенсорсный генератор 3D миров, полностью совместимый с графическими пайплайнами"

Создает сцены и 360-градусные панорамы по тексту и по картинке.

В основе работы модели - алгоритм представления и генерации 3D-сцен с семантической иерархией.

В интерактивной демке панорамы на сайте проекта при попытке погулять в генерации очень быстро наталкиваешься на границу, за которую не пускают, как будто там не честное 3D, а картинка натянутая на карту глубины. Так что не вижу в чем он тут "первый", разве что в том что опенсорс. Ну да ладно, это первое впечатление.

Предлагают использовать в VR, геймдеве, физической симуляции, задачах с взаимодействием с объектами

Код
Веса
Попробовать - вход через WeChat. Я залогинился, но дальше сайт не прогружается

Спасибо @iNevestenko

#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world

👍10⚡2❤1😱1

1.62K views09:53

0:31

1:17

3D сцены HunyuanWorld 1.0 полностью редактируемые
(ну они так и написали - совместимые с 3D пайплайнами)

Можно попробовать запустить его в Google Colab Pro (нужно 22ГБ VRAM)

Jupiter / Colab

#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world

👍7🔥2

1.44K views10:16