Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
4K4D: Real-Time 4D View Synthesis at 4K Resolution

Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU

Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео

Код

#rendering
Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference

Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5

Код
Модель
Демо
Колаб

#text2image
🔥9👍1
FreeU : Free Lunch in Diffusion U-Net

Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.

Код
Демо

#text2image #text2video #optimization
👍42
Forwarded from Neurogen
Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.

Скачать само расширение можно тут: Github

По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM

Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
4
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS

Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.

Кода пока нет

#text2scene #textto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing

Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps

Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.

Кода пока нет

#LLM #text2music #music2music #audio2audio
This media is not supported in your browser
VIEW IN TELEGRAM
MIDIjourney: Your GPS for Groove and Pitch

И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы

Гитхаб

#text2music #text2midi #midi
HyperWrite

ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный

Попробовать (сразу включайте VPN)

#LLM #assistant
Реддитор сравнил 50 моделей SDXL и составил отчет с рейтингом по категориям

Отчет в PDF. В поле Назовите справедливую цену вбейте 0 и можете скачать бесплатно
Реддит

#gallery #comparison #shootout
👍7🔥1
Доброго утра, нейраны!
Что-то мне лениво постить новости, лучше проведу опрос.

Я любовно вручную отегиваю каждый пост, чтобы впоследствии было легче найти нужное. Пользуетесь ли вы тегами на этом канале? Находили ли по тегам искомое? И не знаете ли бота который умеет расставлять теги автоматически или хотя бы составить список всех тегов? Опрос выше

#poll
5
Поясняю для тех кто проголосовал за первый пункт. Теги это вот эти слова начинающиеся с решетки. Если кликнуть на тег, получаем список всех постов с таким же тегом. Я так ищу инструменты которые сразу не понадобились, а понадобились впоследствии. Например, нужен генератор глубины - ищу #image2depth
👍15😁3
tungsten.run

Платформа для размещения и запуска SD моделей, прямой конкурент Civitai. Планируют монетизировать использование GPU, но пока генерация бесплатная.

SDK
Шаблон модели SD

#gallery #tools
This media is not supported in your browser
VIEW IN TELEGRAM
Latent Consistency Models (LCM) скрещивают со стилизацией видео и получают 7 кадров в секунду на RTX 4090

реддит

#video2video #realtime