4K4D: Real-Time 4D View Synthesis at 4K Resolution
Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU
Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео
Код
#rendering
Рилтаймовый рендеринг динамических 3D сцен в высоком разрешении.
400 FPS на датасете DNA-Rendering 1080p. 80 FPS на датасете ENeRF-Outdoor 4K. Замеряли на RTX 4090 GPU
Бонусом - алгоритм изучения сцены по глубине на основе RGB - видео
Код
#rendering
Latent Consistency Models: Synthesizing High-Resolution Images with Few-step Inference
Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5
Код
Модель
Демо
Колаб
#text2image
Помните диффузную генерацию картинок за один шаг?
Появилось новое решение для сокращения шагов. Любую модель SD дистиллируют за 4000 шагов, на выходе модель которая дает хороший результат 768*768 за 4 шага. За 1 шаг выдает картинку примерно голого SD v1.5
Код
Модель
Демо
Колаб
#text2image
🔥9👍1
FreeU : Free Lunch in Diffusion U-Net
Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.
Код
Демо
#text2image #text2video #optimization
Ну и раз открыл тему про ускорение инференса, пора упомянуть этот активно развивающийся проект. Улучшение и ускорение генерации изображений и видео без дообучения и лишних телодвижений.
Код
Демо
#text2image #text2video #optimization
👍4❤2
Forwarded from Neurogen
Там Nvidia выпустили расширение и новый драйвер под Stable Diffusion, позволяющие получить до x2 прироста в генерациях за счёт использования тензорных ядер в видеокартах серий RTX.
Скачать само расширение можно тут: Github
По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM
Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
Скачать само расширение можно тут: Github
По требованиям:
- Видеокарта RTX (RTX 20xx, 30xx, 40xx) на 8 Gb видеопамяти
- Установленный драйвер 537.58 и старше
- от 16 гигабайт RAM
Подробнее об установке и настройке можно прочесть в официальном гайде от Nvidia
❤4
Кто-то собрал неофициальную имплементацию RealFill
Код (неофициальный)
#image2image #inpainting #outpainting
Код (неофициальный)
#image2image #inpainting #outpainting
Telegram
Нейронавт | Нейросети в творчестве
RealFillReference-Driven Generation for Authentic Image Completion
Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…
Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует…
3D-GPT: 3D MODELING WITH LARGE LANGUAGE MODELS
Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.
Кода пока нет
#text2scene #textto3D
Генератор 3D сцен, использующий LLM для детального описания объектов.
3D-GPT состоит из агентов: агент отправки задач, агент концептуализации и модельный агент.
Он превращает ваш начальный промт в детальное описание. И легко интегрируется с 3D-софтом.
Кода пока нет
#text2scene #textto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Loop Copilot: Conducting AI Ensembles for Music Generation and Iterative Editing
Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps
Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.
Кода пока нет
#LLM #text2music #music2music #audio2audio
Система генерации и изменения музыки через указания на естественном языке.
За понимание указаний, разумеется, отвечает языковая модель. Ну а для собственно музыки под капотом присутствуют генератор MusicGen, экстрактор стемов (отдельных источников звука) Demucs, генератор VampNet и описатель LP-MusCaps
Тренд интеграции разных нейросеток в один инструмент продолжает усиливаться.
Кода пока нет
#LLM #text2music #music2music #audio2audio
This media is not supported in your browser
VIEW IN TELEGRAM
MIDIjourney: Your GPS for Groove and Pitch
И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы
Гитхаб
#text2music #text2midi #midi
И еще один композитор. На этот раз генератор MIDI по тексту в виде плагина для Ableton Live v10 и v11. Умеет сочинять как небольшие фразы, так и сложные композиции. Есть тут пользователи Ableton? Ждем ваши отзывы
Гитхаб
#text2music #text2midi #midi
HyperWrite
ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный
Попробовать (сразу включайте VPN)
#LLM #assistant
ИИ-ассистент с доступом в интернет. Умеет суммировать видео в YouTube, писать посты, письма и еще что-то. Бесплатный тариф какой-то грустный
Попробовать (сразу включайте VPN)
#LLM #assistant
Реддитор сравнил 50 моделей SDXL и составил отчет с рейтингом по категориям
Отчет в PDF. В поле Назовите справедливую цену вбейте 0 и можете скачать бесплатно
Реддит
#gallery #comparison #shootout
Отчет в PDF. В поле Назовите справедливую цену вбейте 0 и можете скачать бесплатно
Реддит
#gallery #comparison #shootout
👍7🔥1
Пользутесь ли вы тегами на этом канале?
Anonymous Poll
14%
Что такое теги?
12%
Хотел что-то найти, не догадался искать по тегам
46%
Не пользуюсь потому что ничего не ищу тут
5%
Пробовал найти нужное по тегам, не нашел
23%
Пользуюсь, удобная фича
Доброго утра, нейраны!
Что-то мне лениво постить новости, лучше проведу опрос.
Я любовно вручную отегиваю каждый пост, чтобы впоследствии было легче найти нужное. Пользуетесь ли вы тегами на этом канале? Находили ли по тегам искомое? И не знаете ли бота который умеет расставлять теги автоматически или хотя бы составить список всех тегов? Опрос выше
#poll
Что-то мне лениво постить новости, лучше проведу опрос.
Я любовно вручную отегиваю каждый пост, чтобы впоследствии было легче найти нужное. Пользуетесь ли вы тегами на этом канале? Находили ли по тегам искомое? И не знаете ли бота который умеет расставлять теги автоматически или хотя бы составить список всех тегов? Опрос выше
#poll
❤5
Поясняю для тех кто проголосовал за первый пункт. Теги это вот эти слова начинающиеся с решетки. Если кликнуть на тег, получаем список всех постов с таким же тегом. Я так ищу инструменты которые сразу не понадобились, а понадобились впоследствии. Например, нужен генератор глубины - ищу #image2depth
👍15😁3
tungsten.run
Платформа для размещения и запуска SD моделей, прямой конкурент Civitai. Планируют монетизировать использование GPU, но пока генерация бесплатная.
SDK
Шаблон модели SD
#gallery #tools
Платформа для размещения и запуска SD моделей, прямой конкурент Civitai. Планируют монетизировать использование GPU, но пока генерация бесплатная.
SDK
Шаблон модели SD
#gallery #tools
This media is not supported in your browser
VIEW IN TELEGRAM
Latent Consistency Models (LCM) скрещивают со стилизацией видео и получают 7 кадров в секунду на RTX 4090
реддит
#video2video #realtime
реддит
#video2video #realtime