Нейронавт | Нейросети в творчестве

Multi-LoRA Composition for Image Generation

Метод контроля генерации изображений позволяет обойти ограничение обычных LoRa, которые при слиянии спорят друг с другом и теряют детали.
Пишут, что работает без дообучения

Код

#conditioning #text2image #image2image

👍15

1.51K viewsedited 13:28

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

From Skin to Skeleton: Towards Biomechanically Accurate 3D Digital Humans

Биомеханически корректное восстановление позы, скелета, меша по видео.
Код там же, три ссылки внизу

#video2pose #videoto3D #image2pose

🔥8👍3

1.41K views07:40

Нейронавт | Нейросети в творчестве

Инструкция по локальному запуску SUPIR на 10-11 GB VRAM

Подробнее на гитхабе

git clone https://github.com/Fanghua-Yu/SUPIR.git (Клонирование репозитория)

cd SUPIR (перейдите к каталогу)

установка pip -r requirements.txt (При этом будут установлены отсутствующие пакеты, но будьте осторожны, некоторые версии могут быть удалены, если они не совпадают, или используются conda или venv)

Загрузите SDXL CLIP Encoder-1 (Вам нужен полный каталог, вы можете выполнить git clone https://huggingface.co/openai/clip-vit-large-patch14)

Скачать https://huggingface.co/laion/CLIP-ViT-bigG-14-laion2B-39B-b160k/blob/main/open_clip_pytorch_model.bin (только этот файл)

Загрузите модель SDXL, Juggernaut работает хорошо (https://civitai.com/models/133005?modelVersionId=348913) Без Lightning или LCM

Пропустите материалы LLaVA (они большие и требуют много памяти, она создает промт из вашего исходного изображения, но если ваше изображение сгенерировано, вы можете использовать тот же промт)

Скачать SUPIR-v0Q (https://drive.google.com/drive/folders/1yELzm5SvAi9e7kPcO_jPp2XkTs4vK6aR?usp=sharing)

Скачать SUPIR-v0F (https://drive.google.com/drive/folders/1yELzm5SvAi9e7kPcO_jPp2XkTs4vK6aR?usp=sharing)

Измените CKPT_PTH.py локальные пути для загруженных вами файлов SDXL CLIP (каталог для CLIP1 и файл .bin для CLIP2).

Измените SUPIR_v0.yaml в качестве локальных путей для других загруженных вами файлов, в конце файла SDXL_CKPT, SUPIR_CKPT_F, SUPIR_CKPT_Q (расположение файлов для всех 3-х)

Перейдите в каталог SUPIR в командной строке и запустите "python gradio_demo.py --use_tile_vae --no_llava --use_image_slider --loading_half_params"

#upscale

From the StableDiffusion community on Reddit: SUPIR (Super Resolution) - Tutorial to run it locally with around 10-11 GB VRAM

Explore this post and more from the StableDiffusion community

👍4❤2

1.54K views08:07

Нейронавт | Нейросети в творчестве

sd-forge-layerdiffusion

Поддержка layerdiffusion в Forge
Не забудьте обновить Forge командой

git pull

#text2image

👍2

1.57K views12:36

Нейронавт | Нейросети в творчестве

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

Ideogram 1.0

Уже известный нам генератор картинок от гугла обновился до версии 1.0 и теперь доступен всем.

Фишки: хорошо справляется с генерацией текста на изображении, хорошо понимает промты, ну и Magic Prompt - улучшайзер промта

Генерим здесь, хвастаемся в коментах

#text2image

👍9🔥4

1.67K views15:47

Нейронавт | Нейросети в творчестве

Еще один повод освоить ComfiUI Разработчик апскейлера SUPIR опубликовал ноду ComfiUI. В нынешней версии она скачивает 10GB модель CLIP и прожорлива до ресурсов. Гитхаб #upscale

ловите воркфлоу SUPIR для ComfyUI

#upscale

🔥12

1.58K views07:22

Нейронавт | Нейросети в творчестве

AUTOMATIC1111 stable-diffusion-webui 1.8.0

Вышла обновка автоматика.
Если будете обновляться, сделайте бэкап сначала. У людей уже ломается отображение результатов

#news #text2image

🔥4

1.59K views07:27

Нейронавт | Нейросети в творчестве

1:02

This media is not supported in your browser

VIEW IN TELEGRAM

CCSR: Improving the Stability of Diffusion Models for Content Consistent Super-Resolution

Менее известный апскейлер изображений. Он меньше галлюцинирует, чем SUPIR, но и результат выдает не такой интересный. Менее прожорлив к ресурсам.

Следующим постом сравнение

Код
Демо
Колаб
ComfyUI- CCSR upscaler node

#upscale

👍9

1.76K views13:02

Нейронавт | Нейросети в творчестве

CCSR vs SUPIR (реддит)

Не забудьте посмотреть и бонусы - SUPIR уделывает даже хваленый Magnific

#upscale #comparison #shootout

👍17❤1

1.64K views13:10

Нейронавт | Нейросети в творчестве

ComfyUI-layerdiffusion

Поддержка Layerdiffusion для ComfyUI

#text2image

🔥9👍2😱1😈1

1.91K views07:28

Нейронавт | Нейросети в творчестве

Самое важное о чем я не успел вам рассказать на прошлой неделе

Groq - самая быстрая альтернатива ChatGPT, быстый - 500 токенов/сек

Chateq - чатбот спорщик, поможет спорить в интернете

Pika научился делать липсинк. Загружаем запись речи и получаем видео с говорящим персонажем

Suno.ai V3 научился генерить музыку без вокала с отменным качеством, до 2 минут

Adobe анонсировали Project Music GenAI Control - генератор/редактор аудио с помощью текстовых указаний.

#llm #assistant #chatbot #news #lipsync #text2music #music2music #audio2aidio

Groq

Groq is fast inference for AI builders

The LPU™ Inference Engine by Groq is a hardware and software platform that delivers exceptional compute speed, quality, and energy efficiency. Groq provides cloud and on-prem solutions at scale for AI applications.

👍4

1.56K viewsedited 12:26

Нейронавт | Нейросети в творчестве

Differential Diffusion: Giving Each Pixel Its Strength

Контроль количества изменений на сгенерированных изображениях на пиксель или на область изображения.

Интегрируется в существующие генераторы изображений, работает без обучения.

Код
Колаб
Демо

#image2image

🔥9👍3

1.32K views13:12

Нейронавт | Нейросети в творчестве

Forwarded from Сиолошная

This media is not supported in your browser

VIEW IN TELEGRAM

Помните я писал про секретный анонс фичи Gemini, который никто не продвигал, был лишь один ролик? Вот тут: https://yangx.top/seeallochnaya/911, суть в том, что под каждый запрос LLM генерирует код интерфейса, в котором нужно показывать пользователю ответ, а затем уже его наполняет.

Vercel, компания, предоставляющая облачный сервис для развёртывания сайтов, обновила AI SDK до версии 3.0, добавив туда такую фичу. Формочки на демо не предзапрограммированны, а создаются на лету и могут содержать любой контент в любой форме. Думаю, что через пару лет такая персонализация будет широко распространена — особенно с учётом количества пользователей, на которых можно запускать A/B тесты и оптимизировать интерфейс до мельчайших деталей. ~~И главное программисты, перекрашивающие годами две кнопки, будут не нужны!~~

🔥2🤔1

1.01K views13:33

Нейронавт | Нейросети в творчестве

Anthropic релизнули Claude 3, в трех вариантах - Opus, Sonnet и Haiku. Opus и Sonnet доступны уже сейчас, а Haiku - в ближайшие недели. Для россиян все еще по VPN

По цифрам на приборах обходит GPT-4.
Теперь ему можно скармливать картинки.
Контекст 200k токенов

Попробовать Claude 3 Sonnet (включайте VPN)

#news #assistant #vlm

👍11

1.35K views14:38

About

Blog

Apps

Platform