Нейронавт | Нейросети в творчестве

Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control

Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный

Код
Демо

#personalization #image2image

👍14😁2

1.74K viewsedited 05:08

Нейронавт | Нейросети в творчестве

Опубликован официальный код адаптера материалов ZeST

Ждем в ComfyUI/A1111

Код
Демо

#material #image2image

Нейронавт | Нейросети в творчестве

ZeST: Zero-Shot Material Transfer from a Single Image

Перенос материала с одного изображения на другое без дообучения

Код

#material #image2image

👍8🔥1

1.5K views06:59

Нейронавт | Нейросети в творчестве

DeepSeek-VL

Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.

Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.

Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб

Гитхаб
HF
Демо

#chatbot #assistant

👍11🔥2

1.5K viewsedited 07:43

Нейронавт | Нейросети в творчестве

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

ReVideo: Remake a Video with Motion and Content Control

Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan

Код обещают в июне

#video2video

👍9

1.32K views06:29

Нейронавт | Нейросети в творчестве

Forwarded from Эксплойт

6:36

Media is too big

VIEW IN TELEGRAM

Парень провёл абсолютно гениальный эксперимент — «Обратный тест Тьюринга».

Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.

Специально для вас сделали перевод на русский язык.

@exploitex

🔥25👎2👍1

908 views06:35

Нейронавт | Нейросети в творчестве

DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.

Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения

Код

#text2image

👍7

1.21K views07:23

Нейронавт | Нейросети в творчестве

CraftsMan:High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner

Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме

Обучен на персонажах, с ними будут и лучшие результаты

Код
Демо

#imageto3d

❤8

1.24K views07:49

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Подъехал демоспейс CameraCtrl

1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!

Не удалось заставить ее обработать мою картинку, только примеры с демоспейса

Демо

#text2video #conditioning

👍7😐1

1.25K views08:14

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

StopThePop: Sorted Gaussian Splatting for View-Consistent Real-time Rendering

Устранение проблемы появляющихся/исчезающих пятен при реконструкции сцены гауссианами

Код

#gaussian #rendering

👍6😱2

1.29K views08:34

Нейронавт | Нейросети в творчестве

IC-Light прикрутили в ComfyUI ComfyUI-IC-Light-Wrapper #relighting #image2image

IC-Light прикрутили в A1111/SD Forge

Гитхаб

#relighting #image2image

🔥4

1.59K viewsedited 12:59

Нейронавт | Нейросети в творчестве

AnyNode v0.1 (🍄 beta)

Универсальная нода для ComfyUI.
Это не шутка. Делает все что сможете сформулировать текстовым запросом.
Ограничена возможностями подключенной языковой модели. Да, разумеется, магия работает на #LLM

Поддерживает ChatGPT, Gemini, а также локальные модели.
В будущем сможет создавать новые ноды.

Гитхаб
Реддит
Туториал (youtube)

#extension

🔥15❤1👍1

1.92K views14:41

Нейронавт | Нейросети в творчестве

Codestral

Свежий ассистент программиста от Mistral.
Уже доступен в API и в VS Code.
Знает 80+ языков программирования.
Размер модели 22B, пожатая влезет на видюху.
Контекстное окно 32к токенов
Превосходит на humaneval не только лишь всех

Веса
Демо

#coding #assistant

👍8

1.43K views06:43

Нейронавт | Нейросети в творчестве

SDXL Controlnet: Canny, Scribble, Openpose

#controlnet #conditioning

👍8

1.42K views07:16

About

Blog

Apps

Platform