Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control

Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный

Код
Демо

#personalization #image2image
👍14😁2
DeepSeek-VL

Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.

Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.

Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб

Гитхаб
HF
Демо

#chatbot #assistant
👍11🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ReVideo: Remake a Video with Motion and Content Control

Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan

Код обещают в июне

#video2video
👍9
Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Парень провёл абсолютно гениальный эксперимент — «Обратный тест Тьюринга».

Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.

Специально для вас сделали перевод на русский язык.

@exploitex
🔥25👎2👍1
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.

Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения

Код

#text2image
👍7
CraftsMan:High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner

Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме

Обучен на персонажах, с ними будут и лучшие результаты

Код
Демо

#imageto3d
8
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехал демоспейс CameraCtrl

1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!

Не удалось заставить ее обработать мою картинку, только примеры с демоспейса

Демо

#text2video #conditioning
👍7😐1
This media is not supported in your browser
VIEW IN TELEGRAM
StopThePop: Sorted Gaussian Splatting for View-Consistent Real-time Rendering

Устранение проблемы появляющихся/исчезающих пятен при реконструкции сцены гауссианами

Код

#gaussian #rendering
👍6😱2
AnyNode v0.1 (🍄 beta)

Универсальная нода для ComfyUI.
Это не шутка. Делает все что сможете сформулировать текстовым запросом.
Ограничена возможностями подключенной языковой модели. Да, разумеется, магия работает на #LLM

Поддерживает ChatGPT, Gemini, а также локальные модели.
В будущем сможет создавать новые ноды.

Гитхаб
Реддит
Туториал (youtube)

#extension
🔥151👍1
Codestral

Свежий ассистент программиста от Mistral.
Уже доступен в API и в VS Code.
Знает 80+ языков программирования.
Размер модели 22B, пожатая влезет на видюху.
Контекстное окно 32к токенов
Превосходит на humaneval не только лишь всех

Веса
Демо

#coding #assistant
👍8