This media is not supported in your browser
VIEW IN TELEGRAM
Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control
Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный
Код
Демо
#personalization #image2image
Очередной адаптер-персонализатор, заточенный на замену лиц. Вроде прикольный
Код
Демо
#personalization #image2image
👍14😁2
Опубликован официальный код адаптера материалов ZeST
Ждем в ComfyUI/A1111
Код
Демо
#material #image2image
Ждем в ComfyUI/A1111
Код
Демо
#material #image2image
Telegram
Нейронавт | Нейросети в творчестве
ZeST: Zero-Shot Material Transfer from a Single Image
Перенос материала с одного изображения на другое без дообучения
Код
#material #image2image
Перенос материала с одного изображения на другое без дообучения
Код
#material #image2image
👍8🔥1
DeepSeek-VL
Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.
Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.
Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб
Гитхаб
HF
Демо
#chatbot #assistant
Помните ассистент программиста DeepSeek coder?
Так вот, у этой команды разработчиков есть еще несколько моделей, в том числе мультимодальная #VLM DeepSeek-VL/
Она сейчас в тренде на гитхабе.
Понимает диаграммы, веб-страницы, формулы, научную литературу, изображения и т д.
Кроме того, ее можно (я так думаю) запустить локально. Мдель 7B весит 15 Гб. 3B весит 4Гб
Гитхаб
HF
Демо
#chatbot #assistant
👍11🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ReVideo: Remake a Video with Motion and Content Control
Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan
Код обещают в июне
#video2video
Изменение объектов и траекторий на видео. В коллаборации с Open-Sora-Plan
Код обещают в июне
#video2video
👍9
Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Парень провёл абсолютно гениальный эксперимент — «Обратный тест Тьюринга».
Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.
Специально для вас сделали перевод на русский язык.
@exploitex
Он создал на Unity купе, где собрал известных исторических личностей под управлением разных ИИ. Задача безумная — нейросети знают, что среди них есть человек и им нужно его вычислить. Задача чувака — правдоподобно отыграть ИИ-Чингисхана, чтобы не покупать билет.
Специально для вас сделали перевод на русский язык.
@exploitex
🔥25👎2👍1
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis
Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.
Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения
Код
#text2image
Новая технологичная модель генерации изображений по тексту на основе Mamba - насколько помню, это продвинутая альтернатива трансформеров.
Генерация до 1536*1536 пикселей. Дообучается на картинках низкого разрешения
Код
#text2image
👍7
CraftsMan:High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner
Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме
Обучен на персонажах, с ними будут и лучшие результаты
Код
Демо
#imageto3d
Генератор 3D моделей по изображению. Генерит несколько ракурсов и по ним собирает сетку. А еще можно рейфайнить сетку в интерактивном режиме
Обучен на персонажах, с ними будут и лучшие результаты
Код
Демо
#imageto3d
❤8
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехал демоспейс CameraCtrl
1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!
Не удалось заставить ее обработать мою картинку, только примеры с демоспейса
Демо
#text2video #conditioning
1. выбираем способ ресайза
2. выбираем траекторию
3. можно еще тут поменять настройки инференса. Жмем кнопку Set
4. Жмем Start generation!
Не удалось заставить ее обработать мою картинку, только примеры с демоспейса
Демо
#text2video #conditioning
👍7😐1
This media is not supported in your browser
VIEW IN TELEGRAM
StopThePop: Sorted Gaussian Splatting for View-Consistent Real-time Rendering
Устранение проблемы появляющихся/исчезающих пятен при реконструкции сцены гауссианами
Код
#gaussian #rendering
Устранение проблемы появляющихся/исчезающих пятен при реконструкции сцены гауссианами
Код
#gaussian #rendering
👍6😱2
AnyNode v0.1 (🍄 beta)
Универсальная нода для ComfyUI.
Это не шутка. Делает все что сможете сформулировать текстовым запросом.
Ограничена возможностями подключенной языковой модели. Да, разумеется, магия работает на #LLM
Поддерживает ChatGPT, Gemini, а также локальные модели.
В будущем сможет создавать новые ноды.
Гитхаб
Реддит
Туториал (youtube)
#extension
Универсальная нода для ComfyUI.
Это не шутка. Делает все что сможете сформулировать текстовым запросом.
Ограничена возможностями подключенной языковой модели. Да, разумеется, магия работает на #LLM
Поддерживает ChatGPT, Gemini, а также локальные модели.
В будущем сможет создавать новые ноды.
Гитхаб
Реддит
Туториал (youtube)
#extension
🔥15❤1👍1
Codestral
Свежий ассистент программиста от Mistral.
Уже доступен в API и в VS Code.
Знает 80+ языков программирования.
Размер модели 22B, пожатая влезет на видюху.
Контекстное окно 32к токенов
Превосходит на humaneval не только лишь всех
Веса
Демо
#coding #assistant
Свежий ассистент программиста от Mistral.
Уже доступен в API и в VS Code.
Знает 80+ языков программирования.
Размер модели 22B, пожатая влезет на видюху.
Контекстное окно 32к токенов
Превосходит на humaneval не только лишь всех
Веса
Демо
#coding #assistant
👍8