Нейронавт | Нейросети в творчестве
9.44K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Media is too big
VIEW IN TELEGRAM
LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS

Модель умеет быстро обрабатывать и понимать изображения в трёхмерном пространстве, используя язык. Находит объекты на картинках и определяет их местоположение с высокой точностью.

Был похожий проект

Код

#video2mask #segmentation #gaussian
👍10🔥1
Diffusion-4K: Ultra-High-Resolution Image Synthesis with Latent Diffusion Models

Генератор картинок по тексту в 4K.
В деле замешаны SD3-2B и Flux-12B

Сайта нет, проект исследовательский

Код

#text2image
👍13
Media is too big
VIEW IN TELEGRAM
Copart: Contextual Part Latents for 3D Generation

Очередной генератор 3D по частям

Сложные вещи разбивает на более простые части.
Учитывает как эти части связаны друг с другом, и может управлять каждой из них по отдельности.

Код

#imageto3d #3d
👍8
Небось уже слышали про робота Reachy Mini за $299 от HuggingFace, на котором можно запускать демоспейсы?

Теперь они выпускают в опенсорс проект роборуки HopeJR, которую можно напечатать на 3D принтере и собрать за $500

#robot
6👍2🔥2🥴2
Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models

Добавление объектов на изображение от NVIDIA
По текстовому описанию

Код
Демо

#imageediting #inpainting
8👍4
CLiFT: Compressive Light-Field Tokens for Compute-Efficient and Adaptive Neural Rendering

Метод представления (и рендеринга) 3D сцен в виде сжатых токенов светового поля (CLiFT). Метод хорошо сохраняет геометрическую информацию.

На сайте есть сравнение с методами LVSM от Adobe и DepthSplat от Microsoft

Код ждем к 1 августа

#image2scene #rendering #novelview
🔥4👍1
PUSA V1.0: Surpassing Wan-I2V-14B with $500 Training Cost

Новый видеогенератор, использующий особый метод управления временем в видео (vectorized timestep adaptation). Благодаря этому при генерации использует меньше данных и ресурсов по сравнению с другими моделями.

Это затюненный всего за $500 Wan-T2V-14B на 4K датасете.
Побил своего папу Wan-T2V-14B на VBench-I2V с 10 шагами инференса.


Возможности:
- создание видео из одного или нескольких изображений

- продление существующих видео

- генерация по начальному и конечному кадрам

- ну и создание видео по текстовому описанию.

Ждем кванты и дистиллы

Код
Веса

#text2video #image2video #videoediting
👍13🔥3🤔31
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Тут Антропик ввел Connections

Я долго читал, чем они отличаются от MCP-серверов.
Поправьте меня, если я неправ, но они позиционируют Connections как "проверенные" и "улучшенные" mcp-сервера, прошедшие модерацию Антропика.
Часть из них написаны Антропиком, часть партнерами (connect these reviewed and recommended tools from Anthropic’s trusted partners)
Ну то есть они занялись хорошим делом - модерацией всех эти тысяч MCP-коннекторов.
Есть локальные Коннекторы: Канва, Фигма, Страйп и даже Виндовс и Макось. Можно из Клода творить всякую дичь в открытых приложениях и в самой операционке.
Есть Remote Connections - для облачных сервисов: Asana, Atlassian, Paypal, Zapier
Можно написать свой и подать заявку на утверждение - модерация в действии.
Локально работает очень хорошо - Клод видит табы в браузере, разбирается с Ноушеном.
В общем, все это похоже на модерируемый и надежный магазин MCP-серверов, которые теперь встроены в Клод (локальные) или прошли проверку(удаленные).

https://claude.ai/directory

Тут подробнее: https://www.techradar.com/computing/artificial-intelligence/you-dont-have-to-explain-everything-to-claude-anymore-its-finally-in-your-apps

@cgevent
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
ALG: Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance

Улучшение динамики движения в видео, создаваемых на основе изображений. Решает проблему излишней статичности видео путём адаптивного применения низкочастотной фильтрации на начальных этапах обработки изображения. Это позволяет сначала усилить динамику движения, а затем восстановить детали изображения, сохраняя при этом высокое качество видео.

Прикручено к
CogVideoX
Wan 2.1
HunyuanVideo
LTX-Video - ждем

Код

#image2video
🔥7👍32