Нейронавт | Нейросети в творчестве
9.41K subscribers
3.62K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
У генератора музыки Riffusion обновки и весьма интересные

- Можно загрузить свой трек для препарирования и переделки

- Swap Sound - заменяем инструментальные партии/жанры, вокал остается

- Swap Vocal - заменяем вокал, оставляя инструменты

- Get Stems - делим композицию на партии и скачиваем

- Trim - обрезаем, оставляя нужный кусок, и работаем от него

- Ghostwriter - пишет тексты

#text2music #music2music #audio2music
👍13
G-Assist

Игровой помощник Nvidia уже доступен в NVIDIA App.

Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос

Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем

#gaming #news #assistant
😁831👍1
Gemini 2.5 Pro

Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.

Сегодня гугл всех побил. Надолго ли?

Пробовать в AI Studio

#assistant #reasoning #coding
👍10🤯6
4o Image Generation

Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.

Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею

Видео

#imageediting
🤯8👍1😈1
Языковые модели подминают под себя задачи с обработкой изображений. Скоро флюкс и МЖ станут не нужны. Чем ответят авторы картиночных нейросеток?
🤔11👎5😈1
Aether: Geometric-Aware Unified World Modeling

Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:

- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели

Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.

Код ждем
Демо ждем

#video2video #novelview #cameracontrol #motioncontrol
👍12
Новости автоматизации

Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно

image-gen MCP

ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111

————————————
AbletonMCP
MCP к музыкальной станции Ableton

————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко

————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP

————————————
Галереи MCP серверов

https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers

————————————
https://modelcontextprotocol.io/introduction
Введение в MCP

#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
1👍113
Ideogram 3.0

Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.

стабильно превосходит другие модели преобразования текста в изображение


Попробовать
iOS

#text2image
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-TI2V

Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает

Попробовать
Веса

#image2video
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing

Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей

Код ждем

#text2image
👍62
This media is not supported in your browser
VIEW IN TELEGRAM
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement

Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов

А я думал, Клод с MCP уже намного больше может

Кода нет

#mlm #assistant #3d
👍6