This media is not supported in your browser
VIEW IN TELEGRAM
У генератора музыки Riffusion обновки и весьма интересные
- Можно загрузить свой трек для препарирования и переделки
- Swap Sound - заменяем инструментальные партии/жанры, вокал остается
- Swap Vocal - заменяем вокал, оставляя инструменты
- Get Stems - делим композицию на партии и скачиваем
- Trim - обрезаем, оставляя нужный кусок, и работаем от него
- Ghostwriter - пишет тексты
#text2music #music2music #audio2music
- Можно загрузить свой трек для препарирования и переделки
- Swap Sound - заменяем инструментальные партии/жанры, вокал остается
- Swap Vocal - заменяем вокал, оставляя инструменты
- Get Stems - делим композицию на партии и скачиваем
- Trim - обрезаем, оставляя нужный кусок, и работаем от него
- Ghostwriter - пишет тексты
#text2music #music2music #audio2music
👍13
G-Assist
Игровой помощник Nvidia уже доступен в NVIDIA App.
Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос
Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем
#gaming #news #assistant
Игровой помощник Nvidia уже доступен в NVIDIA App.
Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос
Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем
#gaming #news #assistant
😁8❤3⚡1👍1
Gemini 2.5 Pro
Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.
Сегодня гугл всех побил. Надолго ли?
Пробовать в AI Studio
#assistant #reasoning #coding
Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.
Сегодня гугл всех побил. Надолго ли?
Пробовать в AI Studio
#assistant #reasoning #coding
👍10🤯6
4o Image Generation
Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.
Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею
Видео
#imageediting
Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.
Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею
Видео
#imageediting
🤯8👍1😈1
Языковые модели подминают под себя задачи с обработкой изображений. Скоро флюкс и МЖ станут не нужны. Чем ответят авторы картиночных нейросеток?
🤔11👎5😈1
Aether: Geometric-Aware Unified World Modeling
Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:
- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели
Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.
Код ждем
Демо ждем
#video2video #novelview #cameracontrol #motioncontrol
Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:
- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели
Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.
Код ждем
Демо ждем
#video2video #novelview #cameracontrol #motioncontrol
👍12
Новости автоматизации
Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно
image-gen MCP
ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111
————————————
AbletonMCP
MCP к музыкальной станции Ableton
————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко
————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP
————————————
Галереи MCP серверов
https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers
————————————
https://modelcontextprotocol.io/introduction
Введение в MCP
#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно
image-gen MCP
ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111
————————————
AbletonMCP
MCP к музыкальной станции Ableton
————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко
————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP
————————————
Галереи MCP серверов
https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers
————————————
https://modelcontextprotocol.io/introduction
Введение в MCP
#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
1👍11❤3
Нейронавт | Нейросети в творчестве
Grok в Телеграм, не реклама В тг появился бот @GrokAI, вероятно официальный В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию Похоже что это не Grok3, а Grok2. Картинки рисовать отказывается…
👍10🥴6👎2😐1
Ideogram 3.0
Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.
Попробовать
iOS
#text2image
Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.
стабильно превосходит другие модели преобразования текста в изображение
Попробовать
iOS
#text2image
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-TI2V
Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает
Попробовать
Веса
#image2video
Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает
Попробовать
Веса
#image2video
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing
Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей
Код ждем
#text2image
Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей
Код ждем
#text2image
👍6❤2
AvatarArtist: Open-Domain 4D Avatarization
Создает 4D аватар по одному портрету
От авторов Follow-Your-Emoji
Код
Демо ждем
#image2avatar #head
Создает 4D аватар по одному портрету
От авторов Follow-Your-Emoji
Код
Демо ждем
#image2avatar #head
👍6❤1
This media is not supported in your browser
VIEW IN TELEGRAM
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement
Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов
А я думал, Клод с MCP уже намного больше может
Кода нет
#mlm #assistant #3d
Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов
А я думал, Клод с MCP уже намного больше может
Кода нет
#mlm #assistant #3d
👍6