Media is too big
VIEW IN TELEGRAM
А давайте откроем рубрику куда будем скидывать понравившиеся работы. Меня вот это зацепило, интересно смотреть. pika + midjourney + Suno
Накидывайте в коменты
И давайте придумаем тег?
Накидывайте в коменты
И давайте придумаем тег?
🔥15❤5👍5
Kimi K2
Новая версия китайской мультимодалки.
Пишут что убийца cHatGPT и DeepSeek, но как всегда преувеличивают
Архитертура #MoE, Триллион параметров, из них 32B активных. Заточена на агентные и программерские задачи. Есть две версии:
Kimi-K2-Base: Базовая модель, с которой можно начинать работу исследователям и разработчикам, которым нужен полный контроль для точной настройки и создания пользовательских решений.
Kimi-K2-Instruct: модель после обучения, которая лучше всего подходит для работы с клиентами, общения в чате общего назначения и взаимодействия с агентами. Это модель рефлекторного уровня, о которой не нужно долго думать.
- Обрабатывает 100 тысяч строк данных за раз - Строит визуализации
- Создаёт игры в вебе, на создание клона Minecraft у Kimi K2 ушла одна попытка
- Планирует путешествия через 17 инструментов
- Токены в 5 раз дешевле чем у конкурентов
Уже на Perplexity
Хотя какая разница если можно пользоваться прямо на офсайте и в мобильном приложении
Мультимодальные функции пока не работают
Гитхаб
Веса - вам точно это надо?
Попробовать на офсайте - в левом нижнем углу переключаем на английский
На мобиле не факт что K2 уже есть, не проверял
AppStore
Android
#assistant #mllm #mlm #reasoning #mobile #ios
Новая версия китайской мультимодалки.
Пишут что убийца cHatGPT и DeepSeek, но как всегда преувеличивают
Архитертура #MoE, Триллион параметров, из них 32B активных. Заточена на агентные и программерские задачи. Есть две версии:
Kimi-K2-Base: Базовая модель, с которой можно начинать работу исследователям и разработчикам, которым нужен полный контроль для точной настройки и создания пользовательских решений.
Kimi-K2-Instruct: модель после обучения, которая лучше всего подходит для работы с клиентами, общения в чате общего назначения и взаимодействия с агентами. Это модель рефлекторного уровня, о которой не нужно долго думать.
- Обрабатывает 100 тысяч строк данных за раз - Строит визуализации
- Создаёт игры в вебе, на создание клона Minecraft у Kimi K2 ушла одна попытка
- Планирует путешествия через 17 инструментов
- Токены в 5 раз дешевле чем у конкурентов
Уже на Perplexity
Хотя какая разница если можно пользоваться прямо на офсайте и в мобильном приложении
Мультимодальные функции пока не работают
Гитхаб
Веса - вам точно это надо?
Попробовать на офсайте - в левом нижнем углу переключаем на английский
На мобиле не факт что K2 уже есть, не проверял
AppStore
Android
#assistant #mllm #mlm #reasoning #mobile #ios
❤6👍1
WAN Image
Оказалось что WAN отлично генерит картинки, даже
Цитата потому что я таких выводов не делал
какой-то воркфлоу
какой-то воркфлоу WAN 2.1FusionX_14B_Image Generator
Smartphone Snapshot Photo Reality - можно использовать лору
вокрфлоу с лорой
wan2.1 controlnets - можно и контролнеты
Видео от AItrepreneur
Спасибо за наводку @edyukov
#lora #text2image #workflow
Оказалось что WAN отлично генерит картинки, даже
лучше чем Flux и HiDream
Цитата потому что я таких выводов не делал
какой-то воркфлоу
какой-то воркфлоу WAN 2.1FusionX_14B_Image Generator
Smartphone Snapshot Photo Reality - можно использовать лору
вокрфлоу с лорой
wan2.1 controlnets - можно и контролнеты
Видео от AItrepreneur
Спасибо за наводку @edyukov
#lora #text2image #workflow
👍17🔥2❤1
PyVision: Agentic Vision with Dynamic Tooling
Так, агенты добрались и до визуального понимания.
PyVision — это новая система, которая позволяет моделям машинного обучения работать с изображениями и придумывать собственные инструменты для решения задач. Модель может анализировать картинки, находить на них нужные объекты, измерять их. По сути, учится «видеть» и понимать мир как человек, но с помощью кода и алгоритмов.
Например, создает код на питоне для решения задачи
Работает через API OpenAI, поэтому для работы нужен API ключ OpenAI
Код
Демо
#vlm #agent #image2text
Так, агенты добрались и до визуального понимания.
PyVision — это новая система, которая позволяет моделям машинного обучения работать с изображениями и придумывать собственные инструменты для решения задач. Модель может анализировать картинки, находить на них нужные объекты, измерять их. По сути, учится «видеть» и понимать мир как человек, но с помощью кода и алгоритмов.
Например, создает код на питоне для решения задачи
Работает через API OpenAI, поэтому для работы нужен API ключ OpenAI
Код
Демо
#vlm #agent #image2text
👍7
Все продвинутые фрилансеры уже настроили себе GPT-агентов. И вот почему
Он не болеет, не уходит в отпуск, не ноет и не просит премий.
Зато умеет:
✔️заменять до 10 сотрудников
✔️приводить клиентов из соцсетей
✔️зарабатывать до 10 000₽ в день – стабильно, без выгораний и кофе-брейков
Все, что нужно для его создания – 15 минут и смартфон
👉https://clck.ru/3MaeP7
На бесплатном 3-дневном марафоне «GPT’s агенты» вы:
– запустите своего первого ИИ-помощника
– настроите его под свои задачи – продажи, контент, заявки
– узнаете, как его можно монетизировать минимум на 150 000₽/мес через тг
🔥Участникам VIP-дня – именной сертификат от лицензированной школы!
Старт – сегодня.
Будет обзор 100 готовых ИИ-агентов, не пропустите!
Бонус за регистрацию: гайд «Как создать ИИ-агента» – уже с шаблонами и инструкцией, жмите 👉https://clck.ru/3MaeP7
Он не болеет, не уходит в отпуск, не ноет и не просит премий.
Зато умеет:
✔️заменять до 10 сотрудников
✔️приводить клиентов из соцсетей
✔️зарабатывать до 10 000₽ в день – стабильно, без выгораний и кофе-брейков
Все, что нужно для его создания – 15 минут и смартфон
👉https://clck.ru/3MaeP7
На бесплатном 3-дневном марафоне «GPT’s агенты» вы:
– запустите своего первого ИИ-помощника
– настроите его под свои задачи – продажи, контент, заявки
– узнаете, как его можно монетизировать минимум на 150 000₽/мес через тг
🔥Участникам VIP-дня – именной сертификат от лицензированной школы!
Старт – сегодня.
Будет обзор 100 готовых ИИ-агентов, не пропустите!
Бонус за регистрацию: гайд «Как создать ИИ-агента» – уже с шаблонами и инструкцией, жмите 👉https://clck.ru/3MaeP7
🍌5👎4😁2👍1🥴1
PromptTea: Let Prompts Tell TeaCache the Optimal Threshold
Новый метод ускорения видеогенерации
Модель анализирует промпты и на основе их сложности автоматически настраивает процесс генерации видео.
Для простых видео модель работает быстрее, а для сложных — более внимательно, сохраняя высокое качество
Ускорение генерации в 2,79 раз при минимальной потере качества.
Поддерживает CogVideoX1.5, HunyuanVideo и Wan2.1
Код
#optimization
Новый метод ускорения видеогенерации
Модель анализирует промпты и на основе их сложности автоматически настраивает процесс генерации видео.
Для простых видео модель работает быстрее, а для сложных — более внимательно, сохраняя высокое качество
Ускорение генерации в 2,79 раз при минимальной потере качества.
Поддерживает CogVideoX1.5, HunyuanVideo и Wan2.1
Код
#optimization
👍13
This media is not supported in your browser
VIEW IN TELEGRAM
SpatialTrackerV2: 3D Point Tracking Made Easy
Ура, новый трекер. Создан при участии ByteDance
Определяет движение камеры, геометрию сцены и траектории точек в пространстве. Работает в режиме реального времени
Код
Демо
#tracking #realtime
Ура, новый трекер. Создан при участии ByteDance
Определяет движение камеры, геометрию сцены и траектории точек в пространстве. Работает в режиме реального времени
Код
Демо
#tracking #realtime
🔥11👍1