MiDashengLM
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
🔥5👍2🤔1👀1
Seed Diffusion Preview
экспериментальная языковая модель от ByteDance Seed для генерации кода на основе дискретной диффузии.
работает в два этапа: сначала заполняет пропуски в коде, а потом исправляет его, проверяя на глобальные ошибки.
Быстрее в 4-5 раз авторегрессионных моделей схожего масштаба
Попробовать - меня не пускают говорят встань в очередь
#assistant #coding
экспериментальная языковая модель от ByteDance Seed для генерации кода на основе дискретной диффузии.
работает в два этапа: сначала заполняет пропуски в коде, а потом исправляет его, проверяя на глобальные ошибки.
Быстрее в 4-5 раз авторегрессионных моделей схожего масштаба
Попробовать - меня не пускают говорят встань в очередь
#assistant #coding
👍8❤1🔥1
Qwen3-4B-Instruct-2507
недумающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
—————————
Qwen3-4B-Thinking-2507
думающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
#assistant
недумающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
—————————
Qwen3-4B-Thinking-2507
думающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
#assistant
🔥7❤1👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Jules
Google релизнул показанный в мае асинхронный агент для программирования на базе Gemini 2.5 Pro
- интеграция с GitHub
- может запускать существующие тесты и создавать новые
- клонирует код в облачную виртуальную машину и проверяет работоспособность изменений
- показывает план действий, объясняет свои решения и предоставляет диффы изменений в коде
Есть базовый тариф - 15 задач в день, 3 одновременные задачи
Россиян не любят
#assistant #Agent #coding
Google релизнул показанный в мае асинхронный агент для программирования на базе Gemini 2.5 Pro
- интеграция с GitHub
- может запускать существующие тесты и создавать новые
- клонирует код в облачную виртуальную машину и проверяет работоспособность изменений
- показывает план действий, объясняет свои решения и предоставляет диффы изменений в коде
Есть базовый тариф - 15 задач в день, 3 одновременные задачи
Россиян не любят
#assistant #Agent #coding
🔥5❤3🥴2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
gpt-oss 20B в облаке бесплатно
Времена настали тяжкие. Это где это видано чтобы каждый босяк мог запустить новейшую крутую LLM бесплатно в облаке. Совсем распоясались.
Я не знаю как долго она будет скачиваться и запускаться, несколько часов в день на бесплатном Колабе - стоит того чтобы вы об этом знали.
[UPDATE] у меня не запускается, OOM на 9 ячейке. Выходит, не каждый босяк
Колаб ноутбук
#assistant
Времена настали тяжкие. Это где это видано чтобы каждый босяк мог запустить новейшую крутую LLM бесплатно в облаке. Совсем распоясались.
Я не знаю как долго она будет скачиваться и запускаться, несколько часов в день на бесплатном Колабе - стоит того чтобы вы об этом знали.
[UPDATE] у меня не запускается, OOM на 9 ячейке. Выходит, не каждый босяк
Колаб ноутбук
#assistant
👍4❤1
PromptNova
Промпт-конструктор для картинко- и видеогенераторов
На старте дают 1000 кредитов на две недели.
Ежедневно что-то немножко тоже насыпают
#assistant #prompting
Промпт-конструктор для картинко- и видеогенераторов
На старте дают 1000 кредитов на две недели.
Ежедневно что-то немножко тоже насыпают
#assistant #prompting
👍8
GPT-5: все что вам нужно знать
Основные изменения:
➖ GPT-5 превосходит предыдущие модели по точности, скорости и глубине анализа.
➖ Один запрос создает готовое решение: сайт, приложение, игру.
➖ Расширенное контекстное мышление: справляется с длинными задачами и задает уточняющие вопросы.
➖ Снижены «галлюцинации», повышая надежность.
➖ Бесплатный доступ для всех, для Pro - без лимитов.
Ключевые особенности:
➖ Объединяет все предыдущие версии, работает быстрее и точнее.
➖ Пишет сайты, приложения и игры по одному запросу.
➖ Переключается между быстрым и «думающим» режимами.
➖ Улучшена в кодинге, знает новые API.
➖ Самая мощная модель по метрикам LM Arena.
Версии:
➖ GPT-5 — флагманская версия для сложных логических и многоэтапных задач
➖ GPT-5-mini — облегченная версия с балансом производительности и стоимости
➖ GPT-5-nano — сверхбыстрая версия для задач с низкой задержкой (только через API)
➖ GPT-5-chat — специализированная версия для корпоративных диалоговых систем
Мультимодальность и безопасность:
➖ Интеграция с изображениями, аудио и видео.
➖ Лучшее распознавание визуальных структур.
➖ Встроенные guardrails снижают риск jailbreak'ов.
API и настройка:
➖ Поддержка длительной памяти до 256K токенов.
➖ Настройка через custom GPTs и function calling 2.0.
➖ Выход на CPU и edge-устройствах ожидается в 2026.
Cursor
Copilot
API
Попробовать
Кто уже наложил руки - делитесь впечатлениями
#news #assistant
Основные изменения:
➖ GPT-5 превосходит предыдущие модели по точности, скорости и глубине анализа.
➖ Один запрос создает готовое решение: сайт, приложение, игру.
➖ Расширенное контекстное мышление: справляется с длинными задачами и задает уточняющие вопросы.
➖ Снижены «галлюцинации», повышая надежность.
➖ Бесплатный доступ для всех, для Pro - без лимитов.
Ключевые особенности:
➖ Объединяет все предыдущие версии, работает быстрее и точнее.
➖ Пишет сайты, приложения и игры по одному запросу.
➖ Переключается между быстрым и «думающим» режимами.
➖ Улучшена в кодинге, знает новые API.
➖ Самая мощная модель по метрикам LM Arena.
Версии:
➖ GPT-5 — флагманская версия для сложных логических и многоэтапных задач
➖ GPT-5-mini — облегченная версия с балансом производительности и стоимости
➖ GPT-5-nano — сверхбыстрая версия для задач с низкой задержкой (только через API)
➖ GPT-5-chat — специализированная версия для корпоративных диалоговых систем
Мультимодальность и безопасность:
➖ Интеграция с изображениями, аудио и видео.
➖ Лучшее распознавание визуальных структур.
➖ Встроенные guardrails снижают риск jailbreak'ов.
API и настройка:
➖ Поддержка длительной памяти до 256K токенов.
➖ Настройка через custom GPTs и function calling 2.0.
➖ Выход на CPU и edge-устройствах ожидается в 2026.
Cursor
Copilot
API
Попробовать
Кто уже наложил руки - делитесь впечатлениями
#news #assistant
👍6❤4
GGUF-версии GPT-OSS от Unsloth
20B выдет более 10 токенов/с при полной точности на 14 ГБ RAM
120B с полной точностью - >40 токенов/с на примерно 64 ГБ RAM
Запуститься можно даже на всего 6 ГБ и только CPU, медленно разумеется
Запустить можно через llama.cpp, LM Studio или Open WebUI.
Также есть версии с 4-bit и 16-bit точностью. 4-бинтый квант, можно файнтюнить на 24 ГБ VRAM.
Веса
Инструкция по локальному запуску и файнтюну
#gguf #assistant
20B выдет более 10 токенов/с при полной точности на 14 ГБ RAM
120B с полной точностью - >40 токенов/с на примерно 64 ГБ RAM
Запуститься можно даже на всего 6 ГБ и только CPU, медленно разумеется
Запустить можно через llama.cpp, LM Studio или Open WebUI.
Также есть версии с 4-bit и 16-bit точностью. 4-бинтый квант, можно файнтюнить на 24 ГБ VRAM.
Веса
Инструкция по локальному запуску и файнтюну
#gguf #assistant
👍9🤔1