Как подобрать GPU для запуска LLM-модели?»
Ответ на него помогает найти инструмент GenAI-Perf от NVIDIA. В нем можно указать параметры конкретного целевого запроса и получить бенчмарк с оценкой времени генерации токенов и прочих параметров.
▶️ Ознакомиться с полным докладом можно в записи.
#LLM #ИИ
Ответ на него помогает найти инструмент GenAI-Perf от NVIDIA. В нем можно указать параметры конкретного целевого запроса и получить бенчмарк с оценкой времени генерации токенов и прочих параметров.
Ключевые тезисы
- Нефункциональные требования определяют инфраструктуру — проектирование начинается с RPS, latency и числа пользователей, а не с выбора модели.
- Точная оценка видеопамяти критична — ошибка в расчетах по GPU приводит к многократному росту затрат.
- Open-source фреймворки стали зрелым выбором для продакшена — по производительности и удобству интеграции они часто превосходят проприетарные решения.
#LLM #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3✍3
— мощная языковая модель для генерации и автодополнения кода, оптимизированная для программирования на множестве языков.
— платформа для обработки любых данных, от документов до мультимедиа, с преобразованием в структурированный формат для ИИ-приложений.
— инструмент для локального запуска и управления большими языковыми моделями с поддержкой кастомизации и API.
— универсальное приложение для работы с документами через ИИ, с поддержкой локальных и облачных LLM и многопользовательским режимом.
— быстрый веб-краулер с открытым кодом, оптимизированный для подготовки данных для языковых моделей и ИИ-агентов.
#LLM #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
[Перевод] Обнаружение уязвимостей ИИ агентов. Часть I: Введение в уязвимости
Автор оригинала: Sean Park
➡️ Подробнее
#ИИ #LLM #уязвимости #jailbreak #Security
Этот вводная часть открывает серию статей о уязвимостях агентов ИИ, в которых изложены ключевые риски безопасности, например инъекция подсказок ввода и исполнение кода. Также заложены основы для будущих частей, где будут подробно рассмотрены недостатки исполнения кода, утечки данных и угрозы доступа к базам данных.
Автор оригинала: Sean Park
#ИИ #LLM #уязвимости #jailbreak #Security
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👻2😎2