Mistral выпустила модели машинного обучения для кода и математики
Mistral представила модели машинного обучения MathΣtral и Codestral, предназначенные для решения математических задач и генерации кода соответственно. Обе нейросети опубликованы под лицензией Apache 2.0.
MathΣtral представляет собой базовую языковую модель Mistral 7B, дополнительно обученную на математических данных и полном курсе STEM (Science, Technology, Engineering, Mathematics). Нейросеть создавали вместе с исследователями из Project Numina, которые специализируются на разработке математических моделей.
Нейросеть Codestral предназначена для генерации кода и построена на архитектуре Mamba V2. Модель с 7 млрд параметрами бесплатная и доступна всем пользователям, также есть версия с 22 млрд параметрами, но для неё надо приобрести коммерческую лицензию.
В тестах MathΣtral превосходит другие открытые нейросети, но пока уступает проприетарным моделям машинного обучения. Codestral также не дотягивает до производительности Llama 3 8B и других закрытых моделей. Обе нейросети открыты и доступны на платформе Hugging Face (1, 2).
🌟 Подписывайтесь на Двоичный код
#Mistral #MathΣtral #Codestral
Mistral представила модели машинного обучения MathΣtral и Codestral, предназначенные для решения математических задач и генерации кода соответственно. Обе нейросети опубликованы под лицензией Apache 2.0.
MathΣtral представляет собой базовую языковую модель Mistral 7B, дополнительно обученную на математических данных и полном курсе STEM (Science, Technology, Engineering, Mathematics). Нейросеть создавали вместе с исследователями из Project Numina, которые специализируются на разработке математических моделей.
Нейросеть Codestral предназначена для генерации кода и построена на архитектуре Mamba V2. Модель с 7 млрд параметрами бесплатная и доступна всем пользователям, также есть версия с 22 млрд параметрами, но для неё надо приобрести коммерческую лицензию.
В тестах MathΣtral превосходит другие открытые нейросети, но пока уступает проприетарным моделям машинного обучения. Codestral также не дотягивает до производительности Llama 3 8B и других закрытых моделей. Обе нейросети открыты и доступны на платформе Hugging Face (1, 2).
#Mistral #MathΣtral #Codestral
Please open Telegram to view this post
VIEW IN TELEGRAM