VIRSUN

🔧 مدل جدید Mistral برای برنامه‌نویسی سازمانی معرفی شد!

شرکت Mistral با معرفی اکوسیستم کامل توسعه‌ نرم‌افزار، حالا رقیب جدی GitHub Copilot محسوب میشه. هسته این سیستم، مدل‌های خانواده Codestral هستن — به‌ویژه نسخه جدید Codestral 25.08.

📌 بهبودهای کلیدی:

♻️افزایش ۳۰٪ در پذیرش تکمیل خودکار کد توسط توسعه‌دهنده‌ها
♻️افزایش ۱۰٪ در مقدار کدی که بعد از پیشنهاد حفظ میشه
♻️کاهش ۵۰٪ در تولید کدهای طولانی و اشتباه
♻️در حالت چت هم عملکرد بهتر شده؛ طبق ارزیابی IF Eval v8 و آزمون MultiplE، دقت و مهارت برنامه‌نویسی این مدل حدود ۵٪ افزایش داشته.

🔍 مرحله بعدی: جستجوی معنایی در کل پروژه مدل Codestral Embed برای تولید امبدینگ برداری اختصاصی کد طراحی شده. طبق تست‌های واقعی بازیابی کد، از امبدینگ‌های OpenAI و Cohere بهتر عمل می‌کنه. حتی امکان تنظیم ابعاد امبدینگ (تا ۲۵۶ بعد با INT8) هم فراهمه.

🛠 وقتی بافت مرتبط پیدا شد، نوبت به Agentها می‌رسه: سیستم Devstral برای انجام کارهایی مثل ری‌فکتور، تولید تست و ساخت Pull Request فعاله. مدل Devstral Small روی یک GPU مثل RTX 4090 یا Mac با ۳۲GB RAM اجرا میشه.

نتایج بنچمارک SWE-Bench:

Devstral Small: امتیاز ۵۳.۶٪

Devstral Medium: امتیاز ۶۱.۶٪
(بالاتر از Claude 3.5 و GPT-4.1-mini)

🧩 همه این قابلیت‌ها در افزونه Mistral Code برای IDEهای JetBrains و VS Code قابل استفاده‌ست. افزونه نه‌تنها کد رو کامل می‌کنه، بلکه وظایف تکراری مثل نوشتن commit یا docstring رو با کمک Devstral انجام می‌ده.

✳️قابلیت‌ها:
♻️پشتیبانی از Git diff و تاریخچه ترمینال
♻️جستجوی معنایی

استفاده محلی یا ابری با امنیت سازمانی (SSO، audit log، بدون تلِمتری اجباری)

📌 @rss_ai_ir
#هوش_مصنوعی #برنامه‌نویسی #کد_اتوماتیک #Mistral #Codestral #Devstral

👍2🔥1👏1

182 views10:31

VIRSUN

📊 نتایج تازه‌ی بنچمارک مدل‌ها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1

به‌نظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجی‌های ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً هم‌امتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝

🔹 نکات مهم:

امروز تعداد بیشتری از ارائه‌دهندگان مستقل خروجی ساختاریافته رو ساپورت می‌کنن:
✅ Fireworks
✅ Cerebras
✅ Groq

علاوه بر این‌ها، ارائه‌دهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (به‌صورت محدود) هم پشتیبانی دارن.

⚠️ مدل‌های GPT-OSS به‌دلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمی‌کنن؛ نه روی ارائه‌دهندگان و نه در ollama. باید صبر کرد.

📉 وضعیت بقیه:

علاوه بر این Anthropic Claude همچنان در رتبه‌های پایین وظایف صنعتی مونده. شرکت هم درباره‌ی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیف‌تر شده (رتبه ۲۲).

همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایین‌تر از نسخه 3.0 با رتبه‌ی ۳۸.

📌 جمع‌بندی: آینده رقابت مدل‌ها در صنعت به شدت به توانایی در خروجی‌های ساختاریافته وابسته خواهد بود.

#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir

👏11🔥10❤9🎉8😁5👍4🥰4

4.37K views15:00

About

Blog

Apps

Platform