🔧 مدل جدید Mistral برای برنامهنویسی سازمانی معرفی شد!
شرکت Mistral با معرفی اکوسیستم کامل توسعه نرمافزار، حالا رقیب جدی GitHub Copilot محسوب میشه. هسته این سیستم، مدلهای خانواده Codestral هستن — بهویژه نسخه جدید Codestral 25.08.
📌 بهبودهای کلیدی:
♻️افزایش ۳۰٪ در پذیرش تکمیل خودکار کد توسط توسعهدهندهها
♻️افزایش ۱۰٪ در مقدار کدی که بعد از پیشنهاد حفظ میشه
♻️کاهش ۵۰٪ در تولید کدهای طولانی و اشتباه
♻️در حالت چت هم عملکرد بهتر شده؛ طبق ارزیابی IF Eval v8 و آزمون MultiplE، دقت و مهارت برنامهنویسی این مدل حدود ۵٪ افزایش داشته.
🔍 مرحله بعدی: جستجوی معنایی در کل پروژه مدل Codestral Embed برای تولید امبدینگ برداری اختصاصی کد طراحی شده. طبق تستهای واقعی بازیابی کد، از امبدینگهای OpenAI و Cohere بهتر عمل میکنه. حتی امکان تنظیم ابعاد امبدینگ (تا ۲۵۶ بعد با INT8) هم فراهمه.
🛠 وقتی بافت مرتبط پیدا شد، نوبت به Agentها میرسه: سیستم Devstral برای انجام کارهایی مثل ریفکتور، تولید تست و ساخت Pull Request فعاله. مدل Devstral Small روی یک GPU مثل RTX 4090 یا Mac با ۳۲GB RAM اجرا میشه.
نتایج بنچمارک SWE-Bench:
Devstral Small: امتیاز ۵۳.۶٪
Devstral Medium: امتیاز ۶۱.۶٪
(بالاتر از Claude 3.5 و GPT-4.1-mini)
🧩 همه این قابلیتها در افزونه Mistral Code برای IDEهای JetBrains و VS Code قابل استفادهست. افزونه نهتنها کد رو کامل میکنه، بلکه وظایف تکراری مثل نوشتن commit یا docstring رو با کمک Devstral انجام میده.
✳️قابلیتها:
♻️پشتیبانی از Git diff و تاریخچه ترمینال
♻️جستجوی معنایی
استفاده محلی یا ابری با امنیت سازمانی (SSO، audit log، بدون تلِمتری اجباری)
📌 @rss_ai_ir
#هوش_مصنوعی #برنامهنویسی #کد_اتوماتیک #Mistral #Codestral #Devstral
شرکت Mistral با معرفی اکوسیستم کامل توسعه نرمافزار، حالا رقیب جدی GitHub Copilot محسوب میشه. هسته این سیستم، مدلهای خانواده Codestral هستن — بهویژه نسخه جدید Codestral 25.08.
📌 بهبودهای کلیدی:
♻️افزایش ۳۰٪ در پذیرش تکمیل خودکار کد توسط توسعهدهندهها
♻️افزایش ۱۰٪ در مقدار کدی که بعد از پیشنهاد حفظ میشه
♻️کاهش ۵۰٪ در تولید کدهای طولانی و اشتباه
♻️در حالت چت هم عملکرد بهتر شده؛ طبق ارزیابی IF Eval v8 و آزمون MultiplE، دقت و مهارت برنامهنویسی این مدل حدود ۵٪ افزایش داشته.
🔍 مرحله بعدی: جستجوی معنایی در کل پروژه مدل Codestral Embed برای تولید امبدینگ برداری اختصاصی کد طراحی شده. طبق تستهای واقعی بازیابی کد، از امبدینگهای OpenAI و Cohere بهتر عمل میکنه. حتی امکان تنظیم ابعاد امبدینگ (تا ۲۵۶ بعد با INT8) هم فراهمه.
🛠 وقتی بافت مرتبط پیدا شد، نوبت به Agentها میرسه: سیستم Devstral برای انجام کارهایی مثل ریفکتور، تولید تست و ساخت Pull Request فعاله. مدل Devstral Small روی یک GPU مثل RTX 4090 یا Mac با ۳۲GB RAM اجرا میشه.
نتایج بنچمارک SWE-Bench:
Devstral Small: امتیاز ۵۳.۶٪
Devstral Medium: امتیاز ۶۱.۶٪
(بالاتر از Claude 3.5 و GPT-4.1-mini)
🧩 همه این قابلیتها در افزونه Mistral Code برای IDEهای JetBrains و VS Code قابل استفادهست. افزونه نهتنها کد رو کامل میکنه، بلکه وظایف تکراری مثل نوشتن commit یا docstring رو با کمک Devstral انجام میده.
✳️قابلیتها:
♻️پشتیبانی از Git diff و تاریخچه ترمینال
♻️جستجوی معنایی
استفاده محلی یا ابری با امنیت سازمانی (SSO، audit log، بدون تلِمتری اجباری)
📌 @rss_ai_ir
#هوش_مصنوعی #برنامهنویسی #کد_اتوماتیک #Mistral #Codestral #Devstral
👍2🔥1👏1
📊 نتایج تازهی بنچمارک مدلها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
👏11🔥10❤9🎉8😁5👍4🥰4