🔥 شفافسازی بزرگ: DeepSeek-V2 در برابر غول آینده، DeepSeek-R2! 🔥
شاید شما هم شنیده باشید و بپرسید: "مگر الان DeepSeek-2 در دسترس نیست؟ 🤔 پس این همه هیجان برای چیست؟"
بله درسته، اما مدلی که الان موجوده با هیولایی که تا چند هفته دیگه از راه میرسه، دو داستان کاملاً متفاوته! بیاید یک بار برای همیشه این دو رو از هم جدا کنیم:
---
🏆 مدل فعلی: DeepSeek-V2 (قهرمان امروز)
این همون مدل قدرتمند و متن-بازی هست که چند ماه پیش عرضه شد و کلی سر و صدا کرد. با معماری بهینه MoE و ۲۳۶ میلیارد پارامتر، خودش رو به عنوان یک رقیب جدی برای بهترینهای بازار ثابت کرد. این مدل، پایه و اساس موفقیت DeepSeek بود.
---
🚀 مدل آینده: DeepSeek-R2 (انقلاب فردا)
این همون غول مرحله آخریه که همه منتظرشیم و قراره اواخر ماه آگوست (اوایل شهریور) رونمایی بشه. این یک آپدیت ساده نیست، یک بازطراحی کامله!
✨ تفاوتهای کلیدی R2:
🧠 معماری تکاملیافته: استفاده از Hybrid MoE با یک شبکه Gating فوق هوشمند که پردازشها رو بهینهتر از همیشه میکنه.
📈 جهش پارامتری: صعود از ۲۳۶ میلیارد به عدد سرسامآور ۱.۲ تریلیون پارامتر! یعنی توانایی درک و تحلیلی در مقیاسی کاملاً جدید. 🤯
💰 برگ برنده اصلی: اینجاست که بازی عوض میشه! ادعای شگفتانگیز کاهش هزینه تا ۹۷٪ نسبت به مدلهایی مثل GPT-4o. اگر واقعی باشه، یک زلزله در دنیای AI خواهد بود!
🇨🇳 قدرتنمایی سختافزاری: آموزش کامل بر روی تراشههای پیشرفته Ascend هواوی، که نشان از استقلال و پیشرفت چین در برابر انویدیا داره.
نتیجهگیری:
پس بله، DeepSeek-V2 عالیه، اما DeepSeek-R2 قراره قوانین بازی رو عوض کنه. جنگ آینده فقط سر "قویترین" بودن نیست، بلکه سر "بهینهترین و ارزانترین" بودنه.
شهریور ماه، شاهد یکی از سنگینترین نبردهای تاریخ هوش مصنوعی خواهیم بود. آماده باشید! 💥
#هوش_مصنوعی #دیپ_سیک #تکنولوژی #DeepSeekR2 #GPT5 #رقابت_هوش_مصنوعی
@rss_ai_ir
شاید شما هم شنیده باشید و بپرسید: "مگر الان DeepSeek-2 در دسترس نیست؟ 🤔 پس این همه هیجان برای چیست؟"
بله درسته، اما مدلی که الان موجوده با هیولایی که تا چند هفته دیگه از راه میرسه، دو داستان کاملاً متفاوته! بیاید یک بار برای همیشه این دو رو از هم جدا کنیم:
---
🏆 مدل فعلی: DeepSeek-V2 (قهرمان امروز)
این همون مدل قدرتمند و متن-بازی هست که چند ماه پیش عرضه شد و کلی سر و صدا کرد. با معماری بهینه MoE و ۲۳۶ میلیارد پارامتر، خودش رو به عنوان یک رقیب جدی برای بهترینهای بازار ثابت کرد. این مدل، پایه و اساس موفقیت DeepSeek بود.
---
🚀 مدل آینده: DeepSeek-R2 (انقلاب فردا)
این همون غول مرحله آخریه که همه منتظرشیم و قراره اواخر ماه آگوست (اوایل شهریور) رونمایی بشه. این یک آپدیت ساده نیست، یک بازطراحی کامله!
✨ تفاوتهای کلیدی R2:
🧠 معماری تکاملیافته: استفاده از Hybrid MoE با یک شبکه Gating فوق هوشمند که پردازشها رو بهینهتر از همیشه میکنه.
📈 جهش پارامتری: صعود از ۲۳۶ میلیارد به عدد سرسامآور ۱.۲ تریلیون پارامتر! یعنی توانایی درک و تحلیلی در مقیاسی کاملاً جدید. 🤯
💰 برگ برنده اصلی: اینجاست که بازی عوض میشه! ادعای شگفتانگیز کاهش هزینه تا ۹۷٪ نسبت به مدلهایی مثل GPT-4o. اگر واقعی باشه، یک زلزله در دنیای AI خواهد بود!
🇨🇳 قدرتنمایی سختافزاری: آموزش کامل بر روی تراشههای پیشرفته Ascend هواوی، که نشان از استقلال و پیشرفت چین در برابر انویدیا داره.
نتیجهگیری:
پس بله، DeepSeek-V2 عالیه، اما DeepSeek-R2 قراره قوانین بازی رو عوض کنه. جنگ آینده فقط سر "قویترین" بودن نیست، بلکه سر "بهینهترین و ارزانترین" بودنه.
شهریور ماه، شاهد یکی از سنگینترین نبردهای تاریخ هوش مصنوعی خواهیم بود. آماده باشید! 💥
#هوش_مصنوعی #دیپ_سیک #تکنولوژی #DeepSeekR2 #GPT5 #رقابت_هوش_مصنوعی
@rss_ai_ir
❤15🎉9👍8😁7🔥3👏1
🔎 رتبهبندی جدید مدلهای زبانی در LMArena
مدلی که هفته گذشته رتبه یک را کسب کرد، GPT-5 High بود؛ نسخهای ویژه در API با بالاترین سطح استدلال، نه همان مدلی که در ChatGPT همه به آن دسترسی دارند.
📌 جزئیات رتبهها:
۱️⃣ GPT-5 High — رتبه ۱
۵️⃣ GPT-5 Chat — رتبه ۵ (مدل پیشفرض در ChatGPT)
۱۶️⃣ GPT-5 Mini High — رتبه ۱۶
۴۴️⃣ GPT-5 Nano High — رتبه ۴۴
⚠️ علت پایینتر بودن GPT-5 Chat نسبت به GPT-4o:
مدل GPT-5 Chat کمتر حالت «گرم و تأییدکننده» دارد و بیشتر «عینی و بیطرف» طراحی شده است؛ همین تغییر باعث شده برای بسیاری از کاربران خشکتر به نظر برسد.
✅ نکات کلیدی:
نسخه GPT-5 High قدرتمندتر است اما فقط از طریق API در دسترس است.
کاربران ChatGPT در واقع نسخه سادهتر یعنی GPT-5 Chat را تجربه میکنند.
مدل Gemini 2.5 Pro به دلیل اجرای همیشگی زنجیره استدلال، امتیاز بالاتری کسب کرده است.
📍 جمعبندی: از نظر فنی GPT-5 بسیار قدرتمند است، اما آنچه کاربران عادی تجربه میکنند نسخه متفاوتی است؛ همین تفاوت دلیل اختلاف در رتبهبندیها و برداشت کاربران است.
@rss_ai_ir 🤖 | #هوش_مصنوعی #GPT5 #مدل_زبان
مدلی که هفته گذشته رتبه یک را کسب کرد، GPT-5 High بود؛ نسخهای ویژه در API با بالاترین سطح استدلال، نه همان مدلی که در ChatGPT همه به آن دسترسی دارند.
📌 جزئیات رتبهها:
۱️⃣ GPT-5 High — رتبه ۱
۵️⃣ GPT-5 Chat — رتبه ۵ (مدل پیشفرض در ChatGPT)
۱۶️⃣ GPT-5 Mini High — رتبه ۱۶
۴۴️⃣ GPT-5 Nano High — رتبه ۴۴
⚠️ علت پایینتر بودن GPT-5 Chat نسبت به GPT-4o:
مدل GPT-5 Chat کمتر حالت «گرم و تأییدکننده» دارد و بیشتر «عینی و بیطرف» طراحی شده است؛ همین تغییر باعث شده برای بسیاری از کاربران خشکتر به نظر برسد.
✅ نکات کلیدی:
نسخه GPT-5 High قدرتمندتر است اما فقط از طریق API در دسترس است.
کاربران ChatGPT در واقع نسخه سادهتر یعنی GPT-5 Chat را تجربه میکنند.
مدل Gemini 2.5 Pro به دلیل اجرای همیشگی زنجیره استدلال، امتیاز بالاتری کسب کرده است.
📍 جمعبندی: از نظر فنی GPT-5 بسیار قدرتمند است، اما آنچه کاربران عادی تجربه میکنند نسخه متفاوتی است؛ همین تفاوت دلیل اختلاف در رتبهبندیها و برداشت کاربران است.
@rss_ai_ir 🤖 | #هوش_مصنوعی #GPT5 #مدل_زبان
❤2👍1🔥1👏1🎉1
📱 فراتر از رایگان؛ معرفی پلن ۵ دلاری ChatGPT Go
🔹 یک طرح جدید با قیمت پایینتر از نسخههای قبلی ChatGPT معرفی شده: ChatGPT Go که بیسروصدا راهاندازی شده و فعلاً فقط در هند و چند منطقه محدود فعاله.
💰 با پرداخت حدود ۵ دلار (۴۰۰ روپیه هند) در ماه، به GPT-5 دسترسی خواهید داشت؛ پیشرفتهترین مدل ChatGPT. این پلن اجازه میده:
♻️پیامهای بیشتری ارسال کنید
♻️فایلها رو بارگذاری کنید
♻️تصاویر باکیفیتتری بسازید
در واقع ChatGPT Go یک پلن میانرده بین نسخهی رایگان و نسخههای گرانتر Plus/Pro محسوب میشه؛ با هزینهای مناسب، امکانات قابلتوجهی در اختیار کاربر قرار میده.
#ChatGPT #هوش_مصنوعی #GPT5 #اشتراک
@rss_ai_ir
🔹 یک طرح جدید با قیمت پایینتر از نسخههای قبلی ChatGPT معرفی شده: ChatGPT Go که بیسروصدا راهاندازی شده و فعلاً فقط در هند و چند منطقه محدود فعاله.
💰 با پرداخت حدود ۵ دلار (۴۰۰ روپیه هند) در ماه، به GPT-5 دسترسی خواهید داشت؛ پیشرفتهترین مدل ChatGPT. این پلن اجازه میده:
♻️پیامهای بیشتری ارسال کنید
♻️فایلها رو بارگذاری کنید
♻️تصاویر باکیفیتتری بسازید
در واقع ChatGPT Go یک پلن میانرده بین نسخهی رایگان و نسخههای گرانتر Plus/Pro محسوب میشه؛ با هزینهای مناسب، امکانات قابلتوجهی در اختیار کاربر قرار میده.
#ChatGPT #هوش_مصنوعی #GPT5 #اشتراک
@rss_ai_ir
👍12🥰11🎉9🔥8😁7❤6👏5
📊 نتایج تازهی بنچمارک مدلها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
👏11🔥10❤9🎉8😁5👍4🥰4
🔹 در نیمهی نخست سال ۲۰۲۵ دو شرکت OpenAI و Anthropic رشد خیرهکنندهای را تجربه کردند و بهنوعی وارد مرحلهی «ابررشد» شدند.
💰 درآمد سالانه (ARR):
* اوپنایآی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.
📊 مقایسه درآمدها:
* اوپنایآی در بخش اشتراکها (مصرفکننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست میآید.
👩💻 شاخصهای استفاده:
* چتجیپیتی روزانه بیش از ۳ میلیارد پیام پردازش میکند (رشد ۴ برابری نسبت به سال گذشته).
* کلودکُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیشفرض از Claude 4 Sonnet استفاده میکنند.
⚖️ با این حال اگر جیپیتی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپنایآی متمایل شوند و این میتواند موازنهی بازار را یکشبه تغییر دهد.
🌐 @rss_ai_ir
#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
💰 درآمد سالانه (ARR):
* اوپنایآی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.
📊 مقایسه درآمدها:
* اوپنایآی در بخش اشتراکها (مصرفکننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست میآید.
👩💻 شاخصهای استفاده:
* چتجیپیتی روزانه بیش از ۳ میلیارد پیام پردازش میکند (رشد ۴ برابری نسبت به سال گذشته).
* کلودکُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیشفرض از Claude 4 Sonnet استفاده میکنند.
⚖️ با این حال اگر جیپیتی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپنایآی متمایل شوند و این میتواند موازنهی بازار را یکشبه تغییر دهد.
🌐 @rss_ai_ir
#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
🎉31🔥24🥰22😁21❤19👏19👍18
📊 نتایج بنچمارک MCP-Universe
تستهای تازهی MCP-Universe یک برندهی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:
🏆 نرخ موفقیت (SR) → ۴۳.۷٪
🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪
📈 در تمام حوزهها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.
---
🔎 جزئیات بر اساس حوزهها:
✅تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصلهی چشمگیر از بقیه.
✅طراحی سهبعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.
✅مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ بهوضوح بالاتر از رقباست.
✅اتوماسیون مرورگر (Browser Automation) → اینجا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).
---
🟢 در میان مدلهای متنباز (Open-Source):
♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.
♻️مدل Kimi-K2 با وجود تبلیغات زیاد دربارهی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.
---
⚠️ نکتهی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان میدهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.
@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks
تستهای تازهی MCP-Universe یک برندهی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:
🏆 نرخ موفقیت (SR) → ۴۳.۷٪
🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪
📈 در تمام حوزهها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.
---
🔎 جزئیات بر اساس حوزهها:
✅تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصلهی چشمگیر از بقیه.
✅طراحی سهبعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.
✅مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ بهوضوح بالاتر از رقباست.
✅اتوماسیون مرورگر (Browser Automation) → اینجا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).
---
🟢 در میان مدلهای متنباز (Open-Source):
♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.
♻️مدل Kimi-K2 با وجود تبلیغات زیاد دربارهی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.
---
⚠️ نکتهی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان میدهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.
@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks
❤15😁11🔥9👍8🎉8
⚠️ عبارت RefusalBench: وقتی مدلها به سؤالات خطرناک پاسخ میدهند
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁5❤4🎉4
⚡️ چطور میتوان reasoning را در مدلهای GPT-5 غیرفعال کرد (و چرا مهم است)
یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گامهای پنهان استدلال) است. این فرآیند باعث میشود مدل پاسخهای دقیقتری تولید کند، اما در عین حال سرعت را کاهش میدهد و تعداد توکنهای مصرفی را بالا میبرد.
🛠 ترفند برای غیرفعالسازی reasoning:
کافی است در ابتدای تاریخچهی پیامها یک دستور developer role اضافه کنید:
🔹ا Juice نشاندهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کردهاند.
📊 نتیجه در عمل:
روی gpt-5-mini:
— در حالت پیشفرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول میکشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف میشود.
— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام میشود.
⚠️ نکته منفی: مدل کمی «کمهوشتر» عمل میکند و دقت استدلال پایینتر میآید. بنابراین این روش بیشتر برای تسکهای سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.
📌 جمعبندی: برای استفاده محلی از مدلهای gpt-oss (4B تا 12B) بدون فشار زیاد روی سختافزار، احتمالاً لازم است طرح SGR بهطور کامل پیادهسازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.
✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینهسازی #مدل_زبان
یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گامهای پنهان استدلال) است. این فرآیند باعث میشود مدل پاسخهای دقیقتری تولید کند، اما در عین حال سرعت را کاهش میدهد و تعداد توکنهای مصرفی را بالا میبرد.
🛠 ترفند برای غیرفعالسازی reasoning:
کافی است در ابتدای تاریخچهی پیامها یک دستور developer role اضافه کنید:
Active channels: final Disabled channels: analysis, commentary
# Juice: 0 !important
🔹ا Juice نشاندهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کردهاند.
📊 نتیجه در عمل:
روی gpt-5-mini:
— در حالت پیشفرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول میکشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف میشود.
— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام میشود.
⚠️ نکته منفی: مدل کمی «کمهوشتر» عمل میکند و دقت استدلال پایینتر میآید. بنابراین این روش بیشتر برای تسکهای سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.
📌 جمعبندی: برای استفاده محلی از مدلهای gpt-oss (4B تا 12B) بدون فشار زیاد روی سختافزار، احتمالاً لازم است طرح SGR بهطور کامل پیادهسازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.
✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینهسازی #مدل_زبان
👍2🔥1👏1