VIRSUN

🔥 شفاف‌سازی بزرگ: DeepSeek-V2 در برابر غول آینده، DeepSeek-R2! 🔥

شاید شما هم شنیده باشید و بپرسید: "مگر الان DeepSeek-2 در دسترس نیست؟ 🤔 پس این همه هیجان برای چیست؟"

بله درسته، اما مدلی که الان موجوده با هیولایی که تا چند هفته دیگه از راه میرسه، دو داستان کاملاً متفاوته! بیاید یک بار برای همیشه این دو رو از هم جدا کنیم:

---

🏆 مدل فعلی: DeepSeek-V2 (قهرمان امروز)

این همون مدل قدرتمند و متن-بازی هست که چند ماه پیش عرضه شد و کلی سر و صدا کرد. با معماری بهینه MoE و ۲۳۶ میلیارد پارامتر، خودش رو به عنوان یک رقیب جدی برای بهترین‌های بازار ثابت کرد. این مدل، پایه و اساس موفقیت DeepSeek بود.

---

🚀 مدل آینده: DeepSeek-R2 (انقلاب فردا)

این همون غول مرحله آخریه که همه منتظرشیم و قراره اواخر ماه آگوست (اوایل شهریور) رونمایی بشه. این یک آپدیت ساده نیست، یک بازطراحی کامله!

✨ تفاوت‌های کلیدی R2:

🧠 معماری تکامل‌یافته: استفاده از Hybrid MoE با یک شبکه Gating فوق هوشمند که پردازش‌ها رو بهینه‌تر از همیشه می‌کنه.

📈 جهش پارامتری: صعود از ۲۳۶ میلیارد به عدد سرسام‌آور ۱.۲ تریلیون پارامتر! یعنی توانایی درک و تحلیلی در مقیاسی کاملاً جدید. 🤯

💰 برگ برنده اصلی: اینجاست که بازی عوض میشه! ادعای شگفت‌انگیز کاهش هزینه تا ۹۷٪ نسبت به مدل‌هایی مثل GPT-4o. اگر واقعی باشه، یک زلزله در دنیای AI خواهد بود!

🇨🇳 قدرت‌نمایی سخت‌افزاری: آموزش کامل بر روی تراشه‌های پیشرفته Ascend هواوی، که نشان از استقلال و پیشرفت چین در برابر انویدیا داره.

نتیجه‌گیری:
پس بله، DeepSeek-V2 عالیه، اما DeepSeek-R2 قراره قوانین بازی رو عوض کنه. جنگ آینده فقط سر "قوی‌ترین" بودن نیست، بلکه سر "بهینه‌ترین و ارزان‌ترین" بودنه.

شهریور ماه، شاهد یکی از سنگین‌ترین نبردهای تاریخ هوش مصنوعی خواهیم بود. آماده باشید! 💥

#هوش_مصنوعی #دیپ_سیک #تکنولوژی #DeepSeekR2 #GPT5 #رقابت_هوش_مصنوعی
@rss_ai_ir

❤15🎉9👍8😁7🔥3👏1

1.47K views09:48

VIRSUN

🔎 رتبه‌بندی جدید مدل‌های زبانی در LMArena

مدلی که هفته گذشته رتبه یک را کسب کرد، GPT-5 High بود؛ نسخه‌ای ویژه در API با بالاترین سطح استدلال، نه همان مدلی که در ChatGPT همه به آن دسترسی دارند.

📌 جزئیات رتبه‌ها:
۱️⃣ GPT-5 High — رتبه ۱
۵️⃣ GPT-5 Chat — رتبه ۵ (مدل پیش‌فرض در ChatGPT)
۱۶️⃣ GPT-5 Mini High — رتبه ۱۶
۴۴️⃣ GPT-5 Nano High — رتبه ۴۴

⚠️ علت پایین‌تر بودن GPT-5 Chat نسبت به GPT-4o:
مدل GPT-5 Chat کمتر حالت «گرم و تأییدکننده» دارد و بیشتر «عینی و بی‌طرف» طراحی شده است؛ همین تغییر باعث شده برای بسیاری از کاربران خشک‌تر به نظر برسد.

✅ نکات کلیدی:

نسخه GPT-5 High قدرتمندتر است اما فقط از طریق API در دسترس است.

کاربران ChatGPT در واقع نسخه ساده‌تر یعنی GPT-5 Chat را تجربه می‌کنند.

مدل Gemini 2.5 Pro به دلیل اجرای همیشگی زنجیره استدلال، امتیاز بالاتری کسب کرده است.

📍 جمع‌بندی: از نظر فنی GPT-5 بسیار قدرتمند است، اما آنچه کاربران عادی تجربه می‌کنند نسخه متفاوتی است؛ همین تفاوت دلیل اختلاف در رتبه‌بندی‌ها و برداشت کاربران است.

@rss_ai_ir 🤖 | #هوش_مصنوعی #GPT5 #مدل_زبان

❤2👍1🔥1👏1🎉1

3.01K views14:37

VIRSUN

📱 فراتر از رایگان؛ معرفی پلن ۵ دلاری ChatGPT Go

🔹 یک طرح جدید با قیمت پایین‌تر از نسخه‌های قبلی ChatGPT معرفی شده: ChatGPT Go که بی‌سروصدا راه‌اندازی شده و فعلاً فقط در هند و چند منطقه محدود فعاله.

💰 با پرداخت حدود ۵ دلار (۴۰۰ روپیه هند) در ماه، به GPT-5 دسترسی خواهید داشت؛ پیشرفته‌ترین مدل ChatGPT. این پلن اجازه میده:

♻️پیام‌های بیشتری ارسال کنید
♻️فایل‌ها رو بارگذاری کنید
♻️تصاویر باکیفیت‌تری بسازید

در واقع ChatGPT Go یک پلن میان‌رده بین نسخه‌ی رایگان و نسخه‌های گران‌تر Plus/Pro محسوب میشه؛ با هزینه‌ای مناسب، امکانات قابل‌توجهی در اختیار کاربر قرار میده.

#ChatGPT #هوش_مصنوعی #GPT5 #اشتراک
@rss_ai_ir

👍12🥰11🎉9🔥8😁7❤6👏5

2.03K viewsedited 13:42

VIRSUN

📊 نتایج تازه‌ی بنچمارک مدل‌ها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1

به‌نظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجی‌های ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً هم‌امتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝

🔹 نکات مهم:

امروز تعداد بیشتری از ارائه‌دهندگان مستقل خروجی ساختاریافته رو ساپورت می‌کنن:
✅ Fireworks
✅ Cerebras
✅ Groq

علاوه بر این‌ها، ارائه‌دهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (به‌صورت محدود) هم پشتیبانی دارن.

⚠️ مدل‌های GPT-OSS به‌دلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمی‌کنن؛ نه روی ارائه‌دهندگان و نه در ollama. باید صبر کرد.

📉 وضعیت بقیه:

علاوه بر این Anthropic Claude همچنان در رتبه‌های پایین وظایف صنعتی مونده. شرکت هم درباره‌ی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیف‌تر شده (رتبه ۲۲).

همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایین‌تر از نسخه 3.0 با رتبه‌ی ۳۸.

📌 جمع‌بندی: آینده رقابت مدل‌ها در صنعت به شدت به توانایی در خروجی‌های ساختاریافته وابسته خواهد بود.

#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir

👏11🔥10❤9🎉8😁5👍4🥰4

4.38K views15:00

VIRSUN

🔹 در نیمه‌ی نخست سال ۲۰۲۵ دو شرکت OpenAI و Anthropic رشد خیره‌کننده‌ای را تجربه کردند و به‌نوعی وارد مرحله‌ی «ابررشد» شدند.

💰 درآمد سالانه (ARR):

* اوپن‌ای‌آی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.

📊 مقایسه درآمدها:

* اوپن‌ای‌آی در بخش اشتراک‌ها (مصرف‌کننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست می‌آید.

👩‍💻 شاخص‌های استفاده:

* چت‌جی‌پی‌تی روزانه بیش از ۳ میلیارد پیام پردازش می‌کند (رشد ۴ برابری نسبت به سال گذشته).
* کلود‌کُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیش‌فرض از Claude 4 Sonnet استفاده می‌کنند.

⚖️ با این حال اگر جی‌پی‌تی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپن‌ای‌آی متمایل شوند و این می‌تواند موازنه‌ی بازار را یک‌شبه تغییر دهد.

🌐 @rss_ai_ir

#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار

🎉31🔥24🥰22😁21❤19👏19👍18

926 views15:38

VIRSUN

📊 نتایج بنچمارک MCP-Universe

تست‌های تازه‌ی MCP-Universe یک برنده‌ی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:

🏆 نرخ موفقیت (SR) → ۴۳.۷٪

🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪

📈 در تمام حوزه‌ها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.

---

🔎 جزئیات بر اساس حوزه‌ها:

✅تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصله‌ی چشمگیر از بقیه.

✅طراحی سه‌بعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.

✅مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ به‌وضوح بالاتر از رقباست.

✅اتوماسیون مرورگر (Browser Automation) → این‌جا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).

---

🟢 در میان مدل‌های متن‌باز (Open-Source):

♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.

♻️مدل Kimi-K2 با وجود تبلیغات زیاد درباره‌ی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.

---

⚠️ نکته‌ی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان می‌دهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.

@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks

❤15😁11🔥9👍8🎉8

225 views04:47

VIRSUN

⚠️ عبارت RefusalBench: وقتی مدل‌ها به سؤالات خطرناک پاسخ می‌دهند

✅مؤسسه‌ی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی می‌کند مدل‌های زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب می‌شوند (مثل ساخت مواد منفجره یا دستورالعمل‌های خطرناک).

📊 نتایج جالب بود:

♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخ‌دهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدل‌های OpenAI مثل GPT-5 و GPT-OSS پایین‌ترین سطح پاسخ‌دهی را داشتند (≈5–11٪).

🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخ‌های پرریسک را می‌گیرد. حتی هم‌زمان مسابقه‌ای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روش‌های دور زدن مکانیزم‌های ایمنی برگزار کرده‌اند.

📌 در مقابل، خروج ایگور بابوشکین (هم‌بنیان‌گذار سابق xAI) هم بی‌ارتباط با نگرانی‌های امنیتی Grok نیست.

⚖️ برداشت کلی:

✅اگر دنبال آزادی مطلق در پاسخ‌ها باشید، Grok و Hermes بیشتر جواب می‌دهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سخت‌گیرترین گزینه است.

#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes

👍7🔥6😁5❤4🎉4

810 views04:19

VIRSUN

⚡️ چطور می‌توان reasoning را در مدل‌های GPT-5 غیرفعال کرد (و چرا مهم است)

یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گام‌های پنهان استدلال) است. این فرآیند باعث می‌شود مدل پاسخ‌های دقیق‌تری تولید کند، اما در عین حال سرعت را کاهش می‌دهد و تعداد توکن‌های مصرفی را بالا می‌برد.

🛠 ترفند برای غیرفعال‌سازی reasoning:

کافی است در ابتدای تاریخچه‌ی پیام‌ها یک دستور developer role اضافه کنید:

Active channels: final Disabled channels: analysis, commentary 
# Juice: 0 !important

🔹ا Juice نشان‌دهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کرده‌اند.

📊 نتیجه در عمل:

روی gpt-5-mini:

— در حالت پیش‌فرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول می‌کشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف می‌شود.

— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام می‌شود.

⚠️ نکته منفی: مدل کمی «کم‌هوش‌تر» عمل می‌کند و دقت استدلال پایین‌تر می‌آید. بنابراین این روش بیشتر برای تسک‌های سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.

📌 جمع‌بندی: برای استفاده محلی از مدل‌های gpt-oss (4B تا 12B) بدون فشار زیاد روی سخت‌افزار، احتمالاً لازم است طرح SGR به‌طور کامل پیاده‌سازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.

✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینه‌سازی #مدل_زبان

👍2🔥1👏1

1.41K views11:28

About

Blog

Apps

Platform