VIRSUN
14K subscribers
494 photos
291 videos
2 files
296 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
📊 نتایج تازه‌ی بنچمارک مدل‌ها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1

به‌نظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجی‌های ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً هم‌امتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝

🔹 نکات مهم:

امروز تعداد بیشتری از ارائه‌دهندگان مستقل خروجی ساختاریافته رو ساپورت می‌کنن:
Fireworks
Cerebras
Groq

علاوه بر این‌ها، ارائه‌دهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (به‌صورت محدود) هم پشتیبانی دارن.


⚠️ مدل‌های GPT-OSS به‌دلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمی‌کنن؛ نه روی ارائه‌دهندگان و نه در ollama. باید صبر کرد.

📉 وضعیت بقیه:

علاوه بر این Anthropic Claude همچنان در رتبه‌های پایین وظایف صنعتی مونده. شرکت هم درباره‌ی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیف‌تر شده (رتبه ۲۲).

همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایین‌تر از نسخه 3.0 با رتبه‌ی ۳۸.


📌 جمع‌بندی: آینده رقابت مدل‌ها در صنعت به شدت به توانایی در خروجی‌های ساختاریافته وابسته خواهد بود.

#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
👏11🔥109🎉8😁5👍4🥰4
🔹 در نیمه‌ی نخست سال ۲۰۲۵ دو شرکت OpenAI و Anthropic رشد خیره‌کننده‌ای را تجربه کردند و به‌نوعی وارد مرحله‌ی «ابررشد» شدند.

💰 درآمد سالانه (ARR):

* اوپن‌ای‌آی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.

📊 مقایسه درآمدها:

* اوپن‌ای‌آی در بخش اشتراک‌ها (مصرف‌کننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست می‌آید.

👩‍💻 شاخص‌های استفاده:

* چت‌جی‌پی‌تی روزانه بیش از ۳ میلیارد پیام پردازش می‌کند (رشد ۴ برابری نسبت به سال گذشته).
* کلود‌کُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیش‌فرض از Claude 4 Sonnet استفاده می‌کنند.

⚖️ با این حال اگر جی‌پی‌تی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپن‌ای‌آی متمایل شوند و این می‌تواند موازنه‌ی بازار را یک‌شبه تغییر دهد.

🌐 @rss_ai_ir

#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
🎉31🔥24🥰22😁2119👏19👍18
📊 نتایج بنچمارک MCP-Universe

تست‌های تازه‌ی MCP-Universe یک برنده‌ی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:

🏆 نرخ موفقیت (SR) → ۴۳.۷٪

🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪

📈 در تمام حوزه‌ها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.



---

🔎 جزئیات بر اساس حوزه‌ها:

تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصله‌ی چشمگیر از بقیه.

طراحی سه‌بعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.

مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ به‌وضوح بالاتر از رقباست.

اتوماسیون مرورگر (Browser Automation) → این‌جا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).



---

🟢 در میان مدل‌های متن‌باز (Open-Source):

♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.

♻️مدل Kimi-K2 با وجود تبلیغات زیاد درباره‌ی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.



---

⚠️ نکته‌ی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان می‌دهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.

@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks
15😁11🔥9👍8🎉8
⚠️ عبارت RefusalBench: وقتی مدل‌ها به سؤالات خطرناک پاسخ می‌دهند

مؤسسه‌ی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی می‌کند مدل‌های زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب می‌شوند (مثل ساخت مواد منفجره یا دستورالعمل‌های خطرناک).

📊 نتایج جالب بود:

♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخ‌دهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدل‌های OpenAI مثل GPT-5 و GPT-OSS پایین‌ترین سطح پاسخ‌دهی را داشتند (≈5–11٪).


🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخ‌های پرریسک را می‌گیرد. حتی هم‌زمان مسابقه‌ای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روش‌های دور زدن مکانیزم‌های ایمنی برگزار کرده‌اند.

📌 در مقابل، خروج ایگور بابوشکین (هم‌بنیان‌گذار سابق xAI) هم بی‌ارتباط با نگرانی‌های امنیتی Grok نیست.

⚖️ برداشت کلی:

اگر دنبال آزادی مطلق در پاسخ‌ها باشید، Grok و Hermes بیشتر جواب می‌دهند.
اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سخت‌گیرترین گزینه است.


#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁54🎉4
⚡️ چطور می‌توان reasoning را در مدل‌های GPT-5 غیرفعال کرد (و چرا مهم است)

یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گام‌های پنهان استدلال) است. این فرآیند باعث می‌شود مدل پاسخ‌های دقیق‌تری تولید کند، اما در عین حال سرعت را کاهش می‌دهد و تعداد توکن‌های مصرفی را بالا می‌برد.

🛠 ترفند برای غیرفعال‌سازی reasoning:

کافی است در ابتدای تاریخچه‌ی پیام‌ها یک دستور developer role اضافه کنید:
Active channels: final Disabled channels: analysis, commentary 
# Juice: 0 !important

🔹ا Juice نشان‌دهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کرده‌اند.

📊 نتیجه در عمل:

روی gpt-5-mini:

— در حالت پیش‌فرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول می‌کشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف می‌شود.

— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام می‌شود.

⚠️ نکته منفی: مدل کمی «کم‌هوش‌تر» عمل می‌کند و دقت استدلال پایین‌تر می‌آید. بنابراین این روش بیشتر برای تسک‌های سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.

📌 جمع‌بندی: برای استفاده محلی از مدل‌های gpt-oss (4B تا 12B) بدون فشار زیاد روی سخت‌افزار، احتمالاً لازم است طرح SGR به‌طور کامل پیاده‌سازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.

✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینه‌سازی #مدل_زبان
👍3🔥1👏1
🖥️ نمونه‌های کدنویسی با GPT-5

با یک پرامپت ساده می‌توان یک وب‌سایت تک‌صفحه‌ای ساخت! 🎨
اینجا مجموعه‌ای از مثال‌ها جمع‌آوری شده که نشان می‌دهد چطور می‌توان از GPT-5 برای ایجاد اپلیکیشن‌های سبک استفاده کرد:

🔗 نمونه‌ها

نکته جالب اینجاست که هیچ جادویی در کار نیست؛ فقط سایت مرتب و شسته‌رفته‌ای ساخته شده تا بتوانید از آن ترفندها و ساختارهای مختلف یاد بگیرید.

📌 حتی می‌توانید ببینید چطور پرامپت مستقیماً داخل کادر ورودی قرار داده می‌شود و کافی است روی Enter بزنید:
👉 مثال زنده

@rss_ai_ir 🤖💡

#GPT5 #هوش_مصنوعی #کدنویسی #فرانت‌اند #وب #AI_industrial_news
👍3🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 سام آلتمن درباره GPT-5

«بازگشت به مدل‌های قدیمی بعد از GPT-5 مثل یک عذاب است.»

به گفته‌ی او، GPT-5 عمیق‌تر، طبیعی‌تر و به‌طور محسوسی باهوش‌تر شده. این مدل یکپارچه است، بدون نیاز به سوییچ کردن بین نسخه‌ها، و مثل یک تیم متخصص همیشه در کنار شما عمل می‌کند.

قابلیت‌ها:
نوشتن برنامه‌ها از صفر
📚 تولید گزارش‌های دقیق درباره سخت‌ترین موضوعات
🎯 برنامه‌ریزی رویدادهای واقعی به صورت کاملاً خودکار

@rss_ai_ir 🤖🚀

#هوش_مصنوعی #GPT5 #SamAltman #مدل_زبان
👍1🔥1👏1