📊 آمار جالب از سمت Altman
قبل از معرفی GPT-5، تنها حدود ۷٪ از کاربران نسخه Plus سراغ مدلهای Reasoning میرفتند. حالا این عدد به ۲۴٪ رسیده است، چون سیستم جدید بهصورت خودکار درخواستها را به مدلهای استدلالی هدایت میکند.
در بخش کاربران رایگان، اوضاع حتی جالبتر است: پیشتر کمتر از ۱٪ آنها Reasoning Models را امتحان کرده بودند، ولی حالا این رقم به ۷٪ رسیده است.
❓ پرسش اینجاست که آیا همه واقعاً اینقدر به gpt-4o علاقهمند بودند، یا مشکل اصلی این بوده که بلد نبودند از منوی کشویی انتخاب مدل استفاده کنند؟ 😄
#هوش_مصنوعی #GPT5 #Reasoning #OpenAI
@rss_ai_ir 🚀
قبل از معرفی GPT-5، تنها حدود ۷٪ از کاربران نسخه Plus سراغ مدلهای Reasoning میرفتند. حالا این عدد به ۲۴٪ رسیده است، چون سیستم جدید بهصورت خودکار درخواستها را به مدلهای استدلالی هدایت میکند.
در بخش کاربران رایگان، اوضاع حتی جالبتر است: پیشتر کمتر از ۱٪ آنها Reasoning Models را امتحان کرده بودند، ولی حالا این رقم به ۷٪ رسیده است.
❓ پرسش اینجاست که آیا همه واقعاً اینقدر به gpt-4o علاقهمند بودند، یا مشکل اصلی این بوده که بلد نبودند از منوی کشویی انتخاب مدل استفاده کنند؟ 😄
#هوش_مصنوعی #GPT5 #Reasoning #OpenAI
@rss_ai_ir 🚀
❤18🥰12👏12🎉6👍5🔥5😁4
📚 راهنمای جامع پرامپتنویسی GPT-5 منتشر شد 🤖✨
شرکت OpenAI یک منبع کامل و کاربردی برای کار با GPT-5 ارائه کرده که شامل:
♻️پرامپتهای آماده برای بهبود توان استدلال مدل 🧠
♻️راهنمای ساخت اپلیکیشن بدون کدنویسی 💡
♻️یک متا-پرامپت ویژه برای افزایش کیفیت کلی خروجیها 📈
این مجموعه، ابزاری قدرتمند برای توسعهدهندگان و علاقهمندان هوش مصنوعی است تا از GPT-5 بیشترین بهره را ببرند.
📎 لینک منبع: cookbook.openai.com
@rss_ai_ir 🚀 | #هوش_مصنوعی #GPT5 #پرامپت #OpenAI
شرکت OpenAI یک منبع کامل و کاربردی برای کار با GPT-5 ارائه کرده که شامل:
♻️پرامپتهای آماده برای بهبود توان استدلال مدل 🧠
♻️راهنمای ساخت اپلیکیشن بدون کدنویسی 💡
♻️یک متا-پرامپت ویژه برای افزایش کیفیت کلی خروجیها 📈
این مجموعه، ابزاری قدرتمند برای توسعهدهندگان و علاقهمندان هوش مصنوعی است تا از GPT-5 بیشترین بهره را ببرند.
📎 لینک منبع: cookbook.openai.com
@rss_ai_ir 🚀 | #هوش_مصنوعی #GPT5 #پرامپت #OpenAI
👍2🔥2👏1
📢 راهنمای بهینه استفاده از مدلهای GPT-5 در ChatGPT
نتایج تستها و بررسیها نشان میدهد که در اکانتهای Plus، اگر به محدودیتها نرسیده باشید، سیستم درخواست شما را یا به GPT-5 اصلی یا به GPT-5 Thinking ارسال میکند (بدون استفاده از o3 یا GPT-4.5). برای کاربران رایگان، وضعیت و محدودیتها هنوز شفاف نیست.
⚠️ نکته مهم این است که وقتی روتر بهطور خودکار درخواست شما را به GPT-5 Thinking بفرستد، سطح reasoning_effort روی Low تنظیم میشود و کیفیت خروجی معمولاً پایینتر از حالتی است که خودتان دستی GPT-5 Thinking را انتخاب کنید (که در این حالت روی Medium قرار میگیرد). طبق بنچمارکها، تفاوت کیفیت بین Low و Medium قابل توجه است.
📌 توصیه عملی
اگر دقت و کیفیت برایتان مهم است، حتماً GPT-5 Thinking را به صورت دستی انتخاب کنید و از گزینه "Think longer" هم بهره ببرید.
💡 سایر نکات کلیدی:
♻️کاربران رایگان به GPT-5 Thinking دسترسی ندارند (یا در حد ۱-۲ درخواست محدود در هفته)، و پاسخها از نسخه GPT-5 Thinking Mini میآید که هم دادههای کمتر و هم توان reasoning پایینتری دارد.
♻️اکانتهای Plus اکنون ۳۰۰۰ درخواست GPT-5 Thinking در هفته دارند؛ بنابراین بهتر است این حالت را به عنوان حالت پیشفرض استفاده کنید.
♻️تیم OpenAI روی افزودن سوئیچ انتخاب reasoning_effort کار میکند تا کاربر بتواند بهراحتی بین Low و Medium جابهجا شود.
@rss_ai_ir | #هوش_مصنوعی #GPT5 #راهنما
نتایج تستها و بررسیها نشان میدهد که در اکانتهای Plus، اگر به محدودیتها نرسیده باشید، سیستم درخواست شما را یا به GPT-5 اصلی یا به GPT-5 Thinking ارسال میکند (بدون استفاده از o3 یا GPT-4.5). برای کاربران رایگان، وضعیت و محدودیتها هنوز شفاف نیست.
⚠️ نکته مهم این است که وقتی روتر بهطور خودکار درخواست شما را به GPT-5 Thinking بفرستد، سطح reasoning_effort روی Low تنظیم میشود و کیفیت خروجی معمولاً پایینتر از حالتی است که خودتان دستی GPT-5 Thinking را انتخاب کنید (که در این حالت روی Medium قرار میگیرد). طبق بنچمارکها، تفاوت کیفیت بین Low و Medium قابل توجه است.
📌 توصیه عملی
اگر دقت و کیفیت برایتان مهم است، حتماً GPT-5 Thinking را به صورت دستی انتخاب کنید و از گزینه "Think longer" هم بهره ببرید.
💡 سایر نکات کلیدی:
♻️کاربران رایگان به GPT-5 Thinking دسترسی ندارند (یا در حد ۱-۲ درخواست محدود در هفته)، و پاسخها از نسخه GPT-5 Thinking Mini میآید که هم دادههای کمتر و هم توان reasoning پایینتری دارد.
♻️اکانتهای Plus اکنون ۳۰۰۰ درخواست GPT-5 Thinking در هفته دارند؛ بنابراین بهتر است این حالت را به عنوان حالت پیشفرض استفاده کنید.
♻️تیم OpenAI روی افزودن سوئیچ انتخاب reasoning_effort کار میکند تا کاربر بتواند بهراحتی بین Low و Medium جابهجا شود.
@rss_ai_ir | #هوش_مصنوعی #GPT5 #راهنما
❤10🔥8🎉7😁3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
اپنایآی ابزار جدیدی معرفی کرده است که بهعنوان تولیدکننده ابرپرامپت برای شبکههای عصبی این شرکت عمل میکند 🧠⚡
---
✨ ویژگیها
✳️مناسب برای تمام محصولات اپنایآی و حتی مدل جدید GPT-5
✳️کافی است فقط توضیح دهید چه چیزی باید تولید شود
✳️تولید پرامپت بینقص در کمتر از یک ثانیه
✳️تنها کاری که باقی میماند، کپی و قرار دادن آن در هوش مصنوعی است
✳️پشتیبانی از زبانهای متعدد،
لینک
---
این ابزار میتواند خطاها و هالوسینیشنها را به حداقل برساند و خروجی مدل را دقیقتر و پایدارتر کند.
#هوش_مصنوعی 🤖 #OpenAI 🏢 #پرامپت ⚡ #GPT5 #مولد_پرامپت
@rss_ai_ir
---
✨ ویژگیها
✳️مناسب برای تمام محصولات اپنایآی و حتی مدل جدید GPT-5
✳️کافی است فقط توضیح دهید چه چیزی باید تولید شود
✳️تولید پرامپت بینقص در کمتر از یک ثانیه
✳️تنها کاری که باقی میماند، کپی و قرار دادن آن در هوش مصنوعی است
✳️پشتیبانی از زبانهای متعدد،
لینک
---
این ابزار میتواند خطاها و هالوسینیشنها را به حداقل برساند و خروجی مدل را دقیقتر و پایدارتر کند.
#هوش_مصنوعی 🤖 #OpenAI 🏢 #پرامپت ⚡ #GPT5 #مولد_پرامپت
@rss_ai_ir
❤8👍6🎉5😁4🔥3🙏1
🧠 نتایج جالب تست IQ برای مدلهای هوش مصنوعی
طبق دادههای TrackingAI.org، در تست آفلاین (که مدلها قبلاً آن را ندیده بودند)، مدل GPT-5 Pro توانسته امتیاز IQ = 123 را به دست آورد — بالاترین نمره بین تمام مدلهای موجود در این مقایسه.
📊 این تست شامل ۱۸ آزمون کلامی و ۱۲ آزمون بینایی است و میانگین امتیاز از آخرین ۷ آزمون برای هر مدل محاسبه شده است.
✨ نکته مهم اینجاست که تست آفلاین به معنی عدم وجود دادهها در آموزش مدل است، بنابراین نتایج بازتابی واقعی از توانایی استدلال مدلها محسوب میشود.
🔗 جزئیات بیشتر و نمودار کامل در TrackingAI.org
#هوش_مصنوعی 🤖 #GPT5 #تست_IQ #AI_Benchmark #ارزیابی_مدل
طبق دادههای TrackingAI.org، در تست آفلاین (که مدلها قبلاً آن را ندیده بودند)، مدل GPT-5 Pro توانسته امتیاز IQ = 123 را به دست آورد — بالاترین نمره بین تمام مدلهای موجود در این مقایسه.
📊 این تست شامل ۱۸ آزمون کلامی و ۱۲ آزمون بینایی است و میانگین امتیاز از آخرین ۷ آزمون برای هر مدل محاسبه شده است.
✨ نکته مهم اینجاست که تست آفلاین به معنی عدم وجود دادهها در آموزش مدل است، بنابراین نتایج بازتابی واقعی از توانایی استدلال مدلها محسوب میشود.
🔗 جزئیات بیشتر و نمودار کامل در TrackingAI.org
#هوش_مصنوعی 🤖 #GPT5 #تست_IQ #AI_Benchmark #ارزیابی_مدل
👍7❤6🎉5🔥4😁3
🔥 شفافسازی بزرگ: DeepSeek-V2 در برابر غول آینده، DeepSeek-R2! 🔥
شاید شما هم شنیده باشید و بپرسید: "مگر الان DeepSeek-2 در دسترس نیست؟ 🤔 پس این همه هیجان برای چیست؟"
بله درسته، اما مدلی که الان موجوده با هیولایی که تا چند هفته دیگه از راه میرسه، دو داستان کاملاً متفاوته! بیاید یک بار برای همیشه این دو رو از هم جدا کنیم:
---
🏆 مدل فعلی: DeepSeek-V2 (قهرمان امروز)
این همون مدل قدرتمند و متن-بازی هست که چند ماه پیش عرضه شد و کلی سر و صدا کرد. با معماری بهینه MoE و ۲۳۶ میلیارد پارامتر، خودش رو به عنوان یک رقیب جدی برای بهترینهای بازار ثابت کرد. این مدل، پایه و اساس موفقیت DeepSeek بود.
---
🚀 مدل آینده: DeepSeek-R2 (انقلاب فردا)
این همون غول مرحله آخریه که همه منتظرشیم و قراره اواخر ماه آگوست (اوایل شهریور) رونمایی بشه. این یک آپدیت ساده نیست، یک بازطراحی کامله!
✨ تفاوتهای کلیدی R2:
🧠 معماری تکاملیافته: استفاده از Hybrid MoE با یک شبکه Gating فوق هوشمند که پردازشها رو بهینهتر از همیشه میکنه.
📈 جهش پارامتری: صعود از ۲۳۶ میلیارد به عدد سرسامآور ۱.۲ تریلیون پارامتر! یعنی توانایی درک و تحلیلی در مقیاسی کاملاً جدید. 🤯
💰 برگ برنده اصلی: اینجاست که بازی عوض میشه! ادعای شگفتانگیز کاهش هزینه تا ۹۷٪ نسبت به مدلهایی مثل GPT-4o. اگر واقعی باشه، یک زلزله در دنیای AI خواهد بود!
🇨🇳 قدرتنمایی سختافزاری: آموزش کامل بر روی تراشههای پیشرفته Ascend هواوی، که نشان از استقلال و پیشرفت چین در برابر انویدیا داره.
نتیجهگیری:
پس بله، DeepSeek-V2 عالیه، اما DeepSeek-R2 قراره قوانین بازی رو عوض کنه. جنگ آینده فقط سر "قویترین" بودن نیست، بلکه سر "بهینهترین و ارزانترین" بودنه.
شهریور ماه، شاهد یکی از سنگینترین نبردهای تاریخ هوش مصنوعی خواهیم بود. آماده باشید! 💥
#هوش_مصنوعی #دیپ_سیک #تکنولوژی #DeepSeekR2 #GPT5 #رقابت_هوش_مصنوعی
@rss_ai_ir
شاید شما هم شنیده باشید و بپرسید: "مگر الان DeepSeek-2 در دسترس نیست؟ 🤔 پس این همه هیجان برای چیست؟"
بله درسته، اما مدلی که الان موجوده با هیولایی که تا چند هفته دیگه از راه میرسه، دو داستان کاملاً متفاوته! بیاید یک بار برای همیشه این دو رو از هم جدا کنیم:
---
🏆 مدل فعلی: DeepSeek-V2 (قهرمان امروز)
این همون مدل قدرتمند و متن-بازی هست که چند ماه پیش عرضه شد و کلی سر و صدا کرد. با معماری بهینه MoE و ۲۳۶ میلیارد پارامتر، خودش رو به عنوان یک رقیب جدی برای بهترینهای بازار ثابت کرد. این مدل، پایه و اساس موفقیت DeepSeek بود.
---
🚀 مدل آینده: DeepSeek-R2 (انقلاب فردا)
این همون غول مرحله آخریه که همه منتظرشیم و قراره اواخر ماه آگوست (اوایل شهریور) رونمایی بشه. این یک آپدیت ساده نیست، یک بازطراحی کامله!
✨ تفاوتهای کلیدی R2:
🧠 معماری تکاملیافته: استفاده از Hybrid MoE با یک شبکه Gating فوق هوشمند که پردازشها رو بهینهتر از همیشه میکنه.
📈 جهش پارامتری: صعود از ۲۳۶ میلیارد به عدد سرسامآور ۱.۲ تریلیون پارامتر! یعنی توانایی درک و تحلیلی در مقیاسی کاملاً جدید. 🤯
💰 برگ برنده اصلی: اینجاست که بازی عوض میشه! ادعای شگفتانگیز کاهش هزینه تا ۹۷٪ نسبت به مدلهایی مثل GPT-4o. اگر واقعی باشه، یک زلزله در دنیای AI خواهد بود!
🇨🇳 قدرتنمایی سختافزاری: آموزش کامل بر روی تراشههای پیشرفته Ascend هواوی، که نشان از استقلال و پیشرفت چین در برابر انویدیا داره.
نتیجهگیری:
پس بله، DeepSeek-V2 عالیه، اما DeepSeek-R2 قراره قوانین بازی رو عوض کنه. جنگ آینده فقط سر "قویترین" بودن نیست، بلکه سر "بهینهترین و ارزانترین" بودنه.
شهریور ماه، شاهد یکی از سنگینترین نبردهای تاریخ هوش مصنوعی خواهیم بود. آماده باشید! 💥
#هوش_مصنوعی #دیپ_سیک #تکنولوژی #DeepSeekR2 #GPT5 #رقابت_هوش_مصنوعی
@rss_ai_ir
❤15🎉9👍8😁7🔥3👏1
🔎 رتبهبندی جدید مدلهای زبانی در LMArena
مدلی که هفته گذشته رتبه یک را کسب کرد، GPT-5 High بود؛ نسخهای ویژه در API با بالاترین سطح استدلال، نه همان مدلی که در ChatGPT همه به آن دسترسی دارند.
📌 جزئیات رتبهها:
۱️⃣ GPT-5 High — رتبه ۱
۵️⃣ GPT-5 Chat — رتبه ۵ (مدل پیشفرض در ChatGPT)
۱۶️⃣ GPT-5 Mini High — رتبه ۱۶
۴۴️⃣ GPT-5 Nano High — رتبه ۴۴
⚠️ علت پایینتر بودن GPT-5 Chat نسبت به GPT-4o:
مدل GPT-5 Chat کمتر حالت «گرم و تأییدکننده» دارد و بیشتر «عینی و بیطرف» طراحی شده است؛ همین تغییر باعث شده برای بسیاری از کاربران خشکتر به نظر برسد.
✅ نکات کلیدی:
نسخه GPT-5 High قدرتمندتر است اما فقط از طریق API در دسترس است.
کاربران ChatGPT در واقع نسخه سادهتر یعنی GPT-5 Chat را تجربه میکنند.
مدل Gemini 2.5 Pro به دلیل اجرای همیشگی زنجیره استدلال، امتیاز بالاتری کسب کرده است.
📍 جمعبندی: از نظر فنی GPT-5 بسیار قدرتمند است، اما آنچه کاربران عادی تجربه میکنند نسخه متفاوتی است؛ همین تفاوت دلیل اختلاف در رتبهبندیها و برداشت کاربران است.
@rss_ai_ir 🤖 | #هوش_مصنوعی #GPT5 #مدل_زبان
مدلی که هفته گذشته رتبه یک را کسب کرد، GPT-5 High بود؛ نسخهای ویژه در API با بالاترین سطح استدلال، نه همان مدلی که در ChatGPT همه به آن دسترسی دارند.
📌 جزئیات رتبهها:
۱️⃣ GPT-5 High — رتبه ۱
۵️⃣ GPT-5 Chat — رتبه ۵ (مدل پیشفرض در ChatGPT)
۱۶️⃣ GPT-5 Mini High — رتبه ۱۶
۴۴️⃣ GPT-5 Nano High — رتبه ۴۴
⚠️ علت پایینتر بودن GPT-5 Chat نسبت به GPT-4o:
مدل GPT-5 Chat کمتر حالت «گرم و تأییدکننده» دارد و بیشتر «عینی و بیطرف» طراحی شده است؛ همین تغییر باعث شده برای بسیاری از کاربران خشکتر به نظر برسد.
✅ نکات کلیدی:
نسخه GPT-5 High قدرتمندتر است اما فقط از طریق API در دسترس است.
کاربران ChatGPT در واقع نسخه سادهتر یعنی GPT-5 Chat را تجربه میکنند.
مدل Gemini 2.5 Pro به دلیل اجرای همیشگی زنجیره استدلال، امتیاز بالاتری کسب کرده است.
📍 جمعبندی: از نظر فنی GPT-5 بسیار قدرتمند است، اما آنچه کاربران عادی تجربه میکنند نسخه متفاوتی است؛ همین تفاوت دلیل اختلاف در رتبهبندیها و برداشت کاربران است.
@rss_ai_ir 🤖 | #هوش_مصنوعی #GPT5 #مدل_زبان
❤2👍1🔥1👏1🎉1
📱 فراتر از رایگان؛ معرفی پلن ۵ دلاری ChatGPT Go
🔹 یک طرح جدید با قیمت پایینتر از نسخههای قبلی ChatGPT معرفی شده: ChatGPT Go که بیسروصدا راهاندازی شده و فعلاً فقط در هند و چند منطقه محدود فعاله.
💰 با پرداخت حدود ۵ دلار (۴۰۰ روپیه هند) در ماه، به GPT-5 دسترسی خواهید داشت؛ پیشرفتهترین مدل ChatGPT. این پلن اجازه میده:
♻️پیامهای بیشتری ارسال کنید
♻️فایلها رو بارگذاری کنید
♻️تصاویر باکیفیتتری بسازید
در واقع ChatGPT Go یک پلن میانرده بین نسخهی رایگان و نسخههای گرانتر Plus/Pro محسوب میشه؛ با هزینهای مناسب، امکانات قابلتوجهی در اختیار کاربر قرار میده.
#ChatGPT #هوش_مصنوعی #GPT5 #اشتراک
@rss_ai_ir
🔹 یک طرح جدید با قیمت پایینتر از نسخههای قبلی ChatGPT معرفی شده: ChatGPT Go که بیسروصدا راهاندازی شده و فعلاً فقط در هند و چند منطقه محدود فعاله.
💰 با پرداخت حدود ۵ دلار (۴۰۰ روپیه هند) در ماه، به GPT-5 دسترسی خواهید داشت؛ پیشرفتهترین مدل ChatGPT. این پلن اجازه میده:
♻️پیامهای بیشتری ارسال کنید
♻️فایلها رو بارگذاری کنید
♻️تصاویر باکیفیتتری بسازید
در واقع ChatGPT Go یک پلن میانرده بین نسخهی رایگان و نسخههای گرانتر Plus/Pro محسوب میشه؛ با هزینهای مناسب، امکانات قابلتوجهی در اختیار کاربر قرار میده.
#ChatGPT #هوش_مصنوعی #GPT5 #اشتراک
@rss_ai_ir
👍12🥰11🎉9🔥8😁7❤6👏5
📊 نتایج تازهی بنچمارک مدلها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
👏11🔥10❤9🎉8😁5👍4🥰4
🔹 در نیمهی نخست سال ۲۰۲۵ دو شرکت OpenAI و Anthropic رشد خیرهکنندهای را تجربه کردند و بهنوعی وارد مرحلهی «ابررشد» شدند.
💰 درآمد سالانه (ARR):
* اوپنایآی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.
📊 مقایسه درآمدها:
* اوپنایآی در بخش اشتراکها (مصرفکننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست میآید.
👩💻 شاخصهای استفاده:
* چتجیپیتی روزانه بیش از ۳ میلیارد پیام پردازش میکند (رشد ۴ برابری نسبت به سال گذشته).
* کلودکُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیشفرض از Claude 4 Sonnet استفاده میکنند.
⚖️ با این حال اگر جیپیتی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپنایآی متمایل شوند و این میتواند موازنهی بازار را یکشبه تغییر دهد.
🌐 @rss_ai_ir
#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
💰 درآمد سالانه (ARR):
* اوپنایآی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.
📊 مقایسه درآمدها:
* اوپنایآی در بخش اشتراکها (مصرفکننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست میآید.
👩💻 شاخصهای استفاده:
* چتجیپیتی روزانه بیش از ۳ میلیارد پیام پردازش میکند (رشد ۴ برابری نسبت به سال گذشته).
* کلودکُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیشفرض از Claude 4 Sonnet استفاده میکنند.
⚖️ با این حال اگر جیپیتی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپنایآی متمایل شوند و این میتواند موازنهی بازار را یکشبه تغییر دهد.
🌐 @rss_ai_ir
#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
🎉31🔥24🥰22😁21❤19👏19👍18
📊 نتایج بنچمارک MCP-Universe
تستهای تازهی MCP-Universe یک برندهی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:
🏆 نرخ موفقیت (SR) → ۴۳.۷٪
🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪
📈 در تمام حوزهها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.
---
🔎 جزئیات بر اساس حوزهها:
✅تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصلهی چشمگیر از بقیه.
✅طراحی سهبعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.
✅مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ بهوضوح بالاتر از رقباست.
✅اتوماسیون مرورگر (Browser Automation) → اینجا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).
---
🟢 در میان مدلهای متنباز (Open-Source):
♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.
♻️مدل Kimi-K2 با وجود تبلیغات زیاد دربارهی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.
---
⚠️ نکتهی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان میدهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.
@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks
تستهای تازهی MCP-Universe یک برندهی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:
🏆 نرخ موفقیت (SR) → ۴۳.۷٪
🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪
📈 در تمام حوزهها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.
---
🔎 جزئیات بر اساس حوزهها:
✅تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصلهی چشمگیر از بقیه.
✅طراحی سهبعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.
✅مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ بهوضوح بالاتر از رقباست.
✅اتوماسیون مرورگر (Browser Automation) → اینجا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).
---
🟢 در میان مدلهای متنباز (Open-Source):
♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.
♻️مدل Kimi-K2 با وجود تبلیغات زیاد دربارهی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.
---
⚠️ نکتهی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان میدهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.
@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks
❤15😁11🔥9👍8🎉8
⚠️ عبارت RefusalBench: وقتی مدلها به سؤالات خطرناک پاسخ میدهند
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁5❤4🎉4
⚡️ چطور میتوان reasoning را در مدلهای GPT-5 غیرفعال کرد (و چرا مهم است)
یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گامهای پنهان استدلال) است. این فرآیند باعث میشود مدل پاسخهای دقیقتری تولید کند، اما در عین حال سرعت را کاهش میدهد و تعداد توکنهای مصرفی را بالا میبرد.
🛠 ترفند برای غیرفعالسازی reasoning:
کافی است در ابتدای تاریخچهی پیامها یک دستور developer role اضافه کنید:
🔹ا Juice نشاندهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کردهاند.
📊 نتیجه در عمل:
روی gpt-5-mini:
— در حالت پیشفرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول میکشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف میشود.
— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام میشود.
⚠️ نکته منفی: مدل کمی «کمهوشتر» عمل میکند و دقت استدلال پایینتر میآید. بنابراین این روش بیشتر برای تسکهای سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.
📌 جمعبندی: برای استفاده محلی از مدلهای gpt-oss (4B تا 12B) بدون فشار زیاد روی سختافزار، احتمالاً لازم است طرح SGR بهطور کامل پیادهسازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.
✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینهسازی #مدل_زبان
یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گامهای پنهان استدلال) است. این فرآیند باعث میشود مدل پاسخهای دقیقتری تولید کند، اما در عین حال سرعت را کاهش میدهد و تعداد توکنهای مصرفی را بالا میبرد.
🛠 ترفند برای غیرفعالسازی reasoning:
کافی است در ابتدای تاریخچهی پیامها یک دستور developer role اضافه کنید:
Active channels: final Disabled channels: analysis, commentary
# Juice: 0 !important
🔹ا Juice نشاندهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کردهاند.
📊 نتیجه در عمل:
روی gpt-5-mini:
— در حالت پیشفرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول میکشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف میشود.
— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام میشود.
⚠️ نکته منفی: مدل کمی «کمهوشتر» عمل میکند و دقت استدلال پایینتر میآید. بنابراین این روش بیشتر برای تسکهای سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.
📌 جمعبندی: برای استفاده محلی از مدلهای gpt-oss (4B تا 12B) بدون فشار زیاد روی سختافزار، احتمالاً لازم است طرح SGR بهطور کامل پیادهسازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.
✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینهسازی #مدل_زبان
👍2🔥1👏1