VIRSUN
14.6K subscribers
472 photos
267 videos
2 files
278 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافته‌ی مدل‌های زبانی معرفی کرد.

ابزار Stax یک پروژه‌ی آزمایشی برای توسعه‌دهندگان است که جایگزینی برای تست‌های غیررسمی و اصطلاحاً vibe-testing ارائه می‌دهد و امکان ارزیابی داده‌محور و سیستماتیک مدل‌ها را فراهم می‌سازد.

🔹 همچنین Stax می‌تواند مدل‌ها را با استفاده از ارزیاب‌های آماده یا سفارشی بررسی کند.
🔹 متریک‌های اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسه‌ی نتایج مدل‌های مختلف همراه با شاخص‌های بصری عملکرد در دسترس است.

قابلیت‌ها:

♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصی‌سازی متریک‌ها متناسب با محصول
♻️جریان کاری end-to-end از مرحله‌ی نمونه‌سازی تا استقرار


🎯 هدف اصلی: کمک به توسعه‌دهندگان برای تصمیم‌گیری دقیق‌تر در انتخاب و به‌کارگیری مدل‌های زبانی.

@rss_ai_ir

#news #ai #ml #Google #Stax
👍1🔥1👏1