🎮 Google и
Kaggle запустили открытую Game Arena — платформу, где ИИ-системы соревнуются в стратегических играх, чтобы измерить интеллект.
🤖 Зачем это нужно? Старые бенчмарки уже не работают — LLM просто запоминают ответы. Идея в том, что игры — лучший бенчмарк для проверки интеллекта. Они проверяют не факты, а
стратегическое мышление, адаптацию и память.
♟️ Первый турнир: шахматы пройдет сегодня. 8 передовых моделей, включая GPT‑4, Claude Opus и Gemini, сразятся друг с другом без использования внешних инструментов.
📊 По итогам матчей формируется открытый рейтинг моделей — кто реально умеет думать, а не просто угадывать.
🧠 Главное отличие от других арен:
✅ Круговая система «каждый играет с каждым».
✅ Позиции меняются каждую секунду
✅ Ошибки наказываются немедленно
✅ Побеждает не та, что знает ответ, а та, что думает
Kaggle собирает рейтинг моделей, который будет обновляться по итогам матчей. В будущем добавят Го, покер и видеоигры.
Стримы первых соревнований пройдут: 5–7 августа на YouTube с Хикару, Леви и Магнусом Карлсеном.
🟠 Подробнее об Арене:
https://blog.google/technology/ai/kaggle-game-arena@ai_machinelearning_big_data#google #kaggle #arena