Pierwszy otwarty turniej szachowy AI w ramach Kaggle Game Arena to wydarzenie zapoczątkowane przez Google i jej platformę Kaggle oraz laboratorium DeepMind, opracowujące zaawansowane rozwiązania dotyczące sztucznej inteligencji. Trzydniowy turniej odbędzie się w dniach 5-7 sierpnia i weźmie w nim udział osiem wiodących na świecie modeli AI.
Wśród uczestników znajdą się modele Google, OpenAI, Anthropic oraz innych laboratoriów: Gemini 2.5 Pro (Google), Gemini 2.5 Flash (Google), o3 (OpenAI), o4-mini (OpenAI), Claude 4 Opus (Anthropic), Grok 4 (xAI), DeepSeek R1, Kimi k2 (Moonshot AI).
Walki maszyn o puchar mistrza
Zawody rozgrywane są systemem pucharowym, a modele rywalizują do czterech zwycięskich partii, aby wyłonić wygranego w pojedynku. Pierwszego dnia odbędą się cztery pojedynki ćwierćfinałowe, drugiego dnia dwa półfinały, a ostatniego dnia finał.
Partie są transmitowane na żywo na kanale You Tube Kaggle z komentarzem Hikaru Nakamury, amerykańskiego arcymistrza szachowego japońskiego pochodzenia, a codzienne podsumowania prezentować będzie Levy Rozman, mistrz szachowy i twórca najpopularniejszego na świecie szachowego kanału YouTube (GothamChess). Recenzję całego turnieju i finałowy komentarz przygotuje Magnus Carlsen, norweski arcymistrz i jeden z najwybitniejszych szachistów w historii, określany często mianem „Mozarta szachów”.
Wszystkie ruchy w pojedynkach są komunikowane w postaci tekstowej bez interfejsu wizualnego. Model nie dostaje listy możliwych legalnych ruchów – musi samodzielnie je identyfikować i nie może korzystać z zewnętrznych silników szachowych takich jak Stockfish, najsilniejszego na świecie programu komputerowego do gry w szachy publicznie dostępnego. Jeśli model wykona nielegalny ruch, ma trzy próby na poprawienie błędu – trzecia nieudana próba oznacza przegraną partię. Na każdy ruch model ma maksymalnie 60 minut.
Równolegle rozgrywane są setki dodatkowych partii między modelami (all-play-all), które tworzą statystycznie wiarygodną tablicę rankingową, stale dostępną na Kaggle Benchmarks. Turniej służy nie tylko sprawdzeniu, „kto wygra”, ale przede wszystkim stworzeniu trwałego, otwartego benchmarku dla testowania szeroko pojętych umiejętności rozumowania modeli AI.
Plaforma Kaggle Game Arena
To pierwsza tego typu szeroko otwarta i publiczna rywalizacja mająca zademonstrować zdolności AI do rozumowania w kontekście gry strategicznej, z wysokim poziomem transparentności, dotyczącym zarówno zasad, jak i przebiegu rywalizacji oraz wyników modeli. Celem inicjatywy jest stworzenie nowego, transparentnego benchmarku oceniającego nie tylko zdolności stricte szachowe, ale też szeroko pojęte umiejętności rozumowania, adaptacji, planowania i przewidywania ruchów przeciwnika.
Google zapowiada, że w ramach Kaggle Game Arena podobne turnieje będą regularnie organizowane, a kolejne gry jak gra planszowa Go, pochodząca ze starożytnych Chin, czy Werewolf, towarzyska gra imprezowa z elementami dedukcji i bluffu, już są zaplanowane jako kolejne testy tych samych modeli.
Firma podkreśla, że gry, takie jak szachy, stanowią jeden z najlepszych sposobów na przeprowadzenie rzetelnej oceny umiejętności rozumowania modeli LLM. Dzieje się tak, ponieważ są odporne na to, co Google nazywa „nasyceniem” – czyli, innymi słowy, na rozwiązywanie ich za pomocą standardowej formuły. Wybrano szachy ponieważ są niezwykle złożone. Claude Shannon oszacował liczbę wszystkich teoretycznie możliwych partii szachów na około , co jest liczbą znacznie większą niż liczba atomów we Wszechświecie.
Kaggle oraz DeepMind są obecnie integralnymi częściami Google, a dokładniej firmy-matki, czyli Alphabet Inc. Kaggle został przejęty przez Google w marcu 2017 roku i funkcjonuje jako platforma będąca częścią Google Cloud. Specjalizuje się w organizowaniu konkursów data science i uczenia maszynowego. Z kolei DeepMind Google przejęło w 2014 roku. Początkowo unkcjonowało jako niezależny zespół, ale w 2023 roku zostało formalnie połączone z zespołem Google Brain. Opracowuje zaawansowane rozwiązania AI, takie jak AlphaGo, AlphaFold czy rodzina modeli Gemini.
Warto dodać, że Kaggle przy współpracy z DeepMind wydali w 2017 roku program komputerowy do gry w szachy AlphaZero, który nigdy nie był publicznie dostępny. Wykorzystując uczenie maszynowe i rozgrywając miliony partii przeciwko sobie, szturmem podbił świat szachów, pokonując Stockfisha, w meczu składającym się ze 100 partii. Pod koniec 2018 roku wygrał drugi mecz ze Stockfishem, który składał się z ponad 1000 partii.
Modele sztucznej inteligencji konkurujące w Kaggle nie dorównują poziomem AlphaZero. W przeciwieństwie do niego nie są programowane specjalnie do gry w szachy. Jak szczegółowo opisuje Chess.com, modele te wciąż się uczą i znane są z wykonywania zarówno nielegalnych ruchów, jak i absurdalnych rezygnacji. Rywalizacja szachowa modeli AI może być ciekawa, czy jednak dorówna emocjom, jakie towrzyszły np. rywalizacji Gary’go Kasparova z superkomputerem Deep Blue od IBM? Czas pokaże, a do tego momentu warto sobie przypomnieć ten pojedynek np. za sprawą serialu "Rewanż".
Michał Kubicki