REKLAMA
TYLKO U NAS

Google organizuje turniej szachowy modeli AI. Powalczą m.in. Grok, Gemini, Chat GPT i DeepSeek

Michał Kubicki2025-08-05 09:49redaktor Bankier.pl
publikacja
2025-08-05 09:49

Należące do Google platforma Kaggle oraz DeepMind, organizują pokazowy turniej szachowy AI, mający na celu ocenę umiejętności rozumowania i planowania najlepszych dużych modeli językowych wykorzystywanych m.in. przez Chat GPT, Gemini, czy DeepSeek. Po turnieju, na platformie Kaggle, będzie dostępna stale aktualizowana tabela wyników z rankingami dającymi obraz tego, która sztuczna inteligencja jest najlepsza w szachach.

Google organizuje turniej szachowy modeli AI. Powalczą m.in. Grok, Gemini, Chat GPT i DeepSeek
Google organizuje turniej szachowy modeli AI. Powalczą m.in. Grok, Gemini, Chat GPT i DeepSeek
fot. Alexander Limbach / / Shutterstock

Pierwszy otwarty turniej szachowy AI w ramach Kaggle Game Arena to wydarzenie zapoczątkowane przez Google i jej platformę Kaggle oraz laboratorium DeepMind, opracowujące zaawansowane rozwiązania dotyczące sztucznej inteligencji. Trzydniowy turniej odbędzie się w dniach 5-7 sierpnia i weźmie w nim udział osiem wiodących na świecie modeli AI.

Wśród uczestników znajdą się modele Google, OpenAI, Anthropic oraz innych laboratoriów: Gemini 2.5 Pro (Google), Gemini 2.5 Flash (Google), o3 (OpenAI), o4-mini (OpenAI), Claude 4 Opus (Anthropic), Grok 4 (xAI), DeepSeek R1, Kimi k2 (Moonshot AI).

Walki maszyn o puchar mistrza

Zawody rozgrywane są systemem pucharowym, a modele rywalizują do czterech zwycięskich partii, aby wyłonić wygranego w pojedynku. Pierwszego dnia odbędą się cztery pojedynki ćwierćfinałowe, drugiego dnia dwa półfinały, a ostatniego dnia finał.

kaggle.com

Partie są transmitowane na żywo na kanale You Tube Kaggle z komentarzem Hikaru Nakamury, amerykańskiego arcymistrza szachowego japońskiego pochodzenia, a codzienne podsumowania prezentować będzie Levy Rozman, mistrz szachowy i twórca najpopularniejszego na świecie szachowego kanału YouTube (GothamChess). Recenzję całego turnieju i finałowy komentarz przygotuje Magnus Carlsen, norweski arcymistrz i jeden z najwybitniejszych szachistów w historii, określany często mianem „Mozarta szachów”.

Wszystkie ruchy w pojedynkach są komunikowane w postaci tekstowej bez interfejsu wizualnego. Model nie dostaje listy możliwych legalnych ruchów – musi samodzielnie je identyfikować i nie może korzystać z zewnętrznych silników szachowych takich jak Stockfish, najsilniejszego na świecie programu komputerowego do gry w szachy publicznie dostępnego. Jeśli model wykona nielegalny ruch, ma trzy próby na poprawienie błędu – trzecia nieudana próba oznacza przegraną partię. Na każdy ruch model ma maksymalnie 60 minut.

Równolegle rozgrywane są setki dodatkowych partii między modelami (all-play-all), które tworzą statystycznie wiarygodną tablicę rankingową, stale dostępną na Kaggle Benchmarks. Turniej służy nie tylko sprawdzeniu, „kto wygra”, ale przede wszystkim stworzeniu trwałego, otwartego benchmarku dla testowania szeroko pojętych umiejętności rozumowania modeli AI.

Plaforma Kaggle Game Arena

To pierwsza tego typu szeroko otwarta i publiczna rywalizacja mająca zademonstrować zdolności AI do rozumowania w kontekście gry strategicznej, z wysokim poziomem transparentności, dotyczącym zarówno zasad, jak i przebiegu rywalizacji oraz wyników modeli. Celem inicjatywy jest stworzenie nowego, transparentnego benchmarku oceniającego nie tylko zdolności stricte szachowe, ale też szeroko pojęte umiejętności rozumowania, adaptacji, planowania i przewidywania ruchów przeciwnika.

Google zapowiada, że w ramach Kaggle Game Arena podobne turnieje będą regularnie organizowane, a kolejne gry jak gra planszowa Go, pochodząca ze starożytnych Chin, czy Werewolf, towarzyska gra imprezowa z elementami dedukcji i bluffu, już są zaplanowane jako kolejne testy tych samych modeli. 

Firma podkreśla, że gry, takie jak szachy, stanowią jeden z najlepszych sposobów na przeprowadzenie rzetelnej oceny umiejętności rozumowania modeli LLM. Dzieje się tak, ponieważ są odporne na to, co Google nazywa „nasyceniem” – czyli, innymi słowy, na rozwiązywanie ich za pomocą standardowej formuły. Wybrano szachy ponieważ są niezwykle złożone. Claude Shannon oszacował liczbę wszystkich teoretycznie możliwych partii szachów na około 10120, co jest liczbą znacznie większą niż liczba atomów we Wszechświecie. 

Kaggle oraz DeepMind są obecnie integralnymi częściami Google, a dokładniej firmy-matki, czyli Alphabet Inc. Kaggle został przejęty przez Google w marcu 2017 roku i funkcjonuje jako platforma będąca częścią Google Cloud. Specjalizuje się w organizowaniu konkursów data science i uczenia maszynowego. Z kolei DeepMind Google przejęło w 2014 roku. Początkowo unkcjonowało jako niezależny zespół, ale w 2023 roku zostało formalnie połączone z zespołem Google Brain. Opracowuje zaawansowane rozwiązania AI, takie jak AlphaGo, AlphaFold czy rodzina modeli Gemini.

Warto dodać, że Kaggle przy współpracy z DeepMind wydali w 2017 roku program komputerowy do gry w szachy AlphaZero, który nigdy nie był publicznie dostępny. Wykorzystując uczenie maszynowe i rozgrywając miliony partii przeciwko sobie, szturmem podbił świat szachów, pokonując Stockfisha, w meczu składającym się ze 100 partii. Pod koniec 2018 roku wygrał drugi mecz ze Stockfishem, który składał się z ponad 1000 partii.

Modele sztucznej inteligencji konkurujące w Kaggle nie dorównują poziomem AlphaZero. W przeciwieństwie do niego nie są programowane specjalnie do gry w szachy. Jak szczegółowo opisuje Chess.com, modele te wciąż się uczą i znane są z wykonywania zarówno nielegalnych ruchów, jak i absurdalnych rezygnacji. Rywalizacja szachowa modeli AI może być ciekawa, czy jednak dorówna emocjom, jakie towrzyszły np. rywalizacji Gary’go Kasparova z superkomputerem Deep Blue od IBM? Czas pokaże, a do tego momentu warto sobie przypomnieć ten pojedynek i towarzyszące mu kontrowersje np. za sprawą serialu "Rewanż". 

Michał Kubicki

Źródło:
Michał Kubicki
Michał Kubicki
redaktor Bankier.pl

Redaktor działu Rynki Bankier.pl. Absolwent finansów i rachunkowości na UMCS w Lublinie. W czasie studiów zainteresował się giełdą i rynkami finansowymi, które to zainteresowania rozwinął na SGH w Warszawie na kierunku Bankowość Inwestycyjna. Na co dzień obserwuje notowania warszawskiej giełdy, by przekazać czytelnikom portalu najważniejsze informacje z parkietu oraz przybliżyć istotne wiadomości ze spółek. Telefon 728 927 242

Tematy
Załóż konto osobiste w apce Moje ING i zgarnij do 600 zł w promocjach od ING
Załóż konto osobiste w apce Moje ING i zgarnij do 600 zł w promocjach od ING

Komentarze (9)

dodaj komentarz
dzyszla
A będzie też konkurencja w szachach błyskawicznych z limitem jakichś 50μs/partię?
pogo0
Sama infrastruktura sieciowa pozwalająca na tak szybką komunikację kosztowałaby majątek. Naturalne opóźnienia komunikacji (per request) wynikające z konieczności synchronizacji są większe niż limit, który chcesz dać.
Coś tak prostego jak "ping" do siebie samego trwa 4ms, a Ty chcesz dać 100 razy mniej na całą rozgrywkę.
Sama infrastruktura sieciowa pozwalająca na tak szybką komunikację kosztowałaby majątek. Naturalne opóźnienia komunikacji (per request) wynikające z konieczności synchronizacji są większe niż limit, który chcesz dać.
Coś tak prostego jak "ping" do siebie samego trwa 4ms, a Ty chcesz dać 100 razy mniej na całą rozgrywkę.
Oczywiście da się to obejść, ale to by wymagało ustawienia wszystkich tych AI w jednej serwerowni i to fizycznie bardzo blisko siebie. Jednak wciąż pewnie starczy to na jakieś 5 ruchów jeśli były z gory zaplanowane i nie trzeba nawet sprawdzać co zrobił przeciwnik.

Jeszcze muszę sprawdzić jaki jest lag w komunikacji między procesorem, a RAMem i kartą graficzną... Bo może już na tym etapie czas, który dałeś nie starczy na całą rozgrywkę.
pogo0 odpowiada pogo0
No i potwierdzam... średnie opóźnienie samej magistrali PCIe to 200-300 ns (w jedną stronę, czyli w obie to 500 ns). Czyli nawet gdyby wszystko działo się na jednym komputerze to optymistycznie zdążymy wykonać 100 ruchów, przy założeniu, że nie wymaga to już żadnych obliczeń.

Podpowiem tylko, że żadnego z tych modeli AI nie
No i potwierdzam... średnie opóźnienie samej magistrali PCIe to 200-300 ns (w jedną stronę, czyli w obie to 500 ns). Czyli nawet gdyby wszystko działo się na jednym komputerze to optymistycznie zdążymy wykonać 100 ruchów, przy założeniu, że nie wymaga to już żadnych obliczeń.

Podpowiem tylko, że żadnego z tych modeli AI nie zamierzają raczej uruchamiać na pojedynczym kompie, a już na pewno nie 2 na raz.
adam.1983
System pucharowy nie jest miarodajny, powinien być kołowy wtedy każdy z każdym by zagrał
helixo
To nie 96 rok żeby komputer grający w szachy robił jakiekolwiek wrażenie
prawdziwynierobot
dokładnie.
google to niech popracuje nad algorytmami swojej wyszukiwarki, bo coraz gorzej to wygląda
jas2
Wtedy tylko grał w szachy. Teraz może z tobą w międzyczasie pogadać.
Właściwie nie z tobą, tylko z milionem ludzi na raz.
dzyszla
Programy do rozgrywek szachowych były oparte o matematykę dyskretną. AI działa zupełnie inaczej, więc Twoje stwierdzenie świadczy tylko o nierozumieniu zasad działania.

Powiązane: Sztuczna inteligencja

Polecane

Najnowsze

Popularne

Ważne linki