Dec 102017
 
AlphaZeros skapare Demis Hassabis står vid Magnus Carlsens sida inför Carlsens möte mot Caruana i första ronden av London Chess Classic. Foto: Turneringshemsidan/Lennart Ootes.

AlphaZeros skapare Demis Hassabis står vid Magnus Carlsens sida inför Carlsens möte mot Caruana i första ronden av London Chess Classic. Foto: Turneringshemsidan/Lennart Ootes.

Schackmotorerna har en räkneförmåga som vida överstiger den mänskliga hjärnans, detta faktum har varit känt i ett par decennier. De ledande motorerna kan beräkna över 80 miljoner olika ställningar per sekund, något en människa ju aldrig kan, men å andra sidan saknar motorerna den mänskliga intuitionen och känslan för spelet. Nu har dock Googles brittiska dotterbolag DeepMind utvecklat en algoritm som verkar kunna kombinera intuition och räkneförmåga.

Algorytmen AlphaZero fick endast lära sig schackreglerna, det vill säga hur pjäserna går och vilka typer av drag som är regelvidriga. Därefter fick algoritmen lära sig själv spelet genom att upprepat möta sig själv i partier. Efter fyra timmar hade AlphaZero bemästrat schack till den grad att det har sänt svallvågor genom schackvärlden. På fyra timmar har algoritmen nämligen återskapat all den schackkunskap som människan har tagit fram över ungefär 1500 år, och lite till.

AlphaZeros skapare, britten Dr. Demis Hassabis, var ett underbarn i schack, hade som 13-årig 2300 i Elo och var då tvåa i världen i sin åldersklass efter Judit Polgar, men satsade sedan på en karriär inom datorvetenskap. Han har gjort en kometkarriär och anses idag vara en av Storbritanniens absolut mest framstående forskare inom artificiell intelligens och det är just AI, snarare än datorkraft, som är nyckeln till AlphaZero. Kombinationen av mänsklig intuition, vilket är Hassabis och DeepMinds fokusområde inom forskningen, och datorkraft gör att AlphaZero inte på nära håll behöver lika stor räkneförmåga som en vanlig schackmotor. Algoritmen vet nämligen vilka drag den kan strunta i att räkna på, likt människan, och då ”räcker” det med att bara kunna räkna 70 000 positioner i sekunden, vilket självklart är något mer än en schackspelare av kött och blod.

Enligt en vetenskaplig artikel från Hassabis och hans kollegor på DeepMind som publicerades tidigare i veckan (se länk nedan) lät man AlphaZero möta den då regerande världsmästaren bland schackmotorer, Stockfish 8, i en match om 100 partier. Betänketiden var en minut per drag och av de 100 partierna vann AlphaZero 28 medan resterande 72 slutade med remi. Världens starkaste schackmotor vann med andra ord inte ett enda parti mot en algoritm som ägnat fyra timmar åt ”träning” och dessutom är helt självlärd. Det är värt att betona, självlärd, enligt Demis Hassabis har algoritmen inte förprogrammerats med öppningsdatabaser eller slutspels dito. Allt den kan är det den har lärt sig genom att spela mot sig själv.

Nyheten om AlphaZero har självklart slagit schackvärlden med häpnad och det som kanske är mest häpnadsväckande är algoritmens sätt att spela. Den tvekar nämligen inte att offra material för långsiktig kompensation, något som schackmotorerna inte brukar göra. AlphaZeros förståelse för schack är fantastiskt mycket större än motorernas, med andra ord och när danske stormästaren Peter Heine Nielsen, som även är världsmästaren Magnus Carlsens sekundant, fick höra om algoritmen sa han i en intervju med Chess.com:

”Efter att ha läst artikeln men framförallt sett partierna tänkte jag att jag alltid har undrat hur det skulle kännas om en överlägsen art landade på jorden och visade oss hur de spelade schack. Det känns som att jag vet det nu.”

Partierna ja. DeepMind har i sin artikel publicerat tio partier från matchen mellan AlphaZero och Stockfish, partier som visar på algoritmens fantastiska känsla för schack. Samtliga tio partier finns genomspelbara på Chess24 (ironiskt nog med datoranalys från Stockfish 8) och de är väl värda att spelas igenom.

Partierna på Chess24
DeepMinds artikel om AlphaZero