Robots die Rubiks kubus kunnen oplossen, zijn er al langer, maar onderzoekers hebben nu een algoritme ontwikkeld dat zichzelf aanleert hoe de klus moet worden geklaard zonder inbreng van de mens. DeepCube maakt hiervoor zijn eigen beloningssysteem.
Bij het inzetten van deep learning voor bijvoorbeeld schaken of go kunnen systemen leren winnen met alleen kennis van de spelregels, door een beloningssysteem. Bij elke zet evalueren algoritmes de invloed op het spel en op basis van waarderingen kunnen machines zo goed leren spelen.
Bij Rubiks kubus is het voor een algoritme lastig te bepalen of een willekeurige handeling het dichter bij de oplossing brengt of niet, schrijft Technology Review. Onderzoekers van de Universiteit van Californië in Irvine maken daarom gebruik van een deeplearningtechniek met de naam 'autodidactische iteraties'. Hierbij begint het algoritme met een al opgeloste kubus en werkt het terug naar andere configuraties om een idee te krijgen welke handelingen naar de oplossing toewerken en welke niet.
Na training kan het honderd procent van de willekeurig geconfigureerde kubussen oplossen, in gemiddeld dertig handelingen. Volgens de onderzoekers kan hun werk behulpzaam zijn bij het zelf laten oplossen door systemen van bijvoorbeeld puzzelspel Sokoban en het spel Montezuma’s Revenge, maar ook voor het ontbinden in factoren. Daarnaast hopen ze hun techniek te kunnen inzetten voor complexere problemen, zoals het voorspellen van de tertiaire structuur van eiwitten.
De wetenschappers beschrijven hun onderzoek in de paper Solving the Rubik's Cube Without Human Knowledge.