Game Theory: wat is pokerspeltheorie?

Game Theory is een tak van de wiskunde. Deze houdt zich bezig met situaties waarin de beslissingen van één persoon invloed hebben op de manier waarop andere mensen handelen en reageren. Het wordt vaak gebruikt in economie, politieke wetenschap en zelfs biologie. Bij poker is deze theorie vooral relevant omdat twee of meer spelers concurrerende belangen hebben. Omdat online poker de afgelopen 20 jaar erg populair is geworden, zijn de spelers enorm verbeterd. Dit tot het punt waarop het nu erg moeilijk is om het spel consistent te verslaan zonder kennis van deze theorie op zak.

Optimale Beslissingstheorie of OST

Als je aandacht besteedt aan de instructievideo’s die worden gedeeld over online poker, moet één acroniem je zijn opgevallen. Dat is GTO (Game Theory Optimal). Het is geen term die specifiek is voor poker, maar wel een nuttige. Het is het resultaat van studies die in de 19e eeuw begonnen zijn door Antoine Augustin Cournot. En deze zijn in de jaren ’20 geïntensiveerd door Ernst Zermelo en Émile Borel. Deze ideeën werden vervolgens ontwikkeld door John von Neumann. Die publiceerde in 1944 samen met Oskar Morgenstern het belangrijkste werk over speltheorie: Game Theory and Economic Behaviour.

Het is gebaseerd op de vooronderstelling dat elke speler die een beslissing neemt om zijn winst te maximaliseren, moet weten dat er altijd een ‘optimale beslissing’ is. D.w.z. een beslissing die alle andere verslaat. De GTO-strategie is vooral nuttig in situaties waar de tegenstander zeer vaardig is of wanneer je tegen onbekende spelers speelt. De GTO-strategie is altijd hetzelfde. Dit ongeacht de tegenstander, omdat het wiskundig gezien de beste strategie is en er geen uitbuitende pareren tegen zijn. Op de korte tot middellange termijn is het de variantie, d.w.z. het gemiddelde van de zetten. En die geeft de doorslag tussen de spelers.

Het concept van minimax en Nash-evenwicht

Het was de zoektocht naar dit ‘optimum’ die in de daaropvolgende jaren een groot aantal min of meer gedetailleerde artikels opleverde, met als meest emblematische vandaag het Nash-evenwicht (genoemd naar de Nobelprijswinnaar voor economie John Forbes Nash uit 1994). De wetenschapper stelt dat het optimum niet altijd een maximale winst is. Het kan ook een minimaal verlies zijn in gevallen waar verlies onvermijdelijk is, waardoor het concept ‘minimax’ ontstaat.

Bij het spelen van poker kan het zoeken naar een Nash-evenwicht voordelig zijn. Dit omdat het je in staat stelt je potentiële winst te maximaliseren en je verlies te minimaliseren. Dit houdt in dat je het gedrag van de andere spelers aan tafel analyseert, anticipeert op hun mogelijke acties en je strategie hierop aanpast.

Het uitbuitende spel

In het exploitatieve spel daarentegen gaan we ervan uit dat onze tegenstanders geen GTO-strategie spelen. We gaan er ook van uit dat we het ons kunnen veroorloven om af te wijken van het optimale spel om onze winstverwachting te verbeteren. Het profiel van de tegenstander moedigt de speler aan om zijn spel aan te passen om er beter van te profiteren, bijvoorbeeld door agressief te spelen als hij te passief is, of omgekeerd, door steviger te spelen als hij agressiever wordt.

In dit spel is er geen sprake van evenwichtig spel. Voordat het begrip GTO bekend was, speelden alle pokerspelers een exploitatief spel. Het nadeel van exploitatief spel is dat het ook ‘exploiteerbaar’ is door de tegenstander.

Bluffrequentie

De theorie van bluffrequentie bestaat uit het meten en aanpassen van de frequentie waarmee een speler bluft ten opzichte van de frequentie waarmee hij handen met waarde speelt. De bluff to value-ratio is het aantal bluffende handcombinaties vergeleken met het aantal value handcombinaties in een inzetbereik.

Om de bluf/waarde-ratio te berekenen, is het belangrijk om de winstkansen van value handen en de winstkansen van bluf handen in overweging te nemen. De theoretisch optimale bluf/waarde verhouding wordt over het algemeen geschat op ongeveer 1 tot 2,33, wat betekent dat er ongeveer 1 blufcombinatie is voor elke 2,33 waardecombinaties.

De perfecte strategie?

Game Theory is een krachtig hulpmiddel om pokerstrategieën te verbeteren. Het kan gebruikt worden om strategieën te ontwerpen die onwerkbaar zijn, om optimale bluffrequenties te definiëren en om optimaal te spelen volgens de acties van andere spelers. Strategieën variëren afhankelijk van de expertise van de tegenstander en de zwakke punten die ten koste van hem kunnen worden uitgebuit. Poker-algoritmes zijn ontworpen om deze zwakke punten te modelleren en er voordeel uit te halen.

Poker zit echter nog vol mysteries en de perfecte strategie bestaat niet. Als dat wel zo was, zou dat betekenen dat het spel ‘opgelost’ is. Men zegt dat een spel wiskundig ‘opgelost’ is als het mogelijk is om altijd te winnen door een of meer vooraf gedefinieerde technieken te gebruiken. Kom meer te weten en oefen op het internet. Er zijn een heleboel gratis modules om je spel te verbeteren. Maar vergeet niet dat poker een kanselement bevat. Dat maakt het spannend!