Game Theory : qu’est-ce que la théorie des jeux au poker ?
La théorie des jeux (ou Game Theory en anglais) est une branche des mathématiques qui s’intéresse aux situations dans lesquelles les décisions prises par une personne ont un impact sur la manière dont les autres personnes agissent et réagissent. Elle est souvent utilisée en économie, en science politique et même, en biologie. Au poker, cette théorie est particulièrement pertinente puisque deux joueurs, ou plus, ont des intérêts en concurrence. Comme le poker en ligne est devenu très populaire ces 20 dernières années, les joueurs se sont améliorés de façon spectaculaire, à tel point qu’il est très difficile aujourd’hui de battre le jeu de façon constante sans avoir les connaissances de la théorie du jeu dans sa poche.
La théorie de la décision optimale ou GTO
Si vous êtes attentif aux vidéos pédagogiques partagée sur le poker en ligne un sigle a dû vous frapper : GTO (Game Theory Optimal). Ce n’est pas un terme spécifique au poker, mais il y trouve toute son utilité. Il est l’aboutissement d’études commencées dès le XIXe siècle par Antoine Augustin Cournot, puis intensifiées dans les années 1920 par Ernst Zermelo et Émile Borel. Ces idées sont ensuite développées par John von Neumann, lequel publie en 1944, avec Oskar Morgenstern, l’ouvrage fondateur de la théorie des jeux : Théorie des jeux et Comportements économiques.
Ils partent du postulat que tout acteur qui prend une décision en cherchant à maximiser son gain doit savoir qu’il existe toujours une « décision optimale », c’est-à-dire une décision qui bat toutes les autres. La stratégie GTO est particulièrement utile dans les situations où l’adversaire est très compétent ou lorsque l’on joue contre des joueurs inconnus. La stratégie GTO est toujours la même quel que soit l’adversaire, puisqu’en elle-même elle est mathématiquement la meilleure et qu’il n’y a pas de parade exploitante contre elle. A court ou moyen terme, c’est la variance (soit la moyenne des coups) qui départagera les joueurs.
Le concept de minimax et l’équilibre de Nash
C’est la recherche de cet « optimum » qui a généré les années suivantes une multitude d’articles plus ou moins approfondis, avec ce qui est devenu le plus emblématique aujourd’hui, à savoir l’équilibre de Nash (du nom du prix Nobel d’économie 1994 John Forbes Nash). Le scientifique affirme que l’optimum n’est pas toujours un gain maximum. Il peut être aussi une perte minimale dans les cas où la perte est inévitable, ce qui donne le concept de « minimax ». Lorsqu’il s’agit de jouer au poker, rechercher un équilibre de Nash peut être bénéfique, car cela permet de maximiser ses gains potentiels, tout en minimisant ses pertes. Cela implique d’analyser le comportement des autres joueurs à la table, d’anticiper leurs actions possibles et d’adapter sa stratégie en conséquence.
Le jeu exploitant
A contrario, dans le jeu exploitant, on suppose que nos adversaires ne jouent pas une stratégie GTO, et que nous pouvons nous permettre de nous écarter du jeu optimal dans le but d’améliorer notre espérance de gain. Le profil adverse engage le joueur à adapter son jeu pour mieux en tirer parti, par exemple en jouant agressif s’il est trop passif, ou inversement, en jouant plus solide quand il se fait plus agressif. Dans ce jeu, il n’y a pas de notion de jeu équilibré. Avant que soit connue la notion de GTO, tous les joueurs de poker jouaient exploitant. L’inconvénient du jeu exploitant est qu’il est aussi « exploitable » par l’adversaire.
La fréquence de bluff
La théorie de la fréquence de bluff consiste à mesurer et ajuster la fréquence à laquelle un joueur bluffe par rapport à la fréquence à laquelle il joue des mains de valeur. Le ratio de bluff/value est le nombre de combinaisons de mains de bluff par rapport au nombre de combinaisons de mains de valeur dans une range de bet. Pour calculer le ratio de bluff/value, il est important de considérer les probabilités de gagner avec des mains de valeur et les probabilités de gagner avec des mains de bluff. Le ratio de bluff/value théoriquement optimal est généralement estimé à environ 1 pour 2,33, ce qui signifie qu’il y a environ 1 combinaison de bluff pour chaque 2,33 combinaisons de value.
La stratégie parfaite ?
La théorie des jeux est un outil puissant pour améliorer les stratégies de jeu au poker. Elle permet de concevoir des stratégies inexploitable, de définir des fréquences de bluff optimales et de jouer de manière optimale en fonction des actions des autres joueurs. Les stratégies varient en fonction de l’expertise de l’opposant et des faiblesses qu’il devient possible d’exploiter à ses dépens. Les algorithmes de jeu de poker sont conçus pour modéliser ces faiblesses et en tirer avantage.
Toutefois, le poker regorge encore de mystères et la stratégie parfaite n’existe pas. Dans l’affirmative, cela voudrait dire que le jeu serait « résolu ». Un jeu est dit mathématiquement « résolu » s’il est possible de toujours gagner en utilisant une ou plusieurs techniques définies à l’avance. Renseignez-vous, exercez-vous sur le net. Il existe une kirielle de modules gratuit pour améliorer votre jeu. Mais, n’oubliez pas que le poker recèle une part de hasard. C’est ce qui le rend excitant !