Les mathématiques dans un jeu de hasard : le poker
Publié par Zacharie Tazrout, le 12 mars 2019 26k
Il y a quelques mois, j’ai découvert un jeu fascinant qui est pourtant connu de tous : le poker. Je joue de temps en temps au poker en ligne, par moments sur de vraies tables. Mais les sensations restent quasiment les mêmes : la pression de pousser tous ses jetons, celle d’abandonner ses cartes ou de suivre une mise adverse. En rencontrant Clément Sire, chercheur en mathématiques appliquées, j’ai découvert qu’il y a énormément de phénomènes mathématiques qui se produisent dans le poker. Des phénomènes qui peuvent être utilisés pour justement améliorer sa manière de jouer. Retour sur un jeu de hasard, pas si hasardeux que ça.
Le Poker, kézako ?
En lisant cet article, vous êtes peut-être perdu. Alors voici une petite piqûre de rappel. La manière de jouer au poker la plus connue est appelée le “Texas No Limit Hold’Em”. C’est un jeu qui se joue sur une table de deux à dix joueurs.
A chaque tour, chaque joueur reçoit deux cartes qui seront cachées. Seul le joueur qui les reçoit en connaît la nature. S’en suit alors un tour de mise : chaque joueur va miser plus ou moins de jetons selon la force des deux cartes qu’il a en main (un As est la carte la plus forte, un 2 la plus faible). Ou alors il peut se coucher, abandonner le coup et jouer au prochain tour. A la fin de ce premier tour de mise, trois cartes sont mises à disposition de tous, ce sont les cartes communes. Ces cinq cartes lui donneront une combinaison plus ou moins forte (avec trois cartes identiques il sera plus fort que d’en avoir que deux par exemple). Un nouveau tour de mise débute et après celui ci, s’il reste des joueurs encore en course, une quatrième carte va être dévoilée avec un nouveau tour de mise puis une cinquième et un dernier tour de mise. A la fin, s’il reste encore des joueurs en jeu qui ne se sont pas couchés, on dévoile les jeux (5 cartes posées sur la table + 2 cartes en main). Celui qui a la meilleure combinaison de cinq cartes parmis les sept remporte les mises de tous ses adversaires.
Le poker est donc un jeu de mise, un peu comme lorsque l’on parie pour un match de football. Mais aussi un jeu de bluff : on peut faire croire par moments à ses adversaires qu’on a un jeu bon en misant pour qu’ils abandonnent le coup. Si tout le monde abandonne le coup avant la cinquième et dernière carte dévoilée, le dernier joueur encore en lice s’adjuge tous les jetons déjà misés.
J’ai découvert plusieurs stratégies en jouant au poker en ligne, liées à plusieurs phénomènes mathématiques. En interrogeant un mathématicien toulousain spécialiste sur la théorie des jeux, Clément Sire, j’ai aussi pu dégager des exemples clairs qui étayeront mes propos.
Probabilité et espérance
Le premier concept, c’est celui des “probabilités”. En recevant deux cartes en main au début du coup, il y a des mains qui nous paraissent plus fortes que d’autres. Avoir un 7 et un 2 de la même couleur est mauvais comparé à une paire de 10 par exemple. La première main a beaucoup moins de chances de trouver une tirage favorable lorsque l’on découvrira les trois cartes communes qu’une paire de 10 déjà constituée. Même si, par exemple, on tombe sur un 7 ou un 2, la paire de 10 restera tout de même plus forte qu’une paire de 7. Des tableaux ont été conçus pour les joueurs pour savoir quelles cartes sont les plus intéressantes à jouer selon la situation. C’est ce qu’on appelle une “range”.
De plus, on peut aussi compter le nombre de cartes qui peuvent améliorer notre main. C’est dû au principe “d'espérance mathématique”. C’est la somme d’argent que l’on peut esperer gagner si nous jouons une main de la même manière, en misant exactement la même somme et en effectuant les mêmes actions. Imaginons que j’ai 8 et 9 de pique en main et que sur la table, pour tout le monde, nous avons un 7 de pique, un 10 de carreau et un 2 de pique. Dans cette situation, ma main est très mauvaise mais elle peut être améliorée. En effet, si la quatrième ou la cinquième carte dévoilée par la suite est un 6 ou un valet, j’aurais une suite (6,7,8,9,10 ou 7,8,9,10,Valet) et si c’est un pique, j’aurais une couleur qui est supérieure à la suite (c’est à dire avoir cinq cartes de même symbole : pique, carreau, trèfle ou coeur). De toutes les possibilités : il y a donc 8 cartes de piques, 4 cartes de “6” et 4 cartes de “valet” qui peuvent apparaître. J’ai 16 possibilités d’améliorer mon jeu, j’ai 16 “outs”. Et ça fait quasiment 50% de chance d’améliorer son jeu. En bref : autant de chance de tomber sur pile que sur face quand on lance une pièce. C’est un “coin flip”.
Chance ou Variance
Le second concept est celui de “variance” : La variance au poker, c’est un terme abusivement utilisé pour parler de “chance”. Prenons un cas concret : j’ai une paire de rois et mon adversaire a une paire de 6. Nous décidons chacun notre tour dès le premier tour de mise, de mettre l’intégralité de nos jetons sur la table. Plus personne n’est dans le coup, il ne reste que nous deux et nous n’avons plus de jetons : le vainqueur gagnera la totalité des jetons au centre. Nous dévoilons nos jeux : le mien est nettement meilleur. Arrive les trois premières cartes communes : As, 9, 7. La quatrième carte est un 2, je gagne toujours. Voici la dernière carte : un 6. J’étais pourtant devant mon adversaire. Les probabilités me donnaient gagnant à 94% juste avant cette dernière carte. Mais pourtant, il l’emporte avec trois cartes identiques alors que je n’en ai que deux.
C’est parce que la variance nous a joué un mauvais tour. La variance, c’est une mesure utilisé par les probabilistes pour définir la dispersion des valeurs. Autrement dit, c’est une mesure qui montre TOUTES les possibilités dans une situation donnée. Et perdre alors qu’on a la meilleur main avant le tirage de la cinquième carte, c’est une situation possible bien que rare.
C’est aussi pour cela que les meilleurs joueurs de poker, même s’ils ont bien joué leur coup, peuvent se faire avoir par la variance. Les meilleurs joueurs font donc tout pour éviter cette variance et adapte leur manière de jouer. Justement pour éviter de se faire avoir.
L’équilibre de Nash
Le dernier concept est celui “d'Équilibre de Nash” : un concept très présent dans les tournois de poker. C’est par ce concept que des tableaux ont été créés. Ces tableaux dit de “push or fold” (littéralement “pousser ou se coucher”) proposent aux joueurs des mains où on peut miser l’intégralité de ses jetons et où la probabilité est assez grande pour espérer gagner plus de jetons. C’est donc combiner les deux premiers concepts de probabilités et de variance.
L’équilibre de Nash, du mathématicien John Forbes Nash (1928 - 2015), est une situation où chacun cherche à prévoir comment l’adversaire va réagir et prendre en compte cette information pour essayer de maximiser son gain.
L’exemple le plus connu est celui du dilemme du prisonnier : deux individus viennent d’être arrêtés et sont séparés. Si les deux se dénoncent mutuellement, ils écopent d’une peine d’un an de prison. Si aucun des deux se dénoncent, la peine s’alourdit à trois ans. Toutefois, on peut sortir libre si un des deux dénoncent mais pas l’autre. Ce dernier écopant de cinq ans de prison. Un dilemme qui paraît difficile aux premiers abords mais qui, après coup, semble évident : il faut toujours dénoncer. Il faut partir du fait qu’ils partent avec trois ans de prison chacun. A chaque fois qu’ils dénonceront, leur peine sera logiquement diminuée. S’il est seul à dénoncer, il est libre. Et au pire des cas, si son acolyte l’a également dénoncé, ils se retrouvent avec une seule année de prison.
Dans le poker, quand un joueur n’a plus beaucoup de jetons à sa possession, il se retrouve dans cette même situation face à son adversaire. Si ce joueur et son adversaire ne font rien, leurs nombres de jetons seront conservés. S’il mise tout et que son adversaire fait la même chose, un des deux remportera la totalité des jetons. Si un des deux mise une partie de ses jetons et que l’autre mise la totalité, si le premier se couche et ne suit pas la mise totale du second, ce dernier remporte une partie des jetons adverses et l’autre garde toutefois des jetons.
Est-ce que le poker sera résolu un jour ?
Un jeu est dit “résolu” mathématiquement s’il est possible de toujours gagner en utilisant une ou plusieurs techniques déjà définies à l’avance. Pour la variante du “Texas No Limit Hold’Em”, on est encore loin d’y arriver. Toutefois, pour une autre variante, le “Head’s up limit”, un algorithme, "Cepheus", a été inventé par des chercheurs canadiens de l’université d’Alberta. Cette intelligence artificielle a une façon de jouer qui est mathématiquement infaillible sur le long terme pour gagner au poker en “Head’s up limit”.
Cette dernière variante ne se joue qu’en duel (un contre un) et on ne peut pas miser autant que l’on souhaite. On ne peut pas miser plus qu’un montant déjà défini à l’avance et on ne peut relancer qu’une seule fois le double de ce montant. Il est tout à fait possible de jouer contre ce programme, si vous pensez pouvoir le battre…
Le poker regorge de mystères. Il ne serait pas surprenant de voir dans un futur à moyen ou long terme que la variante du “Texas No Limit Hold’Em”, la plus jouée dans le monde, soit résolue. Je reste malgré cela, un amateur de ce jeu, totalement fasciné des surprises qu’il peut encore nous réserver...
Compléments d’informations :
Le site internet de Céphéus : http://poker.srv.ualberta.ca/
Le site de Clément SIRE et ses articles sur la théorie des jeux (poker, bridge etc…) : http://www.lpt.ups-tlse.fr/spip.php?article676
Une vidéo du vidéaste Will Aime sur le dilemme du prisonnier : https://www.facebook.com/LaPageDeWilAime/videos/1333462240083114/