Elo World! ou les dessous du classement Elo

posté le 10 octobre 2022

Si vous pratiquez le jeu de société en ligne vous êtes forcément déjà tombé sur ce terme de « classement Elo ». Prenons donc un instant pour explorer ce qui se cache derrière ce concept.

La compétition est rude

Playtime ou les variances de Monsieur Elo

Il faut déjà savoir que, même si on le trouve parfois écrit en capitales, le mot « Elo » n’est pas un sigle mais bien le nom de famille de son inventeur : Arpad Elo, professeur de physique et joueur d’échec américain d’origine hongroise.

Arpad a mis au point le système qui porte son nom au début des années 1960 et celui-ci a été utilisé dès cette époque par les fédérations d’échec, d’abord états-unienne puis internationale. Il est encore pratiqué aujourd’hui, sous des formes plus ou moins adaptées, par de nombreuses associations et communautés de joueuses. Aux échecs mais aussi dans beaucoup d’autres disciplines.

Un classement pour les ordonner tous

Mais revenons aux raisons de son existence.

À la base du classement Elo on trouve une question simple : Comment mesurer le niveau respectif de deux joueuses qui ne se sont pourtant jamais rencontré ? Ou pire, qui n’ont jamais joué contre une même adversaire ?

Pour y répondre, le classement Elo associe à chaque joueuse une somme de « Points Elo », augmentée ou diminuée au fil de ses victoires et ses défaites. Le classement est ainsi mis à jour en temps réel sur la base des points de chacune. C’est jusqu’ici le même principe que ce que peut faire le tennis avec les classements ATP et WTA par exemple.

Mais la ressemblance s’arrête là. En effet les classements ATP et WTA attribuent des points forfaitairement lors des participations aux principaux tournois de la discipline et ne classent donc que les meilleures joueuses et joueurs. Le classement Elo, lui, en appelle aux probabilités et prend en considération tout type de match.

Points attribués aux joueurs masculins de tennis pour le classement ATP (source : Wikipédia)

Sans défaite, point de victoire

À la base du classement Elo, une idée simple mais encore fallait-il y penser : tous les matchs n’ont pas la même valeur ou, pour le dire autrement, tous les matchs ne nous en apprennent pas autant sur le niveau respectif des deux joueuses :

Si une Maîtresse internationale d’échecs bat une débutante, cette victoire ne nous apprend rien sur le niveau de l’un et de l’autre qu’on ne supposait déjà.
En revanche si une débutante bat une Maîtresse internationale d’échecs, on peut estimer que cette débutante est bien plus forte qu’une débutante habituelle et/ou que la championne est en perte de vitesse.

C’est pour cela que le classement Elo ne se base pas sur des forfaits de points : les points Elo attribués varient en fonction du classement respectif des joueuses. Ou plus exactement en fonction de leur différence de classement :

Une joueuse forte qui remporte le combat face à une joueuse faible remporte peu de nouveaux points Elo et son classement sera très peu modifié.
En revanche, une joueuse faible qui gagne face à une joueuse forte remporte beaucoup plus de points Elo et son classement augmentera fortement. Et inversement pour la joueuse forte qui vient de perdre.

Tout le génie du classement Elo se cache là. Tout match corrige et affine le score et le classement Elo de ses participantes !

Conséquence immédiate : plus il y a de matchs joués, plus le classement est précis.

Échecs et maths

Crevons l’abcès immédiatement, voici la formule d’attribution de points Elo suite à un match gagné aux Echecs :

Voilà c’est dit, vous l’avez vu, nous n’en parlerons plus.

Enfin pas directement mais, sans rentrer dans les détails techniques, certaines propriétés mathématiques de ce système de points sont tout-de-même intéressantes à regarder de plus près. Ne fuyez pas tout de suite !

Probable mais peu plausible

La formule Elo se base sur un calcul de probabilité de victoire et compare ensuite le résultat réel du match par rapport à la probabilité estimée en amont. C’est cet écart par rapport au résultat attendu qui déterminera le volume de points attribués.

Il faut noter d’ailleurs que seul compte l’écart de points entre les deux joueuses, pas leur classement respectif. Autrement dit une joueuse avec un classement Elo de 500 a autant de chances de l’emporter face à une joueuse à 400 points, qu’une de 350 face à une joueuse à 250 points car dans les deux cas l’écart est le même : 100 points Elo. Soit environ deux chances sur trois de victoire.

Graphique représentant la probabilité de victoire de la joueuse la mieux classée selon l'écart de points Elo

Si l’écart de points Elo est de 0, une chance sur deux de l’emporter. Si l’écart est de 200, environ trois chances sur quatre, etc.

Nul ton match

Dans le système Elo, un match nul est une source d’information et de classement. Car une bonne joueuse ne devrait pas faire un match nul contre une moins bien classée. Si c’est pourtant le cas, il faut remanier le classement.

Loi normale

En soi la valeur et la signification d’un point Elo sont totalement arbitraires. Seule la comparaison vaut. Il a bien fallu cependant choisir comment les attribuer et calculer leur variation.

Lorsqu’Arpad Elo a inventé son système, il est parti de l’hypothèse que les niveaux des joueuses étaient répartis dans ce qu’on appelle une distribution normale (une « courbe en cloche » quoi). Autrement dit qu’il y avait peu de très mauvaises joueuses, peu de très bonnes et beaucoup de niveau moyen. La formule se base sur cette distribution.

Notez que la Fédération Internationale des Echecs (la FIDE) a, empiriquement par la suite, décidé d’adapter la formule avec une distribution différente, plus adaptée à leur usage.

Coefficient multiplicateur de vélocité

La formule fait apparaître « K » un coefficient multiplicateur des points attribués, totalement arbitraire. Plus ce coefficient est élevé, plus les variations de points sont fortes. Plus il est faible, plus le classement reste figé. Là où ça devient intéressant c’est qu’il est même possible de faire varier ce paramètre selon les conditions de la partie.

Car il faut tout de même mentionner un effet de bord du système Elo : le cas des nouvelles arrivantes. En effet, de base, avant qu’une joueuse n’ait joué son premier match, il est impossible de connaître son niveau. Il faut donc lui en assigner un par défaut. Ça peut être par exemple zéro point ou la moyenne du classement.

Mais cela rend la formule d’attribution des points Elo inadaptée pour les matchs contre une nouvelle arrivante dans le classement. Les bonnes joueuses risquent de voir par exemple leur classement dégringoler pour avoir perdu face à une « fausse débutante ».

Pour contrer cela, on adapte le coefficient multiplicateur K à la situation : accélérer le gain et la perte de points lors des premières parties pour que chaque nouvelle joueuse classée atteigne plus rapidement son niveau réel. Ou à l’opposé, ralentir les gains et pertes de points de leurs adversaires. Concrètement aujourd’hui la FIDE augmente ce coefficient pour les 30 premières parties d’une joueuse et le réduit fortement pour les joueuses les mieux classées.

Inflation honnie

En dehors du classement relatif de toutes les joueuses, le classement Elo doit aussi permettre de mesurer rapidement le niveau d’une joueuse. Il faut donc veiller à ce qu’un nombre de points donné équivaut à un niveau constant. Aux échecs toujours, on devient « Grand maître international » en dépassant le seuil des 2 500 points Elo.

Pour y parvenir, les gains et pertes de points Elo suite à un match s’équilibrent : il y autant de points gagnés que de points perdus. Ainsi on évite un effet d’inflation ou déflation du point Elo qui serait causé par un volume toujours plus grand de points Elo en jeu et une variation de sa signification.

Cela implique l’existence d’un plafond pour les meilleures joueuses. Parvenue à un certain niveau, elles ne trouveront plus de joueuses mieux classées qu’elles et gagneront très peu de nouveaux points.

L’arrivée de nouvelles joueuses, qui bénéficient de plus d’un coefficient multiplicateur revu (voir ci-dessus), fait exister de nouveaux points Elo mais dilués proportionnellement au nombre de pratiquantes. J’imagine cependant que c’est un paramètre à surveiller et qui a été adapté au cours du temps dans la formule Elo.

Usages variés

En pratique, le classement Elo est toujours utilisé aujourd’hui par la FIDE comme déjà mentionné. On trouve ainsi sur le site ratings.fide.com le classement mondial du moment et le profil avec historique des parties et calculs de chacune des joueuses classées. Vous pouvez même simuler les gains et pertes de points Elo avec leur calculateur en ligne. Des heures de plaisir en perspective !

D’après Wikipédia, le système Elo et ses adaptations sont également utilisés pour trouver des adversaires de force équivalente dans les matchs multi-joueurs dans des jeux vidéo comme Clash of Clans, Rocket League, League of Legends ou encore Counter-Strike: Global Offensive.

La plateforme BGA détaille les points Elo gagnés et perdus après chaque partie. On retrouve le facteur K et la probabilité de victoire.

Côté jeu de société, il est mis en avant sur la plate-forme Board Game Arena comme déjà dit mais on le retrouve aussi en place sur l’espace de jeu en ligne de l’éditeur Days of Wonder.

Attention, chaque usage du classement Elo utilise ses propres paramètres et adaptations, il est donc vain de vouloir comparer les points Elo dans deux disciplines ou plateformes différentes.

Arnaques, crimes et choses ludiques

Comme mon chat dit toujours « l’imagination humaine est sans limite, surtout vers le pire ». Il y a toujours quelqu’un quelque part pour trouver puis exploiter la faille.

Jouer la montre

Les points Elo attribués suite à un match dépendent du nombre de points Elo des deux joueuses avant le match, ça c’est la base. Mais cela induit un biais dans le cas de parties pouvant être menées simultanément. Par exemple dans le cas du jeu en ligne.

Imaginons deux matchs d’échecs en ligne en parallèle entre deux mêmes joueuses à 1 200 points Elo, chacune remportant un des deux matchs :

L’écart de points Elo entre les deux joueuses lors du premier match est nul, l’une gagne donc 10 points (pour atteindre 1 210) et l’autre en perd 10 (1 190).
L’écart lors du second match est désormais de 20 points Elo, ce qui augmente (un peu) le nombre de points Elo attribué : la gagnante emporte 10,6 points et la perdante en perd autant.
Après les deux matchs, l’une finit à 1 200,6 points et l’autre à 1 199,4 points.

On observe donc qu’il vaut toujours mieux perdre avant de gagner plutôt que l’inverse.

Sur une seule partie l’incidence reste très faible mais sur un grand volume de parties en parallèle cela peut engendrer des différences plus significatives et altérer les comportements.

Prison break the code

C’est le moment de vous parler de Claude Bloodgood. Un prisonnier américain qui, depuis sa cellule, est devenu en 1996 le deuxième meilleur joueur d’échecs au classement national états-unien.

Note : Dans mes recherches, je n’ai pas trouvé mention exacte du classement Elo pour son histoire mais, d’après les dates et explications, il s’agit vraisemblablement de ce système ou d’un système très proche.

Monsieur Bloodgood, donc, privé de liberté ne jouait au départ que des parties par courrier. Mais il prit bientôt le parti d’enseigner les échecs à ces camarades de prison, puis les aida à se faire homologuer par la Fédération. Il organisa de nombreux matchs en prison, faisant émerger des bons joueurs qu’il rencontrait ensuite. Matchs qu’il gagnait systématiquement, sans qu’on sache encore aujourd’hui, si c’était grâce à son niveau ou par entente. Dans les faits, chacun de ses matchs lui rapportait quelques points supplémentaires, le nombre de match assurant le volume nécessaire pour grimper les échelons du classement national.

Il avait ainsi créé son propre « vivier de points Elo » personnel en vase clos ! Il avertit d’ailleurs lui-même la Fédération des dangers que représentait le classement Elo dans ce cadre. La malhonnêteté se perd.

Et à plus de deux ?

Si vous avez lu avec attention jusqu’ici, il ne vous aura pas échappé que le classement Elo est adapté aux jeux en duel mais pas prévu pour les matchs à plus de deux. Pourtant sur la plate-forme Board Game Arena on le trouve mis en place pour des jeux plus nombreux. Sorcellerie ?

L’astuce ici est de découper toute partie en une somme de duels. Ainsi si Tam, Alex et Sylia ont joué une partie de The Boss à trois et fini dans cet ordre, BGA va considérer qu’il y a en fait eu l’équivalent de trois parties à deux joueuses :

Tam-Alex gagnée par Tam
Tam-Sylia, gagnée par Tam
Alex-Sylia, gagnée par Alex

Il ne reste plus qu’à attribuer les gains et pertes de points Elo pour chacun de ces trois duels et le tour est joué.

ELOge de la compétition

Comme ce rapide tour d’horizon le montre, à partir d’une idée simple, le classement Elo est devenu l’outil par excellence du jeu compétitif. 60 ans plus tard, son usage est toujours autant d’actualité.

Plus qu’un simple outil, on pourrait même dire qu’il est devenu un symbole de la compétition. Des livres et des vidéos l’utilisent comme illustration du niveau de jeu :

Il faut dire que le système Elo bénéficie pour cela d’une complexité mathématique qui attise les conversations (critiquer le système et l’accuser de tricherie plutôt que de remettre en cause son propre niveau de jeu) et d’un nom accrocheur qui autorise tous les jeux de mot !

Elo quoi.

Sources

La page Wikipédia sur le classement Elo, riche de détails mathématiques sur le concept
La section consacrée au classement ELO dans la FAQ sur la plateforme Board Game Arena
La page d’explication du système du classement du jeu en ligne sur la plateforme de jeux en ligne de l’éditeur Days of Wonder
Une vidéo YouTube du toujours très bon ScienceEtonnante : https://www.youtube.com/watch?v=9oRDksmH0zM
Une vidéo en belge très didactique et mathématique sur le système Elo : Le système Elo : les bases – #calculudorum #2
Une conférence filmée (en anglais) lors de la Game Developer Conference : Ranking Systems: Elo, TrueSkill and your own
La page Wikipédia consacrée à Claude Bloodgood
La page Murderpedia (si si ça existe) consacrée à Claude Bloodgood

4 réponses à “Elo World! ou les dessous du classement Elo”

dreamtim dit :

14 octobre 2022 à 20:26

Bonjour, petite remarque sur l’analogie avec le classement ATP. Celui-ci regroupe les joueurs de tennis, les joueuses sont classées par la WTA.

Répondre
acariatre dit :

18 octobre 2022 à 13:03

Merci, c’est précisé dans le ticket !

Répondre
thegoodthebadandthemeeple dit :

25 octobre 2022 à 15:39

Tres bon article. Merci !

Répondre
acariatre dit :

25 octobre 2022 à 17:53

Merci beaucoup !

Répondre

Laisser un commentaire Annuler la réponse

Il est aussi possible de réagir à ce billet via Mastodon :