Système de notation Elo - Elo rating system

Arpad Elo , l'inventeur du système de notation Elo

Le système de notation Elo est une méthode de calcul des niveaux de compétence relatifs des joueurs dans les jeux à somme nulle tels que les échecs . Il porte le nom de son créateur Arpad Elo , un professeur de physique hongro-américain.

Le système Elo a été inventé à l'origine comme un système d'évaluation des échecs amélioré par rapport au système Harkness précédemment utilisé , mais est également utilisé comme système d'évaluation dans le football d'association , le football américain , le basket - ball , la Major League Baseball , le tennis de table , les jeux de société tels que le Scrabble et Diplomatie et esports , en particulier Counter Strike : Global Offensive et League of Legends .

La différence de notes entre deux joueurs sert de prédicteur de l'issue d'un match. On s'attend à ce que deux joueurs avec des notes égales qui jouent l'un contre l'autre marquent un nombre égal de victoires. Un joueur dont la note est supérieure de 100 points à celle de son adversaire devrait marquer 64% ; si la différence est de 200 points, alors le score attendu pour le joueur le plus fort est de 76%.

Le classement Elo d'un joueur est représenté par un nombre qui peut changer en fonction du résultat des parties classées jouées. Après chaque partie, le joueur gagnant prend des points au perdant. La différence entre les notes du gagnant et du perdant détermine le nombre total de points gagnés ou perdus après un match. Si le joueur le mieux noté gagne, seuls quelques points de classement seront retirés du joueur le moins bien noté. Cependant, si le joueur le moins bien noté remporte une victoire contrariée , de nombreux points de classement seront transférés. Le joueur le moins bien noté gagnera également quelques points du joueur le mieux noté en cas d'égalité. Cela signifie que ce système de notation est autocorrecteur. Les joueurs dont les notes sont trop basses ou trop élevées devraient, à long terme, faire mieux ou moins bien que le système de notation ne le prédit et ainsi gagner ou perdre des points de notation jusqu'à ce que les notes reflètent leur véritable force de jeu.

Une notation Elo est une notation comparative uniquement et n'est valable que dans le groupe de notation où elle a été établie.

Histoire

Arpad Elo était un joueur d'échecs de niveau maître et un participant actif à la Fédération des échecs des États-Unis (USCF) depuis sa fondation en 1939. L'USCF a utilisé un système d'évaluation numérique, conçu par Kenneth Harkness , pour permettre aux membres de suivre leurs progrès individuels dans termes autres que les victoires et les défaites du tournoi. Le système Harkness était raisonnablement juste, mais dans certaines circonstances, a donné lieu à des évaluations que de nombreux observateurs considéraient comme inexactes. Au nom de l'USCF, Elo a conçu un nouveau système avec une base statistique plus solide .

Le système d'Elo a remplacé les anciens systèmes de récompenses compétitives par un système basé sur l'estimation statistique. Les systèmes de notation pour de nombreux sports attribuent des points conformément à des évaluations subjectives de la « grandeur » de certaines réalisations. Par exemple, gagner un tournoi de golf important peut valoir cinq fois plus de points choisis arbitrairement que gagner un tournoi de moindre importance.

Un effort statistique, en revanche, utilise un modèle qui relie les résultats du jeu aux variables sous-jacentes représentant la capacité de chaque joueur.

L'hypothèse centrale d'Elo était que la performance aux échecs de chaque joueur dans chaque partie est une variable aléatoire normalement distribuée . Bien qu'un joueur puisse avoir des performances significativement meilleures ou pires d'un jeu à l'autre, Elo a supposé que la valeur moyenne des performances d'un joueur donné ne change que lentement au fil du temps. Elo considérait la véritable compétence d'un joueur comme la moyenne de la variable aléatoire de performance de ce joueur.

Une autre hypothèse est nécessaire car la performance aux échecs dans le sens ci-dessus n'est toujours pas mesurable. On ne peut pas regarder une séquence de mouvements et dériver un nombre pour représenter l'habileté de ce joueur. Les performances ne peuvent être déduites que des victoires, des nuls et des défaites. Par conséquent, si un joueur gagne un match, il est supposé avoir joué à un niveau supérieur à celui de son adversaire pour ce match. Inversement, si le joueur perd, il est supposé avoir joué à un niveau inférieur. Si le jeu est un match nul, les deux joueurs sont supposés avoir joué à peu près au même niveau.

Elo n'a pas précisé à quel point deux performances devraient être proches pour aboutir à un match nul par opposition à une victoire ou une défaite. Et alors qu'il pensait qu'il était probable que les joueurs puissent avoir des écarts types différents de leurs performances, il a fait une hypothèse simplificatrice du contraire.

Pour simplifier encore plus le calcul, Elo a proposé une méthode simple d'estimation des variables de son modèle (c'est-à-dire la véritable compétence de chaque joueur). On pourrait calculer relativement facilement à partir de tableaux combien de jeux les joueurs devraient gagner en comparant leurs notes à celles de leurs adversaires. Les notes d'un joueur qui a gagné plus de matchs que prévu seraient ajustées à la hausse, tandis que celles d'un joueur qui a gagné moins que prévu seraient ajustées à la baisse. De plus, cet ajustement devait être linéairement proportionnel au nombre de victoires par lequel le joueur avait dépassé ou n'avait pas atteint son nombre prévu.

D'un point de vue moderne, les hypothèses simplificatrices d'Elo ne sont pas nécessaires car la puissance de calcul est peu coûteuse et largement disponible. Plusieurs personnes, notamment Mark Glickman , ont proposé d'utiliser des machines statistiques plus sophistiquées pour estimer les mêmes variables. D'autre part, la simplicité de calcul du système Elo s'est avérée être l'un de ses plus grands atouts. À l'aide d'une calculatrice de poche, un compétiteur d'échecs averti peut calculer à un point près quelle sera sa prochaine note officiellement publiée, ce qui contribue à promouvoir l'impression que les notes sont justes.

Mettre en œuvre le schéma d'Elo

L' USCF a mis en œuvre les suggestions d'Elo en 1960, et le système a rapidement été reconnu comme étant à la fois plus juste et plus précis que le système de notation Harkness . Le système d'Elo a été adopté par la Fédération mondiale des échecs (FIDE) en 1970. Elo a décrit son travail en détail dans le livre The Rating of Chessplayers, Past and Present , publié en 1978.

Des tests statistiques ultérieurs ont suggéré que les performances aux échecs ne sont presque certainement pas distribuées comme une distribution normale , car les joueurs les plus faibles ont de plus grandes chances de gagner que le modèle d'Elo ne le prédit. Par conséquent, l'USCF et certains sites d'échecs utilisent une formule basée sur la distribution logistique . Des anomalies statistiques significatives ont également été trouvées lors de l'utilisation de la distribution logistique aux échecs. La FIDE continue d'utiliser le tableau des différences de notation proposé par Elo. Le tableau est calculé avec une espérance 0 et un écart type 200.

Les points de distribution normale et logistique sont, en quelque sorte, des points arbitraires dans un spectre de distributions qui fonctionneraient bien. En pratique, ces deux distributions fonctionnent très bien pour un certain nombre de jeux différents.

Différents systèmes de notation

L'expression "cote Elo" est souvent utilisée pour désigner la cote d'échecs d'un joueur telle que calculée par la FIDE. Cependant, cet usage est déroutant et trompeur car les idées générales d'Elo ont été adoptées par de nombreuses organisations, y compris l'USCF (avant la FIDE), de nombreuses autres fédérations nationales d'échecs, l'éphémère Professional Chess Association (PCA) et des serveurs d'échecs en ligne, y compris le Internet Chess Club (ICC), Free Internet Chess Server (FICS) et Yahoo! Jeux. Chaque organisation a une mise en œuvre unique, et aucune d'entre elles ne suit précisément les suggestions originales d'Elo. Il serait plus exact de parler de toutes les cotes ci - dessus comme évaluations ELO et aucun d'entre eux comme la elo.

Au lieu de cela, on peut se référer à l'organisation qui accorde la notation. Par exemple : "En août 2002, Gregory Kaidanov avait une cote FIDE de 2638 et une cote USCF de 2742." Les cotes Elo de ces différentes organisations ne sont pas toujours directement comparables, car les cotes Elo mesurent les résultats au sein d'un pool fermé de joueurs plutôt que des compétences absolues. Il existe également des différences dans la manière dont les organisations mettent en œuvre les notations Elo.

Notations FIDE

Pour les meilleurs joueurs, la note la plus importante est leur note FIDE . La FIDE a publié les listes suivantes :

  • De 1971 à 1980, une liste par an a été publiée.
  • De 1981 à 2000, deux listes par an ont été publiées, en janvier et juillet.
  • De juillet 2000 à juillet 2009, quatre listes par an ont été publiées, début janvier, avril, juillet et octobre.
  • De juillet 2009 à juillet 2012, six listes par an ont été publiées, début janvier, mars, mai, juillet, septembre et novembre.
  • Depuis juillet 2012, la liste est mise à jour mensuellement.

L'analyse suivante de la liste de notation FIDE de juillet 2015 donne une idée approximative de ce que signifie une notation FIDE donnée en termes de classement mondial :

  • 5323 joueurs avaient une note active comprise entre 2200 et 2299, qui est généralement associée au titre Candidate Master .
  • 2869 joueurs avaient une note active comprise entre 2300 et 2399, qui est généralement associée au titre FIDE Master .
  • 1420 joueurs avaient une cote active entre 2400 et 2499, dont la plupart avaient soit le titre International Master soit le titre International Grandmaster .
  • 542 joueurs avaient une cote active entre 2500 et 2599, dont la plupart avaient le titre de Grand Maître International .
  • 187 joueurs avaient une cote active entre 2600 et 2699, tous ayant le titre de Grand Maître International .
  • 40 joueurs avaient une cote active entre 2700 et 2799.
  • 4 joueurs avaient une note active de plus de 2800. ( Magnus Carlsen a été noté 2853, et 3 joueurs ont été notés entre 2814 et 2816).

La note la plus élevée jamais enregistrée par la FIDE était de 2882, que Magnus Carlsen avait sur la liste de mai 2014. Une liste des joueurs les mieux notés de tous les temps est disponible sur Comparaison des meilleurs joueurs d'échecs à travers l'histoire .

Évaluation des performances

1,00 +800
0.99 +677
0,9 +366
0,8 +240
0,7 +149
0,6 +72
0,5 0
0,4 −72
0,3 −149
0,2 −240
0,1 -366
0,01 −677
0,00 -800

La cote de performance est une cote hypothétique qui résulterait des matchs d'un seul événement seulement. Certaines organisations d'échecs utilisent "l'algorithme de 400" pour calculer l'évaluation des performances. Selon cet algorithme, la note de performance d'un événement est calculée de la manière suivante :

  1. Pour chaque victoire, ajoutez la note de votre adversaire plus 400,
  2. Pour chaque défaite, ajoutez la cote de votre adversaire moins 400,
  3. Et divisez cette somme par le nombre de parties jouées.

Exemple : 2 victoires, 2 défaites

Cela peut être exprimé par la formule suivante :

Exemple : si vous battez un joueur avec une cote Elo de 1000,

Si vous battez deux joueurs avec une cote Elo de 1000,

Si vous dessinez,

Il s'agit d'une simplification, mais elle offre un moyen facile d'obtenir une estimation de PR (performance rating).

Cependant, la FIDE calcule la note de performance au moyen de la formule : Moyenne de la note des opposants + Différence de note. La différence de classement est basée sur le score en pourcentage du tournoi d'un joueur , qui est ensuite utilisé comme clé dans une table de recherche où est simplement le nombre de points marqués divisé par le nombre de parties jouées. A noter qu'en cas de score parfait ou nul est de 800. Le tableau complet se trouve dans le Manuel de la FIDE, B. Commissions permanentes, 02. Règlement de rating FIDE (Commission de qualification), Règlement de rating FIDE en vigueur depuis le 1er juillet 2017 , 8.1a en ligne. Une version simplifiée de ce tableau se trouve à droite.

Catégories de tournois FIDE

Catégorie Note moyenne
Le minimum Maximum
14 2576 2600
15 2601 2625
16 2626 2650
17 2651 2675
18 2676 2700
19 2701 2725
20 2726 2750
21 2751 2775
22 2776 2800
23 2801 2825

La FIDE classe les tournois en catégories selon la note moyenne des joueurs. Chaque catégorie est large de 25 points de notation. La catégorie 1 est pour une note moyenne de 2251 à 2275, la catégorie 2 est de 2276 à 2300, etc. Pour les tournois féminins, les catégories sont inférieures de 200 points, donc une catégorie 1 est une note moyenne de 2051 à 2075, etc. La plus élevée Le tournoi classé a été classé dans la catégorie 23, avec une moyenne de 2801 à 2825. Les meilleures catégories sont dans le tableau.

Évaluations en direct

La FIDE met à jour sa liste de notations au début de chaque mois. En revanche, les « évaluations en direct » non officielles calculent l'évolution des évaluations des joueurs après chaque match. Ces classements en direct sont basés sur les classements FIDE publiés précédemment, de sorte que le classement en direct d'un joueur est censé correspondre à ce que serait le classement FIDE si la FIDE publiait une nouvelle liste ce jour-là.

Bien que les cotes en direct ne soient pas officielles, l'intérêt s'est manifesté pour les cotes en direct en août/septembre 2008, lorsque cinq joueurs différents ont pris le classement « Live » n° 1.

Les évaluations en direct non officielles des joueurs de plus de 2700 ont été publiées et maintenues par Hans Arild Runde sur le site Web Live Rating jusqu'en août 2011. Un autre site Web, 2700chess.com , est maintenu depuis mai 2011 par Artiom Tsepotan , qui couvre également les 100 meilleurs joueurs. comme les 50 meilleures joueuses.

Les changements de notation peuvent être calculés manuellement à l'aide du calculateur de changement de notation FIDE. Tous les meilleurs joueurs ont un facteur K de 10, ce qui signifie que la variation maximale des notes d'un seul jeu est d'un peu moins de 10 points.

Notes de la Fédération des échecs des États-Unis

La United States Chess Federation (USCF) utilise sa propre classification des joueurs :

  • 2400 et plus : Senior Master
  • 2200-2399 : Maître national
    • 2200-2399 plus 300 jeux au-dessus de 2200 : Original Life Master
  • 2000-2199 : Expert ou candidat maître
  • 1800-1999 : Classe A
  • 1600-1799 : Classe B
  • 1400-1599 : Classe C
  • 1200-1399 : Classe D
  • 1000-1199 : Classe E
  • 800-999 : Classe F
  • 600-799 : Classe G
  • 400-599 : Classe H
  • 200-399 : Classe I
  • 100-199 : classe J

Le facteur K utilisé par l'USCF

Le facteur K , dans le système d'évaluation de l'USCF, peut être estimé en divisant 800 par le nombre effectif de parties sur lesquelles la notation d'un joueur est basée ( N e ) plus le nombre de parties que le joueur a terminé dans un tournoi ( m ).

Étages de notation

L'USCF maintient un plancher de notation absolu de 100 pour toutes les notations. Ainsi, aucun membre ne peut avoir une note inférieure à 100, quelle que soit sa performance lors d'événements sanctionnés par l'USCF. Cependant, les joueurs peuvent avoir des planchers de notation absolue individuels plus élevés, calculés à l'aide de la formule suivante :

où est le nombre de parties classées gagnées, le nombre de parties classées tirées au sort et le nombre d'événements au cours desquels le joueur a terminé trois parties classées ou plus.

Des planchers de notation plus élevés existent pour les joueurs expérimentés qui ont obtenu des notes importantes. De tels planchers de notation plus élevés existent, à partir de notations de 1200 par incréments de 100 points jusqu'à 2100 (1200, 1300, 1400, ..., 2100). Un plancher de notation est calculé en prenant la note maximale établie du joueur, en soustrayant 200 points, puis en arrondissant au plancher de notation le plus proche. Par exemple, un joueur qui a atteint une note maximale de 1464 aurait une note plancher de 1464 - 200 = 1264, qui serait arrondie à 1200. Selon ce schéma, seuls les joueurs de classe C et plus sont capables d'avoir une note plus élevée. plancher que leur cote absolue de joueur. Tous les autres joueurs auraient un plancher d'au plus 150.

Il existe deux manières d'obtenir des planchers de notation plus élevés que dans le cadre du schéma standard présenté ci-dessus. Si un joueur a atteint la cote Original Life Master, sa cote plancher est fixée à 2200. La réalisation de ce titre est unique en ce qu'aucun autre titre reconnu de l'USCF n'entraînera un nouveau plancher. Pour les joueurs dont le classement est inférieur à 2000, gagner un prix en espèces de 2 000 $ ou plus augmente le plancher de classement de ce joueur au niveau de 100 points le plus proche qui aurait disqualifié le joueur pour sa participation au tournoi. Par exemple, si un joueur gagnait 4 000 $ dans un tournoi de 1750 ans et moins, il aurait désormais une cote plancher de 1800.

Théorie

Les comparaisons par paires constituent la base de la méthodologie de notation Elo. Elo a fait référence aux articles de Good, David, Trawinski et David, et Buhlman et Huber.

Détails mathématiques

La performance n'est pas mesurée de manière absolue ; il est déduit des victoires, des pertes et des matchs nuls contre d'autres joueurs. Les notes des joueurs dépendent des notes de leurs adversaires et des résultats obtenus contre eux. La différence de note entre deux joueurs détermine une estimation du score attendu entre eux. La moyenne et la répartition des notes peuvent être choisies arbitrairement. Elo a suggéré d'échelonner les notes de sorte qu'une différence de 200 points d'évaluation aux échecs signifierait que le joueur le plus fort a un score attendu (qui est essentiellement un score moyen attendu) d'environ 0,75, et l'USCF visait initialement à ce qu'un joueur de club moyen ait un cote de 1500.

Le score attendu d' un joueur est sa probabilité de gagner plus la moitié de sa probabilité de tirer. Ainsi, un score attendu de 0,75 pourrait représenter 75 % de chances de gagner, 25 % de chances de perdre et 0 % de chances de tirer. À l'autre extrême, cela pourrait représenter 50 % de chances de gagner, 0 % de chances de perdre et 50 % de chances de tirer. La probabilité de tirer, par opposition à avoir un résultat décisif, n'est pas spécifiée dans le système Elo. Au lieu de cela, un match nul est considéré comme une moitié de victoire et une moitié de défaite. En pratique, étant donné que la véritable force de chaque joueur est inconnue, les scores attendus sont calculés en utilisant les notes actuelles du joueur comme suit.

Si le joueur A a une note de et le joueur B une note de , la formule exacte (en utilisant la courbe logistique ) pour le score attendu du joueur A est

De même, le score attendu pour le joueur B est

Cela pourrait aussi s'exprimer par

et

où et . Notez que dans ce dernier cas, le même dénominateur s'applique aux deux expressions, et il est clair que . Cela signifie qu'en étudiant uniquement les numérateurs, nous découvrons que le score attendu pour le joueur A est fois supérieur au score attendu pour le joueur B. Il s'ensuit que pour chaque 400 points d'avantage sur l'adversaire, le score attendu est amplifié dix fois par rapport au score attendu de l'adversaire.

Lorsque les scores réels d'un joueur en tournoi dépassent ses scores attendus, le système Elo considère cela comme une preuve que la note du joueur est trop basse et doit être ajustée à la hausse. De même, lorsque les scores réels d'un joueur en tournoi sont inférieurs aux scores attendus, la note de ce joueur est ajustée à la baisse. La suggestion originale d'Elo, qui est encore largement utilisée, était un simple ajustement linéaire proportionnel au montant par lequel un joueur a surperformé ou sous-performé son score attendu. L'ajustement maximum possible par jeu, appelé facteur K, a été fixé à K = 16 pour les maîtres et K = 32 pour les joueurs plus faibles.

Supposons que le joueur A devait marquer des points mais qu'il en ait en fait marqué . La formule pour mettre à jour le classement de ce joueur est

Cette mise à jour peut être effectuée après chaque match ou chaque tournoi, ou après toute période de classement appropriée. Un exemple peut aider à clarifier. Supposons que le joueur A a une cote de 1613 et joue dans un tournoi en cinq rondes. Ils perdent contre un joueur classé 1609, font match nul avec un joueur classé 1477, battent un joueur classé 1388, battent un joueur classé 1586 et perdent contre un joueur classé 1720. Le score réel du joueur est (0 + 0,5 + 1 + 1 + 0 ) = 2,5. Le score attendu, calculé selon la formule ci-dessus, était (0,51 + 0,69 + 0,79 + 0,54 + 0,35) = 2,88. Par conséquent, la nouvelle note du joueur est (1613 + 32 (2,5 - 2,88)) = 1601, en supposant qu'un facteur K de 32 est utilisé. De manière équivalente, à chaque jeu, on peut dire que le joueur a mis une ante de K fois son score attendu pour le jeu dans un pot, le joueur adverse fait de même, et le gagnant récupère le pot complet de valeur K ; en cas d'égalité, les joueurs se partagent le pot et reçoivent K/2 points chacun.

Notez que même si deux victoires, deux défaites et un match nul peuvent sembler être un score normal, c'est pire que prévu pour le joueur A car ses adversaires étaient en moyenne moins bien notés. Par conséquent, le joueur A est légèrement pénalisé. Si le joueur A avait marqué deux victoires, une défaite et deux nuls, pour un score total de trois points, cela aurait été légèrement meilleur que prévu, et la nouvelle note du joueur aurait été (1613 + 32 (3 − 2,88)) = 1617.

Cette procédure de mise à jour est au cœur des notations utilisées par la FIDE , l' USCF , Yahoo! Games , l' Internet Chess Club (ICC) et le Free Internet Chess Server (FICS). Cependant, chaque organisation a emprunté une voie différente pour faire face à l'incertitude inhérente aux notations, notamment les notations des nouveaux arrivants, et pour faire face au problème de l'inflation/déflation des notations. Les nouveaux joueurs se voient attribuer des cotes provisoires, qui sont ajustées plus radicalement que les cotes établies.

Les principes utilisés dans ces systèmes de notation peuvent être utilisés pour noter d'autres compétitions, par exemple des matchs de football internationaux .

Les cotes Elo ont également été appliquées aux jeux sans possibilité de match nul , et aux jeux dans lesquels le résultat peut également avoir une quantité (petite/grande marge) en plus de la qualité (gagnant/perte). Voir l' évaluation Go avec Elo pour en savoir plus.

Modèle de distribution le plus précis

La première préoccupation mathématique abordée par l'USCF était l'utilisation de la distribution normale . Ils ont constaté que cela ne représentait pas avec précision les résultats réels obtenus, en particulier par les joueurs les moins bien notés. Au lieu de cela, ils sont passés à un modèle de distribution logistique , qui, selon l'USCF, correspondait mieux aux résultats réels obtenus. La FIDE utilise également une approximation de la distribution logistique.

Facteur K le plus précis

La deuxième préoccupation majeure est le "facteur K" correct utilisé. Le statisticien des échecs Jeff Sonas pense que la valeur originale K=10 (pour les joueurs évalués au-dessus de 2400) est inexacte dans le travail d'Elo. Si le coefficient du facteur K est défini trop grand, il y aura trop de sensibilité à quelques événements récents, en termes d'un grand nombre de points échangés à chaque match. Et si la valeur K est trop faible, la sensibilité sera minimale et le système ne répondra pas assez rapidement aux changements du niveau réel de performance d'un joueur.

L'estimation originale du facteur K d'Elo a été réalisée sans bénéficier d'énormes bases de données et de preuves statistiques. Sonas indique qu'un facteur K de 24 (pour les joueurs évalués au-dessus de 2400) peut être plus précis à la fois comme outil prédictif des performances futures, et également plus sensible aux performances.

Certains sites d'échecs sur Internet semblent éviter un échelonnement du facteur K à trois niveaux en fonction de la plage de notation. Par exemple, l'ICC semble adopter un K=32 global sauf lorsqu'il joue contre des joueurs classés provisoirement.

L'USCF (qui utilise une distribution logistique par opposition à une distribution normale ) échelonnait auparavant le facteur K selon trois plages de notation principales de :

  • Joueurs en dessous de 2100 : facteur K de 32 utilisé
  • Joueurs entre 2100 et 2400 : facteur K de 24 utilisé
  • Joueurs au-dessus de 2400 : facteur K de 16 utilisé.

Actuellement, l'USCF utilise une formule qui calcule le facteur K en fonction de facteurs tels que le nombre de parties jouées et la note du joueur. Le facteur K est également réduit pour les joueurs les mieux notés si l'événement a des contrôles de temps plus courts.

La FIDE utilise les plages suivantes :

  • K = 40, pour un joueur nouveau dans la liste de classement jusqu'à la fin des événements avec un total de 30 jeux et pour tous les joueurs jusqu'à leur 18e anniversaire, tant que leur classement reste inférieur à 2300.
  • K = 20, pour les joueurs avec une cote toujours inférieure à 2400.
  • K = 10, pour les joueurs dont la cote publiée est d'au moins 2400 et au moins 30 matchs joués lors d'événements précédents. Par la suite, il reste en permanence à 10.

La FIDE utilisait les plages suivantes avant juillet 2014 :

  • K = 30 (était 25), pour un joueur nouveau dans la liste de classement jusqu'à la fin des événements avec un total de 30 matchs.
  • K = 15, pour les joueurs avec une cote toujours inférieure à 2400.
  • K = 10, pour les joueurs dont la cote publiée est d'au moins 2400 et au moins 30 matchs joués lors d'événements précédents. Par la suite, il reste en permanence à 10.

La gradation du facteur K réduit les changements de notation à l'extrémité supérieure du spectre des notations, réduisant ainsi la possibilité d'inflation ou de déflation rapide des notations pour ceux dont le facteur K est faible. Cela pourrait en théorie s'appliquer également à un site d'échecs en ligne ou à des joueurs hors jeu, car il est plus difficile pour les joueurs d'obtenir des notes beaucoup plus élevées lorsque leur facteur K est réduit. Lorsque vous jouez en ligne, c'est peut-être simplement la sélection d'adversaires bien notés qui permet à plus de 2800 joueurs d'augmenter encore leur note, puisqu'un grand maître sur le site de jeu ICC peut jouer une série d'adversaires différents qui sont tous notés plus de 2700. les événements sur le plateau, ce ne serait que dans les événements all-play-all de très haut niveau qu'un joueur serait en mesure d'engager ce nombre de 2700+ adversaires, tandis que dans un tournoi d'échecs ouvert normal à paires suisses, il y aurait souvent de nombreux les adversaires ont noté moins de 2500, réduisant les gains de notes possibles d'un seul concours.

Questions pratiques

Activité de jeu par rapport à la protection de sa cote

Dans certains cas, le système de notation peut décourager l'activité de jeu pour les joueurs qui souhaitent protéger leur notation. Afin de décourager les joueurs de s'asseoir sur une note élevée, une proposition de 2012 du grand maître britannique John Nunn pour choisir les qualifiés pour le championnat du monde d'échecs incluait un bonus d'activité, à combiner avec la note.

Au-delà du monde des échecs, les inquiétudes concernant les joueurs évitant le jeu compétitif pour protéger leurs notes ont amené Wizards of the Coast à abandonner le système Elo pour les tournois Magic: the Gathering en faveur d'un système de leur propre conception appelé "Planeswalker Points".

Appariement sélectif

Un problème plus subtil est lié à l'appariement. Lorsque les joueurs peuvent choisir leurs propres adversaires, ils peuvent choisir des adversaires avec un risque minimal de perdre et une récompense maximale pour la victoire. Des exemples particuliers de joueurs notés 2800+ choisissant des adversaires avec un risque minimal et une possibilité maximale de gain de notation incluent : choisir des adversaires qu'ils savent qu'ils peuvent battre avec une certaine stratégie ; choisir des adversaires qu'ils pensent être surestimés ; ou éviter de jouer des joueurs forts qui sont notés plusieurs centaines de points en dessous d'eux, mais peuvent détenir des titres d'échecs tels que IM ou GM. Dans la catégorie du choix d'adversaires surévalués, les nouveaux entrants dans le système de notation ayant joué moins de 50 parties sont en théorie une cible commode car ils peuvent être surévalués dans leur notation provisoire. L'ICC compense ce problème en attribuant un facteur K inférieur au joueur établi s'il gagne contre un nouveau participant au classement. Le facteur K est en fait fonction du nombre de jeux notés joués par le nouveau participant.

Par conséquent, les cotes Elo en ligne offrent toujours un mécanisme utile pour fournir une cote basée sur la cote de l'adversaire. Sa crédibilité globale, cependant, doit être considérée dans le contexte d'au moins les deux problèmes majeurs décrits ci-dessus - l'abus de moteur et l'appariement sélectif d'adversaires.

L'ICC a également récemment introduit des classements « d'appariement automatique » qui sont basés sur des appariements aléatoires, mais chaque victoire consécutive garantit un adversaire statistiquement beaucoup plus difficile qui a également remporté x matchs d'affilée. Avec potentiellement des centaines de joueurs impliqués, cela crée certains des défis d'un grand événement suisse majeur qui est férocement disputé, avec des vainqueurs de manche rencontrant des vainqueurs de manche. Cette approche de l'appariement maximise certainement le risque de notation des participants les mieux notés, qui peuvent faire face à une opposition très vive de la part de joueurs de moins de 3000, par exemple. Il s'agit d'une évaluation distincte en elle-même, qui relève des catégories d'évaluation « 1 minute » et « 5 minutes ». Les cotes maximales atteintes au-dessus de 2500 sont exceptionnellement rares.

Notes d'inflation et de déflation

Graphiques des probabilités et des changements de notation Elo (pour K = 16 et 32) du résultat attendu (courbe pleine) et du résultat inattendu (courbe en pointillés) par rapport à la différence de notation initiale. Par exemple, le joueur A commence avec une cote de 1400 et B avec 1800 dans un tournoi utilisant K  = 32 (courbes brunes). La ligne bleue tiret-point indique la différence de notation initiale de 400 (1800 - 1400). La probabilité que B gagne, le résultat attendu, est de 0,91 (intersection de la courbe noire pleine et de la ligne bleue) ; si cela se produit, la note de A diminue de 3 (intersection de la courbe brune pleine et de la ligne bleue) à 1397 et celle de B augmente du même montant à 1803. Inversement, la probabilité que A gagne, le résultat inattendu, est de 0,09 (intersection de courbe et ligne bleue); si cela se produit, la cote de A augmente de 29 (intersection de la courbe en pointillé marron et de la ligne bleue) à 1429 et celle de B diminue du même montant jusqu'à 1771.

Le terme « inflation », appliqué aux cotes, est destiné à suggérer que le niveau de force de jeu démontré par le joueur classé diminue au fil du temps ; à l'inverse, la « déflation » suggère que le niveau progresse. Par exemple, s'il y a inflation, une cote moderne de 2500 signifie moins qu'une cote historique de 2500, alors que l'inverse est vrai s'il y a déflation. L'utilisation des notes pour comparer les joueurs entre différentes époques est rendue plus difficile lorsque l'inflation ou la déflation sont présentes. (Voir aussi Comparaison des meilleurs joueurs d'échecs à travers l'histoire .)

En analysant les listes de notation FIDE au fil du temps, Jeff Sonas suggère que l'inflation peut avoir eu lieu depuis 1985 environ. Sonas examine les joueurs les mieux notés, plutôt que tous les joueurs notés, et reconnaît que les changements dans la distribution des notes pourraient avoir été causés par une augmentation du niveau de jeu aux plus hauts niveaux, mais cherche également d'autres causes.

Le nombre de personnes avec des notes supérieures à 2700 a augmenté. Vers 1979, il n'y avait qu'un seul joueur actif ( Anatoly Karpov ) avec une note aussi élevée. En 1992, Viswanathan Anand n'était que le 8e joueur de l'histoire des échecs à atteindre la barre des 2700 à ce moment-là. Ce nombre est passé à 15 joueurs en 1994. 33 joueurs avaient une cote de 2700+ en 2009 et 44 en septembre 2012. La référence actuelle pour les joueurs d'élite se situe au-delà de 2800.

Une cause possible de cette inflation était le plancher de notation, qui était pendant longtemps à 2200, et si un joueur tombait en dessous de ce seuil, il était rayé de la liste de notation. En conséquence, les joueurs à un niveau de compétence juste en dessous du plancher ne figureraient sur la liste de classement que s'ils étaient surestimés, ce qui les amènerait à ajouter des points au pool de classement. En juillet 2000, la note moyenne des 100 meilleurs était de 2644. En juillet 2012, elle était passée à 2703.

À l'aide d'un puissant moteur d'échecs pour évaluer les coups joués dans les parties entre joueurs classés, Regan et Haworth analysent des séries de parties de tournois classés par la FIDE et tirent la conclusion qu'il y a eu peu ou pas d'inflation de 1976 à 2009.

Dans un système Elo pur, chaque jeu se termine par une transaction égale de points de classement. Si le gagnant gagne N points de classement, le perdant perdra N points de classement. Cela empêche les points d'entrer ou de sortir du système lorsque les jeux sont joués et notés. Cependant, les joueurs ont tendance à entrer dans le système en tant que novices avec une note faible et à se retirer du système en tant que joueurs expérimentés avec une note élevée. Par conséquent, à long terme, un système avec des transactions strictement égales a tendance à entraîner une déflation de notation.

En 1995, l'USCF a reconnu que plusieurs jeunes joueurs scolaires s'amélioraient plus rapidement que le système de notation n'était capable de suivre. En conséquence, les joueurs établis avec des notes stables ont commencé à perdre des points de classement au profit des joueurs jeunes et sous-estimés. Plusieurs des joueurs les plus anciens étaient frustrés par ce qu'ils considéraient comme une baisse de notation injuste, et certains ont même abandonné les échecs à ce sujet.

Combattre la déflation

En raison de la différence significative dans le moment où se produisent l'inflation et la déflation, et afin de lutter contre la déflation, la plupart des implémentations des notations Elo disposent d'un mécanisme pour injecter des points dans le système afin de maintenir les notations relatives au fil du temps. La FIDE a deux mécanismes inflationnistes. Tout d'abord, les performances en dessous d'un "plancher de notation" ne sont pas suivies, donc un joueur avec une vraie compétence en dessous du plancher ne peut être que non noté ou surestimé, jamais correctement noté. Deuxièmement, les joueurs établis et mieux notés ont un facteur K inférieur. Les nouveaux joueurs ont un K  = 40, qui tombe à K  = 20 après 30 parties jouées, et à K  = 10 lorsque le joueur atteint 2400. Le système actuel aux États-Unis comprend un système de points bonus qui alimente le système en points de classement en afin de suivre l'amélioration des joueurs et différentes valeurs K pour différents joueurs. Certaines méthodes, utilisées en Norvège par exemple, différencient les juniors des seniors et utilisent un facteur K plus important pour les jeunes joueurs, augmentant même la progression de la note de 100 % lorsqu'ils obtiennent un score bien supérieur à leur performance prévue.

Les planchers de notation aux États-Unis fonctionnent en garantissant qu'un joueur ne descendra jamais en dessous d'une certaine limite. Cela combat également la déflation, mais le président du comité de notation de l'USCF a critiqué cette méthode car elle ne donne pas de points supplémentaires aux joueurs qui s'améliorent. Un motif possible pour ces étages de notation est de lutter contre les sacs de sable, c'est-à-dire la baisse délibérée des notes pour être éligible aux sections et aux prix des classes de notation inférieures.

Évaluations des ordinateurs

Les matchs d'échecs homme-ordinateur entre 1997 ( Deep Blue contre Garry Kasparov ) et 2006 ont démontré que les ordinateurs d'échecs sont capables de vaincre même les joueurs humains les plus forts. Cependant, les cotes des moteurs d'échecs sont difficiles à quantifier, en raison de facteurs variables tels que le contrôle du temps et le matériel sur lequel le programme s'exécute. Les listes d'évaluation des moteurs publiées telles que CCRL sont basées sur des jeux de moteur uniquement sur des configurations matérielles standard et ne sont pas directement comparables aux évaluations FIDE.

Pour certaines estimations de notes, voir Moteur d'échecs § Notes .

Utilisation en dehors des échecs

Sports athlétiques

Le système de notation Elo est utilisé dans la partie échecs de la boxe d'échecs . Pour être éligible à la boxe d'échecs professionnelle, il faut avoir une cote Elo d'au moins 1600, ainsi qu'avoir participé à 50 matchs ou plus de boxe amateur ou d'arts martiaux.

Le football universitaire américain a utilisé la méthode Elo dans le cadre de ses systèmes d'évaluation de la série de championnats de bols de 1998 à 2013, après quoi le BCS a été remplacé par le College Football Playoff . Jeff Sagarin de USA Today publie les classements des équipes pour la plupart des sports américains, qui incluent les classements du système Elo pour le football universitaire. L'utilisation de systèmes de notation a été effectivement abandonnée avec la création du College Football Playoff en 2014 ; les participants au CFP et ses jeux de boules associés sont choisis par un comité de sélection.

Dans d'autres sports, les individus maintiennent des classements basés sur l'algorithme Elo. Ceux-ci ne sont généralement pas officiels et ne sont pas approuvés par l'instance dirigeante du sport. Le World Football Elo Ratings est un exemple de la méthode appliquée au football masculin . En 2006, les cotes Elo ont été adaptées pour les équipes de la Ligue majeure de baseball par Nate Silver , puis de Baseball Prospectus . Sur la base de cette adaptation, les deux ont également fait des simulations de Monte Carlo basées sur Elo des chances de voir les équipes se qualifier pour les séries éliminatoires. En 2014, Beyond the Box Score, un site SB Nation , a introduit un système de classement Elo pour le baseball international.

Dans le tennis, l'Universal Tennis Rating (UTR) basé sur Elo classe les joueurs à l'échelle mondiale, quels que soient leur âge, leur sexe ou leur nationalité. Il s'agit du système de notation officiel des principales organisations telles que l' Intercollegiate Tennis Association et World TeamTennis et est fréquemment utilisé dans les segments de Tennis Channel . L'algorithme analyse plus de 8 millions de résultats de matchs de plus de 800 000 joueurs de tennis dans le monde. Le 8 mai 2018, Rafael Nadal – ayant remporté 46 sets consécutifs dans des matchs sur terre battue – avait un UTR sur terre battue presque parfait de 16,42.

L'un des rares classements basés sur Elo approuvés par l'instance dirigeante d'un sport est le Classement mondial féminin de la FIFA , basé sur une version simplifiée de l'algorithme Elo, que la FIFA utilise comme système de classement officiel pour les équipes nationales de football féminin .

Depuis la première liste de classement après la Coupe du Monde de la FIFA 2018 , la FIFA a utilisé Elo pour son classement mondial de la FIFA .

En 2015, Nate Silver, rédacteur en chef du site Web de commentaires statistiques FiveThirtyEight , et Reuben Fischer-Baum ont produit des évaluations Elo pour chaque équipe et saison de la National Basketball Association jusqu'à la saison 2014. En 2014, FiveThirtyEight a créé des évaluations et des projections de victoires basées sur Elo pour la Ligue nationale de football professionnelle américaine .

L'English Korfball Association a évalué les équipes en fonction des cotes Elo, afin de déterminer les handicaps de leur compétition de coupe pour la saison 2011/12.

Un classement basé sur Elo des joueurs de la Ligue nationale de hockey a été élaboré. La métrique hockey-Elo évalue le jeu bidirectionnel global d'un joueur : marquer ET défendre à la fois dans des situations de force égale et de jeu de puissance/sur penalty.

Rugbyleagueratings.com utilise le système de notation Elo pour classer les équipes internationales et de clubs de rugby à XV .

Autres jeux de société et de cartes

Les organisations nationales de Scrabble calculent des cotes Elo normalement distribuées, sauf au Royaume-Uni , où un système différent est utilisé. La North American Scrabble Players Association a la plus grande population évaluée de membres actifs, au nombre d'environ 2 000 au début de 2011. Lexulous utilise également le système Elo.

Le populaire First Internet Backgammon Server (FIBS) calcule les notes sur la base d'un système Elo modifié. Les nouveaux joueurs se voient attribuer une cote de 1500, avec les meilleurs humains et les robots notation par rapport à 2000. La même formule a été adoptée par plusieurs autres sites de backgammon, tels que Play65 , DailyGammon , GoldToken et VogClub . VogClub fixe la cote d'un nouveau joueur à 1600. La Fédération britannique de backgammon utilise la formule FIBS pour ses cotes nationales britanniques.

La Fédération européenne de Go a adopté un système de notation basé sur Elo, initialement lancé par la Fédération tchèque de Go.

Malgré des questions sur l'opportunité d'utiliser le système Elo pour évaluer les jeux dans lesquels la chance est un facteur, les fabricants de jeux de cartes à collectionner utilisent souvent les évaluations Elo pour leurs efforts de jeu organisé. Le DCI (anciennement Duelists' Convocation International) a utilisé les classements Elo pour les tournois de Magic: The Gathering et d'autres jeux Wizards of the Coast . Cependant, la DCI a abandonné ce système en 2012 en faveur d'un nouveau système cumulatif de "Planeswalker Points", principalement en raison de la préoccupation susmentionnée qu'Elo encourage les joueurs les mieux notés à éviter de jouer pour "protéger leur classement". Pokémon USA utilise le système Elo pour classer ses concurrents en jeu organisé TCG. Les prix pour les meilleurs joueurs dans diverses régions comprenaient des vacances et des invitations aux championnats du monde jusqu'à la saison 2011-2012, où les récompenses étaient basées sur un système de points de championnat, leur justification étant la même que celle du DCI pour Magic: The Gathering . De même, Decipher, Inc. a utilisé le système Elo pour ses jeux classés tels que Star Trek Customizable Card Game et Star Wars Customizable Card Game .

Jeux vidéo et jeux en ligne

De nombreux jeux vidéo utilisent des systèmes Elo modifiés dans le jeu compétitif. Le jeu MOBA League of Legends utilisait un système de notation Elo avant la deuxième saison de jeu compétitif. Le jeu Esports Overwatch , la base de l' organisation sportive professionnelle unique de l' Overwatch League , utilise un dérivé du système Elo pour classer les joueurs compétitifs avec divers ajustements effectués entre les saisons de compétition. Counter-Strike: Global Offensive et GO Battle League dans Pokemon Go utilise un Glicko-2 , un système Elo modifié, tandis que les ligues professionnelles extérieures pour le jeu (telles que ESEA League et Faceit ) utilisent des classements Elo. World of Warcraft utilisait également auparavant le système Glicko-2 pour faire équipe et comparer les joueurs Arena, mais utilise désormais un système similaire à TrueSkill de Microsoft . Le jeu Puzzle Pirates utilise le système de notation Elo pour déterminer le classement dans les différents puzzles. Roblox a introduit le classement Elo en 2010. Ce système est également utilisé dans FIFA Mobile pour les modes Division Rivals. Le jeu par navigateur Quidditch Manager utilise la cote Elo pour mesurer les performances d'une équipe. Un autre jeu récent pour commencer à utiliser le système de notation Elo est AirMech , qui utilise les notations Elo pour le matchmaking aléatoire/en équipe 1v1, 2v2 et 3v3. RuneScape 3 a utilisé le système Elo dans la réédition du mini-jeu du chasseur de primes en 2016. Mechwarrior Online a institué un système Elo pour son nouveau mode "Comp Queue", effectif avec le patch du 20 juin 2017.

Peu de jeux vidéo utilisent le système de notation Elo d'origine. Selon Lichess , un serveur d'échecs en ligne, le système Elo est obsolète, Glicko-2 étant désormais utilisé par de nombreuses organisations d'échecs. PlayerUnknown's Battlegrounds est l'un des rares jeux vidéo à utiliser le tout premier système Elo. Dans Guild Wars , les classements Elo sont utilisés pour enregistrer les classements de guilde gagnés et perdus lors de batailles guilde contre guilde. League of Legends a initialement utilisé le système Elo classique pour un gameplay classé, mais est passé à un système de notation unique après la troisième saison. Divers autres jeux en ligne utilisent les classements Elo pour les classements joueur contre joueur. Depuis 2005, Golden Tee Live évalue les joueurs sur la base du système Elo. Les nouveaux joueurs commencent à 2100, les meilleurs joueurs ayant une note supérieure à 3000. La valeur K initiale était de 30, mais a été modifiée à 5 en janvier 2007, puis à 15 en juillet 2009. En 1998, une échelle de jeu en ligne appelée Clanbase a été lancée, qui utilisé le système de notation Elo pour classer les équipes. Le site a ensuite été mis hors ligne en 2013. Un site alternatif similaire a été lancé en 2016 sous le nom de Scrimbase , qui utilisait également le système de notation Elo pour classer les équipes.

Malgré de nombreux jeux vidéo utilisant différents systèmes de matchmaking , il est courant que les joueurs de jeux vidéo classés se réfèrent à toutes les notes de matchmaking comme Elo .

Autre utilisation

Le système de notation Elo a été utilisé en biométrie douce , qui concerne l'identification d'individus à l'aide de descriptions humaines. Des descriptions comparatives ont été utilisées parallèlement au système de notation Elo pour fournir des « mesures relatives » robustes et discriminantes, permettant une identification précise.

Le système de notation Elo a également été utilisé en biologie pour évaluer les hiérarchies de dominance masculine, et dans l'automatisation et la vision par ordinateur pour l' inspection des tissus .

De plus, les sites de juges en ligne utilisent également le système de notation Elo ou ses dérivés. Par exemple, Topcoder utilise une version modifiée basée sur la distribution normale, tandis que Codeforces utilise une autre version basée sur la distribution logistique.

Le système de notation Elo a également été noté dans les applications de rencontres, comme dans l'application de matchmaking Tinder , qui utilise une variante du système de notation Elo.

Références dans les médias

Le système de notation Elo a figuré en bonne place dans The Social Network lors de la scène de l'algorithme où Mark Zuckerberg a publié Facemash . Dans la scène, Eduardo Saverin écrit des formules mathématiques pour le système de notation Elo sur la fenêtre du dortoir de Zuckerberg. Dans les coulisses, affirme le film, le système Elo est utilisé pour classer les filles en fonction de leur attrait. Les équations guidant l'algorithme sont montrées brièvement, écrites sur la fenêtre ; cependant, ils sont légèrement incorrects.

Voir également

Remarques

Les références

Lectures complémentaires

Liens externes