Les Système Elo/Glicko

Les systèmes Elo & Glicko 

Origine et intérêt : Elo et Glicko viennent historiquement du monde des échecs (puis ont été adaptés à beaucoup d’autres sports).

Glicko est souvent considéré “plus fort” qu’un Elo classique parce qu’il ajoute une mesure d’incertitude (RD) : le modèle sait quand il est peu sûr (joueur inactif, peu de matchs, retour) et adapte automatiquement la prudence de ses estimations et de ses mises à jour, là où Elo dépend surtout du réglage du K-factor et/ou de pénalités manuelles.

Sur TennisUnderdog, nous utilisons deux familles de modèles de notation pour estimer la force d’un joueur à partir de ses résultats : Elo et Glicko.

Ces systèmes ne garantissent jamais un résultat : ils expriment une probabilité de victoire, utile pour comparer deux joueurs et détecter des écarts de niveau (ou de cotes).


1) Elo : une note qui s’ajuste après chaque match

Le système Elo attribue à chaque joueur un rating (une note). Après chaque match, la note évolue en fonction :

  • de l’écart de rating entre les deux joueurs,

  • du résultat (victoire/défaite),

  • et de plusieurs paramètre de réglages dont le paramètre central : le K-factor (facteur K).

Elo fixe

Dans un Elo fixe, le K-factor est constant (par ex. 32 dans des versions classiques, mais la valeur exacte dépend du modèle).

  • ✅ Simple, lisible, stable

  • ⚠️ Peut être un peu lent à s’adapter si un joueur change vite de niveau (progression, blessure, retour, etc.)

Elo dynamique

Dans un Elo dynamique, le K-factor varie selon le contexte (par exemple : plus élevé au début, puis plus faible quand la note devient plus “fiable”).

  • ✅ Plus réactif quand il faut “apprendre vite”

  • ⚠️ Plus délicat à calibrer (risque de sur-réagir sur peu de matchs car peut être agressif)

👉 Image théorique : “Elo dynamique – simulation K fixe vs K dynamique” montre typiquement qu’un K dynamique peut monter plus vite au départ que l’Elo fixe puis se stabiliser.

Probabilité de victoire : la courbe logistique

En Elo, on convertit généralement l’écart de rating en probabilité via une courbe logistique (sigmoïde) : plus l’écart est grand, plus la probabilité se rapproche de 0 ou 1.

Exemple concret :

Si un joueur a 2000 et l’autre 1800 (écart = 200), alors la probabilité théorique est d’environ 0,7597, soit ~76%.

Ça veut dire : sur 100 matchs identiques, on “s’attend” à ~76 victoires, mais rien n’empêche que le joueur à 1800 gagne sur un match donné.

👉 Image : “Elo fixe – courbe logistique” illustre cette relation.


2) Elo et tennis : l’effet des surfaces

En tennis, la performance dépend fortement de la surface : dur, terre battue, gazon, indoor.

Certaines joueuses/joueurs peuvent être bien plus forts sur une surface précise (profil “spécialiste”), d’où l’intérêt d’avoir :

  • Un Elo général (toutes surfaces),

  • Et/Ou des Elo par surface.

Blending (mélange des notes)

Une technique fréquente pour être plus proche de la réalité est le blending : on mélange une note générale et une note surface (avec un poids généralement 50/50), en théorie ça permet de capter la forme actuelle d’un joueur sans négligé sa force par surface.

3) Gestion des pénalités (Elo avancé)

Mes variantes Elo ajoutent des pénalités/ajustements (inactivité, retours, fin de carrière, comportements atypiques, etc.)
L’idée est simplement d’attribué des pénalités de points par période d’absence.

Le but est de rendre le modèle plus réaliste, mais :

  • ✅ améliore parfois la robustesse

  • ⚠️ augmente fortement la complexité de la calibration (et le risque d’effets de bord si mal calibré)


4) Glicko : Elo + une notion de “confiance” (incertitude)

Le système Glicko reprend l’idée d’un rating, mais ajoute une information essentielle : L’incertitude.

  • R : rating (la note)

  • RD (Rating Deviation) : l’incertitude sur cette note (à quel point on est sûr du rating)

Pourquoi c’est utile ?

Deux joueurs peuvent avoir le même rating, mais :

  • joueur très actif, beaucoup de matchs récents → RD faible (rating fiable)

  • joueur inactif / retour / peu de matchs → RD élevé (rating moins fiable)

👉 Résultat : Glicko peut être plus “naturel” pour gérer les retours et le manque d’historique, sans tout compenser via des pénalités manuelles.

ELO & GLICKO WTA:

ELO & GLICKO ATP:

Scroll to Top