Proposition d'ELO
-
D'un point de vue calculatoire faut modifié un peu le calcul pour prendre en compte le fait qu'on joue bcp moins de partie sur une variante (je suis pas certain qu'on arrive à un Elo qui représente quoi que ce soit, même en ne faisant qu'un ELO général par variante et pas par pays).
Faire un Elo par pays sur une variante serait un non sens total, vu que la majorité des joueurs ne joue pas plusieurs fois chaque pays sur une variante. -
C'est vrai que ça ne serait pas suffisamment représentatif au début, c'est sur, mais faut bien commencer à un moment.
Je lance l'idée pour qu'on y réfléchisse à terme, peut être le mettes en place d'ici 1 voir 2 ans, lorsqu'il y aura plus de partie jouer, et si tournoi, ça peut accélérer les choses (exemple la ligue des champions, plus de 120 parties) , mais alors en reprenant rétroactivement les parties. -
Je reviens sur le propos de Groschat concernant l'impact d'un solo sur l'ELO : "Les solo impact fortement l'ELO c'est p'tet le point négatif que je retiendrais ...".
Groschat, quel est le gain en ELO auquel tu penses pour un solo ?
J'espérais effectivement de mon côté un bond substantiel après le solo fait dans la partie Bélier 07 et j'ai été un peu déçu d'avoir seulement eu droit à un petit +19 ! ... A moins que le calcul ait été fait à partir du résultat erroné de la partie fait par ZZ dans un premier temps (et rectifié ensuite) ? -
@essaime : tu vas être très déçu. Le calcul de ELO ne prend en compte que le classement (en général indépendant du scorage). Donc ton SOLO ne t'a apporté qu'un bénéfice très faible...
-
OrangeCar a écrit :
Le calcul de ELO ne prend en compte que le classement.
Effectivement pas top.
Il faudrait une sorte d'Elo basé sur un score moyen en mélangeant les systèmes de pointage les plus utilisés. De manière générale, tous faisait ressortir le solo (sauf celui de la Diplo-Ligue, je crois), il faudrait que le solo rapporte éminemment plus.
-
essaime a écrit :
A moins que le calcul ait été fait à partir du résultat erroné de la partie fait par ZZ dans un premier temps (et rectifié ensuite) ?
Ca non, pas possible, car l’erreur était dans mon tableur qui n’alimente pas l’ELO
-
Test a écrit :
OrangeCar a écrit :
Le calcul de ELO ne prend en compte que le classement.
Effectivement pas top.
Il faudrait une sorte d'Elo basé sur un score moyen en mélangeant les systèmes de pointage les plus utilisés. De manière générale, tous faisait ressortir le solo (sauf celui de la Diplo-Ligue, je crois), il faudrait que le solo rapporte éminemment plus.
Ahahah ça à été un grand débat à l'époque de la mise en place de l'ELO (j'étais farouchement contre le fait de ne prendre que le classement, mais j'ai pas su proposer mieux
).La grosse difficulté à prendre les scores c'est qu'il faut rajouter plusieurs paramètres pour rendre comparable l'éclatement des scores.
Mathématiquement il faut que gagner une partie sur un scorage ou sur un autre donne des résultats comparable au niveau de l'ELO (de même que finir éliminé). Imaginons un très bon joueur qui aurait une espérance de point de 30% (p(x)=0.3). Si le scorage de la partie donne 100 au gagnant et 0 aux autres, y a pas de soucis. Par contre sur un scorage ou le gagnant gagne 25 pts et les autres entre 10 et 15, même en gagnant il perd de l'ELO, ce qui pose problème.
Cette équilibrage des scorages est très délicat à faire (mes exemples peuvent sembler extrême, mais sont en fait assez proche d'un C-diplo et d'une diplo ligue). Cela dis si quelqu'un à une méthode je suis preneur...
J'avais testé des méthodes basé sur une réduction des scores (au sens mathématique de réduire via l'écart-type) mais c'était assez peu probant.
J'avais testé 2-3 autres bidouilles que j'ai oublié depuis aussi ^^Pour ce qui est du cas d'essaime je suis un peu étonné, le gain me parait plus faible qu'une victoire classique, tout dépend de l'ELO avant le début de partie et du nb de partie, mais généralement c'est plutôt entre +180/+200 quand on a une dizaine de partie avec le pays il me semble (de mémoire il me semble que Wolland avait eu un gain bcp plus fort lors de son solo, de mémoire + 360 là où une victoire sur une 1er partie tourne autour de 270, mais faudrait vérifier).
-
Il y avait clairement un bug sur le calcul du ELO pour les solo (pour les solo uniquement).
Je viens de le corriger (merci groschat) et rectifier le classement en conséquence.Sur la table en question dans laquelle essaime fait un solo on a maintenant ceci :
``
time_creation_str=25-04-2023 23:00:58 GMT game_name=Astrocup2023_Belier_Qualif_07 classic=False
game_scoring_name=WNAM
solo_threshold=17
ratings={'Allemagne': 18, 'Autriche': 5, 'Italie': 4, 'Turquie': 4, 'Russie': 2, 'France': 1, 'Angleterre': 0}
pseudo_table={'Angleterre': 'Coyote_Leader', 'France': 'ZebulonZirbou', 'Allemagne': 'essaime', 'Italie': 'Elric_S', 'Autriche': 'Jean_De_Dreux', 'Russie': 'Warguy', 'Turquie': 'Abydos'}
score_table={'Allemagne': 82, 'Autriche': 0, 'Italie': 0, 'Turquie': 0, 'Russie': 0, 'France': 0, 'Angleterre': 0}
ranking_table={'Allemagne': 1, 'Autriche': 2, 'Italie': 2, 'Turquie': 2, 'Russie': 2, 'France': 2, 'Angleterre': 2}
expected_table={'Angleterre': 0.1527297803697758, 'France': 0.20670855105278244, 'Allemagne': 0.25172059345662423, 'Italie': 0.058444364944016024, 'Autriche': 0.10341955745620324, 'Russie': 0.08319747511563699, 'Turquie': 0.14377967760496133}
performed_table={'Allemagne': 0.4127870887647424, 'Autriche': 0.09786881853920959, 'Italie': 0.09786881853920959, 'Turquie': 0.09786881853920959, 'Russie': 0.09786881853920959, 'France': 0.09786881853920959, 'Angleterre': 0.09786881853920959}
Effect :
Coyote_Leader(Angleterre) -> delta = -49.059415116983836 so elo changes from 1478.0568041916515 to 1428.9973890746676
ZebulonZirbou(France) -> delta = -79.99720339747604 so elo changes from 1629.2483766067767 to 1549.2511732093005
essaime(Allemagne) -> delta = 134.16839059166244 so elo changes from 1790.7823780311028 to 1924.9507686227653
Elric_S(Italie) -> delta = 30.908771618631757 so elo changes from 1219.26622244174 to 1250.1749940603718
Jean_De_Dreux(Autriche) -> delta = -4.555768966122536 so elo changes from 1349.0541982360112 to 1344.4984292698887
Warguy(Russie) -> delta = 12.94012489959103 so elo changes from 1293.5737981468521 to 1306.513923046443
Abydos(Turquie) -> delta = -39.368561648882114 so elo changes from 1454.6422660381452 to 1415.273704389263Ce qui compte est de faire une différence entre "expected" (attendu) et "performed" (réalisé). -
groschat a écrit :
Pour ce qui est du cas d'essaime je suis un peu étonné, le gain me parait plus faible qu'une victoire classique, tout dépend de l'ELO avant le début de partie et du nb de partie, mais généralement c'est plutôt entre +180/+200 quand on a une dizaine de partie avec le pays il me semble (de mémoire il me semble que Wolland avait eu un gain bcp plus fort lors de son solo, de mémoire + 360 là où une victoire sur une 1er partie tourne autour de 270, mais faudrait vérifier).
Après vérification j'avais un mauvais souvenir Woland avait bien fait que +280 (soit une victoire seule).
Mathématiquement du coup un solo est bien considéré comme une simple victoire. Autant pour moi. -
Waouh ! Je n'en attendais pas tant. Je n'imaginais même pas qu'une modification serait envisagée. Mon message n'était qu'une remarque suite à la phrase de Groschat concernant l'influence importante d'un solo sur l'ELO que je n'avais pas vraiment observé pour cette partie. Du coup, je présente toutes mes excuses à mes six partenaires de la partie qui vont sûrement voir leur ELO descendre si le mien monte...
-
essaime a écrit :
Waouh ! Je n'en attendais pas tant. Je n'imaginais même pas qu'une modification serait envisagée. Mon message n'était qu'une remarque suite à la phrase de Groschat concernant l'influence importante d'un solo sur l'ELO que je n'avais pas vraiment observé pour cette partie. Du coup, je présente toutes mes excuses à mes six partenaires de la partie qui vont sûrement voir leur ELO descendre si le mien monte...
Pour le coup ton elo ne va pas monter
(mais celui de tes adversaires étaient mal calculé : ils étaient classés de la 2e à la 7e places comme s'il n'y avait pas de solo)Mais pour le coup ça m'a donné l'occasion de remettre le nez dans les calculs de l'elo et de faire quelques retours constructifs à Jérémie sur le calcul (en particulier sur la prise en compte des éliminations multiples), donc merci essaime de cette remarque

Et peut être une modification du paramètre D (qui détermine en gros l’étalement des elo sur le temps long, plus D est grand plus les scores d'elo au fil du temps vont s'éloigner, ce qui ne faut pas confondre avec le K qui détermine la vitesse de variation à court terme de l'ELO, l'amplitude des oscillations si on veut).
-
Donc mon ELO ne va pas changer mais celui de mes partenaires de la partie va baisser ?! Je ne sais plus où me mettre !...
Une question quand même à laquelle je n'ai pas trouvé de réponse : pour cette partie (Bélier 07) la colonne dernier changement indique +19(+134). A quoi correspondent ces deux nombres et quelle relation y a t-il entre eux (à part un rapport d'environ 7) -
Pas nécessairement baisser, certains vont monter et d'autre baisser (en fait c'est déjà fait
). Y avait juste une erreur dans le calcul qui faisait que le 2e au nombre de centres était considéré comme 2e, le 3e au nb de centre 3e ... Alors qu'en fait ils sont tous égalité (à la 2e place égalité à 6 dans le calcul).Pour être tout à fait exacte il reste une coquille, si tu regarde l'extrait qu'à posté Jérémie, Warguy et Elric_S ont leur Elo qui grimpe suite à la partie alors qu'ils subissent un solo ... pas très logique ^^
Le premier nombre correspond à l'évolution de ton Elo général et le second entre parenthèse à l'évolution de ton elo pour le pays en question (donc 7 fois plus à l'arrondi près, vu que l'elo général est la moyenne des 7 elos)
-
groschat a écrit :
Pour être tout à fait exacte il reste une coquille, si tu regarde l'extrait qu'à posté Jérémie, Warguy et Elric_S ont leur Elo qui grimpe suite à la partie alors qu'ils subissent un solo ... pas très logique ^^
Pas une coquille.
En quelques sorte, Warguy et Elric_S étaient tellement en dessous de essaime avant le début de la partie que c'est pour eux un "bon" résultat".
Je vous renvoie aux spécifications du calcul du ELO. Seul le classement compte, essaime premier, les autres deuxième. -
OrangeCar a écrit :
groschat a écrit :
Pour être tout à fait exacte il reste une coquille, si tu regarde l'extrait qu'à posté Jérémie, Warguy et Elric_S ont leur Elo qui grimpe suite à la partie alors qu'ils subissent un solo ... pas très logique ^^
Pas une coquille.
En quelques sorte, Warguy et Elric_S étaient tellement en dessous de essaime avant le début de la partie que c'est pour eux un "bon" résultat".
Je vous renvoie aux spécifications du calcul du ELO. Seul le classement compte, essaime premier, les autres deuxième."10. Un perdant est un joueur qui a obtenu la marque minimale sur la
partie, il ne doit pas gagner de points (cela provoque un avertissement)" -
En effet !
- je vais vérifier dans le code pourquoi l'avertissement n'a pas été affiché, j'ai du oublier ce point, je vais corriger je pense
- je vais faire évoluer le document de spécification pour attribuer un partage 1 pour le solo et 0 pour les autres sur le 'performed_table' qui correspond à la "vraie" victoire
- je vais modifier le code pour prendre en compte le point précédent.
- je vais mesurer et publier les impacts
-
OrangeCar a écrit :
- je vais faire évoluer le document de spécification pour attribuer un partage 1 pour le solo et 0 pour les autres sur le 'performed_table' qui correspond à la "vraie" victoire
A mon sens il faut généraliser le n=0 pour tous joueurs éliminés. Aujourd'hui on a le même problème que sur les solos sur les parties avec plusieurs éliminations. par exemple si on a 3 joueurs éliminés, l'elo considère qu'il partage la 5e place et donc qu'ils ont une performance de 0.04 alors qu'ils ont été éliminé. Alors que si y a un seul joueur éliminé il a logiquement une perf de 0.
-
ne prendre en compte que le classement c'est choisir un scoring par defaut
assez catastrophique le il n' y aucun sens a etre 6e bdevant le 7e par contre avoir 2c au lieu d'un fait sens
un compromis a minima pourrait etre de tenir compte de deux parametre
1/ le classement (en mettant en avant la victoire)
2/ les centres et oui c'est un indicateur tres pertinantpeut etre meme faut il reduire le classement au seul fait de topper
1/ la victoire et l'elimination
2/ les centressi on donne 50% a chacun de ses deux critere on obtiens un compromis qui me parait faire sens
-
C'est marrant (ou pas) je suis à la fois d'accord et pas d'accord avec ta proposition.
Je trouve que ta proposition de mixage des critères est plus intéressante que ce qui est fait actuellement, mais au final qu'elle que soit le choix de mixage on conserve le biais principale : on choisi un scorage par défaut, qui peut être très long de celui de la partie, ce qui implique un double "but" dans les parties, celui d'optimiser son score et celui d'optimiser son ELO. Et ça fondamentalement ça me dérange (j'insiste sur le fait que c'est déjà le cas aujourd'hui).
Ta réflexion m’amène à une autre idée de solution (plus complexe mathématiquement parlant, mais qui permettrait potentiellement de résoudre les deux gros défaut soulever : conserver l'esprit du scorage de la partie et que les parties (avec différents scorages) restent comparable entre elles.
Un système de scorage n'est jamais qu'au fond qu'un mixage de un ou plusieurs mécanismes parmis :-Le nb de centres
-Le classement
-La victoire
-La proximité à la victoire (l'écart en centre avec le 1er, où par extension l'éloignement en centre du 2e quand on est 1er)
-Le nombre de joueurs éliminés (même si très peu utilisé par chez nous)
-L'élimination (un joueur éliminé marque x pts)
-Le solo (un joueur qui fait un solo marque x pts)
(j'en oublie peut être)On pourrait donc approximer les scorages existant comme étant une combinaison de 1 ou plusieurs de ses mécanismes, par exemple le score diplo ligue (au doigt mouiller) est composé de 80% de classement et 20 % de victoire. Le win Namur de 50% de centres, de 20 % de proximité à la victoire et de 30% de victoire (toujours au doigt mouiller).
A partir de là si on peut définir des "scorage elo" pour chacun des mécanismes qui reste comparable entre eux (c'est à dire qu'ils permettent le bon fonctionnement de l'elo dans les cas extrêmes, ce que ne permettent pas le scorage diplo-ligue ou win-namur par exemple). Alors on pourra calcule le résultat n de la partie en mixant les "scorage elo" en proportion du mixte du scorage de la partie.
Expliqué comme ça, ça peut sembler incroyablement compliqué pour pas grand chose, mais ça devrait permettre de résoudre les deux problématiques évoqués plus haut : les parties seront (sauf erreur de ma part et sous réserve de bon "scorage elo") bien comparé par l'elo et l'esprit du scorage choisi sur la partie sera bien pris en compte dans l'elo.
Merci Lei pour la fertilisation des idées

-
Pas con en effet !
Sinon, plutôt que de chercher une approximation à tous les scoring possibles, est-ce qu'il serait possible de savoir quelle est la répartition du scoring utilisé pour toutes les parties ? Si on en a que 2 ou 3 qui sortent, on peut peut être trouver une fa on de "normaliser" les résultats pour ces 3 scoring donnés et tant pis pour les 5 à 10% à la marge ?