Comment fonctionne Comète, l’algorithme de Tennis Metrics ?

Intro


Un algorithme est la description d'une suite d'étapes permettant d'obtenir un résultat à partir d'éléments fournis en entrée. Par exemple, l’opérateur “+” est un algorithme permettant d'obtenir une somme à partir de 2 nombres ou plus. Si on lui donne 2, 5 et 7 en entrée, il nous donnera 2+5+7=14 en sortie.


Dans le cadre du pari sportif, un algorithme est souvent utilisé afin de calculer la probabilité d’issue d’un événement comme la victoire d’un joueur lors d’un match de tennis professionnel. On lui donne des paramètres comme l’état de confiance des joueurs, leur état de fatigue... Et il nous donne en sortie leur probabilité de victoire.


Et c’est exactement ce que fait Comète !


Bon ok, c’est un peu plus compliqué que ça… 👇




Histoire et création


Le développement de notre algorithme a débuté en mars 2020. Après plusieurs mois de recherche et développement, Comète est enfin né.


La création d’un algorithme de machine learning n’est pas une mince affaire. En effet, tu dois passer par 5 étapes clefs :


  1. Établir son objectif → calculer finement la probabilité de victoire d’un joueur de tennis
  2. Trouver une technologie d’intelligence artificielle pertinente pour y répondre → XGBoost
  3. Définir les paramètres qui régissent son fonctionnement → nous en avons précisément 48 (exemple : le classement ELO par surface)
  4. Déterminer et trouver les données sur lesquelles l’entrainerComète est entrainé à partir d’une base de données de 20 ans de statistiques tennis
  5. Tester ses performances sur des matchs passés → nous avons testé Comète sur les saisons 2018, 2019 et 2020




Fonctionnement


Notre algorithme utilise la technologie XGBoost, véritable star des compétitions de machine learning. Pour faire simple, XGBoost (pour eXtreme Gradient Boosting) est une implémentation open source optimisée de l’algorithme d’arbres de boosting de gradient (d’arbres de quoi 🤔 ?!).


Le boosting de gradient est un algorithme d’apprentissage supervisé dont le principe et de combiner les résultats d’un ensemble de modèles plus simples et plus faibles afin de fournir une meilleure prédiction. On parle d'ailleurs de méthode d'agrégation de modèles. L’idée est donc simple : au lieu d’utiliser un seul modèle, l’algorithme va en utiliser plusieurs qui seront ensuite combinés pour obtenir un seul résultat. Si tu veux en savoir davantage, nous te conseillons cet article.


L’idée derrière cet algorithme est que plusieurs petits algorithmes peuvent être plus performants qu’un seul grand algorithme.


Pour décrire succinctement le principe, l’algorithme travaille de manière séquentielle. Cette façon de faire va permettre à l’algorithme de s’améliorer par capitalisation par rapport aux exécutions précédentes. Il commence ainsi par construire un premier modèle qu’il va bien sûr évaluer. À partir de cette première évaluation, chaque individu va être alors pondéré en fonction de la performance de la prédiction. Etc…


XGBoost se comporte donc remarquablement dans les compétitions d’apprentissage automatique (Machine Learning), mais pas seulement grâce à son principe d’auto-amélioration séquentielle. XGBoost inclut en effet un grand nombre d’hyperparamètres qui peuvent être modifiés et réglés à des fins d’amélioration !


Ces hyperparamètres, c’est notre recette secrète. Dépendant de ce qu’on choisit, c’est la performance de l’algorithme qui est directement impactée. Il y a des milliards de possibilités. Une connaissance fine de ce sport nous a aidé à trouver une combinaison de 48 hyperparamètres parmi une infinité de possibilités. Nous pouvons vous en citer quelques-uns comme un paramètre de fatigue, un paramètre de forme du joueur à l’instant t calculé à partir du Elo ranking, ou encore… En fait, on va le garder pour nous finalement ;).


Si tu veux avoir une vue d’ensemble et facile d’accès sur les différents types d’algorithmes de machine learning, nous te conseillons vivement cet article sur les forêts d’arbres de décision.




Performances


Si la probabilité calculée par Comète s’éloigne trop de la probabilité reflétée par la cote du bookmaker, alors une opportunité de pari pointe peut-être le bout de son nez !


Notre algorithme est en fonctionnement depuis le lundi 4 janvier 2021. Et je suis sûr que tu brûles d’impatience de connaitre ses performances !


Les voici : (à date du 19 avril 2023)


👉 Nombre de matchs analysés : 10 209

👉 Pourcentage de prédictions justes : 59.97%

👉 Nombre de value bets dénichés : 602

👉 Pourcentage de réussite : 69.1%

👉 Cote moyenne des value bets : 1.54


Qu’est-ce qu’un value bet ? Lire notre article (lien à venir).




Conclusion


Les résultats de notre algorithme sont positifs malgré une année COVID 2021 difficile à gérer. Nous avons dégagé du profit, ce qui nous distingue déjà de bon nombre de concurrents (surtout si on comptabilise uniquement ceux qui sont honnêtes 👊).


Néanmoins, 2 bémols sont à souligner :


  1. Bien que très raisonnable par rapport à ce qu’il se fait sur le marché, notre volume total de paris reste encore relativement faible pour pouvoir miser exclusivement sur Comète. Laissons-le temps faire son travail.
  2. Notre cote moyenne de 1.54 traduit une stratégie plutôt averse au risque. Elle reflète un style de pari spécifique qui n’est pas forcément adapté à ton profil de joueur.


D’ailleurs, connais-tu ton profil de joueur ? C’est une information absolument indispensable à savoir avant de parier, et qui en plus évolue au cours du temps. Nous avons développé un outil de test gratuit disponible en cliquant ici (lien à venir).


Comète doit donc être pris avec des pincettes car encore jeune et pas forcément adapté à ton profil parieur. De plus, il représente ‘seulement’ un point de vue statistique, point de vue que l’être humain serait d’ailleurs incapable d’avoir tant la quantité de données analysée est immense. Par conséquent, il ne peut prendre en compte tous les paramètres nécessaires à une analyse exhaustive. Il est donc nécessaire, mais pas suffisant comme on dit dans le jargon. Il conviendrait de l’associer avec d’autres types d’analyse…


Chez Tennis Metrics, nous le combinons à 3 autres approches :


  1. Une analyse humaine établie par un expert du tennis qui étudie les profils des joueurs et la stratégie de match
  2. Un indicateur de masse qui représente la moyenne des paris pris par les parieurs du monde entier
  3. Un tracker d’évolution des cotes pour comprendre la réaction du bookmaker en fonction des sommes misées


Tu l’auras compris, nous ne sommes pas un tipster au sens classique du terme. Nous sommes une plateforme qui t’aide à prendre de meilleures décisions de pari grâce à des indicateurs qui te permettent de mesurer plus finement la probabilité réelle d’issue d’un événement, afin de la comparer à celle induite par la cote de ton bookmaker.


Bref, nous t’aidons à repérer les opportunités de paris, autrement dit, les value bets.


Pourquoi ? Parce que c’est la seule solution pour gagner. Je te l’explique ici (lien à venir) si tu n’es pas convaincu 😉.


Notre UNIQUE façon de mesurer si nous faisons du bon travail ou non est alors de suivre le nombre d’abonnés qui ont amélioré leurs résultats depuis qu’ils utilisent Tennis Metrics. Et c’est ce que nous pourrons bientôt faire grâce au développement de notre outil de gestion de bankroll…


Voilà, c'est tout pour aujourd’hui, en espérant que tu auras appris plein de choses !


La bise,



Elie de Tennis Metrics.