La Machine a été humiliée il y a quelques mois. Après le fiasco de sa prédiction du gagnant du Mondial de soccer, la Belgique, sortie sans gloire dans la phase de poules, elle veut remettre les pendules à l’heure. Les séries de la LNH étaient l’occasion tout indiquée.

Toute l’équipe de la science de données de La Presse, derrière la création de la Machine, est donc retournée à la table à dessin. Pendant des heures et des heures, elle a analysé, analysé encore et suranalysé 15 ans de statistiques. C’est Zakaria Sassioui qui a mené le projet ambitieux. Et voici donc les prédictions de la Machine de La Presse pour le grand gagnant de la Coupe Stanley…

Les Bruins de Boston ! Qui battront en finale les Golden Knights de Vegas.

Avec pour dernier carré : les Stars de Dallas contre les Golden Knights dans l’Ouest et les Devils du New Jersey contre les Bruins dans l’Est.

On note au passage quelques prédictions osées, dont l’élimination des redoutables Oilers d’Edmonton dès le premier tour. On y prévoit aussi que les Maple Leafs de Toronto passeront enfin le premier tour… avant de frapper leur Waterloo contre Boston.

Et vous, que pensez-vous des prédictions de la Machine de La Presse ?

Voici donc la méthodologie expliquée par Zakaria Sassioui :

« Pour la méthodologie, nous avons extrait des données historiques depuis 2008 du site NHL.com concernant les performances de chaque équipe lors des matchs de saison*. Nous avons croisé ces données avec les résultats des séries des 15 dernières années pour ‟entraîner” la Machine.

« Notre modèle s’est ainsi entraîné sur les données des 15 dernières saisons pour apprendre à prédire les résultats des matchs de la saison actuelle. Finalement, nous avons prédit les résultats de la Coupe Stanley en nous basant sur les performances de chaque équipe cette saison. Par ailleurs, le rythme de fin de saison des Knights et des Stars semble fortement jouer dans les prédictions également. »

*Données utilisées pour le modèle :

  • « gamesPlayed » : Nombre total de matchs joués
  • « wins » : Nombre total de victoires
  • « losses » : Nombre total de défaites
  • « ot » : Nombre total de défaites en prolongation
  • « pts » : Nombre total de points accumulés
  • « ptPctg » : Pourcentage de points, calculé en divisant les points accumulés par le nombre maximum de points possible
  • « goalsPerGame » : Nombre moyen de buts marqués par match
  • « goalsAgainstPerGame » : Nombre moyen de buts accordés par match
  • « evGGARatio » : Ratio des buts marqués et accordés en situation de jeu à forces égales
  • « powerPlayPercentage » : Taux de réussite en supériorité numérique
  • « powerPlayGoals » : Nombre total de buts en supériorité numérique
  • « powerPlayGoalsAgainst » : Nombre total de buts accordés en infériorité numérique
  • « powerPlayOpportunities » : Nombre total d’occasions en supériorité numérique
  • « penaltyKillPercentage » : Taux de réussite en infériorité numérique
  • « shotsPerGame » : Nombre moyen de tirs effectués par match
  • « shotsAllowed » : Nombre moyen de tirs accordés par match
  • « winScoreFirst » : Pourcentage de victoires lorsque l’équipe marque le premier but
  • « winOppScoreFirst » : Pourcentage de victoires lorsque l’adversaire marque le premier but
  • « winLeadFirstPer » : Pourcentage de victoires avec une avance après la première période
  • « winLeadSecondPer » : Pourcentage de victoires avec une avance après la deuxième période
  • « winOutshootOpp » : Pourcentage de victoires en dominant l’adversaire au nombre de tirs
  • « winOutshotByOpp » : Pourcentage de victoires en étant dominé au nombre de tirs par l’adversaire
  • « faceOffsTaken » : Nombre total de mises en jeu effectuées
  • « faceOffsWon » : Nombre total de mises en jeu remportées
  • « faceOffsLost » : Nombre total de mises en jeu perdues
  • « faceOffWinPercentage » : Pourcentage de réussite des mises en jeu
  • « shootingPctg » : Pourcentage de tirs convertis en buts de l’équipe