L’an dernier, le modèle statistique développé par l’équipe de la Science de données de La Presse avait prédit correctement la finale de l’Ouest (Stars de Dallas contre Golden Knights de Vegas) ainsi que la présence des Golden Knights en finale. Le modèle avait toutefois donné le trophée aux Bruins de Boston, finalement éliminés rapidement par les Panthers de la Floride, futurs finalistes.

Ainsi, toute l’équipe de la science de données est donc retournée à la table à dessin. Pendant des heures et des heures, elle a analysé, analysé encore et suranalysé 16 ans de statistiques. C’est Zakaria Sassioui qui a mené le projet ambitieux. Et voici donc les prédictions du modèle de La Presse pour le grand gagnant de la Coupe Stanley…

Les Hurricanes de la Caroline ! Qui battront en finale les Oilers d’Edmonton. Avec pour le carré d’as : les Stars contre les Oilers dans l’Ouest et les Panthers contre les Hurricanes dans l’Est.

INFOGRAPHIE LA PRESSE

Note : le nombre de matchs gagnés par série est inscrit par défaut et ne fait pas partie des prédictions.

Voici donc la méthodologie expliquée par Zakaria Sassioui :

« Nous avons extrait des données historiques depuis 2008 du site NHL.com concernant les performances de chaque équipe lors des matchs de saison. Nous avons croisé ces données avec les résultats des séries des 16 dernières années. Ensuite, nous avons utilisé toutes ces données pour entraîner notre modèle.

« Finalement, nous avons prédit les résultats de la Coupe Stanley en nous basant sur les performances de chaque équipe durant la saison. Le modèle ne fournit pas de pointages, mais plutôt qui a le plus de chances de gagner chaque série. »

Données utilisées pour le modèle :

  • « gamesPlayed » : Nombre total de matchs joués
  • « wins » : Nombre total de victoires
  • « losses » : Nombre total de défaites
  • « ot » : Nombre total de défaites en prolongation
  • « pts » : Nombre total de points accumulés
  • « ptPctg » : Pourcentage de points, calculé en divisant les points accumulés par le nombre maximum de points possible
  • « goalsPerGame » : Nombre moyen de buts marqués par match
  • « goalsAgainstPerGame » : Nombre moyen de buts accordés par match
  • « evGGARatio » : Ratio des buts marqués et accordés en situation de jeu à forces égales
  • « powerPlayPercentage » : Taux de réussite en supériorité numérique
  • « powerPlayGoals » : Nombre total de buts en supériorité numérique
  • « powerPlayGoalsAgainst » : Nombre total de buts accordés en infériorité numérique
  • « powerPlayOpportunities » : Nombre total d’occasions en supériorité numérique
  • « penaltyKillPercentage » : Taux de réussite en infériorité numérique
  • « shotsPerGame » : Nombre moyen de tirs effectués par match
  • « shotsAllowed » : Nombre moyen de tirs accordés par match
  • « winScoreFirst » : Pourcentage de victoires lorsque l’équipe marque le premier but
  • « winOppScoreFirst » : Pourcentage de victoires lorsque l’adversaire marque le premier but
  • « winLeadFirstPer » : Pourcentage de victoires avec une avance après la première période
  • « winLeadSecondPer » : Pourcentage de victoires avec une avance après la deuxième période
  • « winOutshootOpp » : Pourcentage de victoires en dominant l’adversaire au nombre de tirs
  • « winOutshotByOpp » : Pourcentage de victoires en étant dominé au nombre de tirs par l’adversaire
  • « faceOffsTaken » : Nombre total de mises en jeu effectuées
  • « faceOffsWon » : Nombre total de mises en jeu remportées
  • « faceOffsLost » : Nombre total de mises en jeu perdues
  • « faceOffWinPercentage » : Pourcentage de réussite des mises en jeu
  • « shootingPctg » : Pourcentage de tirs convertis en buts de l’équipe