Règle générale, pour atteindre nos objectifs d'affaires, nous devons mettre en oeuvre une séquence de décisions menant à des actions qui auront un impact, petit ou grand, sur le bon déroulement de nos activités commerciales. Cette capacité à générer des succès dépend de multiples facteurs qui influencent la nature des résultats. Pour les secteurs du transport, du divertissement et de la finance, l'intelligence artificielle joue un rôle fondamental en matière de prise de décision. Comment? Grâce à l'apprentissage par renforcement.

Qu’est-ce qu’un XTRA?

XTRA est une section qui regroupe des contenus promotionnels produits par ou pour des annonceurs.

L'apprentissage par renforcement (reinforcement learning) permet d'évaluer des résultats successifs. L'accumulation de ces résultats alimente la plateforme de Stradigi AI qui, dès lors, peut améliorer ses performances, jusqu'à l'atteinte d'objectifs préalablement fixés, en se basant sur ses propres décisions. Voyons, concrètement, comment ça marche.

Transport : plus rapide, plus efficace

Vous souhaitez réduire les temps de déplacement d'un endroit à un autre? Pour y parvenir, la plateforme de Stradigi AI est en mesure d'expérimenter, d'analyser, puis d'optimiser chacune des étapes d'un itinéraire, selon ces actions possibles : aller vers la droite, la gauche, l'avant ou encore rebrousser chemin.

L'itinéraire

« L'apprentissage par renforcement va tenir compte de la géographie, de la météo, de l'historique de circulation, de la période de la journée ou encore des zones de construction, pour générer des résultats optimaux », souligne Carolina Bessega, cofondatrice de Stradigi AI, société de 120 employés, majoritairement actifs depuis le siège social, au centre-ville de Montréal. « En fait, l'idée est de créer la meilleure séquence d'actions à prendre dans un environnement donné », résume-t-elle.

Au feu!

Toujours en transport, nous savons qu'un contrôle inefficace des feux de circulation peut causer des pertes (de patience!) et une surconsommation (inutile) d'énergie. Or, le recours à l'intelligence artificielle, par le truchement d'une plateforme dotée d'apprentissage par renforcement comme celle de Stradigi AI, peut améliorer le contrôle, donc l'efficacité des flux de circulation, grâce à la collecte de données en temps réel.

L'apprentissage profond prendra en considération un ensemble de scénarios de trafic complexe pour générer une prise de décision stratégique optimisant le comportement des feux. « La récompense suprême est de constater, tant du côté des conducteurs que des responsables des opérations, la réduction considérable du temps d'attente entre les cycles », souligne Carolina Bessega.  

Contenus et publicité

Dans les domaines de l'information et de la publicité, l'idée consiste à capter et à optimiser l'intérêt d'un internaute à l'égard de contenus web, par exemple un article ou une annonce publicitaire. Rien de nouveau à première vue : il est évidemment possible de recommander des contenus en fonction du profil et de l'historique de chaque utilisateur. Or, l'apprentissage par renforcement peut aller plus loin, par exemple en apportant des ajustements en fonction des commentaires.

Aussi, sachant que les taux de clics sur les publicités sont souvent bas, les retours réels varient considérablement. Dans ce contexte, le traitement d'un ensemble de données peut impliquer et générer un grand nombre de scénarios d'interaction entre un client et un site web, pour ainsi créer des contenus et des propositions ultraspécifiques, donc encore plus attrayants et captivants.  

Finance

Dans un texte précédent, nous avons expliqué comment il était possible de prédire certains comportements boursiers grâce au recours à l'apprentissage automatique. Sachant qu'il est possible de savoir si le coût d'une action est porté à croître ou à décroître, l'apprentissage par renforcement peut ensuite jouer un rôle crucial si on rattache à l'action une stratégie boursière. La prise de décision générée par intelligence artificielle entre ici en scène, en activant un « agent » capable d'apprendre et d'appliquer une politique transactionnelle optimale.

« Les actions possibles sont acheter, vendre ou garder une action, dans un environnement fort complexe, celui de la finance, où les facteurs externes, l'historique des cours et les indicateurs économiques sont nombreux », explique Carolina Bessega, l'une des trente personnes à détenir un doctorat dans son entreprise. Selon elle, l'agent actif propulsé par Stradigi AI doit donc pouvoir comprendre, par exemple, les compromis à faire entre des opérations trop importantes affectant le marché, ou encore le paiement trop fréquent de commissions élevées. « Il est même possible de lui attribuer des caractéristiques liées à notre tolérance au risque », souligne-t-elle.

Ainsi concilié à l'apprentissage profond, l'apprentissage par renforcement se transforme en un outil redoutablement performant pour résoudre rapidement, et efficacement, quantité de problèmes du monde réel. Visiblement, la prise de décision stratégique ne sera plus ce qu'elle était.

Découvrez les solutions intégrées de Stradigi AI

Contactez-nous