Ce n'est plus un secret : vos publications sur l'internet sont scrutées à la loupe par les géants du web ou les grands annonceurs. Mais saviez-vous qu'une firme de Montréal, spécialisée en intelligence artificielle, prétend pouvoir décrypter le sentiment derrière votre tout dernier tweet ? Alors que la campagne électorale bat son plein au Québec, Semeon Analytics fait le pari de prendre le pouls des électeurs, sans sondage. Explications.

Semeon Analytics publie depuis le début de la campagne des rapports présentant l'état d'esprit des électeurs à la lumière de ce qui se dégage sur les réseaux sociaux et les sites publics comme les blogues ou la section commentaires de sites de nouvelles. Ce qui est particulier, c'est que la firme s'intéresse à l'aspect qualitatif de la donnée et non seulement à l'aspect quantitatif. C'est-à-dire que Semeon, grâce à l'élaboration d'un algorithme, affirme arriver à décoder de quoi les gens parlent sur la Toile, mais surtout comment ils se sentent par rapport à telle ou telle proposition politique.

« Ce qui est le plus important, c'est de comprendre le contenu. On ne parle plus juste de trouver un mot-clé par phrase, par exemple », explique le chef de la direction technologique de Semeon, Alkis Papadoupoullos.

« Les gens, quand ils s'expriment, ils expriment des idées, alors ça donne des phrases plus longues, plus complexes à mesurer. C'est là-dessus qu'on se concentre [...]. Notre machine respecte les idées exprimées. » - Alkis Papadoupoullos

COMMENT FONCTIONNE LA BÊTE ?

Un message exprimé par un internaute n'est pas simple à décomposer, « parce que ce n'est pas binaire », indique M. Papadoupoullos. Semeon, qui se spécialise dans l'analyse « sémantique contextuelle profonde », développe depuis 2012 un algorithme capable de déchiffrer du texte en français. Le système décèle même les expressions québécoises, les fautes d'orthographe ou le sarcasme, assure l'architecte du projet.

« Un algorithme est une série d'instructions que l'on fournit à un ordinateur », explique M. Papadoupoullos. « Dans notre cas, on fournit des millions de phrases. L'instruction est de décortiquer ces phrases ; de trouver les verbes, les adjectifs. En gros, on lui demande de quoi elles parlent. On arrive à voir les idées, les concepts qui se dégagent de l'échantillon. »

Grâce à leur analyse, Semeon affirme pouvoir déterminer si la publication d'un utilisateur est associée à une émotion positive ou négative. Les émojis et l'usage des majuscules sont aussi examinés. Depuis le lancement de la campagne électorale, Semeon estime avoir « aspiré » de 300 000 à 400 000 messages sur la Toile.

DONNÉES PUBLIQUES

Pour être repérées par Semeon Analytics, les publications doivent contenir un mot-clé lié aux élections provinciales de 2018, comme le nom d'une formation politique ou celui d'un chef. Il faut aussi que le message soit public. C'est-à-dire que si vous publiez sur votre page Facebook une opinion en lien avec une proposition politique, votre publication, si elle est réservée à vos amis, ne se trouvera pas sur l'écran radar de Semeon.

« C'est important pour nous, on ne cherche pas à savoir qui a dit ça, on ne cherche pas les données privées de l'utilisateur », assure Alkis Papadoupoullos.

« On n'a jamais cherché à contourner les règles. Il faut que la publication soit publiée sur un espace public. » - Alkis Papadoupoullos

Par exercice, la firme peut passer au crible de 30 000 à 40 000 messages.

GARE AUX ROBOTS !

L'algorithme de Semeon serait aussi capable de détecter les messages envoyés par des robots, estime M. Papadoupoullos. « Le problème avec eux, c'est qu'ils doivent générer un volume important de messages pour avoir une influence. Ils n'ont pas le luxe de produire des messages élaborés. Comme notre modèle s'intéresse aux idées derrière les messages, la valeur de ce que peut produire un robot sera réduite dans nos calculs », dit-il. « Ces messages deviennent une espèce de bruit de fond qui s'élimine. »

L'opération est plus complexe lorsque vient le temps de détecter les messages de militants très actifs, par contre. On l'a vu les soirs de débat, les formations politiques sont bien organisées et s'assurent que des dizaines de membres et partisans relayent leurs messages-clés. « Si un groupe choisissait par exemple d'embaucher 100 personnes par jour pour écrire des commentaires en les variant, en changeant les thèmes, les noms, nous serions dans une situation difficile à détecter », admet M. Papadoupoullos.

« Mais ça demande un effort technique assez important. On ne voit pas de modèle ou de marqueur comme ça pour l'instant au Québec. »

PAS UNE INTENTION DE VOTE

Contrairement à un sondage, l'algorithme de Semeon ne traduit pas l'intention de vote des électeurs, mais bien leur sentiment devant les promesses ou propositions politiques. « Ce qui est intéressant, c'est qu'indépendamment des formations, on peut voir quels sont les thèmes qui viennent chercher, positivement ou non, les Québécois », explique-t-il.

Selon lui, ce genre de rapport peut devenir un « outil précieux pour saisir instantanément le pouls de l'opinion publique » sur différents enjeux. Ce qui différencie l'analyse d'un sondage, par exemple, c'est qu'aucune question n'est posée. On vient plutôt surveiller la réaction des internautes. De quoi parlent les gens ? Qu'est-ce qui retient leur attention ?

Semeon Analytics offre ses services à la grande et moyenne entreprise, mais a choisi de mettre son modèle à l'essai dans le cadre de la campagne électorale de 2018 « pour mettre de l'avant la voix du citoyen ». La firme ne compte pas de formations politiques en lice dans la présente élection parmi ses clients, a-t-elle confirmé à La Presse.

***

« UNE PHOTO » DE CE DONT ON PARLE

Le journaliste et blogueur en technologie Bruno Guglielminetti a accepté de diffuser les analyses de Semeon lors de la campagne électorale. « Dans un coup d'oeil, on voit si la semaine a été bonne ou mauvaise pour un parti ou un chef. C'est assez intéressant. On voit aussi les grands thèmes qui ressortent. C'est là que ça prend de la valeur parce que c'est bien de savoir qu'un sujet a intéressé les gens, mais de quoi ils ont parlé, c'est autre chose », explique-t-il. « Là, c'est vraiment une photo de ce dont les gens ont parlé. »

POUR ACCOMPAGNER LES « AURAS »

Voyez ci-dessous ce qui se dégage des « auras en ligne » des quatre formations politiques après le débat télévisé du 20 septembre dernier. Les messages en vert sont ceux associés à une émotion positive, ceux en rouge, au négatif et ceux en gris, à un sentiment neutre.