Le «big data», ou mégadonnées, c'est l'art de tirer des informations utiles d'un immense ramassis de données, souvent non filtrées, éparses, hétérogènes, déstructurées et de provenances diverses. Là où l'oeil humain ne voit qu'un fouillis, un algorithme peut discerner une mine d'or.

«Ce n'est plus un simple buzzword, il y a un réel engouement, on est vraiment dedans», observe la présidente-directrice générale de l'Association québécoise des technologies, Nicole Martel.

«Les gens en ont parlé longtemps, mais il n'y avait pas vraiment de traction dans le marché», admet Robin Grosset, un ingénieur spécialisé dans l'analytique pour IBM à Ottawa. «Mais depuis 12 à 18 mois, ça commence à se faire pour vrai.»

«On sent vraiment l'engouement des clients», confirme Brian Cann, vice-président au marketing international chez CGI. «Ils ont des données et ils veulent les transformer en informations utiles.»

Cet intérêt se ressent dans les résultats financiers des grandes entreprises qui offrent le service à leurs clients.

«Pour nous, la transition se fait depuis environ cinq ans et les revenus de ce secteur progressent d'environ 10% par année», estime M. Cann.

Chez IBM, un pionnier du domaine, on estime à 20 milliards les revenus qui proviendront de l'analyse des mégadonnées en 2015.

Mauvais joueurs

Mais l'analyse des mégadonnées n'est pas un domaine réservé aux poids lourds. De plus en plus de jeunes entreprises s'y lancent. C'est le cas par exemple de la jeune pousse montréalaise Datacratic, qui compte maintenant une trentaine d'employés.

Le fondateur et chef des technologies de Datacratic, Jeremy Barnes, constate lui aussi l'intérêt accru des entreprises pour les mégadonnées.

«Tout le monde est tellement noyé avec le message des mégadonnées qu'il n'y a plus d'évangélisation à faire, note-t-il. Par contre, plusieurs clients ont déjà eu des projets qui ne leur ont pas vraiment livré de valeur, alors ils sont méfiants. Il y a des entreprises qui profitent de la vague et qui livrent de mauvais résultats.»

Autre difficulté: l'arrimage entre les connaissances d'affaires du client et celles en analyse du fournisseur.

«Pour bien des gens, c'est déjà difficile de savoir ce qui a bien fonctionné ou non, observe M. Barnes. Souvent, les gestionnaires ne savent même pas quelle question poser pour savoir si ça marche ou non.»

Et à l'inverse, il peut être compliqué pour une jeune entreprise versée dans l'informatique ou les mathématiques de bien saisir l'industrie dans laquelle évolue son client.

«La clé avec les mégadonnées, c'est de comprendre l'industrie et les problèmes d'affaires du client, pour cerner les informations qui peuvent avoir un impact», juge pour sa part M. Cann, de CGI.

En ce sens, de grandes entreprises comme la sienne, croit-il, sont mieux positionnées pour assurer ce lien, quitte à miser sur des solutions développées par de petits joueurs. CGI ne développe d'ailleurs généralement pas elle-même les solutions de mégadonnées qu'elle offre. Elle en assure plutôt l'intégration.

«Il y a une énorme démocratisation de cette technologie qui va se passer dans les prochaines années, à mesure que l'expertise va se développer pour comprendre comment l'intégrer dans les affaires quotidiennes de chaque entreprise», estime M. Barnes.

Quelques exemples: le parcours du coureur et le tweet du téléspectateur

Course, vélo, métro

Strava est une application mobile populaire qui aide les cyclistes et les coureurs à enregistrer leurs parcours. Mais elle ne fait pas que ça.

L'entreprise analyse les multiples données de positionnement ainsi récoltées pour offrir à des villes, notamment Londres et Glasgow, des analyses qui leur permettent de connaître les points de passage préférés de ces deux groupes et d'ainsi aménager les lieux en conséquence.

Au Québec, les créateurs de l'appli mobile Transit ont pendant quelque temps étudié un modèle d'affaires similaire. Très populaire et offert dans 87 régions métropolitaines à travers le monde, celle-ci est proposée gratuitement sur iOS et Android. Pour la rentabiliser, on a songé à vendre des «mégadonnées» aux sociétés de transport, pour leur permettre d'améliorer le service.

Malheureusement, pour l'instant, les données recueillies par l'appli Transit ne sont pas assez exhaustives.

«On sait où l'utilisateur monte parce qu'il ouvre l'appli pour connaître son trajet, mais on ne sait pas où il descend, explique Samuel Vermette. Il faudrait que l'appli continue d'accéder au GPS, mais les utilisateurs n'aimeraient pas ça.»

Sécurité informatique

L'un des contrats de CGI avec le gouvernement américain concerne la sécurité informatique des installations du Pentagone.

Un lourd mandat auquel l'analyse des mégadonnées contribue.

«Il y a 45 millions d'événements par jour sur leur réseau, explique Brian Cann, vice-président au marketing international de CGI. En les analysant en temps réel, on peut débusquer des tendances. Avant, on agissait en réaction. Là, on arrive à prévoir des attaques qu'on va recevoir.»

Tel que vu à la télé

Imaginez si, après avoir vu un produit intéressant à la télé, vous visitiez le site d'une boutique en ligne et le retrouviez, par un curieux hasard, affiché en page d'accueil.

C'est plus que possible, ça existe réellement, grâce entre autres à l'analyse des médias sociaux.

«Si un animateur présente un produit et que ça suscite une réaction sur les médias sociaux, on peut le détecter et placer le produit en accueil sur le site», explique M. Cann, de CGI.

D'autres comme lui

Si, du jour au lendemain, les sites que vous visitez commencent à vous afficher de la publicité pour une marque particulière de voiture, ce n'est peut-être pas à cause de vous. Du moins pas directement, explique Jeremy Barnes, de Datacratic.

«On peut prendre les informations de quelqu'un qui s'inscrit en ligne pour aller faire l'essai d'une voiture, déterminer son profil puis, grâce à l'analyse d'un paquet de données, retrouver d'autres individus qui ont un profil similaire et qui, donc, pourraient eux aussi être tentés par ce modèle. Plutôt que d'afficher la publicité à tous les gens dans une région donnée, on peut l'afficher seulement chez les 3 à 4% de gens les plus susceptibles de s'y intéresser.»

Assister un médecin

La technologie d'intelligence artificielle Watson, d'IBM, s'est notamment distinguée en battant des champions du jeu-questionnaire Jeopardy. Aujourd'hui, elle est mise à profit dans le domaine des mégadonnées.

IBM fait notamment la promotion de Watson Oncology, un système qui peut assister un médecin dans le diagnostic ou le traitement d'un cancer.

«Pour se tenir à la fine pointe de son art, un médecin pourrait devoir lire des publications spécialisées 150 heures chaque semaine», explique Robin Grosset, d'IBM.

C'est évidemment impossible, mais Watson peut assimiler ces informations et bien d'autres. À partir du dossier médical d'un patient, il peut en quelques secondes suggérer au médecin des tests supplémentaires, fournir une liste de traitements ou formuler des questions à poser. Dans chaque cas, le médecin peut accéder aux documents qui ont incité Watson à énoncer cette suggestion.

Deux pour un publicitaire

La jeune entreprise québécoise SeeVibes se spécialise dans l'analyse des médias sociaux pour le compte de l'industrie de la télévision.

L'une des possibilités, relativement simple, évoquée par son fondateur, Laurent Maisonnave, se déroule ainsi.

Un annonceur achète une publicité télé dans une émission qu'un téléspectateur aperçoit tout en tweetant sur sa tablette. Les algorithmes de SeeVibes détectent son tweet et permettent ensuite au même annonceur de s'afficher dans le fil Twitter du même téléspectateur. L'efficacité de ce rappel publicitaire serait ainsi multipliée, selon la théorie de SeeVibes.

Prévoir les bris

Nos recherches de cas d'utilisation de l'analyse des mégadonnées ont souvent mené vers des situations d'entretien préventif de pièces mécaniques.

En collaboration avec Microsoft, CGI a par exemple développé une solution qui permet au fabricant d'ascenseurs ThyssenKrupp de surveiller à distance ses millions d'ascenseurs installés à travers le monde et de prévoir les défectuosités en se basant sur des données amassées par des capteurs apposés à certaines composantes.

Les deux entreprises ont aussi collaboré à l'installation d'une solution semblable dans le métro de Londres.

Qui utilise les mégadonnées?

Fervents amateurs :

Commerce de détail

«Sachons que quand nous nous rendons dans un grand magasin maintenant, nous sommes surveillés», résume Nicole Martel, de l'Association québécoise des technologies. «Certains sont capables d'analyser leurs taux de conversion en temps réel, de se demander pourquoi les huit personnes qui se trouvent en ce moment dans le rayon des sous-vêtements n'achètent que six pièces, tandis que les six de la semaine dernière à la même heure en ont acheté huit.»

Que ce soit en magasin ou en ligne, le commerce de détail est aujourd'hui considéré par à peu près tous les experts interrogés comme le client le plus avide au chapitre de l'analyse des mégadonnées.

Secteur financier

Le succès de l'analyse des mégadonnées dépend de plusieurs facteurs, dont la disponibilité des données, leur fiabilité, la façon dont elles sont structurées et la possibilité de les exploiter de façon profitable.

Le secteur financier est probablement celui pour lequel tous ces critères sont les mieux remplis.

«Il y a déjà une très bonne pénétration dans ce secteur, et pas seulement auprès des négociateurs à haute fréquence, note Jeremy Barnes, de Datacratic. On s'en sert aussi pour améliorer le service et détecter la fraude.»

*

Utilisateurs émergents : l'internet des objets

Les capteurs se multiplient à une vitesse folle, que ce soit à la maison, au gymnase, dans les usines ou sur les routes, etc. Ces capteurs génèrent des masses de données qui ne demandent qu'à être analysées.

La jeune entreprise québécoise Mnubo se spécialise justement dans ce créneau. Ses algorithmes permettent déjà d'optimiser des bornes de systèmes similaires à celles de BIXI ou d'anticiper la demande d'énergie dans certains quartiers à partir de données recueillies par des thermostats intelligents.

*

Ils gagneraient à s'y mettre...

Les centres d'appels

«Il y a beaucoup à faire dans ce secteur», résume simplement M. Barnes, de Datacratic.

La médecine

L'exemple d'IBM avec Watson (voir autre onglet) n'est que l'une des nombreuses possibilités ouvertes par les mégadonnées en médecine.

«Il y a de plus en plus d'intérêt en médecine en raison des capteurs qui se multiplient, mais ça pourrait être compliqué par la réglementation», estime M. Barnes.

Les gouvernements

Leur situation financière n'est pas idéale et les projets informatiques gouvernementaux ont la réputation de rapidement s'embourber, mais l'implantation des mégadonnées s'y fait «au ralenti», selon M. Cann, de CGI.

Le secteur manufacturier

Que ce soit pour optimiser la production ou mieux gérer l'entretien de la machinerie, les manufacturiers auraient intérêt à regarder davantage du côté des mégadonnées, juge M. Cann.

Les solutions de gestion des entretiens et des bris ne sont encore adoptées que par une minorité de pionniers, estime pour sa part Robin Grosset, d'IBM.