Il y a deux ans, une équipe de chercheurs de l'Université de l'Indiana a découvert qu'en analysant des millions de messages sur Twitter, elle pouvait prévoir le comportement de l'indice Dow Jones. L'an dernier, à la conférence SXSW, au Texas, la vice-présidente de Google, Marissa Meyer, a expliqué à son auditoire que les entreprises de crédit peuvent prévoir le divorce d'un couple en étudiant ses relevés de dépenses.

Nous vivons dans un monde d'information et nos appareils électroniques ont multiplié par plusieurs millions la quantité de données produites à notre sujet. Vous craignez de laisser des traces lorsque vous naviguez dans l'internet? Au Media Lab du MIT, un groupe de recherche du département de dynamique humaine (Human Dynamics) a constaté que notre téléphone intelligent en révèle beaucoup plus sur nous.

Pendant deux ans, 60 familles ont accepté d'utiliser un téléphone Android fourni par le professeur Alex Pentland et son équipe. Ces téléphones étaient munis de capteurs et de logiciels conçus expressément aux fins de l'expérience, et fournissaient entre autres, des données sur leurs déplacements et leurs dépenses. «Nous voulions étudier plusieurs champs pour comprendre comment nos réseaux peuvent influencer nos comportements, explique Nadav Aharony, diplômé en génie et candidat au doctorat du MIT, rencontré dans les locaux du Media Lab l'automne dernier. Nous nous sommes intéressés aux déplacements physiques des gens, à leurs relations avec les autres, à leur état d'esprit, à leur santé, à leurs achats. Les participants devaient remplir des questionnaires sur leur poids, leurs habitudes alimentaires, leurs opinions, etc. À partir des informations recueillies, nous avons pu comprendre beaucoup de choses.»

À l'heure actuelle, plusieurs grandes entreprises explorent les données concernant leurs clients afin d'affiner leur stratégie de vente. C'est le cas des géants de la téléphonie cellulaire qui sont en mesure de prévoir à quel moment un client changera de fournisseur de services à partir de certaines données recueillies sur son téléphone.

Mais l'exploration des données fournies par les téléphones Android des participants à l'étude du Media Lab en a révélé bien plus. Non seulement les informations compilées par les chercheurs en disaient beaucoup sur les habitudes d'un participant à l'heure des repas (mangeait-il seul ou avec des amis, bio ou restauration rapide?), mais elles donnaient aussi des indications sur le parcours d'une opinion politique, l'état de santé mentale d'un individu et même sur la progression d'un rhume au sein d'un groupe de personnes donné!

Des informations précieuses, donc, qui feraient le bonheur de bien des entreprises, agences gouvernementales et partis politiques...

«Face à toutes ces données, nous nous sommes demandé si nous pouvions en venir à prédire certains comportements, poursuit Nadav Aharony en montrant des points lumineux se déplaçant sur un écran géant situé en plein coeur d'un grand salon où les chercheurs se rencontrent pour se détendre entre deux réunions de travail. L'équipe de M. Aharony a développé un logiciel qui permet de visualiser les données, une sorte d'imagerie par résonance magnétique sociale, précise le chercheur en souriant. Nous nous demandions jusqu'à quel point le groupe peut influencer le comportement de chaque personne. Nous avons découvert que les réseaux sociaux sont plus complexes qu'ils en ont l'air. Par exemple, si on entend quelque chose, on n'ira pas nécessairement le répéter à tout le monde. Il y a des choses qui vont rester dans la famille, d'autres choses qui ne franchiront pas les frontières du groupe d'amis restreint. Autre exemple: disons que vous avez un enfant, votre vie va changer, n'est-ce pas? Allez-vous commencer à acheter de la nourriture bio ou allez-vous acheter des aliments semblables à ceux qu'achètent vos amis originaires du même pays que vous (la moitié des participants à l'étude venait de l'extérieur des États-Unis et habitait le campus)? Les données recueillies grâce à l'expérience nous ont permis de comprendre la motivation d'un comportement ainsi que d'identifier les influenceurs au sein du groupe. C'est ce qu'on appelle la contagion sociale.»

Le chercheur explique également que l'expérience du téléphone cellulaire a permis de déboulonner certaines croyances. «Par exemple, dans un questionnaire, un participant pouvait nous dire qu'il se considérait très proche de sa famille et particulièrement proche d'un ami X. Or, en analysant les données, on a remarqué qu'il n'avait pas appelé ni vu sa famille durant plusieurs mois et qu'il voyait davantage son ami Y que son ami X. Les données sont bien réelles alors que ce que l'on dit sur nous-mêmes est parfois déformé par notre volonté de projeter une image en particulier.»

La masse d'informations recueillies est tellement considérable que les chercheurs n'ont pas encore exploré toutes les hypothèses et les conclusions qui s'y trouvent. «Il s'agit d'une étude importante, la plus importante du genre, conclut Nadav Aharony. Il faudra sans doute encore un an avant d'analyser toutes les données. Et nous prévoyons qu'au moins une dizaine de thèses de doctorat émaneront des informations recueillies par notre équipe.» Entre les mauvaises mains, cette cartographie de nos faits et gestes permettrait à une entreprise de développer des outils encore plus sophistiqués pour nous encourager à consommer davantage. Difficile de ne pas entrevoir le spectre de Big Brother... Mais Nadav Aharony se fait rassurant. «Pensez plutôt à ce qu'une agence de santé publique pourrait faire avec des données comme celles-là lorsque vient le temps, par exemple, de planifier une campagne de santé publique pour inciter les gens à bouger davantage. Grâce à notre étude, on peut comprendre davantage les comportements et même les prévoir à partir de certaines informations.» Il n'y a aucun doute, les possibilités sont infinies.

***

Et la vie privée dans tout ça?

On ne peut pas parler de forage de données sans aborder la question de la vie privée et de la protection des renseignements personnels. D'autant plus qu'un grand nombre d'individus ne soupçonnent même pas la quantité d'informations qu'ils génèrent au quotidien. Que font les entreprises avec toutes les données qu'elles recueillent à notre sujet? L'équipe de recherche du Dr Pentland était très consciente de la délicatesse de l'opération surtout que les participants avaient même accepté de lui donner accès à leur compte Facebook. «Nous avons fait très attention de protéger l'identité des participants et des gens avec qui ils étaient en contact en leur attribuant un code afin de ne pas les reconnaître. Nous savions qui ils étaient, mais ils demeuraient anonymes», explique le chercheur Nadav Aharony qui, lors de notre rencontre, se préparait à aller présenter les résultats de l'étude à la conférence Ubicomp, en Chine.

«Par souci de transparence, nous avons décidé d'ouvrir les données et de les mettre à la disposition de la communauté scientifique, poursuit-il. Récemment, j'ai été en contact avec la communauté des adeptes de l'auto-quantification. C'est exactement le genre de personnes intéressées par ce type de données.» L'équipe du Dr Pentland a également conçu une application Android offerte gratuitement à ceux qui souhaitent mener une expérience semblable à celle des 130 cobayes ayant participé à l'étude du Media Lab. L'application permet de mesurer 30 catégories de données. Nous aimerions un jour demander aux utilisateurs de léguer leurs données à la science afin de pouvoir les étudier. Un don anonyme, bien entendu.»

Pour en savoir plus sur l'application: funf.media.mit.edu/