Alors que notre monde numérique croule sous la masse de données, des chercheurs européens viennent de faire la démonstration de l'étonnante capacité de l'ADN synthétique à stocker des textes, des images ou des sons.

Un peu comme un disque dur est le support de l'information numérique, l'ADN stocke  l'information génétique, grâce à un code  construit à partir de quatre éléments, les nucléotides («A», «T», «C» et «G»), organisés en triplets.

L'idée d'utiliser l'ADN synthétique comme support de stockage pour suppléer aux outils actuels (DVD, disques durs, puces à mémoire flash...), fait son chemin.

En 2011, une étude publiée dans la revue Science montrait que l'ensemble des capacités de stockage informatique en 2007 représentait moins d'un pour cent de la quantité d'informations mémorisées dans les molécules d'ADN d'un seul être humain...

L'été dernier, la même revue publiait les travaux d'une équipe américaine, dirigée par le biologiste George Church, connu pour ses travaux sur la biologie synthétique : ils avaient réussi à coder 5,27 mégabits de données, dont un livre de Church, dans un milliardième de gramme d'ADN synthétisé.

Cette fois c'est une équipe de l'Institut européen de bio-informatique (EMBL-EBI), à Cambridge, qui publie mercredi dans la revue britannique Nature une nouvelle méthode pour stocker des données sous forme d'ADN.

Grain de poussière

L'équipe de Nick Goldman et Ewan Birney a tenté l'expérience sur un ensemble de fichiers, dont un enregistrement MP3 du célèbre discours de Martin Luther King «J'ai fait un rêve», un fichier texte des Sonnets de Shakespeare et, comme un clin d'oeil, un PDF de l'article de Watson et Crick sur la structure en double-hélice de l'acide désoxyribonucléique (ADN). Soit sensiblement le même volume d'informations que l'expérience américaine.

«Nous savons déjà que l'ADN est un moyen efficace pour stocker des informations, parce que nous pouvons l'extraire à partir d'os de mammouths laineux qui datent de plusieurs dizaines de milliers d'années et lui donner un sens», a expliqué Nick Goldman.

Son équipe est partie du système binaire informatique (suite de 0 et de 1), a transcrit une première fois les données en système trinaire (0, 1, 2), puis en code ADN. L'ADN a ensuite été synthétisé en laboratoire.

«Le résultat ressemble à un grain de poussière», a déclaré Emily Leproust, de la société de biotechnologie américaine Agilent qui a synthétisé l'ADN.

L'échantillon a été expédié outre Atlantique et décodé par les chercheurs de l'EBI sur des séquenceurs ADN standard. Ils ont récupéré et lu les fichiers avec une précision de 100 pour cent.

«Nous savions que nous avions besoin de faire un code en utilisant uniquement des chaînes courtes d'ADN», a expliqué Nick Goldman. Les chercheurs ont décomposé le code en de multiples fragments qui se chevauchent dans les deux sens, de façon à éliminer le risque d'erreurs.

«La seule limite (au stockage ADN, ndlr), c'est son coût», a déclaré Ewan Birney.

Les coûts de séquençage pourraient cependant être divisés par 20 d'ici une décennie, rendant le stockage ADN économiquement viable à une échéance de moins d'un demi-siècle, selon les chercheurs.

«L'ADN est incroyablement petit et dense, et sa conservation ne consomme pas d'énergie», a souligné Nick Goldman.

Chaque seconde, plus d'une heure de vidéo est mise en ligne sur Youtube. Les scientifiques sont eux-mêmes de gros pourvoyeurs de masses de données. Le grand collisionneur de hadrons (LHC), célèbre pour sa traque du boson de Higgs, amasse par exemple chaque année près de 15 pétaoctets de données, soit l'équivalent de plus de 3 millions de DVD, relevait le journal du CNRS dans son numéro de novembre-décembre.