mardi 12 février 2013

De l'ADN artificiel pour stocker des données informatiques

Des scientifiques planchent, avec succès, sur le moyen de conserver du texte, de l'image ou de la vidéo sous la forme de minuscules molécules. Explications.

Plusieurs équipes scientifiques ont récemment démontré qu'il était possible d'inscrire du texte, de l'image et même de la vidéo dans des brins d'ADN artificiel fabriqués à cet effet. Plusieurs équipes scientifiques ont récemment démontré qu'il était possible d'inscrire du texte, de l'image et même de la vidéo dans des brins d'ADN artificiel fabriqués à cet effet. © VHB / Science Photo Library
 
Qu'est-ce qui est minuscule, permet de stocker une énorme quantité d'informations complexes, manifeste une extraordinaire longévité, le tout sans consommer d'énergie ? Vous ne voyez pas... Il s'agit de l'incroyable molécule d'acide désoxyribonucléique, autrement dit ADN, qui est capable de contenir, dans sa double hélice, tout le programme génétique d'un être vivant. Imaginez maintenant l'incroyable potentiel de conservation de données qu'elle pourrait offrir si nous parvenions à lui transmettre les énormes quantités de textes, d'images, de vidéos produits par notre société accro au numérique et toujours à la merci de supports à durée de vie limitée... L'idée paraît peut-être d'avant-garde, mais elle n'est pas nouvelle et serait même en passe de devenir une réalité.
À quelques mois d'intervalle, deux équipes scientifiques, l'une américaine et l'autre britannique, sont en effet parvenues à la mettre en oeuvre avec un certain succès. La première, conduite par le célèbre généticien George Church de l'université d'Harvard - qui s'est récemment illustré en évoquant la possibilité de ressusciter l'homme de Neandertal -, a réussi à encoder un livre de 300 pages, comportant plus de 50 000 mots et une dizaine d'illustrations (soit un peu plus de cinq millions de bits). Le tout dans seulement 55 000 petits brins d'ADN pesant bien moins d'un gramme : une densité de stockage inégalée. Toutefois, l'ouvrage, restitué par séquençage, présentait quelques erreurs, d'où une fiabilité revendiquée de "seulement" 99,9 %. La seconde équipe, issue de l'European Bioinformatics Institute de l'université de Cambridge, a, quant à elle, choisi de convertir une photo haute définition, une version MP3 du célèbre discours "I have a dream" de Martin Luther King, l'article scientifique où Watson et Crick ont décrit pour la première fois la double hélice de l'ADN ainsi que l'ensemble des sonnets de William Shakespeare (soit près de six millions de bits). Mais, cette fois, plutôt que de privilégier la densité de stockage, les chercheurs se sont concentrés sur la fiabilité de l'encodage. Résultat : 115 000 brins d'ADN synthétique (environ le double de l'équipe d'Harvard), mais un sans-faute, plus aucune erreur dans les fichiers retranscrits ! Un pas de plus, en somme.

Des 0 et des 1 changés en molécules

Pour y parvenir, les scientifiques ont d'abord converti les données informatiques, suite de 0 et de 1, dans un code trinaire composé de 0, de 1 et de 2, avant de les transcrire en langage ADN. Une étape préalable qui diffère de la manip réalisée par l'équipe de George Church, qui avait conservé un système binaire. Dans un second temps, la séquence ainsi obtenue a été traduite en A, T, C ou G, correspondant aux différentes briques de base de l'ADN (adénine, thymine, cytosine et guanine), puis a été synthétisée chimiquement par un assemblage minutieux de ces composants. Compte tenu de la difficulté à produire de l'ADN en chaîne longue, l'information a été tronçonnée en fractions plus petites reprenant, à la fois, le début de la séquence précédente, la fin de la suivante et des informations sur la place de chacune dans le tout. Et, pour améliorer la conservation de ces brins reproduits à 12 millions d'exemplaires, ils ont finalement été lyophilisés, prenant l'aspect d'une simple poussière dont il suffit de séquencer l'ADN pour récupérer les données. Le concept est assez fascinant...
Pour autant, il ne faut pas s'attendre à ce que cette technique puisse remplacer disques durs, CD, DVD et cartes mémoires en une paire d'années. D'une part, parce que le coût de la synthèse puis du séquençage de l'ADN reste élevé. Ainsi l'équipe de Cambridge évalue-t-elle le coût du stockage d'un seul mégaoctet à 10 000 euros, un prix parfaitement prohibitif pour un usage courant même s'il sera à coup sûr amené à baisser. D'autre part, parce que la restitution de l'information par séquençage prend nécessairement du temps alors que le contenu d'un disque dur est lu presque instantanément. Enfin, le support n'est pas facilement réinscriptible et les informations ne peuvent donc pas être modifiées à l'envi. La technique pourrait donc être réservée à l'archivage de documents, d'autant qu'elle présente, pour cet usage, un avantage non négligeable : si l'inscription des données dans l'ADN est coûteuse, leur conservation sous cette forme ne nécessite ensuite pratiquement plus aucune dépense et quasiment aucune énergie. Rien à voir avec les actuels gigantesques datacenters extrêmement gourmands et... polluants.
 

Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.