jeudi 7 février 2013

L'ADN comme support d'archivage, ou comment se méprendre sur les besoins

L'ADN comme support d'archivage, ou comment se méprendre sur les besoins

Références :
Décidément,  la non compréhension des contraintes et des besoins de l'archivage numérique me sidère.
Houra ! On sait stocker des bits pour l'éternité ! Plus besoin de changer de support tous les 10 ans, plus besoin de s'embêter avec cette pérennisation qui nous ennui ! Enfin, les scientifiques ont mis au point un système révolutionnaire : le stockage sur brin ADN synthétique. Enfin la donnée est stable pour 50 ans et plus (1 millions d'années ?) ! Enfin on ne va plus avoir besoin de gérer le transvasement des données d'un support à un autre !

Ah, que c'est beau... Mais encore une fois, je vous invite à retrouver un de vos vieux CDROM, un fichier que vous avez transféré de PC en PC, écrit dans les années 90... Arriveriez vous à l'ouvrir ? J'en ai fait l'expérience il y a peu : un fichier créé en 1993 avec Word de l'époque. J'ai eu une belle erreur avec Word : impossible d'ouvrir le document... blablabla...
En mode hexadécimal, j'arrive encore à relire quelques passages (ouf), mais rien de plus...



OK, on me dira que ce n'est pas grave, on peut réécrire avec l'ADN (merci les chercheurs), mais alors, si on peut réécrire, comment s'assurer que la donnée n'a pas été altérée justement par une réécriture depuis ces 50 dernières années ? Est-ce que cela répond au besoin ?

OK, on me dira, ça ne prend pas de place, c'est pratique. Pratique ? Combien de temps pour le relire, quel équipement ? OK, la science avance et peut être que les outils se miniaturiseront.
Je ne dis pas que ce support n'a pas d'avenir, peut être sa miniaturisation, sa stabilité en font un candidat sympathique pour le stockage...

Mais par pitié, ne confondez pas conservation et pérennisation ! Ce n'est pas parce que l'on a conservé un objet numérique qu'il est exploitable... Des preuves ?
OK, je ferais un parallèle : l'écriture sur papier (ou équivalent, incluant les tablettes d'argiles et autres marbres) ont un très gros avantage ! Elles sont stables (ou à peu près) et le logiciel qui permet de les relire est lui aussi stable depuis l'invention de l'écriture : l'être humain. Son évolution est suffisamment lente pour que nous parvenions à "voir" à nouveau le document.
Mais est-il compréhensible ? Avons nous réussi à déchiffrer tous les hiéroglyphes, toutes les écritures cunéiformes, les dessins préhistoriques ? Pas sûr, n'est-ce pas...
Pourquoi, parce que ce n'est pas que l'objet (les bits) qui sont importants, c'est aussi l'interprétation de celui-ci (la façon d'écrire, la langue utilisée, à mettre en relief avec le format de présentation, l'encodage des informations).

Hors en informatique, contrairement à l'humain, l'évolution est telle que 20 ans correspond à 2000 ans. Donc imaginez 50 ans ! Mon document qui date de 20 ans tout rond est illisible ! Pour le moment, j'ai de la chance, je suis encore en capacité à le comprendre (en regardant l'hexadécimal) car ... j'en suis l'auteur ! Mais dans 20 ans, quelqu'un qui lira ce document (oups, enfin, pas celui-ci, il est privé !), il lira quoi ? Des octets ? Qui signifieront quoi ? Et encore, là, c'est un document texte. Imaginez une vidéo ou une image ou une bande son ! Sans le codec d'origine (la façon dont l'image et le son sont encodés dans un container numérique), qu'aura-t-on ? RIEN !

Et je pousse encore un peu plus... Aujourd'hui la représentation des données informatiques est réalisée sur la base de bits, octets, 4-octets (64 bits pour l'encodage UTF-8 par exemple). Mais, tout comme nous sommes passés dans l'histoire de l'humanité du cunéiforme à l'alphabet, sans oublier les idéogrammes, l'informatique quantique (aux portes de notre histoire contemporaine) représente ses données sous formes de Qbits, où ce n'est plus 0 ou 1, mais 0 ET 1 (ou plus exactement une probabilité de 0 ou de 1). Quid dans 200 ans d'un humain (même logiciel génétique ou à peu près) qui tomberait sur cette succession de 0 et de 1 alors que sa logique sera celle du quantique ? Quels efforts devra-t-il fournir pour tenter de reconstituer le sens de ces 0 et ces 1 ?

C'est là le travail de la pérennisation : assurer que les objets numériques survivent dans le temps plus sur le signifiant que sur leur format, le fond plutôt que la forme.

Alors oui à l'innovation sur la miniaturisation, la stabilité des supports, mais que diable, pas de fausses rumeurs, de solutions techniques "absolues" qui ne peuvent pas en être, à moins... à moins de figer l'histoire de l'humanité et son développement à aujourd'hui ? Ce qui est contradictoire (sans dire non souhaitable)...

Aucun commentaire:

Publier un commentaire