Eternite Numerique
Accueil ] Remonter ]

 

On savait qu'un jour ou l'autre, les supports de stockage numériques allaient nous claquer dans les doigts.

C'est fait, et c'est la Nasa qui sonne l'alarme. A quoi ca sert d'aller conquérir Mars si on n'en garde aucun souvenir ? ...

Par Emile Servan-Schreiber

Le problème est d'abord apparu lorsque les chercheurs de la Nasa ont voulu relire les précieuses données de la mission Viking transmises depuis la planète Mars en 1976. Les bandes magnétiques etaient en pleine décomposition, "désastreusement inefficaces comme support d'archives".

Résultat : 20% des données irrémédiablement perdues ...

Et combien d'autres données moisissent aussi sûrement sur les étagères impeccablement rangées et protégées des salles d'archives disséminées dans le monde ? Autant dire que la Nasa, elle qui foule la poussière d'astres lointains, qui est a l'écoute des murmures du cosmos pour en capter le moindre rayonnement fossile ou y discerner l'écho d'une autre intelligence, vient rien moins que d'identifier la source d'un nouveau danger pour notre civilisation. Début février, les scientifiques de la Division du traitement des données de la Terre et de l'Espace publiaient ainsi un rapport alarmant dans lequel ils préviennent de "l'émergence d'une crise sévère quant à notre capacité à assurer la pérennité de nos données scientifiques, médicales, industrielles, financières et administratives".

La solution ? Recopier souvent les données sur de nouveaux supports pour éviter quelles ne se perdent. Oui mais, selon le rapport, nous sommes tout près du point critique où le volume des données à sauvegarder est tel que le temps de transfert d'un média à un autre excède la durée de vie du support de départ; dès lors, la perte d'informations devient inévitable ... Le problème vient surtout du fait que les dix dernières années ont vu la capacité des bandes magnétiques multipliée par cent (de 200 Mo à 20 Go), alors que la vitesse du transfert des données n'a, elle, été que quadruplée (de 3 Mo/s à 12 Mo/s). A titre d'exemple, la Nasa vient d'engager la migration de 35 000 bandes représentant 28 To (un téra-octet équivaut à 1 024 giga-octets) sur un nouveau support dont l'espérance de vie est de dix ans.

Comme cette opération prendra près de quatre ans, elle sera à peine achevée qu'il faudra déjà la recommencer.

Et c'est sans compter les nouvelles données qui se seront accumulées pendant ce temps-là: au rythme actuel de 1,5 To par mois, c'est 70 To supplémentaires dont il faudra alors assurer la pérennité.

A moins d'un miracle, le seuil critique est déjà dépassé...

Certes, le cas de la Nasa est extrême, au vu de la quantité d'informations qui y est absorbée chaque jour, mais il n'est pas isolé et, surtout, il préfigure simplement le danger qui menace, à terme, tous les gardiens d'archives numériques : banques, administrations, armées, hôpitaux, centres de recherche scientifique, grandes entreprises industrielles et médiatiques ...

Tous vont connaître le même problème, et cela plus tôt que tard. Par exemple, il est prévu que, dès l'an 2000, les plus grandes entreprises aient à stocker des volumes d'informations de l'ordre du peta-octet, soit du million de giga-octets. Or, selon le rapport de la Nasa, "Puisque la migration d'un peta-octet de données sur un nouveau support pourrait prendre dix ans, alors que la longévité de ce support est elle même de dix ans il pourrait être impossible d'achever le transfert sans pertes".

Bref, la future "société de l'information risque d'avoir la mémoire bien courte ... "Nous sommes en train de laisser les traces numériques de notre culture. de notre science et de nos gouvernements se désintégrer ou devenir inaccessibles aux générations futures", prévient de son côté le Clir, une organisation d'archivistes qui a récemment produit un documentaire sur le sujet.

Ce faisant, c'est nous-mêmes que nous jetons aux oubliettes, hors de portée des Historiens à venir. Amorcée il y a un demi-siècle, la révolution informatique a tant augmenté la valeur de l'information que, quelques données personnelles, votre nom, profession, revenus et préférences, peuvent aujourd'hui s'échanger... contre un PC tout neuf (www.free-pc.com)! Ceux, de plus en plus nombreux, qui ont senti que, les données étaient le minerai du futur n'ont eu de cesse de pousser pour leur collection toujours plus massive, leur stockage toujours plus dense, leur accès et transmission toujours plus rapides, leur analyse toujours plus fine et leur présentation toujours plus interactive. Mais cette folle course technologique, guidée par les seules lois d'un marché sauvagement compétitif, semble avoir occulté, ou du moins remis à plus tard, la question de la conservation de ces précieuses données. Et pour cause: l'idée est aujourd'hui très répandue que l'information numérique est éternelle ... Puisqu'elle peut être recopiée à l'infini sans aucune perte.

Malheureusement, on sait maintenant que cette idée est fausse.

Du reste, la communauté des archivistes, concernée au premier chef, s'en est vite fait l'écho : dès 1995, le chercheur Jeff Rothenberg ironisait dans la revue Scientific Américan à propos de "l'information numérique [qui] dure pour la vie ou pour cinq ans, suivant ce qui arrive en premier". Sur un ton nettement plus grave, l'Américaine Margaret Hedtstrom, professeur d'archivistique à l'université du Michigan, constate que "notre capacité à créer, amasser et stocker les données numériques dépasse de très loin notre capacité à préserver, ne serait-ce que la petite partie qui mérite de l'être". Une course au recopiage permanente. Au vu d'un archiviste, les supports numériques ont une durée de vie particulièrement courte : les test du National Media Lab américain montre que les meilleures bandes magnétiques - le support standard des grosse bases de données - ne durent guère plus de dix ans et que le comportement du CD-R moyen devient imprévisible en moins de cinq ans. Au mieux, un CD-Rom de qualité exceptionnelle, maintenu à température ambiante, peut espérer préserver ses données intactes pendant cinquante ans. Une durée à comparer avec la centaine d'années que peut durer un microfilm de bonne qualité ou des millénaires que peuvent traverser un papyrus ou une pierre de rosette... De plus, à la différence de ces médias analogues, les supports numériques se dégradent de manière catastrophique : la corruption d'une petite partie des données peut facilement rendre l'ensemble illisible et le reste irrécupérable.

On l'a dit, la seule solution passe par la recopie fréquente des données sur des médias frais : cela les préserve du temps, mais aussi de l'obsolescence des technologies, des programmes et des formats. Mais s'agit là d'un processus compliqué, délicat et cher, que l'on réserve aux données les plus précieuses ou les plus souvent demandées.

Quand aux autres ... Au Centre des Archives Contemporaines de Fontainebleau, où reposent les fichiers produits par les administrations centrales de l'Etat ainsi que les archives de l'Insee concernant ses grandes enquêtes économiques et les recensements généraux de la population depuis 1962, on raconte volontiers l'histoire inquiétante de ce chercheur qui souhaitait accéder à quelques données anciennes ... et qui dut y renoncer face à l'impossibilité de se procurer l'environnement de relecture nécessaire. On est pas au bout des mauvaises surprises : les sinistres ne seront découverts que graduellement, au fur et à mesure des demandes des chercheurs, des historiens ... ou des citoyens.

Dans la communauté des archivistes, il est commun d'assimiler cet état des choses à une "bombe à retardement", une menace aussi grave que le Bug de l'an 2000, mais sans le grand avantage d'une date bien précise pour concentrer les esprits. Que faire pour réagir ? Jeff Rothenberg propose d'abord que l'on écrive des émulations logiciels du même type que ceux qui permettent aujourd'hui de jouer sur un PC les jeux vidéos écrits pour les premiers amiga des années 80 ou les dernières consoles Play Station de Sony. "Les ordinateurs devenant de plus en plus puissants, il pourront simuler, à la demande, n'importe quelle autre machine périmée " assure t'il.

Le laboratoire de Los Alamos, celui la même qui s'est rendu célèbre par la mise au point de la première bombe atomique, a, pour sa part, inventé une nouvelle méthode de gravure nanométrique grâce à laquelle on peut stocker , sur un disque métallique de la taille d'un CD capable de traverser plusieurs millénaires, soit 165 Go de données numériques, soit 1 500 000 pages de texte scannées à 300 ppp. Nommé HD-Rosetta, en hommage à la pierre de rosette, ce disque "dur à cuire" de Norsam Technologie (www.norsam.com) pulvérise la durabilité centenaire des microfilms.

Dernière solution envisagée, assurément la plus originale, sinon farfelue, celle de Cobblestone Software (www.paperdisk.com) : Son programme Paper Disk transforme vos fichiers et programmes en tapisseries binaires imprimable sur du bon vieux papier, leur conférant ainsi plus de longévité; pour recharger ensuite un tel fichier dans votre ordinateur, il vous suffit de le scanner avant de le passer dans le décodeur de Paper Disk.


Retour [Home Page]