mardi 8 février 2011

Compte-rendu de la journée d’études du GIS-DON « Longévité des disques enregistrable : mythe ou réalité » 1/2

Aujourd'hui s'est tenu à Paris, au Réfectoire des Cordeliers (VIe), une journée d’études organisée par le GIS-DON et baptisée « Longévité des disques enregistrable : mythe ou réalité ». Nous étions présents lors de cette journée et nous vous en proposons un compte-rendu. Compte tenu de la richesse de cette journée, ce billet sera divisé en deux parties correspondant pour la première aux interventions du matin et pour la seconde aux interventions de l'après-midi.

NB : Il s'agit d'un compte-rendu basé sur des notes personnelles prises au cours de l'évènement, ce qui implique que les phrases soient dans un style lapidaire.


Introduction et présentation du GIS-DON 
(Franck Laloë, président du groupement)

Le GIS-DON (Groupement d’Intérêt Scientifique sur la conservation des informations enregistrées sur les Disques Optiques Numériques) a été créé en 2004 à l'initiative du LNE (Laboratoire National de Métrologie et d'Essais). Ce pôle réunit six organismes de recherche spécialistes du domaine de l'archivage à long terme des données sur disques optiques numériques. D'avantage d'informations sont disponibles sur la page dédié au groupement sur le site officiel du LNE.

L’information numérique est de plus en plus utilisée, car elle présente une commodité de saisie, de copie, de stockage etc. Elle nous submerge et une grande partie n’a pas d’autre intérêt que le court terme. Mais une partie de cette information présente un intérêt de conservation à long terme.
L’information numérique se recopie sans aucune erreur, contrairement à l’information analogique dont la recopie introduit des erreurs. Elle peut disparaitre de manière brutale (crash disc, perte de support, etc.) ou plus lente (obsolescence des logiciels et des matériels, vieillissement naturel). Avec un peu d’organisation on peut se prémunir de ces risques. Il existe notamment des formats stables et standards. Le vieillissement spontané des supports d’information est lent : pendant un certain temps il ne se voit pas, mais d'un coup, le support n’est plus lisible du tout. Lorsque la perte se produit au niveau des bits, on ne peut plus rien faire, et les données effacées ne peuvent être récupérées.

L’archivage numérique est un problème à multiple facettes : il faut faire des choix, on ne peut pas conserver toute l’information. Il y a également un problème de classement et d’organisation de l’information. Ce qui est le plus important à traiter, c’est la question de la stabilité des supports, qui est la clé du problème. Tant que ce problème ne sera pas réglé, il sera illusoire d’espérer régler les problèmes de formats ou autres.

Les DONE (Disques Optiques Numériques Enregistrables) sont commodes, rapides à graver, compacts, ne s’usent pas à la lecture ; mais ils vieillissent. Les autres supports numériques ont une durée de vie de dix ans maximum : bandes magnétiques, disques durs, mémoire flash (5ans, elles ne sont pas conçues pour le stockage).

Deux méthodes d’archivage :  

  • Stratégie passive : « archive et oublie ».
  • Stratégie active : archive et recopie de migration perpétuelle. Elle est appliquée à grande échelle par les institutions. Cette stratégie est chère, mais elle fonctionne. Elle est également chère au niveau des dépenses énergétiques.

Les disques durs sont exclus pour l’archivage à long terme, les DONE semblent à priori mieux adaptés, car il n’y a pas de contact entre les têtes de lecture et le support.

L’enregistrement optique : Quels problèmes ? Étude de cas
(Jean-Marc Fontaine de l’Institut Jean le Rond d’Alembert Equipe Lutherie, Acoustique et Musique)

La situation dans laquelle nous nous trouvons, c’est l’incertitude d’avoir à faire à un mauvais disque. La qualité du disque dépend du choix du produit (en général les fabricants ne donnent aucune information et aucune garantie) et du rôle du graveur.

Comment connaitre l’état d’un disque?
Il faut disposer d’un analyseur qui est un lecteur qui interroge le signal électrique et obtient des informations sur les propriétés du disque. Ensuite vient l’interrogation des erreurs qui passe par un traitement algorithmique et qui n’est pas spécialement facile à interpréter. Quand une institution peut bénéficier d’un analyseur, on peut questionner le disque, ce qui en fait un outil indispensable. Pour le vieillissement, des tests montrent qu’il y a des disparités entre les disques : il y a les bons et les mauvais, mais les comportements sont imprévisibles.

Pour cette étude, les membres de ce laboratoire ont interrogé des disques enregistrés il y a 15 ans. En 1996, l’équipe a analysé des signaux électriques de disques enregistrés à 3 niveaux de puissance. Cette expérimentation a été menée en partenariat avec la BnF et l’université Blaise Pascal. C’était l'époque des premiers disques et un fabricant japonais (Mitsui) annonçait avoir créé des disques longue conservation.

Résultat de l'étude : En 15 ans, la réflexivité des disques n’a pas bougé. Ces disques ne montrent pas d’évolution du taux d’erreur, ce qui prouve que Mitsui ne s’était pas trompé lorsqu’il a présenté cette gamme de produits. Mais depuis la société a changé de propriétaire et les disques produits par Mitsui sont maintenant de mauvaise qualité. 
Conclusion de l’étude : Les disques étaient très bons, les manifestations de vieillissement restent limitées après 15 ans. Or, le statut des CD-R a changé depuis les années 90 ; les graveurs et disques étaient alors destinés aux professionnels et étaient très suivis. Aujourd’hui, ils sont destinés au grand public et la qualité a baissé autant sur les disques que sur les graveurs.

Présentation du rapport des Académies « longévité de l’information numérique »  
(Erich Spitz de l’Académie des sciences et l’Académie des Technologies)

Le rapport, commencé en 2008, a été présenté à la presse en mars 2010.
La quantité d’information produite annuellement se compte en exaoctets (10 puissance 18), 1 exaoctet fait l’équivalent de 10 bibliothèques nationales.


1. Les DONE
Les DONE sont commodes à l’emploi, on en fabrique chaque année plus de 10 milliards (CD, DVD, Blu-Ray). On a cru pendant longtemps que les DONE permettaient  le stockage de l’information, mais c’est faux. Dans la réalité, il y a des altérations et on ne peut pas maitriser tous les processus car il y a de nombreux composants dans les DONE.


2. L’archivage et ses méthodes
L’archivage à long terme est un processus complexe. Il faut collecter l’information, créer des métadonnées, définir des formats. Après, la conservation peut être active ou passive ; il faut des infrastructures, faire attention aux supports, aux manipulations et au vieillissement naturel. C’est ce dernier point qu’on ne maîtrise pas spécialement. Derrière les problèmes de communication, il y a des outils d’indexation, des problèmes intellectuels, de confidentialité, de propriété intellectuelle (DRM). Le rapport n’aborde pas tous les aspects de l’archivage, il ne parle pas de la sélection des documents, des logiciels et formats, des pannes, questions du matériel de gravure et de lecture, les normes, des solutions futuristes. Le rapport analyse simplement le vieillissement.

Quels sont les supports ?
Les bandes magnétiques : économiques, elles permettent de stocker de grandes quantités d’informations, mais elles ont un temps accès relativement long.
Les disques durs : économiques, mais il faut constamment les copier à cause des pannes, des crashs et du vieillissement qui est imprévisible.
Quand on développe une solution, il faut prendre en compte plusieurs paramètres : capacité, densité de stockage, temps d’accès, accès séquentiel aléatoire, vitesse d’écriture ou de lecture, cyclage, coût, etc.


- Etude du LNE sur le vieillissement naturel des DONE pour la DAF et l’INA :
Sur 70 CR-R gravés en 2000, beaucoup sont endommagé en 2004 et 15% sont illisibles.
- Etude de 2006 des CD-R dans les AD, beaucoup de supports sont illisibles, et donc irrécupérables.

Ces études mettent en évidence une hétérogénéité des disques en fonction des modèles, des marques et même des lots de fabrication. La dégradation peut varier, certains disques sont détériorés en quelques années, certains CD-R en 1 an. Les disques d’archivage ou gold ne sont pas meilleurs que les autres, parfois même ils sont moins bons.

3. Vieillissement artificiel
On suppose que le processus de vieillissement résulte d’un seul processus physico-chimique (inconnu) qui possède une énergie d’activation bien définie. Cette méthode suppose que le vieillissement est unique, mais les processus sont multiples, et il faut donc faire des extrapolations de nombreux facteurs (mesures à plusieurs températures etc.). Le vieillissement artificiel est une estimation, et l'idée est la suivante : si les disques ne marchent pas en vieillissement accéléré, ils ne marcheront pas à long terme, mais s'ils marchent en vieillissement accéléré, ça ne veut pas dire qu'ils marcheront en vieillissement naturel.
Les courbes temporelles observées n’ont rien d’exponentielles. On ne sait pas relier quantitativement le vieillissement naturel et artificiel. La mesure du vieillissement montre qu’il n’y a pas de marques ou de modèles de DONE qui se démarquent d’autres. Selon les périodes, il y en a des meilleures que d’autres. Il est difficile de tirer des règles d’observation, avec une même marque et un même modèle, on peut obtenir des résultats bons ou mauvais à un an d’écart. On ne peut pas prévoir le vieillissement des DONE, même si son principe de séparation des données et du lecteur est prometteur. Les DONE vont disparaitre si l’on ne résout pas le problème de leur longévité. Mais il y a des produits qui arrivent sur le marché, ou qui sont encore en développement, avec des disques de verre, le data tresor disc (matériau inorganique assez simple) et le millénniata (1 millénaire !). Et ce d’autant plus qu'il y a un problème pour l’archivage actif car cela coûte cher, le prix est en effet estimé entre 300 et 3000€ par an pour un To.

Comment faire mieux ?
Pour l’avenir on parle du disque de verre, on a l’impression qu’on peut améliorer techniquement les disques. Nous sommes à une période charnière car on arrive à l’époque où les premiers enregistrements arrivent en fin de vie. Il faudra une catastrophe pour que les choses changent. On sous-estime les risques, on veut tout dématérialiser, mais on ne se soucie pas de la conservation. Pour l’archivage passif, le DONE est pourtant la meilleure solution. Le rapport voulait alerter le grand public, débloquer les études sur le sujet, éviter la perte des compétences, favoriser l’innovation et élaborer une politique d’archivage numérique.


---
Rendez-vous demain pour la suite du compte-rendu, avec les communications sur "les bonnes pratiques de l'INA" et "quelques solutions alternatives pour un archivage à long terme" ainsi que la conclusion de cette journée.


Magalie Lopez et Timothée Bonnet

Aucun commentaire:

Enregistrer un commentaire