lundi 6 décembre 2010

Le contrôle des prestations de numérisation : une étape indispensable pour les institutions culturelles

Aujourd'hui, nous avons eu la chance de visiter les locaux Campinois d'Arkhênum, entreprise spécialisée dans la numérisation du patrimoine culturel écrit et iconographique, basée à Bordeaux, dont l'antenne parisienne a été ouverte en 2008.


La société est notamment prestataire de service des Archives nationales pour la numérisation de son magnifique fonds des dossiers de titulaires de la Légion d'Honneur. Il s'agit là d'un gros marché, s'étendant sur quatre ans, de plus de deux millions d'euros et qui représente un volume de 4.5 millions de vues qui viendront enrichir la base Leonore. C'est un très gros effort pour le prestataire qui travaille en flux tendu et doit fournir un volume important d'environ 90 000 vues par mois.

Il faut savoir que dans un travail à la chaîne comme celui-ci, les problèmes de numérisation, qu'ils soient mineurs ou majeurs, sont plutôt courants et l'ennemi du prestataire comme de la maitrise d'ouvrage (MOA). Ces derniers demandent en effet de repasser des documents sur la chaîne de numérisation ce qui représente une perte de temps ... Et donc d'argent. Pour pallier à ces malfaçons, le prestataire réalise des contrôles internes. Il y a un contrôle sur les images, le nommage, la qualité et les métadonnées. 

Et c'est ensuite qu'intervient la livraison des documents. La responsable d'Arkhênum nous a indiqué que certaines institutions culturelles ne faisaient pas de contrôle intégrité/cohérence/qualité avant la livraison finale. Et on s'est vite rendus compte à la pratique que ces contrôles étaient tout simplement indispensables.

Les contrôles se font sur un échantillon d'images de façon aléatoire au sein de la livraison. Les  AN réalisent trois type de contrôles : 
  • Le contrôle d'intégrité est réalisé sur un échantillon de 5% des images livrées. Il consiste à vérifier que toutes les images numériques annoncées pour chacun des lots dans le fichier de récolement sont présentes, que leur nom est conforme au modèle défini et qu'elles sont rangées dans le répertoire prévu.
  • Le contrôle cohérence est aussi réalisé sur un échantillon de 5% des images livrées. Il consiste à vérifier qu'il n'y a pas de décalage entre le nom du fichier image et l'identifiant du document original dont il est issu. 
  • Le contrôle de qualité effectué par l'atelier photographique des Archives nationales est effectué sur un échantillon des images numériques livrées. Le pourcentage d'images contrôlées restant à son appréciation. 
Ces contrôles visent à détecter deux types d'erreurs répartis entre mineures et majeures. A la suite de ces contrôles, les lots peuvent être validés, acceptés sous réserve, ou rejetés, et repasser ainsi sur les bancs de numérisation. 

Les responsables du projet de numérisation des fonds de la Légion d'Honneur nous ont permis de réaliser des contrôles d'intégrité des documents sortis des chaînes de numérisation. Ce fut une expérience tout à fait intéressante et très formatrice. Nous avons sélectionnés des cartons aléatoirement, et au sein de ces cartons, nous avons également choisi des dossiers aléatoirement. Les contrôles étaient systématiquement reliés au fichier de récolement, qui est la base des relations entre le prestataire et la MOA. Sur les trois dossiers de légionnaires que nous avons contrôlés, deux dossiers ont passé le contrôle et un a posé problème. Ce dossier a en effet cumulé erreur mineure et majeure. 

Pour le dossier en lui-même, ce n'est pas très significatif car les erreurs seront corrigées dans la journée par le prestataire. Par contre, pour les AN, cela représente un enjeu important. Les contrôles prennent du temps, et quand les niveaux atteignent une masse critique comme c'est le cas ici, il est impossible de tout contrôler. C'est ainsi que les AN devront absolument se baser sur la communauté des utilisateurs pour signaler les éventuels problèmes liés à la numérisation des dossiers, et prouver leur réactivité en renumérisant eux-même les dossiers problématiques le plus rapidement possible.

Timothée Bonnet et Magalie Lopez

Aucun commentaire:

Enregistrer un commentaire