Entretien avec François Olléon, Olkoa, AMOA sur ce chantier, dans le cadre du Forum des archivistes en 2013
Nous nous sommes rencontrés au cours de la réalisation du chantier de mise en ligne des archives numérisées du département de Paris. Quelle est l’originalité de l’outil de contrôle des plans de numérisation unique en France, que vous avez mis en place ?
L’originalité de cet outil est d’avoir su exploiter le principe d’une indexation par plage de noms ou de dates, unique en France, à ma connaissance. Comment cette idée est-elle née ? Que pouvez-vous nous en dire ?
Notre intervention en AMOA a en fait commencé par un travail sur le cahier des charges pour faire réaliser la numérisation des microfilms 35mm dont les Archives de Paris disposaient. Il s’agissait de l’état civil complet de 1860 à 1902 (naissances, mariages, décès, tables décennales et registres d’actes par arrondissement), de l’état civil reconstitué (fichiers alphabétiques avant 1860), des tables alphabétiques du recrutement militaire (1875-1912), des répertoires alphabétiques des enfants assistés (1742-1912) et des dénombrements de population (1926-1946). Autrement dit, une masse très conséquente d’images (5 millions), à une date (2002) où l’expertise et les bonnes pratiques en matière de dématérialisation n’étaient pas encore très diffusées, et où les moyens techniques dont on disposait rendaient la chose un peu compliquée, en particulier quand il s’agissait de transférer des dizaines de milliers d’images entre le prestataire et les Archives. Nous sommes en définitive arrivés au choix d’un double format JPEG.
La deuxième phase a consisté à organiser le suivi de la production et le contrôle de la qualité des fournitures. La première difficulté venait du grand nombre de supports à gérer, d’où la nécessité d’une logistique rigoureuse. Le deuxième point dur concernait la façon la plus efficace de réaliser un contrôle qualité suffisamment précis, mais qui ne pouvait en aucun cas être exhaustif étant donné le nombre d’images à traiter.
Notre connaissance des matériels utilisés par les prestataires (scanners de films 35mm) et de leurs modes opératoires nous a permis de valider une approche qui consistait à vérifier exhaustivement les débuts de films, plus une vérification par sondage pour le reste. La mauvaise qualité d’une numérisation peut en effet venir soit d’un mauvais calibrage des scanners par rapport à la densité moyenne des films, ce qui se repère dès le début d’un film, soit d’une dérive du réglage en cours de traitement. Dans le même temps, l’observation de la façon dont les utilisateurs consultaient les registres sur microfilms nous a montré qu’ils procédaient pratiquement tous par dichotomie. C’est donc assez naturellement qu’est venue l’idée de faciliter cette recherche dichotomique en profitant du contrôle qualité pour mémoriser des index relatifs aux images qui allaient être vérifiées.
Pour que cette surcharge de travail soit acceptable par le personnel des Archives qui allait assurer le contrôle qualité, il fallait « outiller » la fonction de contrôle afin de lui fournir un environnement de travail convivial et motivant (une équipe d’une quinzaine d‘agents a réalisé le contrôle à hauteur de 25% de leur temps de travail). Nous avons donc créé un logiciel qui permettait d’industrialiser le processus de : recopie des images, vérification du contenu des supports et des nommages des répertoires et des images, automatisation du parcours des images, mémorisation des défauts de qualité des images (floues, coupées, mal contrastées, etc.), automatisation d’un rapport d’anomalies pour le prestataire, mémorisation des index complémentaires. Pour chaque image visualisée selon un pas prédéfini, l’opérateur, disposait d’un formulaire de saisie du nom ou de la date dans la partie gauche de l’écran de l’outil de contrôle et dans la partie droite de l’image à contrôler.
L’utilisation de la fonction de saisie par pas dans l’outils de contrôle a permis de nous affranchir des cotes des microfilms et de revenir à une logique restitution des lots d’images par registre.
Le résultat a été d’une part de mettre au point un outil de contrôle efficace qui a été réutilisé dans d’autres contextes, et d’autre part une indexation par plage qui a considérablement enrichi les fichiers de récolement initiaux et par voie de conséquence, la puissance de l’interrogation du module de recherche que vous alliez pouvoir paramétrer en aval.
La troisième phase de notre travail a été consacrée à la mise en ligne. Un des challenges de cette opération a consisté à savoir utiliser intelligemment l’indexation par plage que nous avions préparée, et 1 égal 2 a parfaitement réussi dans cette mission, en fournissant l’interface utilisateur appropriée d’Arkothèque.