Publication de fonds au format XML ALTO
La solution Arkothèque offre la possibilité d'intégrer les données contenues dans les fichiers au format Alto :
- Chaque fichier Alto doit permettre d'identifier la ou les ressources (c'est-à-dire l'image physique présente sur le serveur).
- Chaque fichier est analysé et les données sont récupérées et intégrées dans une base de données.
- Chaque texte/paragraphe est stocké ainsi que ses coordonnées afin de permettre un surlignage dans la visionneuse.
La mise à jour des données au format Alto XML s'effectue depuis le back-office en plusieurs étapes :
- Dépôt des fichiers par lots (avec arborescence ou non)
- Numérisation et contrôle de la confirmité selon la norme Alto
- Intégration des données Alto XML
- Mise en correspondance avec les ressources images
- Mise à disposition des données dans le (ou les) moteur(s) de recherche
Mise en place d'un moteur de recherche
Le moteur de recherche texte libre repose sur le moteur Elasticsearch permettant d'obtenir une rapidité de réponse et options d'ajustements de la recherche (pertinence/suggestion/rapprochement de termes/...).
Les données sont ensuite restituées dans la visionneuse avec mise en surbrillance des termes.
Il est possible de cumuler des valeurs issues de l'annotation collaborative.