STITCH

STITCH @ CATCH

Semantic Interoperability To access Cultural Heritage

NWO MPI VU KB

Accès intégré aux collections Mandragore de la BnF et Manuscrits enluminés de la KB

English version: English version

Introduction

En 2006, STITCH a collaboré avec la Bibliothèque nationale de France pour élaborer un démonstrateur en ligne illustrant comment des correspondances sémantiques (alignements) entre des vocabulaires descriptifs peuvent aider à l'intégration de collections provenant de contextes différents.
Cette expérimentation a eu pour objets deux collections de manuscrits enluminés : NB : Le prototype présenté ici est le résultat d'études préliminaires. En particulier, les correspondances sémantiques sur lesquelles il s'appuie n'ont pas été validées, la base de données ne contient qu'un échantillon des collections d'origine et le serveur peut s'avérer lent. Ce travail est toujours en cours et ne doit en aucun cas être considéré ou utilisé comme un substitut aux moyens d'accès courants à ces collections.

Aide à la consultation

Principes
Sur leurs portails respectifs, l'accès aux collections d'enluminures de la BnF et de la KB peut s'effectuer de deux façons : Notre expérimentation porte sur la navigation par sujets des systèmes d'origine. Sur ces portails, il est impossible d'accéder aux objets de la KB en utilisant le système de la BnF et vice versa, pour la raison suivante : chaque système utilise un vocabulaire différent, à savoir Iconclass pour la KB, et un vocabulaire d'analyse de contenu spécifique pour Mandragore.

Pour résoudre ce problème d'interopérabilité sémantique, notre expérimentation utilise des liens d'alignement sémantique entre les deux vocabulaires. Ces liens sont établis automatiquement (pour l'instant, le procédé consiste à comparer les libellés, par exemple "rongeur: lapin" et "lapin"). Ils sont exploités pour augmenter le nombre de résultats associés à un concept donné. Si l'on sélectionne le sujet "Lapin" de Mandragore dans le démonstrateur, on obtient tous les documents de Mandragore indexés avec ce sujet, mais également les documents de la KB indexés avec le sujet Iconclass 25F26(RABBIT) ayant pour forme française "rongeur: lapin".

Navigation hiérarchique dans des ensembles de documents
Dans le paradigme de navigation à facettes que nous avons choisi pour ce démonstrateur, l'utilisateur bénéficie d'une "vue" sur le ou les vocabulaires où il peut cliquer sur un sujet et accéder ainsi aux documents qui s'y rapportent. Dans notre démonstrateur, cette vue apparaît dans la partie gauche de l'écran (écran complet en début de recherche). La vue sur le vocabulaire présente le sujet sélectionné, le cheminement hiérarchique qui conduit à ce sujet depuis le plus haut niveau, et les concepts qui affinent ce sujet. Ainsi il est possible de sélectionner des sujets plus ou moins spécifiques.

Sur la partie droite de l'écran, sont représentés sous forme de vignettes l'ensemble des documents qui correspondent au sujet sélectionné.

Accès aux différents vues
Le démonstrateur STITCH offre deux modalités de navigation dans les collections intégrées en utilisant leurs vocabulaires d'origine : simple, et combiné, selon les vocabulaires disponibles. Dans le cas particulier BnF/KB, nous obtenons cinq vues possibles et autant de "facettes" de navigation différentes :

Vue simple Mandragore
Cette vue permet d'accéder aux deux collections par le biais du vocabulaire de Mandragore. Par exemple, on peut accéder aux objets décrits (directement ou via un alignement) par "amphibiens" en sélectionnant "Zoologie" puis "Amphibiens".
Vue simple Iconclass (en français)
Cette vue permet l'accès aux deux collections par le biais du vocabulaire Iconclass utilisé pour les Manuscrits enluminés, en utilisant les libellés en français des sujets Iconclass. Par exemple, on peut accéder aux objets décrits (directement ou via un alignement) par "batraciens (amphibiens)" en sélectionnant "Nature", "la terre, le monde en tant que corps céleste", "animaux" puis "batraciens (amphibiens)".
Vue simple Iconclass (en anglais)
Comme précédemment, en utilisant cette fois les libellés en anglais des sujets Iconclass (Iconclass est disponible en plusieurs langues, parmi lesquelles l'anglais, le français, et l'allemand).
Vue simple Iconclass (en allemand)
Comme précédemment, en utilisant les libellés en allemand des sujets Iconclass.
Vue combinée
Cette vue permet d'interroger les deux collections en combinant le vocabulaire de Mandragore et Iconclass. Les résultats correspondent à la conjonction des sujets sélectionnés dans l'une ou l'autre des hiérarchies. Par exemple, on peut rechercher à la fois avec le sujet Mandragore "amphibiens" et celui d'Iconclass "famille, descendance", ici.
Dans tous les cas, une facette appelée "Collection" est proposée. Elle permet de restreindre la requête aux documents provenant de l'une ou l'autre des collections. Cela peut s'avérer utile lorsqu'un trop grand nombre de résultats sont disponibles pour une collection, "dissimulant" ainsi les résultats de l'autre collection.

Configuration des correspondances
Pendant la navigation, il est possible d'activer ou de désactiver l'ensemble des correspondances sémantiques utilisées par le système, en cliquant sur les options situées sous le bandeau de présentation bleu, à savoir :

mandraBASE
Pour utiliser toutes les correspondances produites avec les scripts d'alignement sémantique.
mandraNewNONE
Pour n'utiliser aucune correspondance.

Accès à des documents spécifiques
En cliquant sur les vignettes affichées sur la partie droite de l'écran, l'utilisateur peut accéder à un document spécifique qui correspond à la sélection en cours du sujet (voir ici). Des informations de base sur le document sont alors affichées, accompagnées d'une image plus grande et de métadonnées supplémentaires, comme le titre de l'enluminure, la date de création et la description du sujet d'origine, avec des éléments provenant des vocabulaires Mandragore et Iconclass, en fonction de l'origine du document. Pour ceux de Mandragore, un lien est fourni qui donne accès au document sur le site de la BnF.

Remerciements

Le travail à la BnF a été coordonné par Thierry Cloarec et Frédéric Martin (Département de la Bibliothèque numérique). Nous remercions Jean-Pierre Aniel et Thierry Delcourt (Département des Manuscrits) pour leur contribution et leur intérêt pour le projet, ainsi que Anila Angjeli et Françoise Bourdon (Bureau de Normalisation documentaire), Emmanuelle Bermès (Département de la Bibliothèque numérique), Laure Mane (Département des Systèmes d'information) et Michel Mingam (centre national Rameau). Jérôme Boillet et Patrick Le Bœuf ont pris part aux premières étapes de la collaboration.

Nous sommes reconnaissants aux instituts hollandais KNAW et RKD qui ont fourni les ressources Iconclass et à Gerda Duijfjes-Vellekoop pour son aide.