Le Thésaurus

Un vocabulaire pour l'archéologie

Pour organiser les mots-clés utilisés dans l’indexation des notices du Catalogue Collectif Indexé, l’équipe à l’origine de Frantiq a créé le thésaurus PACTOLS. Il est organisé en 6 domaines et une liste dont les intitulés lui ont donné son nom : Peuples et cultures, Anthroponymes, Chronologie, Toponymes, Oeuvres, Lieux et Sujets. Particulièrement adapté au traitement des collections des bibliothèques du réseau, il couvre toutes les thématiques de l’archéologie, depuis la Préhistoire jusqu’à l’époque contemporaine. Sa spécialisation de départ sur les sciences de l’Antiquité tend à se gommer avec l’intégration de nouvelles ressources sur des périodes plus anciennes (Pré- et Protohistoire) ou plus récentes (Moyen âge, contemporain).

Son assiette documentaire et son évolutivité en font aujourd’hui un outil de référence qui intéresse les communautés métiers de l’archéologie : éditeurs scientifiques et gestionnaires des données de la recherche y trouvent les métadonnées contrôlées et ouvertes, nécessaires à l’enrichissement et au partage de l’information sur le web sémantique.

Un vocabulaire libre, contrôlé et interopérable

  • PACTOLS répond à la norme ISO 25964 sur les thésaurus multilingues et sur l’organisation et l’interopérabilité des thésaurus.
  • Il est multilingue : les concepts sont traduits dans 6 des langues européennes (français langue de référence, anglais, allemand, espagnol, italien, néerlandais) et en langue arabe.
  • Il est accessible et libre :  il est consultable en ligne, sous licence libre ODC Open Database License (ODbL) v1.0
  • PACTOLS est géré avec le logiciel Opentheso, développé en libre par M. Rousset, responsable de la plateforme technologique Tête de Réseaux Documentaires (TRD), à la Maison de l’Orient et de la Méditerranée, pour les besoins initiaux de PACTOLS. Celui-ci bénéficie des fonctions avancées de Opentheso pour la gestion des concepts, de la polyhiérarchie, du multilinguisme et du mode d’alimentation collaborative. De fait, PACTOLS est exportable dans des formats non propriétaires (CSV, SKOS, JSON-LD) et interopérable via un Webservices ouvert de type REST.
  • Chaque concept possède un identifiant pérenne (ARK) qui en fait un objet web unique, citable et réutilisable dans le web sémantique.

Au total, PACTOLS est conforme aux principes FAIR édicté par FORCE11 pour le partage des données sur le web.

Structure du thésaurus

Les 30000 concepts que compte le thésaurus sont organisés dans sept domaines :

  • PEUPLES : noms de cultures préhistoriques, peuples antiques et modernes, groupes humains
  • ANTHROPONYMES : noms d'artistes, de divinités et héros, d'écrivains, de gouvernants, de religieux, de savants
  • CHRONOLOGIE : datation absolue (du XIe millénaire avant J.-C. jusqu'au IIIe millénaire), ères géologiques, événements historiques, périodisation
  • TOPONYMES : liste alphabétique de sites et toponymes non intégrés au domaine LIEUX
  • OEUVRES : oeuvres artistiques, textes juridiques, littéraires et religieux
  • LIEUX : par continent, lieux imaginaires, monde antique, monde médiéval
  • SUJETS : soit 26 hyperonymes regroupant les domaines d'études de l'archéologie et des sciences de l'Antiquité

Programme de réorganisation

Depuis plus de 30 ans, le lexique de PACTOLS n’a cessé d’évoluer. Pour faciliter son appropriation par une communauté d’utilisateurs élargie et sa portabilité sur le web, il devenait urgent de repenser l’organisation du thésaurus. Le projet s’est mis en place en 2017 avec le soutien du Consortium MASA. Le recours à l’expertise méthodologique de S. Dalbin (ATD) a permis de définir une méthode de travail avec une feuille de route et des outils de suivi de projet et d’administration qui n’existaient pas. Le travail s’oriente dans trois directions :

  1. Consolider le thésaurus dans sa structure :
    1. en respectant des règles rigoureuses dans les relations. Par exemple, la relation hiérarchique est un/est un type de ou est une partie de (éperon barré EST UN TYPE DE fortification ; Anubis EST UNE divinité égyptienne ; doigt EST UNE PARTIE DE corps) ; en multipliant les règles d’association (sel EST ASSSOCIE A grenier à sel, marais salant, route du sel…)
    2. en réorganisant les domaines sur des modèles sémantiques élaborés favorisant les alignements (Art & Architecture Thesaurus par exemple). La réorganisation porte essentiellement sur le domaine SUJETS dont les thématiques remonteront à un niveau de visibilité équivalent aux autres domaines de PACTOLS.
  2. Enrichir son lexique avec des vocabulaires de spécialité avec deux objectifs : gommer des déséquilibres actuels dans certaines thématiques et répondre aux demandes précises des scientifiques pour la description des données.
  3. Faire évoluer ses modalités d’alimentation vers un collectif élargi en accompagnant les utilisateurs dans l’appropriation d’un outil partagé et contrôlé.

Il nous est apparu que l'organisation thématique révisée ne répondait pas suffisamment aux nécessités d'interopérabilité avec d'autres vocabulaires en ligne. Cela nous conduit aujourd'hui à envisager une structure plus conceptuelle avec facettes telle que mise en œuvre par le BBT de Dariah.

Workflow

Le Groupe de travail PACTOLS assure la maintenance des + 30000 concepts avec des mises à jour en continu. Il est garant de l’intégrité structurelle du thésaurus, gère les candidats, propose des enrichissements sémantiques, assure la liaison avec les contributeurs de Frantiq et les partenaires. Composé d’archéologues et de documentalistes qui connaissent bien la discipline, il consulte des spécialistes dans certains cas complexes pour valider des créations ou pour améliorer les contenus.

Mises à jour récentes

  • Traduction en langue arabe (2015-2016)
  • CHRONOLOGIE (2016-2018) : mise à jour de la périodisation, déplacement de concepts dans de nouveaux dossiers datation absolue et événements historiques
  • LIEUX: mise en conformité de FRANCE sur la réorganisation administrative avec alignements sur GeoNames et Wikidata (INIST, 2016-2018)
  • METHODOLOGIE : en cours

Partenaires

  • Maison de l’Orient et de la Méditerranée : pour le soutien au développement du logiciel Opentheso et le projet Arkéo de génération d’identifiants pérennes de type ARK
  • TGIR Huma-Num, à travers de
    1. ISIDORE : le moteur de recherche des sciences humaines et sociale enrichit ses résultats de recherche avec PACTOLS
    2. Consortium MASA : depuis 2013, PACTOLS y est proposé comme vocabulaire de référence à tous les projets de gestion ou de valorisation des données de la recherche, développés par les partenaires
  • INIST : réalise pour Frantiq les alignements des Lieux avec GeoNames et Wikidata
  • Numédif : développe la connexion dynamique de PACTOLS dans la chaîne de production éditoriale XML-TEI déployée auprès des éditeurs scientifiques de l’archéologie.
  • OpenEdition : associé à l’exploitation des index de revues élaborés à partir de PACTOLS sur la plateforme OpenEdition Journals des revues d’archéologie
  • ARIADNE : l’infrastructure européenne pour l’archéologie a intégré PACTOLS parmi les vocabulaires contrôlés alignés sur le Art & Architecture Thesaurus (AAT)