Le Thésaurus Pactols

La version V2 de Pactols est en ligne depuis septembre 2022 (en version bêta).
In memoriam Évelyne Sinigaglia.

Un vocabulaire pour l’archéologie

Pour organiser les mots-clés utilisés dans l’indexation des notices du Catalogue Collectif Indexé, l’équipe à l’origine de Frantiq a créé le thésaurus Pactols. Ce dernier était originellement organisé en 6 micro-thésaurus, plus une liste, dont les intitulés lui ont donné son nom : Peuples et cultures, Anthroponymes, Chronologie, Toponymes, Œuvres, Lieux et Sujets :

  • PEUPLES : noms de cultures préhistoriques, peuples antiques et modernes, groupes humains
  • ANTHROPONYMES : noms d’artistes, de divinités et héros, d’écrivains, de gouvernants, de religieux, de savants
  • CHRONOLOGIE : datation absolue (du XIe millénaire avant J.-C. jusqu’au IIIe millénaire), ères géologiques, événements historiques, périodisation
  • TOPONYMES : liste alphabétique de sites et toponymes non intégrés au domaine
  • ŒUVRES : œuvres artistiques, textes juridiques, littéraires et religieux
  • LIEUX : par continent, lieux imaginaires, monde antique, monde médiéval
  • SUJETS : soit 26 hyperonymes regroupant les domaines d’études de l’archéologie et des sciences de l’Antiquité

Particulièrement adapté à l’indexation des collections des bibliothèques du réseau, il couvre toutes les thématiques de l’archéologie, depuis la Préhistoire jusqu’à l’époque contemporaine. Sa spécialisation de départ dans les sciences de l’Antiquité tend à s’enrichir avec l’intégration de nouvelles ressources sur des périodes plus anciennes (Pré- et Protohistoire) ou plus récentes (Moyen âge, époque contemporaine).

Son assiette documentaire et son évolutivité en font aujourd’hui un outil de référence qui intéresse les communautés métiers de l’archéologie : éditeurs scientifiques et gestionnaires des données de la recherche y trouvent les métadonnées contrôlées et ouvertes, nécessaires à l’enrichissement et au partage de l’information sur le web sémantique.

C’est ainsi que des éditeurs, des gestionnaires de collections patrimoniales et de données de la recherche ont adopté PACTOLS comme référentiel pour l’enrichissement et le contrôle de leurs métadonnées thématiques. Voir la liste des utilisateurs

Un vocabulaire libre, contrôlé et interopérable

Conformité aux normes et respect des règles d’ouverture et d’interopérabilité :

  • Pactols répond à la norme ISO 25964 sur les thésaurus multilingues et sur l’organisation et l’interopérabilité des thésaurus.
  • Il est multilingue : les concepts sont traduits dans six des langues européennes (français langue de référence, anglais, allemand, espagnol, italien, néerlandais) et en langue arabe.
  • Il est librement consultable en ligne sur https://pactols.frantiq.fr
  • Son utilisation est soumise à la licence libre ODC Open Database License (ODbL), c’est à dire que vous pouvez le consulter et utiliser les concepts en citant leur source (crédit : CNRS-Frantiq).
  • Chaque concept possède un identifiant pérenne (ARK) qui en fait un objet web unique, citable et réutilisable dans le web sémantique.

Pactols est conforme aux principes FAIR pour le partage des données sur le web. Ils stipulent que ces dernières doivent être Faciles à trouver, Accessibles, Interopérables et Réutilisables.

Pactols est géré avec le logiciel Opentheso, développé en libre par M. Rousset, responsable de la plateforme Web sémantique et Thesaurii, à la Maison de l’Orient et de la Méditerranée, pour les besoins initiaux de PACTOLS. Celui-ci bénéficie des fonctions avancées de Opentheso pour la gestion avancée des concepts et des branches, de la polyhiérarchie, du multilinguisme et du mode d’alimentation collaborative. Ainsi, Pactols est exportable dans des formats non propriétaires (CSV, SKOS aux formats RDF/XML, Json, Json-Ld et Turtle) et interopérable via un service web ouvert de type REST.

Plusieurs connecteurs sont déjà opérationnels pour des systèmes Koha (gestion de bibliothèques), OmékaS (CMS), Métopes (édition XML). Cela a permis à plusieurs réservoirs de ressources d’utiliser dynamiquement le thésaurus Pactols pour enrichir leurs métadonnées.

Programmes d’alignements avec d’autres référentiels

Par ailleurs, le thésaurus est engagé dans plusieurs programmes d’alignement avec des référentiels en ligne, ce qui accroit sa visibilité et son interopérabilité :

  • avec Wikidata depuis 2017. L’objectif est de conforter le positionnement de Pactols dans le web des données par le biais de rapprochements réciproques entre les concepts Pactols et les items Wikidata.
    Des ateliers d’alignement se tiennent régulièrement, ouverts à tous.
    Voir la page du projet sur Wikidata.
  • avec GeoNames pour l’alignement des noms de Lieux, en partenariat avec l’Inist qui associe aussi les Pactols-Lieux de France avec l’Insee et la BnF.
  • avec IdRef, le référentiel des autorités de l’Enseignement supérieur et de la Recherche par le biais de programmes CollEx-Persée (RefDivinités, Bibracte-Ville ouverte, ArchéoRef).
  • avec le Art & Architecture Thesaurus du Getty, sur la base du partenariat de l’Inrap avec l’infrastructure européenne ARIADNE.

Structure du thésaurus

Programme de réorganisation (2017-2022)

Le lexique de Pactols n’a cessé d’évoluer depuis sa création. Pour faciliter son appropriation par une communauté d’utilisateurs élargie et sa portabilité sur le web, il devenait urgent de repenser l’organisation du thésaurus. Le projet s’est mis en place à partir de 2017 avec le soutien du Consortium MASA. Le recours à l’expertise méthodologique de S. Dalbin (ATD) a permis de définir une méthode de travail avec une feuille de route et des outils de suivi de projet et d’administration qui n’existaient pas. Le travail s’est orienté dans trois directions :

  1. Consolidation de la structure du thésaurus
  • en respectant des règles rigoureuses dans les relations
  • et en réorganisant les domaines sur des modèles sémantiques élaborés favorisant les alignements.
  1. Enrichissement du lexique avec des vocabulaires de spécialité avec deux objectifs :
  • gommer des déséquilibres actuels dans certaines thématiques,
  • répondre aux demandes précises des scientifiques pour la description des données.
  1. Évolution des modalités d’alimentation vers un collectif élargi en accompagnant les utilisateurs dans l’appropriation d’un outil partagé et contrôlé.

En 2018, il nous est apparu que la réorganisation thématique envisagée ne répondait finalement pas suffisamment aux nécessités d’interopérabilité avec d’autres vocabulaires en ligne. Nous nous inspirons d’une structure plus conceptuelle, avec facettes, telle que mise en œuvre dans le BackBone Thesaurus développé par le Groupe de travail Thesaurus Maintenance de l’Infrastructure européenne DARIAH.

Pour procéder à cette réorganisation structurelle, nous avons figé la version publique du thésaurus qui n’a plus été mise à jour à partir de janvier 2019. La version en développement, installée sur une instance indépendante de Opentheso, intégrait les propositions de candidats, les demandes spécifiques des experts, tandis que les concepts étaient déplacés petit à petit depuis les domaines Pactols vers les nouvelles thématiques.

Les changements de la v. 2.0

La structure a donc été profondément remodelée et les concepts, tous déplacés ont été révisés.

Les principales évolutions sont les suivantes :

  1. Les Lieux, qui constituaient 80% du volume global des concepts, sont désormais traités de manière autonome et constituent un thésaurus à part entière. Il bénéficiera d’un alignement de l’ensemble de ses concepts avec la base GeoNames, et en parallèle, avec Wikidata et IdRef.
  2. Les micro-thésaurus éponymes de Pactols ont été refondus dans une arborescence intégrant les apports du BackBone Thesaurus. Celle-ci propose désormais 12 branches :
    Activités ;
    Entités immatérielles ;
    Entités matérielles ;
    Entités nommées ;
    Entités sociales collectives ;
    Entités spatiales ;
    Matériaux ;
    Organismes vivants ;
    Processus naturels ;
    Rôles ;
    Types d’époque ;
    Unités géopolitiques.
  3. Un travail systématique a été entrepris sur les alignements, associé à un soin particulier apporté aux traductions et aux définitions. L’ensemble améliore sensiblement le degré de fiabilité de l’offre intellectuelle du thésaurus.

L’objectif final est surtout de franchir une étape décisive dans l’interopérabilité avec les grands référentiels internationaux.

Maintenance et mises à jour

Le Groupe de travail Pactols assure la maintenance des concepts avec des mises à jour en continu. Garant de l’intégrité structurelle du thésaurus, il gère les candidats, propose des enrichissements sémantiques, assure la liaison avec les contributeurs de Frantiq et les partenaires. Composé d’archéologues et de documentalistes familiarisés avec la discipline, il consulte des spécialistes dans certains cas complexes pour valider des créations ou pour améliorer les contenus.

Il associe étroitement les communautés de spécialistes pour chacun des dossiers concernés, par exemple :

  • GAAF, Groupement des archéologues et anthropologues funéraires
  • Groupe de travail sur les Matériaux du réseau CAIRN des archéomètres du CNRS
  • le GDR Silex
  • réseau ICERAMM

Partenaires

  • Maison de l’Orient et de la Méditerranée : pour le soutien au développement du logiciel Opentheso et le projet Arkéo de génération d’identifiants pérennes de type ARK
  • IR* Huma-Num, au travers de
    1. ISIDORE, l’assistant de recherche des sciences humaines et sociale du CNRS exploite le multilinguisme de Pactols et enrichit ses résultats de recherche avec le thésaurus
    2. Consortium MASA : depuis 2013, Pactols y est proposé comme vocabulaire de référence à tous les projets de gestion ou de valorisation des données de la recherche, développés par les partenaires
  • INIST : réalise pour Frantiq les alignements des concepts du domaine Lieux avec GeoNames, Pleiades, l’Insee (pour la France) et Wikidata.
  • Métopes : développe la connexion dynamique de Pactols dans la chaîne de production éditoriale XML-TEI déployée auprès des éditeurs scientifiques de l’archéologie.
  • OpenEdition : adapte l’exploitation des index de revues d’archéologie élaborés à partir de Pactols à la plateforme OpenEdition Journals
  • ARIADNE et ARIADNEPlus: l’infrastructure européenne pour l’archéologie a intégré Pactols parmi les vocabulaires contrôlés alignés sur le Art & Architecture Thesaurus (AAT)
  • Thesaurus maintenance WG de DARIAH-EU : depuis 2018, Frantiq participe au nom du CNRS au comité de pilotage du BackBone Thesaurus.