Documentation Pactols

Nouveautés de Pactols v. 2.0

Questions fréquentes – FAQ

La FAQ renvoie parfois à la documentation de Opentheso pour les questions relevant du fonctionnement du logiciel.

Mon compte

Un compte Pactols permet d’accéder à des fonctions du thésaurus qui ne sont pas accessibles en consultation publique.
Par exemple, selon le niveau d’autorisation accordée, demander l’ajout de concepts manquant, ou exporter partie ou totalité du thésaurus.

  • Pour demander la création de votre identifiant : envoyez un mail à pactols@services.cnrs.fr
  • En cas d’oubli, cliquez sur « Connexion / Mot de passe oublié » situé en haut à droite de l’écran.

Comprendre Pactols

Un thésaurus est un langage documentaire fondé sur une structuration hiérarchisée d’un ensemble contrôlé et dynamique de concepts normalisés et multilingues.
Il concerne un domaine de la connaissance en particulier.
Au sein de sa structure hiérarchique, les relations entre les termes (ou mots-clés ou concepts) sont multiples : générique (père), spécifique (fils), associé ou encore synonyme. L’objectif d’un vocabulaire contrôlé est de faciliter la recherche documentaire en contournant les difficultés du langage courant, en évitant les ambiguïtés et en contextualisant les termes.

Le thésaurus Pactols fournit ainsi des termes validés pour l’archéologie, depuis la préhistoire jusqu’à la période contemporaine et pour et les sciences de l’Antiquité, sous tous leurs aspects. Ils servent à compléter les métadonnées descriptives d’une ressource (publication, document de fouille, objet archéologique, etc.) et en permettent la recherche la plus efficace possible.

D’une manière générale, un vocabulaire contrôlé peut aller d’une courte liste de termes clairement définis à une classification plus complexe comme un thésaurus avec des centaines de termes liés entre eux.

Un thésaurus est fondé sur une structuration hiérarchisée d’un ou plusieurs domaines de la connaissance et dans lequel :

  • Les concepts sont représentées par des termes (libellés), en une ou plusieurs langues naturelles,
  • Les relations sont représentées par des signes conventionnels (BT, NT, RT,  SYN, etc.) qui marquent la dépendance ou l’association des concepts entre eux.

Les référentiels sont des « ensembles de termes structurés, décrivant un métier ou une discipline, créés et maintenus par des organisations ou institutions scientifiques, auxquels un système d’information peut faire référence afin d’enrichir sémantiquement les métadonnées des documents indexés » (https://hnlab.huma-num.fr/hnso/ouvrage-in/referentiels-concepts-definitions.html).

Pactols est né de la nécessité d’organiser les mots-clés du Catalogue collectif indexé des bibliothèques du réseau Frantiq créé en 1984. L’ensemble a été regroupé en microthésaurus, aussi appelés domaines ou thématiques, et a été nommé d’après les initiales de ses 7 thématiques : Peuples, Anthroponymes, Chronologie, Toponymes, Œuvres, Lieux, Sujets. Le nombre de concepts du thésaurus a évolué au fur et à mesure de l’intégration dans le réseau de nouvelles bibliothèques, qui l’ont enrichi de leurs concepts spécifiques.

Il contenait près de 60 000 concepts en 2019 dont 80% de noms de lieux.

Une réorganisation complète du thésaurus a été lancée en 2017. Elle visait à consolider sa structure et à l’associer avec d’autres référentiels du web pour assurer son interopérabilité.
Elle a été l’occasion de mettre à jour le lexique au regard des évolutions de la discipline. La version 2022 de Pactols propose deux thésaurus indépendants : l’un avec 12 domaines adaptés à l’archéologie et aux sciences de l’Antiquité, l’autre avec les concepts de lieux.

Pour en savoir plus :

Pactols est un thésaurus. Parler de Pactols fait référence à son contenu, soit 12000 concepts ou mots-clés en septembre 2022, relatifs à l’archéologie et aux sciences de l’Antiquité, organisés en 12 branches thématiques.

Opentheso est un logiciel libre de gestion multilingue, conforme à la norme internationale pour les thésaurus ISO 25964 Information et documentation – Thésaurus et interopérabilité avec d’autres vocabulaires. Il permet de gérer les concepts de Pactols, depuis la suggestion de candidats jusqu’à leur validation en concepts, l’administration des branches et l’exposition de l’ensemble sur le web. En effet, il permet des alignements avec d’autres vocabulaires, la liaison avec d’autres corpus ou base de données. Opentheso est un outil complet, développé au départ pour Pactols à la demande de Frantiq. Il est maintenant ouvert à tous. Il se positionne comme un outil générique proposé dans la grille de services de l’infrastructure de recherche Huma-Num.

Pour en savoir plus sur  Opentheso > tutoriels vidéos  +   Opentheso > mode d’emploi

Pactols est multilingue, ce qui est rare pour ce genre d’outils souvent uniquement traduits en anglais.

Les concepts de Pactols sont traduits du français en 6 langues (au minimum) : l’allemand, l’anglais, l’arabe, l’espagnol, l’italien et le néerlandais. A ce titre ils permettent un choix démultiplié de concepts tant pour le catalogage que pour la recherche.

Pactols est composé de deux thésaurus :

  • un thésaurus thématique (Pactols-Sujets) organisé en 12 domaines hiérarchiques dans lesquelles ont été répartis des concepts utiles à l’archéologie et aux sciences de l’Antiquité,
  • un thésaurus regroupant les noms de lieux (Pactols-Lieux).

Ils ont été séparés afin de permettre un temps d’interrogation plus court, les lieux représentant 80% des données de la version précédente du thésaurus. Pour Pactols-Sujets, chaque thématique est introduite par un concept « tête de hiérarchie » dont dépendent des concepts de niveau inférieur, liés principalement par des relations de dépendance.

Ils sont interrogeables ensemble depuis la page d’accueil ou séparément.

Une arborescence est une organisation hiérarchique de mots-clés ou concepts, dont la représentation rappelle un arbre et ses branches. Les relations sémantiques entre les concepts sont donc d’abord de dépendance descendante/ascendante et s’enrichissent d’associations entre des concepts de branches différentes.

Une collection est un regroupement qui permet de créer des ensembles cohérents de concepts n’appartenant pas nécessairement à une même branche. N’affichant pas de structure hiérarchique, elle liste les concepts sous forme alphabétique.  Elle peut être assimilée à un tag qui marque un concept et permet de constituer un ensemble virtuel.

Dans Pactols, la collection et l’arborescence sont bien deux choses différentes. Les concepts de têtes dans la hiérarchie et les collections ne s’écrivent pas de la même façon : en capitale pour les collections, en caractères normaux pour les têtes de hiérarchie.

La structure hiérarchique de Pactols est composée de 12 entrées ou têtes de hiérarchie :

activités
entités immatérielles
entités matérielles
entités nommées
entités sociales collectives
entités spatiales
matériaux
organismes vivants
processus naturels
rôles
entités temporelles
unités géopolitiques

Cette organisation est inspirée de celle du BackBone Thesaurus (BBT) de DARIAH, à laquelle ont été ajoutées deux branches particulières : entités nommées et organismes vivants.

Aujourd’hui les branches hiérarchiques et les collections de Pactols reprennent en grande partie le modèle du BackBone Thesaurus (BBT) de DARIAH .

Ce méta-thésaurus, élaboré par l’infrastructure européenne DARIAH, présente une structure conceptuelle alignée sur l’ontologie du Cidoc-CRM. Il n’a pas vocation à accueillir des concepts, mais constitue un modèle à deux niveaux hiérarchiques pour l’alignement de thésaurus normalisés dans les domaines des sciences humaines et sociales.

Dans la première version de Pactols, les Lieux faisaient partie des 7 domaines ou micro-thésaurus. Dans la version actuelle (à partir de 2022), il a été décidé de déplacer les noms de lieux dans un thésaurus à part car ils représentaient 80 % de la totalité des concepts et rendaient la manipulation de l’ensemble difficile.

Les thésaurus Sujets et Lieux sont autonomes mais peuvent s’interroger de façon simultanée via le menu Recherche à l’ouverture d’Opentheso.

La facette est un regroupement virtuel de concepts. Elle n’est pas utilisable pour indexer.

Dans Pactols, les concepts rassemblés dans une facette appartiennent la plupart du temps à la même branche que la facette. Celle-ci n’est qu’un moyen de présenter de façon plus cohérente certains contenus.

Une facette est représentée dans la hiérarchie par le signe et n’apparaît pas dans la Collection.
Dans l’exemple ci-dessous, tous les concepts sont des termes spécifiques de médecine. Ils ont été répartis dans deux facettes qui offrent une meilleure lisibilité à l’ensemble.

Exemple

médecine

médecine par spécialité
chirurgie
gynécologie
médecine légale
      (etc.)

médecine par tradition
médecine antique
    médecine arabe

FAIR correspond à des principes d’ouverture des données visant à les rendre Faciles à trouver, Accessibles, Interopérables et Réutilisables.

Comme vocabulaire contrôlé, normalisé et aligné, disponible sous licence ouverte, Pactols fournit des métadonnées, conformes à la norme ISO25964 Information-Documentation et interopérables : chaque concept est décrit selon le modèle SKOS (Simple Knowledge Organization System), il est identifié par un identifiant stable appelé URI (Uniform Resource Identifier) de type Ark (Archival Resource Key) qui en fait un objet numérique repérable sur le web.

Chaque concept de Pactols est aligné à au moins un des référentiels du web (Wikidata, IdRef, GeoNames… ). De plus, sa structure, calquée sur celle du BackBone Thesaurus (BBT) de l’Infrastructure européenne DARIAH, le rend compatible avec le modèle conceptuel de l’ontologie du CIDOC-CRM.

FAIR lui-même, Pactols constitue une brique à la construction de données FAIR.

Toute base de données connectée via le web service de Opentheso peut autoriser l’affichage de son utilisation de Pactols.

Le champ « Corpus lié » signale alors son nom et le nombre d’items indexés avec le concept.
Le lien affiché renvoie à la base de données, sur les items correspondants.

L’intérêt est d’offrir la possibilité de rebonds, depuis un concept Pactols, vers des ressources différentes : notices issues des bibliothèques du Catalogue collectif indexé de Frantiq, notices de sculptures romaines du projet SculptuRO, fiches d’inscriptions épigraphiques de la base EpiCherchell, etc.

Un corpus lié à Pactols peut donc être un catalogue, une base de données, une revue, etc. qui a signalé à Opentheso qu’il utilise Pactols et avec lequel les alignements ont pu être faits.

Cela permet à l’utilisateur du thésaurus de faire des rebonds, depuis un point unique vers des ressources différentes.

Comprendre ce qu’est un concept

Un mot clé est un mot usuel défini pour le référencement d’un objet. C’est souvent un mot ou groupe de mots extrait d’un texte et représentant une des notions fondamentales de l’information contenue dans le texte. Dans les thésaurus, on parle aussi de descripteurs, par opposition aux candidats qui sont des descripteurs proposés et non encore validés. Un concept a un sens plus large car il contient la possibilité d’une représentation concrète ou plus abstraite. Il peut parfois être synonyme de « l’idée de ce qu’on peut se faire de quelque chose ». Cette notion a été retenue dans le modèle SKOS et dans les ontologies. Un concept est constitué des relations sémantiques qu’il entretient avec les autres éléments du thésaurus et par ses caractéristiques (différents libellés, définitions, notes… ).

Un concept est composé d’un certain nombre d’informations normalisées qui le rendent unique et dans l’idéal interopérable :
  • le libellé : le mot ou groupe de mots choisis pour le représenter,
  • les variantes du libellé : les formes rejetées du concept,
  • les collections auxquelles il est rattaché,
  • les corpus liés  : bases de données qui l’utilisent pour indexer leurs ressources et le signalent par un lien remontant via l’API de Opentheso,
  • le concept générique : le concept père,
  • le concept spécifique : le concepts enfant ou fils,
  • le concept associé : le concept de proximité sémantique mais positionnés dans une autre branche du thésaurus. Il permet de naviguer dans le thésaurus par rebond,
  • les traductions : formes traduites du libellé,
  • des notes (définition, note d’application) précisent son sens et contextualisent si besoin son usage,
  • des alignements : liens d’équivalence créés avec un item d’autres référentiels du web,
  • un Id interne : identifiant de gestion interne à Opentheso,
  • un URI (Uniform Resource Identifier) : adresse web unique, stable et pérenne du concept,
  • un IdArk : voir la section sur les identifiants,
  • des coordonnées GPS : la géolocalisation du concept, par exemple le  Théâtre de Lillebonne,
  • des images : illustrations du concept, par exemple : Epitaphe,
  • Un QRcode : lien schématique vers le concept.
La possibilité d’exporter un concept : voir la section dans Opentheso La possibilité de proposer des améliorations au concept Certains champs n’apparaissent qu’une fois connecté.

Dans Pactols, un « terme déprécié » est un concept qui a été retiré de l’arborescence du thésaurus et ne doit plus être utilisé pour indexer. Il renvoie le plus souvent à un concept de remplacement. Plusieurs raisons ont pu conduire à sa dépréciation :
  • il s’est révélé être une forme doublon d’un autre concept,
  • son usage est obsolète,
  • il a été remplacé par une facette.

Les concepts de Pactols portent plusieurs identifiants :
  • un identifiant interne, Id interne, pour la gestion interne du thésaurus,
  • des identifiants stables sur le modèle Ark (IdArk). Ils sont la carte d’identité du concept,
  • un URI (Uniform Resource Identifier) qui est l’adresse web unique du concept. Il est appelé par les systèmes informatiques pour pointer sur le concept en question.

La notion d’alignement fait référence au lien réalisé entre les items de plusieurs vocabulaires contrôlés du web. Ainsi, un concept Pactols a un équivalent dans un autre référentiel. L’équivalence peut être exacte, proche, générique ou spécifique. Dans Pactols, ce sont les équivalences exactes (ExactMatch) qui sont retenues.   Plus un concept est aligné, plus il a d’audience et mieux l’objet qu’il représente est référencé. Pactols est aligné peu ou prou avec le Art & Architecture Thesaurus de la Fondation Getty, Wikidata (à 80%), Rameau (BnF), IdRef (Abes), nomenclature de l’Insee et GeoNames (pour Pactols-Lieux).

Aide à la recherche dans Pactols

Il y a deux modes d’interrogations dans Pactols :
  • la consultation à partir des onglets permet de déployer la hiérarchie des concepts ou de lister le contenu des collections,
  • la boîte de Recherche avec laquelle on a un accède plus directement au contenu.
Quel que soit le chemin choisi, la fiche d’un concept reste identique avec ses éléments de description : définition et/ou autres libellés, le cas échéant, et l’accès aux concepts associés, aux concepts spécifiques, aux Corpus liés, etc.

Les résultats d’une recherche s’affichent sur la droite de l’écran et des sigles précisent les relations du concept. Ces sigles sont décrits dans la norme utilisée pour décrire la position du concept dans l’arborescence du thésaurus.
  • RT signifie « related term /concept associé ». Il renvoie vers un autre concept proche sémantiquement mais placé à un autre endroit du thésaurus.
  • BT signifie « broader term /concept générique ». C’est le concept père qui peut lui-même être dépendant d’un autre concept supérieur.
  • NT signifie « narrower term / concept spécifique ». Il précise ou restreint le sens du concept supérieur.
  • SYN signifie « synonyme / concept alternatif ». Il s’agit de la forme rejetée ou alternative, soit la variante du libellé du concept. Elle reste interrogeable et renvoie à la forme retenue ou préférée du concept.

Utiliser Pactols

L’accès au thésaurus Pactols est libre et gratuit. Il se fait à travers son gestionnaire libre Opentheso à partir de l’adresse https://pactols.frantiq.fr La navigation nécessite de choisir l’un des deux thésaurus, à partir du bouton de sélection de la barre supérieure ou avec les liens donnés dans le texte de la page d’accueil. La recherche se fait par défaut dans les deux thésaurus Sujets et Lieux simultanément mais peut être filtrée sur l’un des deux s’il a été préalablement sélectionné.  

Des formations sont régulièrement proposées. Elles sensibilisent à la méthode de l’indexation et permettent de découvrir le thésaurus, pour une consultation en ligne ou son intégration dans une base de données. Consultez le calendrier des formations du Consortium MASA et celui de Frantiq, sur la page du groupe de travail Formation.

Les utilisateurs de Pactols sont nombreux et divers. Qui sont-ils ?
  • Les bibliothécaires et documentalistes du réseau Frantiq,
  • des gestionnaires de bases de données scientifiques et patrimoniales,
  • les éditeurs de revues et collections scientifiques de la discipline à la recherche d’un vocabulaire contrôlé pour construire des index stabilisés et multilingues. L’utilisation de la chaîne Métopes facilite le choix des mots-clés dans les articles puisque Pactols est intégré dans ses outils d’indexation.
  • des archivistes, dont ceux de Frantiq,
  • les scientifiques qui établissent des bases de données de travail ou exposent leurs données dans des entrepôts,
  • toute personne en quête d’une ressource documentaire portant sur l’archéologie et les sciences de l’Antiquité.
Voir la liste des utilisateurs identifiés

Pactols est diffusé sous licence OdBL : c’est une licence libre, spécifique aux bases de données. Elle permet de consulter et de réutiliser librement le contenu du thésaurus en précisant simplement son origine. Merci de citer : « Crédits : CNRS-Frantiq ».

Pactols est interopérable. Plusieurs possibilités existent pour lier une base de données avec Pactols :
  1. En associant les mots-clés de la base de données aux concepts équivalents de Pactols : – soit au sein d’une liste fermée où chacun des termes sera associé à l’URI du concept Pactols, Il faudra au préalable rapprocher les deux vocabulaires pour repérer les équivalences, – soit en utilisant plus librement les libellés de Pactols et URI de Pactols, copiés/collés dans le champ de la métadonnée correspondant.
  2. En utilisant l’API de Opentheso, il est possible d’associer le thésaurus à une base de données pour avoir un accès dynamique à Pactols. Dès lors, le choix du mot-clé se fait par import dans la zone de métadonnée correspondante, avec libellé et URI. La validation du lien de retour permettra en outre à Pactols d’afficher l’occurrence dans les Corpus liés du concept.
Quoiqu’il en soit, l’aide à l’installation de l’API est en ligne sur Github Opentheso (contact) : faites-vous connaître auprès de nous !

Il est possible de filtrer la requête d’Opentheso sur une ou plusieurs parties du thésaurus Pactols avec les identifiants de chaque élément. Filtrer sur un thésaurus en particulier :
  • Pactols-Sujet : TH_1
  • Pactols-Lieux : th17
Filtrer sur une ou plusieurs collections du thésaurus Sujets : Les collections portent un préfixe qui les rattachent à une version du thésaurus : P2 est spécifique à la version 2, P1 reconstitue les micro-thésaurus de la version précédente de Pactols.
  • P2-ACTIVITÉS= G116
  • P2-ENTITÉS IMMATÉRIELLES = G126
  • P2-ENTITÉS  MATÉRIELLES = G122
  • P2-ENTITÉS NOMMÉES = G173
  • P2-ENTITÉS SOCIALES COLLECTIVES = G128
  • P2-ENTITÉS SPATIALES = G137
  • P2-ENTITÉS TEMPORELLES = G124
  • P2-MATÉRIAUX = G120
  • P2-ORGANISMES VIVANTS = G135
  • P2-PROCESSUS NATURELS = G118
  • P2-RÔLES = G130
  • P2-UNITÉS GÉOPOLITIQUES = G132
  • P1-PEUPLES = 1
  • P1-ANTHROPONYMES = 2
  • P1-CHRONOLOGIE = 4
  • P1-OEUVRES = 3
  • P1-SUJETS = 6

Participer à Pactols

La demande se fait depuis le module « Candidat » accessible avec un compte utilisateur (voir  Mon compte). Toute demande de création d’un nouveau mot-clé doit à minima :
  • correspondre au domaine de l’archéologie ou des sciences dites connexes ;
  • combler une lacune gênante ou propose un nouveau sujet ;
  • être assortie d’une définition sourcée (avec une ou plusieurs références bibliographiques) et dans le cas des termes polysémiques, orientée sur la discipline ;
  • proposer une traduction du concept au minimum en anglais.
Le libellé du concept proposé doit, dans le respect des règles d’écriture des thésaurus en français, être un substantif au singulier. La demande sera examinée par un comité de validation qui contrôlera la validité de la proposition et placera le concept dans la hiérarchie. Le module Candidat assure le suivi de la demande.

Vous pouvez envoyer un email à pactols@services.cnrs.fr (Prochainement : utiliser le bouton « suggérer » une correction » en bas de chaque fiche de concept)

Le comité de validation est composé de documentalistes de Frantiq qui s’appuie sur un comité d’experts. Il se charge de créer la notice du concept et de le positionner dans le thésaurus. Le demandeur est tenu informé du suivi par message électronique du module Candidat.

Les experts de Pactols sont des spécialistes des domaines de l’archéologie qui viennent en appui au comité de validation. Ils émettent des avis sur les suggestions de candidats et sur l’organisation générale du thésaurus. Pour exemple, une quarantaine de spécialistes ont participé à la révision du thésaurus entre 2019 et 2022. Pour rejoindre ce groupe, faire acte de candidature spontanée ou répondre à l’appel à participation de Frantiq.