agrégation des méta-données

Le portail récupère les méta-données de toutes les sources pour constituer sa propre base de données.

Collecte des données

Elle peut se faire à l'initiative du portail (moissonnage) ou à celle des sources par exportation de fichiers.

  • Moissonnage: Un automate client interroge régulièrement les serveurs des SIGB pour récupérer les notices créées ou modifiées depuis le dernier passage. En informatique documentaire, le protocole utilisé est OAI/PMH.

    Tous les SIGB ne proposent pas de serveur OAI et quand il est disponible il est peu diffusé et souvent coûteux.

  • Export: Les sources mettent à disposition un fichier de leurs métadonnées dans leur propre format : ISO 2709/Marc, Dublin Core ou autre schéma XML. L'export peut être incrémentiel et/ou complet. IL n'existe pas à ce jour de protocole normalisé définissant la fréquence de l'export, le mode de transfert des données ou la structure des données locales même si la recommandation 995 est le plus souvent utilisée. C'est donc au gestionnaire du portail d'adapter son outil de collecte aux SIGB.

Modèle de données

Le modèle de la base de données agrégeant les catalogues sera adapté aux exigences de la publication :

  • Dédoublonnage pour ne garder qu'une seule notice par titre avec agrégation des localisations.

  • Enrichissement par récupération d'une notice de référence auprès de sources extérieures, de mots-clés, de résumés ou d'images de couverture.

  • Regroupement de titres : Les différentes éditions d'un même titre sont regroupés sur le principe d'un FRBR simplifié.

  • Moteur de recherche : si certains éditeurs effectuent les interrogations directement sur la base de données, l'utilisation de moteurs de recherche extérieurs spécialisés, la plupart du temps SolR, est de plus en plus pratiquée.

Choix du Format

Cette méthode suppose de disposer d'un connecteur pour chacune des sources potentielles : catalogues de bibliothèques, ressources en ligne, archives, entrepôts du web de données.

Les données devront être convertis du format d'origine -Marc, Dublin Core, Mods, EAD ou encore RDF- au format du portail.

Chaque connecteur devra pouvoir être adapté aux pratiques et usages de chaque source.

AccueilPortail  > Gestion des contenus > Accès aux contenus > agrégation des méta-données< PrécédentSuivant >