API et jeux de données

fr
  • Accueil
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Catalogue général de la BnF
    • Mandragore
    • BnF Archives et Manuscrits
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
  1. Vous êtes ici : Accueil
  2. Dumps De Data.bnf.fr
RDF/XML RDF/NT RDF/N3 RDF Manuscrits Patrimoine écrit Musique Périodiques Images Cartes Transition bibliographique

Dumps de data.bnf.fr


Présentation

Image for: Présentation

data.bnf.fr rassemble les données issues des différentes bases et catalogues de la BnF pour y donner un accès fédéré par auteurs, oeuvres, thèmes, lieux et dates. Les données de data.bnf.fr sont enrichies par des alignements avec d'autres données publiées sur le Web, comme Wikidata ou DBpedia. Elles sont exprimées selon les standards du Web sémantique et sont récupérables au format RDF (XML, NT, N3) et JSON ou JSON-LD.

Contenu des jeux de données

Image for: Contenu des jeux de données

data.bnf.fr utilise des données produites dans des formats divers, notamment Intermarc pour les livres imprimés, XML-EAD pour les archives et manuscrits, et Dublin Core pour la bibliothèque numérique Gallica. Ces données sont modélisées, regroupées, enrichies par des traitements automatiques et publiées selon le langage du Web sémantique, le RDF (Ressource description framework).

data.bnf.fr expose l'ensemble des données de bonne qualité des catalogues et bases de données de la BnF, à savoir les données relatives aux autorités (personnes, organisations, thèmes, oeuvres, lieux) validées par un expert et les données des ressources de la BnF qui sont liées à ces autorités.

Formats de récupération

Image for: Formats de récupération
  • RDF/XML
  • NT
  • N3

Modèle de données

Image for: Modèle de données

Les données de data.bnf.fr sont modélisées selon un modèle entité-relations pensé pour les bibliothèques et les collections qu'elles décrivent, et adapté à l'univers du Web.

Comprendre le modèle de données de data.bnf.fr

API et jeux de données en lien

Image for: API et jeux de données en lien
  • Les données de data.bnf.fr sont également interrogeables grâce à des requêtes SPARQL, qui permettent de récupérer les données de manière plus précise
  • Les identifiants ark des documents numérisés dans Gallica sont présents dans les données de data.bnf.fr
  • Grâce aux identifiants ark, les données de data.bnf.fr peuvent être complétées avec les données du catalogue général, disponibles par le protocole SRU

Guide technique complet

Image for: Guide technique complet

Récupérer les données de data.bnf.fr

Politique de permanence associée aux ressources identifiées par un ARK

Image for: Politique de permanence associée aux ressources identifiées par un ARK

Considérations générales sur les ARK BnF

La BnF attribue des identifiants dans le domaine ARK 12148 (Bibliothèque nationale de France) selon les principes suivants.

  • Aucun identifiant ARK ne sera attribué à nouveau ; c'est-à-dire qu'une fois qu'un lien entre un identifiant ARK et un objet aura été publié, ce lien devra être considéré comme unique, et ce pour une durée indéfinie.
  • Les identifiants ARK attribués par la BnF ne contiennent, dans la mesure du possible, aucune information sémantique facilement reconnaissable ; cela contribue à faciliter leur utilisation indépendamment d'un contexte de temps ou de lieu.
  • Les identifiants ARK attribués par la BnF contiennent un caractère de contrôle qui les garantit contre des erreurs de caractère isolées et des erreurs de transposition. Un utilisateur ayant fait une faute de frappe en tapant un ARK obtiendra une réponse HTTP 400 et un message l’informant que l’ARK fourni est erroné.

Mutabilité des ressources

La mutabilité des ressources présentes dans data.bnf.fr et identifiées par des ARK est définie comme suit.

  • Les données présentes dans data.bnf.fr et identifiées par des ARK sont issues de différents catalogues et applications de la BnF (Catalogue général, Gallica, BAM). Néanmoins, les métadonnées descriptives diffusées par data.bnf.fr présentent un différentiel par rapport à celles des applications sources. Les modifications peuvent être de plusieurs ordres :
    • Les métadonnées sont susceptibles d’avoir été enrichies de données extérieures (Wikimedia, VIAF, Bibliothèque du Congrès, etc.) ;
    • Les métadonnées peuvent avoir été enrichies grâce à des inférences permettent de déduire des informations et des liens non présents dans les données sources ;
    • Certaines métadonnées présentes initialement dans les notices sources des catalogues et applications de la BnF peuvent ne pas être affichées dans les données de data.bnf.fr. 
  • Data.bnf.fr met en avant des données dont l’application n’est pas la productrice. Les notices sources peuvent être scindées, remplacées, supprimées ou dé-publiées des applications et catalogues de la BnF. Dans ces différents cas, il est nécessaire de se référer aux politiques de maintien des ARK émanant des différents sites producteurs des notices. A terme, data.bnf.fr mettra en place des mécanismes de redirection pour que les ressources soient accessibles.

Autorité d’adressage

L’autorité d’adressage data.bnf.fr gère les qualificatifs de service génériques suivants :

  • « description » : les données dans data.bnf.fr sont scindées en deux groupes:
    • Les informations portées par un ARK suffixé par #about concernent  les entités elles-mêmes, les choses du monde réel ;
    • Les informations portées par un ARK non suffixé concernent les notices, les descriptions des entités
  • « policy » : politique de permanence de la ressource.
    • La politique de permanence des ressources rendues disponibles sur le site data.bnf.fr est à consulter sur les sites producteurs des données, notamment le Catalogue général, Gallica, BAM, etc. 

Disponibilité

Les services (hors sparql) et les données de data.bnf.fr sont accessibles 24h/24h 7j/7j. Il convient de mentionner que des indisponibilités temporaires peuvent être liées à des problématiques de service interne et ne sont pas toujours prévisibles.

Contact : data@bnf.fr

Télécharger
  • Accès aux dumps de data.bnf.fr
Fiche Technique
Date de mise en ligne

10 juin 2024

Format

RDF/XML RDF/NT RDF/N3

Licence

Licence ouverte de l’État

Technologies

RDF

Sujets

Manuscrits Patrimoine écrit Musique Périodiques Images Cartes Transition bibliographique

Contact
data@bnf.fr
Partage
Twitter Facebook Linkedin
Ressources en lien
SPARQL endpoint de data.bnf.fr

data.bnf.fr rassemble les données issues des différentes bases et catalogues de la BnF pour y donner un accès fédéré par auteurs, oeuvres, thèmes, lieux et dates.

RDF/N3 JSON RDF/NT XML CSV TSV RDF/XML RDF Sparql Patrimoine écrit Musique Cartes Images Manuscrits Périodiques Transition bibliographique
Dumps détaillés de data.bnf.fr

Cette page liste l'ensemble des jeux de données au format RDF (RDF/XML ; RDF/NT ; RDF/N3) et fournit un lien https pour chacun d'entre eux, à destination des réutilisateurs qui souhaiteraient recha

RDF/XML RDF/NT RDF/N3 RDF
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube