site_title

Web sémantique

Contexte

La Bibliothèque nationale de France est entrée dans une démarche d’ouverture des données, avec l’exposition, sur le « Web de données », de données brutes, sur le site data.bnf.fr. Elle répond ainsi à sa mission de diffusion de son patrimoine le plus largement possible et par les moyens techniques les plus modernes. La BnF étend cette expérience à la base des éditions parisiennes du XVIe siècle, BP 16, en diffusant l’ensemble de ses données en RDF (Resource Description Framework). L'ensemble des métadonnées descriptives de la BnF sont disponibles sous Licence ouverte de l’État, permettant leur libre utilisation, sous réserve de la mention de la source : « Bibliothèque nationale de France ». Pour en savoir plus : http://www.bnf.fr/fr/professionnels/recuperation_donnees_bnf.htm. L’ouverture des données, dans la perspective du « Web sémantique » ou « Web de données » (linked data), est définie par le W3C. Le « Web sémantique » permet aux données disponibles d’être plus facilement utilisables et interprétables automatiquement par des machines. S’appuyant sur ces technologies, le « Web de données » (Linked Data) permet de sortir les données de leurs silos, pour les publier sur le Web et les relier entre elles pour constituer un réseau global d'informations. Ces outils sont une opportunité pour l’intégration des bibliothèques sur le Web et la valorisation de leurs ressources. En fournissant des données structurées et exploitables par des machines, ces techniques permettent de sortir les ressources de la BnF, rares et de bonnes qualité, jusque-là cachées dans le « Web profond », afin de les rendre visibles et utiles sur le Web. Les données de la BnF peuvent ainsi être liées entre elles et vers des ressources extérieures du web. Pour en savoir plus sur le web sémantique, ainsi que sur son application dans les projets de la BnF .

Récupérer et utiliser les données de bp16.bnf.fr

Vous pouvez récupérer les données de bp16.bnf.fr :

Identifiants pérennes :

La BnF fournit des identifiants qu’elle attribue selon le mécanisme ARK (Archival resource key) pour chaque notice. A partir de ces ARK, les URI sont constituées sur le modèle : http://bp16.bnf.fr/ark.

Modèle de données

modèle de données

Le modèle de données de bp16.bnf.fr s’appuie sur le modèle bibliographique modèle FRBR (Functional requirements for Bibliographic Records) élaboré par l’IFLA.

Nous avons distingué :
  • l’édition du livre, qui correspond dans ce modèle au niveau manifestation du modèle FRBR. Exemple : http://bp16.bnf.fr/ark:/12148/cb41877803c
  • l’exemplaire du livre : cet exemplaire est localisé dans une institution ou et numérisé. Exemple : http://bp16.bnf.fr/ark:/12148/cb41877803c#item
  • Vous trouverez aussi des liens vers les données de la BnF :
  • du catalogue général, lorsque des exemplaires d’une édition sont présents à la BnF (propriété rdfs :seeAlso),
  • de la bibliothèque numérique Gallica,
  • ainsi que vers les pages auteur et œuvre de data.bnf.fr.
  • Choix des ontologies et des vocabulaires

    Ontologies :

    Nous avons choisi d’utiliser les vocabulaires et ontologies existantes, dans la mesure du possible :
  • Dublin Core elements : http://purl.org/dc/terms/
  • RDA relationships : http://rdvocab.info/RDARelationshipsWEMI
  • RDA elements groupe 1 :http://rdvocab.info/Elements
  • Les rôles RDAhttp://rdvocab.info/roles/
  • RDFs http://www.w3.org/2000/01/rdf-schema
  • Les éléments spécifiques à la base des éditions parisiennes du 16e siècle (identifiant BP16, par exemple) sont décrits avec des propriétés propres à la BnF, et déclarées dans l’ontologie : http://data.bnf.fr/ontology/bnf-onto.

    Vocabulaires :

    Pour décrire les rôles des personnes ou organisations sur un livre (auteur, commentateur, éditeur scientifique, imprimeur-libraire) nous utilisons:
  • les codes de fonctions de la Librairie du Congrès de type : http://id.loc.gov/vocabulary/relators.html
  • les codes de fonctions de la Bibliothèque nationale de France : http://data.bnf.fr/vocabulary/roles
  • Logiciel utilisé : CubicWeb

    CubicWeb est une plateforme open source de développement d'applications Web sémantique, publiée sous la licence LGPL.
    Pour en savoir plus : logo cubicWeb