Trouver l’élément Wikidata correspondant à une entité qu’on connait dans DBPedia

Supposons que nous nous intéressons à une entité dans DBPedia, par exemple:

http://fr.dbpedia.org/resource/Mus%C3%A9e_Carnavalet (page web associée http://fr.dbpedia.org/page/Mus%C3%A9e_Carnavalet)

qui décrit le Musée Caranavalet.

Nous voulons trouver automatiquement une éventuelle entité dans Wikidata décrivant la même entité.

Dans DBPedia, une entité est toujours associée à la page Wikipedia qui a servi à générer l’entité de DBPedia.  Cette page est désignée par la valeur associée à la propriété http://www.w3.org/ns/prov#wasDerivedFrom qui permet de donner une information de provenance des données.

Ici, la valeur est:

http://fr.wikipedia.org/wiki/Mus%C3%A9e_Carnavalet?oldid=110401968

En suivant ce lien, on peut récupérer la page de Wikipedia correspondante ( et, au passage, tous le texte d’origine). Ce qui va nous intéresser, c’est « t-wikibase » qui désigne, s’il est présent, un lien vers une entité de Wikidata correspondant à la page. Ce lien est dans la propriété href du tag <a> contenu dans l’élément d’id « t-wikibase ».

<li id="t-wikibase">
  <a 
    href="https://www.wikidata.org/wiki/Special:EntityPage/Q640447" 
    title="Lien vers l’élément de référentiel des données connectées [g]" 
    accesskey="g">Élément Wikidata</a>
</li>

C’est bon. Nous avons trouvé l’entité de Wikidata cherchée:

https://www.wikidata.org/wiki/Special:EntityPage/Q640447

 

 

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Cultural data, DBPedia, Données publiques, Outils. Vous pouvez le mettre en favoris avec ce permalien.