Notre équipe a entrepris la réutilisation de données publiques, notamment dans le domaine de la culture. Pour cela, nous traitons des données publiques disponibles sur data.gouv.fr afin d’en améliorer leur utilisation dans le cadre du web sémantique et du LOD (Linked Open Data).
Le premier jeu de données publiées est celui intitulé
Ressources pédagogiques pour l’enseignement de l’histoire des arts
publié par le Ministère de la culture et de la communication français, sous licence ‘Licence Ouverte‘.
Le fichier initial est un fichier CSV, qui contient la description d’environ 5000 fiches pédagogiques. Ce fichier a plusieurs colonnes avec des valeurs multiples séparées par des ‘,’ ou des ‘;’. Nous avons amélioré la structuration de ces données en séparant ces valeurs pour qu’elles puissent aisément être reconnues pour des utilisations dans le cadre du web sémantique, et, en particulier avec des requêtes SPARQL. A ce sujet, voir https://ilot.wp.imt.fr/2014/01/16/publication-de-references-culturelles-dans-un-triple-store/, sur l’intégration en cours dans le cadre du projet ILOT.
Pour cela le fichier a été transformé en RDF/XML. Il est disponible à l’adresse suivante http://givingsense.eu/onto/refCulture/refHistArts.rdf. Il est publié sous licence Creative Commons Share Alike.
Nos données RDF ont été annoncées sur data.gouv.fr ici:
Les évolutions futures de notre travail devraient conduire à enrichir ces données avec:
- des liens avec des données externes (par exemple avec DBPedia pour les personnes et les lieux, des liens avec geonames pour les lieux)
- des liens vers une description enrichie pour tous les tags et mots-clés utilisés dans ce fichier.
N’hésitez pas à utiliser cette ressource. Merci de nous tenir informé si vous utilisez ou améliorez celle-ci.
Ping : Some french SPARQL endpoints | Objets Numériques et Sémantique
Ping : Quelques points d’accès SPARQL français | Objets Numériques et Sémantique