Ré-utilisation de données publiques: ressources pédagogiques

Notre équipe a entrepris la réutilisation de données publiques, notamment dans le domaine de la culture. Pour cela, nous traitons des données publiques disponibles sur data.gouv.fr afin d’en améliorer leur utilisation dans le cadre du web sémantique et du LOD (Linked Open Data).

Le premier jeu de données publiées est celui intitulé

Ressources pédagogiques pour l’enseignement de l’histoire des arts

publié par le Ministère de la culture et de la communication français, sous licence ‘Licence Ouverte‘.

Le fichier initial est un fichier CSV, qui contient la description d’environ 5000 fiches pédagogiques. Ce fichier a plusieurs colonnes avec des valeurs multiples séparées par des ‘,’ ou des ‘;’. Nous avons amélioré la structuration de ces données en séparant ces valeurs pour qu’elles puissent aisément être reconnues pour des utilisations dans le cadre du web sémantique, et, en particulier avec des requêtes SPARQL. A ce sujet, voir https://ilot.wp.imt.fr/2014/01/16/publication-de-references-culturelles-dans-un-triple-store/, sur l’intégration en cours dans le cadre du projet ILOT.

Pour cela le fichier a été transformé en RDF/XML. Il est disponible à l’adresse suivante http://givingsense.eu/onto/refCulture/refHistArts.rdf. Il est publié sous licence Creative Commons Share Alike.

Nos données RDF ont été annoncées sur data.gouv.fr ici:

https://www.data.gouv.fr/fr/dataset/ressources-pedagogiques-pour-l-enseignement-de-l-histoire-des-arts

Les évolutions futures de notre travail devraient conduire à enrichir ces données avec:

  • des liens avec des données externes (par exemple avec DBPedia pour les personnes et les lieux, des liens avec geonames pour les lieux)
  • des liens vers une description enrichie pour tous les tags et mots-clés utilisés dans ce fichier.

N’hésitez pas à utiliser cette ressource. Merci de nous tenir informé si vous utilisez ou améliorez celle-ci.

 

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Cuisine OWL, Données publiques, avec comme mot(s)-clé(s) , , , , . Vous pouvez le mettre en favoris avec ce permalien.

2 réponses à Ré-utilisation de données publiques: ressources pédagogiques

  1. Ping : Some french SPARQL endpoints | Objets Numériques et Sémantique

  2. Ping : Quelques points d’accès SPARQL français | Objets Numériques et Sémantique

Les commentaires sont fermés.