Où Telecom ParisTech publie régulièrement: un peu de technique

Dans l’article Où Telecom ParisTech publie régulièrement, j’ai montré un exemple d’utilisation de la représentation sémantique de notre bibliographie: un graphique qui permet de voir les séries de conférences principalement utilisées par les chercheurs de Télécom ParisTech pour publier des résultats scientifiques.

Je vais donner ici quelques éléments techniques qui ont permis d’obtenir ce résultat. Pour alléger les notations, des préfixes sont utilisés; ils sont explicités à la fin de cet article.

Pour commencer, une URI a été attribuée à chaque publication. Elles sont de la forme:

http://givingsense.eu/sembib/tpt/NNNNN

où NNNNN est un numéro unique attribué à unepublication dans la base bibliographique de Télécom ParisTech. Par exemple:

http://givingsense.eu/sembib/tpt/13387

Chaque article de conférence est associé à une conférence par le prédicat <http://givingsense.eu/sembib/inConf> que nous avons défini pour nos propres besoins.

Par exemple, l’article précédent est associé à une conférence par le triplet:

tpt:13187  sb:inConf conf:ISM2012

Chaque conférence est associée à une série de conférences à l’aide du prédicat

<http://lod.springer.com/data/ontology/property/hasSeries>

défini par l’éditeur Springer pour son point d’accès à son graphe de données (voir http://lod.springer.com/sparql-form/index.html)(chaque fois que possible les prédicats sont choisis parmi des prédicats utiles déjà utilisés par d’autres ensembles de données).

conf:ISM2012 ns0:hasSeries conf:ism

Ainsi la requête suivante nous permet de trouver le nombre de publications par série de conférences, classés par valeur croissante:

SELECT ?source (count(?paper) as ?count) 
WHERE {
graph ?g {
  ?paper sb:inConf ?conf .
  ?conf ns0:hasSeries ?urisource .
  ?urisource dc:label ?source
}
}
group by ?source
order by desc(?count)

En envoyant la requête avec une demande de réponse au format TSV, on peut directement intégrer la réponse en entrée d’un graphique défini avec la librairie graphique javascript D3.js. Le code utilisé par notre représentation graphique est une variante très simple de l’exemple présenté ici.

Note complémentaire: préfixes utilisés ci-dessus

prefix conf: <http://givingsense.eu/sembib/channels/>
prefix tpt: <http://givingsense.eu/sembib/tpt/>
prefix sb: <http://givingsense.eu/sembib/>
prefix ns0: <http://lod.springer.com/data/ontology/property/>

 

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Marquage sémantique, SemBib, SPARQL, Visualisation. Vous pouvez le mettre en favoris avec ce permalien.