Archives de l’auteur : Moissinac

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes

CMN et Wikidata: établir des liens

Au 4/1/2019, ma liste de monuments du CMN –Centre des Monuments Nationaux–  comporte 84 monuments.J’ai établi plusieurs méthodes de recherche de liens de ces monuments avec des entités de Wikidata.La plus simple donne 44 liens. Elle cherche un lien à … Continuer la lecture

Publié dans Cultural data, Data Musée, Marquage sémantique | Laisser un commentaire

Les oeuvres d’art dans Wikidata

Dans le cadre du projet Data&Musée, nous sommes amenés à nous intéresser aux données liées disponibles au sujet des œuvres d’art, aux artistes et aux musées et monuments qui ont un lien avec ces œuvres. Nous avons déjà abordé cette … Continuer la lecture

Publié dans Uncategorized | Laisser un commentaire

Les oeuvres d’art dans DBpedia

Dans le cadre du projet Data&Musée, nous sommes amenés à nous intéresser aux données liées disponibles au sujet des œuvres d’art, aux artistes et aux musées et monuments qui ont un lien avec ces œuvres. Nombre d’œuvres et leurs typesNous … Continuer la lecture

Publié dans Uncategorized | 2 commentaires

Paris Musées et Wikidata: établir des liens

Au 6/1/2019, ma liste des établissements rattachés à Paris Musées comporte 14 musées avec 16 dénominations (voir à la fin de ce billet). Elle a été constituée à la main à partir du site de Paris Musées.J’ai établi plusieurs méthodes … Continuer la lecture

Publié dans Cultural data, Data Musée, Données publiques, Marquage sémantique, Outils, SPARQL | Laisser un commentaire

Transposer Tf-Idf sur des graphes

Tf-Idf est une méthode de pondération, souvent utilisée pour évaluer l’importance d’un mot dans un document.L’idée est ici d’évaluer l’importance d’un prédicat ou d’une paire prédicat-valeur pour une entité d’un graphe sémantique. Tf-Idf sur les prédicatsNous allons, pour cette première … Continuer la lecture

Publié dans Outils, SPARQL | Laisser un commentaire

Trouver l’élément Wikidata correspondant à une entité qu’on connait dans DBPedia

Supposons que nous nous intéressons à une entité dans DBPedia, par exemple:http://fr.dbpedia.org/resource/Mus%C3%A9e_Carnavalet (page web associée http://fr.dbpedia.org/page/Mus%C3%A9e_Carnavalet)qui décrit le Musée Caranavalet.Nous voulons trouver automatiquement une éventuelle entité dans Wikidata décrivant la même entité.Dans DBPedia, une entité est toujours associée à la page … Continuer la lecture

Publié dans Cultural data, DBPedia, Données publiques, Outils | Laisser un commentaire

Les âges sur des livres d’or de musées

Dans le cadre du projet Data&Musée, nous avons des données déposées sur les livre d’or électronique -fournis par Guestviews– de certaines institutions. Ces données proviennent pour le moment de membres de Paris Musées.Note: Bien sûr, nous avons anonymisé ces données.Il y … Continuer la lecture

Publié dans Data Musée, SPARQL | Laisser un commentaire

Contexte de Paris Musées dans DBPedia

Note: les préfixes utilisés dans le corps du texte sont définis à la fin de ce billet Méthode de création d’un « contexte »Nous avons récupéré la liste des 14 musées de Paris Musées. Avec les noms, nous avons facilement trouvé les … Continuer la lecture

Publié dans Uncategorized | Laisser un commentaire

Données des musées et analyses de Tweets

Dans le cadre du projet Data&Musée, nous avons notamment accès à des messages laissés par des visiteurs sur des « livres d’or » électroniques. L’observation de ces messages montre qu’ils sont composés de textes courts, souvent elliptiques, avec une orthographe incertaine et … Continuer la lecture

Publié dans Uncategorized | Laisser un commentaire

Pourquoi un dépôt local de publications?

Le projet SemBib porte l’idée d’une fédération de dépôts locaux de publications scientifiques. Mais pour commencer, on peut se poser la question: pourquoi un dépôt local de publications?Je ne vais pas donner ici toutes les justifications, mais commencer par une: … Continuer la lecture

Publié dans Données publiques, Marquage sémantique, Outils, SemBib | Laisser un commentaire

Désactivation de Wordlift

Dans le billet https://onsem.wp.imt.fr/2016/04/20/wordlift-est-arrive-sur-ce-site/, j’annonçais l’utilisation de l’extension Wordlift. J’étais un des adopteurs précoces de cet outil qui permet de marquer sémantiquement les billets d’un blog WordPress, facilement sous la supervision de l’auteur de l’article.J’ai le regret de devoir la désactiver. … Continuer la lecture

Publié dans Uncategorized | Laisser un commentaire

Lancement du projet Data&Musée

Nous démarrons pour deux ans le projet Data&Musée avec une dizaine de partenaires. Ce projet porte sur les données produites et utilisées par les musées et institutions culturelles: billetterie, traces de visite du site web, livre d’or, parcours…Evidemment, nous allons … Continuer la lecture

Publié dans Cultural data, Marquage sémantique | Laisser un commentaire

Identifiants IdRef de chercheurs

Dans le post Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur, j’avais identifié IDREF comme source possible d’identifiants pour le projet SemBib.J’ai obtenu une liste de 195 personnels de Télécom ParisTech impliqués dans la recherche. J’ai utilisé la … Continuer la lecture

Publié dans Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Où Telecom ParisTech publie régulièrement: un peu de technique

Dans l’article Où Telecom ParisTech publie régulièrement, j’ai montré un exemple d’utilisation de la représentation sémantique de notre bibliographie: un graphique qui permet de voir les séries de conférences principalement utilisées par les chercheurs de Télécom ParisTech pour publier des résultats … Continuer la lecture

Publié dans Marquage sémantique, SemBib, SPARQL, Visualisation | Laisser un commentaire

Où Telecom ParisTech publie régulièrement?

(cliquer pour voir en grand)Notre base bibliographique ne permet pas de faire ressortir aisément les conférences et journaux où nous publions souvent. L’approche sémantique que nous avons entamé avec le projet SemBib apporte des réponses.Dans le cadre du projet SemBib, … Continuer la lecture

Publié dans Marquage sémantique, SemBib, Visualisation | Un commentaire

Analyser les publications de Telecom ParisTech: les données disponibles

Cet article fait suite à https://onsem.wp.imt.fr/2016/04/20/co-auteurs-des-publications-dune-institution-scientifique-telecom-paristech/.Dans cet article, nous visualisions les liens entre chercheurs matérialisés  par des publications scientifiques communes.J’utilise les données obtenues de la base bibliographique de Telecom ParisTech.Mon idée est de tirer des informations utiles -j’espère- de cet ensemble … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Laisser un commentaire

Essais avec l’API Mendeley

Mendeley est un outil d’aide aux chercheurs pour organiser les références qu’ils consultent. Mendeley dispose d’une API. Ce billet rend compte des premiers essais effectués avec cette API. Je vais accéder à quelques données depuis un programme Python.Il est nécessaire … Continuer la lecture

Publié dans Outils, SemBib | Laisser un commentaire

Identifiants LOD pour Télécom ParisTech

Télécom ParisTech est une des principales écoles d’ingénieur du numérique en France; c’est aussi une grande institution de recherche. Le slogan affiché est assez représentatif de ses objectifs « Innover et entreprendre dans un monde numérique ».La dénomination de Télécom ParisTech a … Continuer la lecture

Publié dans DBPedia, Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Expérimentation en Python pour accéder à ISTEX

ISTEX a pour ambition de « construire le socle de la bibliothèque scientifique numérique nationale. » Il s’agit d’une initiative dans le cadre des « Investissements d’Avenir » soutenus par l’Etat français.ISTEX acquiert et structure de grandes quantités de documents scientifiques pour les rendre … Continuer la lecture

Publié dans Données publiques, SemBib, Uncategorized | Laisser un commentaire

Identificateurs uniques de chercheurs versus Uniques identificateurs de chercheurs

Comme mentionné dans l’article « Premier contact avec les outils de l’ABES » , pour le projet SemBib, j’ai commencé par utiliser mes propres identifiants pour les chercheurs. Ensuite, j’ai voulu utiliser des identifiants provenant de sources de références, à commencer par … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Un commentaire