Archives de l’auteur : Moissinac

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes

Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur

Publié le 27/01/2017 par Moissinac

Dans le cadre du projet SemBib, j’ai été amené à choisir un identifiant unique pour chaque auteur. Suivant ma stratégie habituelle, j’ai commencé par utiliser des identifiants définis dans notre espace de nommage, avec notre préfixe. Ainsi, il a été … Continuer la lecture →

Publié dans Données publiques, SemBib | 2 commentaires

Premiers contacts avec l’accès SPARQL de l’éditeur Springer

Publié le 3/12/2016 par Moissinac

Note du 14/5/2018: l’accès SPARQL mentionné dans cet article a disparu; nous allons prochainement étudier la nouvelle politique d’accès aux données de Springer Dans le cadre du projet SemBib, je vais découvrir avec vous l’accès SPARQL public de l’éditeur scientifique … Continuer la lecture →

Publié dans Données publiques, SemBib, SPARQL | Laisser un commentaire

Sémantique de la virgule

Publié le 30/11/2016 par Moissinac

Il y a quelques temps, dans une rame de métro, mon regard a été attiré par une petite affiche avec le contenu suivant: Le ciel bleu sur nous peut s’effondrer Et la terre peut bien s’écrouler Peu m’importe si tu … Continuer la lecture →

Publié dans Cuisine traitement de textes, Marquage sémantique | Laisser un commentaire

Thèse sur l’enrichissement sémantique de livres numériques

Publié le 26/09/2016 par Moissinac

Vous êtes invités à la soutenance de thèse de Vincent Gros, intitulée « Modélisation d’un livre numérique adaptable par enrichissement sémantique des contenus – Réalisation par le standard EPUB », menée dans le cadre d’un partenariat CIFRE entre Hachette Livre et Telecom ParisTech. … Continuer la lecture →

Publié dans Livre numérique, Marquage sémantique, Outils | Laisser un commentaire

Statistiques sur DBPedia-Fr

Publié le 19/07/2016 par Moissinac

J’ai eu besoin du nombre d’entités distinctes décrites dans dbpedia-fr. Nous allons voir un problème à prendre en compte lors de l’utilisation des données liées faisant appel à des points d’accès publics. Ma première tentative a été d’obtenir cette information … Continuer la lecture →

Publié dans DBPedia, SPARQL, Tutoriel | Laisser un commentaire

Héberger une instance de Fuseki sur OpenShift

Publié le 18/07/2016 par Moissinac

Nous allons voir comment héberger une instance de serveur RDF Fuseki sur OpenShift, l’hébergement de RedHat. Vous devez avoir un compte sur OpenShift (possibilité de comptes gratuits). Sur la console d’administration OpenShift, créez une application de type ‘Do It Yourself’. … Continuer la lecture →

Publié dans Outils, SPARQL, Tutoriel | Laisser un commentaire

Utiliser NLTK sur Heroku avec Python

Publié le 3/06/2016 par Moissinac

Sur le principe du billet « Extraire le texte de PDF avec Python« , je vais créer un service qui utilise le package NLTK. NLTK est un ensemble d’outils pour construire en Python des programmes de traitement des langues. Il nécessite donc … Continuer la lecture →

Publié dans Cuisine traitement de textes, SemBib | Laisser un commentaire

Extraire le texte de PDF avec Python

Publié le 2/06/2016 par Moissinac

Dans le cadre de notre projet d’analyse de la production scientifique de Télécom ParisTech, je récupère beaucoup de fichiers PDF. Pour en analyser le contenu, j’ai notamment besoin d’en récupérer le texte brut. Par ailleurs, comme indiqué dans le billet … Continuer la lecture →

Publié dans Cuisine traitement de textes, SemBib | 2 commentaires

Un pays sans guerre

Publié le 29/05/2016 par Moissinac

J’ai vu passer la question « y a-t-il un pays qui n’a jamais été en guerre? » qui renvoie à « World peace? These are the only 11 countries in the world that are actually free from conflict« et je me suis dit, voilà … Continuer la lecture →

Publié dans DBPedia, Marquage sémantique, SPARQL, Tutoriel | Laisser un commentaire

Des services pour l’analyse bibliographique

Publié le 28/05/2016 par Moissinac

Je présente ici les besoins liés à notre démarche d’analyse de la production et de la publication de documents scientifiques -essentiellement des articles- par Telecom ParisTech. Les articles Télécom ParisTech dispose d’une base bibliographique qui recense l’essentiel de nos publications. Pour … Continuer la lecture →

Publié dans Marquage sémantique, Outils, SemBib, Virtuoso | Un commentaire

Co-auteurs des publications d’une institution scientifique, Telecom ParisTech

Publié le 20/04/2016 par Moissinac

Cet article fait partie d’une série concernant l’analyse de la production scientifique d’une communauté scientifique à partir de ses publications. Il s’agit d’un travail entrepris par Cyril Concolato et Jean-Claude Moissinac pour donner divers points de vue sur notre production … Continuer la lecture →

Publié dans Marquage sémantique, SemBib, Uncategorized, Visualisation | Un commentaire

WordLift est arrivé sur ce site

Publié le 20/04/2016 par Moissinac

Après plusieurs tentatives pour intégrer du marquage sémantique sur ce blog, aucune des méthodes essayées précédemment n’était suffisamment satisfaisante. L’essai en cours est de très loin le plus satisfaisant: nous avons intégré l’extension WordLift à ce blog. WordLift propose automatiquement … Continuer la lecture →

Publié dans DBPedia, Marquage sémantique, Outils | Un commentaire

CORS, web sémantique et données liées

Publié le 28/07/2015 par Moissinac

Dans ce billet, j’aborde CORS et je parle des solutions pour utiliser des données provenant d’autres sites. Le développement du web sémantique et de l’usage des données liées passe assurément par le développement de sites web qui exploitent des données rendues … Continuer la lecture →

Publié dans DBPedia, SPARQL, Tutoriel, Virtuoso | Un commentaire

Tuto – Théâtre et représentation sémantique RDFa: l’exemple de l’Avare

Publié le 8/06/2015 par Moissinac

J’ai entrepris de représenter des pièces de théâtre d’une façon exploitable par des logiciels. Même si les applications envisagées à court terme n’ont pas besoin de représentations sémantiques très évoluées, j’ai décidé de m’appuyer sur les techniques du web sémantique afin de: … Continuer la lecture →

Publié dans Cultural data, DBPedia, Tutoriel, Visualisation | Marqué avec green-turtle, rdfa | Laisser un commentaire

Quelques requêtes SPARQL sur DBPedia

Publié le 27/05/2015 par Moissinac

Je propose ici quelques requêtes SPARQL qui ont servis à alimenter la réflexion qui aboutit à l’article, testées sur le point d’accès français (http://fr.dbpedia.org/sparql) https://onsem.wp.imt.fr/2015/05/15/creer-des-connaissances-formalisees-pour-le-web-semantique-a-partir-de-dbpedia/ L’idée est de s’en resservir pour d’autres types d’éléments ou pour compléter des données dans … Continuer la lecture →

Publié dans Cultural data, DBPedia, SPARQL | Laisser un commentaire

Créer des connaissances formalisées pour le Web Sémantique à partir de DBPedia

Publié le 15/05/2015 par Moissinac

Cet article est le deuxième d’une série qui a commencée sur un autre blog par l’article https://ilot.wp.imt.fr/2014/11/26/une-exploration-de-dbpedia-au-sujet-des-monuments-avec-laide-de-sparql/ L’idée est de voir comment étendre les connaissances représentées dans DBPedia en exploitant des connaissances implicitement présentes dans DBPedia lui-même. Transposition directe d’une … Continuer la lecture →

Publié dans DBPedia, SPARQL | 3 commentaires

Visualiser l’ontologie de DBPedia sous forme de graphe avec d3

Publié le 14/01/2015 par Moissinac

Dans le cadre d’un projet exploitant DBPedia, j’ai ressenti le besoin de me faciliter l’exploration de l’ontologie de DBPedia. Bien sûr, j’ai commencé par la télécharger. J’ai pu constater qu’une fois décompressé, ‘il s’agit d’un fichier de 2,3 Mo, au … Continuer la lecture →

Publié dans DBPedia, Visualisation | Laisser un commentaire

Données ouvertes: les accès Wifi de la Ville de Paris

Publié le 12/11/2014 par Moissinac

Tutoriel d’exploitation Web d’un jeu de données JSON J’ai décidé d’entamer une série de billets sur l’utilisation de données ouvertes. Pourquoi ce thème sur un site dédié à la sémantique: je fais un lien profond entre le web sémantique et … Continuer la lecture →

Publié dans Données publiques, Visualisation | Laisser un commentaire

Publications des ontologies de programmes scolaires français

Publié le 2/09/2014 par Moissinac

Nous avons entrepris de publier les ontologies de programmes scolaires français sur lesquelles nous travaillons. Bien que ces ontologies doivent connaitre dans les prochains mois des évolutions significatives, nous pensons que les versions actuelles, considérées comme des versions ‘beta’, permettront … Continuer la lecture →

Publié dans Uncategorized | Laisser un commentaire

Quelques points d’accès SPARQL français

Publié le 9/07/2014 par Moissinac

Un court billet, qui subira surement quelques mises à jour au fil du temps, pour lister des points d’accès SPARQL qui ont un rapport significatif avec la France, par exemple: données émises par un organisme français données concernant des … Continuer la lecture →

Publié dans SPARQL | Marqué avec BNF, DBpedia, Europeana, Isidore, sparql endpoint | Un commentaire