Archives de l’auteur : Moissinac

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes

Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur

Dans le cadre du projet SemBib, j’ai été amené à choisir un identifiant unique pour chaque auteur. Suivant ma stratégie habituelle, j’ai commencé par utiliser des identifiants définis dans notre espace de nommage, avec notre préfixe. Ainsi, il a été … Continuer la lecture

Publié dans Données publiques, SemBib | 2 commentaires

Premiers contacts avec l’accès SPARQL de l’éditeur Springer

Note du 14/5/2018: l’accès SPARQL mentionné dans cet article a disparu; nous allons prochainement étudier la nouvelle politique d’accès aux données de SpringerDans le cadre du projet SemBib, je vais découvrir avec vous l’accès SPARQL public de l’éditeur scientifique Springer … Continuer la lecture

Publié dans Données publiques, SemBib, SPARQL | Laisser un commentaire

Sémantique de la virgule

Il y a quelques temps, dans une rame de métro, mon regard a été attiré par une petite affiche avec le contenu suivant:Le ciel bleu sur nous peut s’effondrer Et la terre peut bien s’écrouler Peu m’importe si tu m’aimes … Continuer la lecture

Publié dans Cuisine traitement de textes, Marquage sémantique | Laisser un commentaire

Thèse sur l’enrichissement sémantique de livres numériques

Vous êtes invités à la soutenance de thèse de Vincent Gros, intitulée « Modélisation d’un livre numérique adaptable par enrichissement sémantique des contenus – Réalisation par le  standard EPUB », menée dans le cadre d’un partenariat CIFRE entre Hachette Livre et Telecom ParisTech.Elle … Continuer la lecture

Publié dans Livre numérique, Marquage sémantique, Outils | Laisser un commentaire

Statistiques sur DBPedia-Fr

J’ai eu besoin du nombre d’entités distinctes décrites dans dbpedia-fr. Nous allons voir un problème à prendre en compte lors de l’utilisation des données liées faisant appel à des points d’accès publics.Ma première tentative a été d’obtenir cette information avec … Continuer la lecture

Publié dans DBPedia, SPARQL, Tutoriel | Laisser un commentaire

Héberger une instance de Fuseki sur OpenShift

Nous allons voir comment héberger une instance de serveur RDF Fuseki sur OpenShift, l’hébergement de RedHat.Vous devez avoir un compte sur OpenShift (possibilité de comptes gratuits).Sur la console d’administration OpenShift, créez une application de type ‘Do It Yourself’. Cela va … Continuer la lecture

Publié dans Outils, SPARQL, Tutoriel | Laisser un commentaire

Utiliser NLTK sur Heroku avec Python

Sur le principe du billet « Extraire le texte de PDF avec Python« , je vais créer un service qui utilise le package NLTK. NLTK est un ensemble d’outils pour construire en Python des programmes de traitement des langues. Il nécessite donc … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | Laisser un commentaire

Extraire le texte de PDF avec Python

Dans le cadre de notre projet d’analyse de la production scientifique de Télécom ParisTech, je récupère beaucoup de fichiers PDF. Pour en analyser le contenu, j’ai notamment besoin d’en récupérer le texte brut. Par ailleurs, comme indiqué dans le billet … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | 2 commentaires

Un pays sans guerre

J’ai vu passer la question « y a-t-il un pays qui n’a jamais été en guerre? » qui renvoie à « World peace? These are the only 11 countries in the world that are actually free from conflict« et je me suis dit, voilà un … Continuer la lecture

Publié dans DBPedia, Marquage sémantique, SPARQL, Tutoriel | Laisser un commentaire

Des services pour l’analyse bibliographique

Je présente ici les besoins liés à notre démarche d’analyse de la production et de la publication de documents scientifiques -essentiellement des articles- par Telecom ParisTech. Les articlesTélécom ParisTech dispose d’une base bibliographique qui recense l’essentiel de nos publications. Pour chaque … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib, Virtuoso | Un commentaire

Co-auteurs des publications d’une institution scientifique, Telecom ParisTech

Cet article fait partie d’une série concernant l’analyse de la production scientifique d’une communauté scientifique à partir de ses publications. Il s’agit d’un travail entrepris par Cyril Concolato et Jean-Claude Moissinac pour donner divers points de vue sur notre production … Continuer la lecture

Publié dans Marquage sémantique, SemBib, Uncategorized, Visualisation | Un commentaire

WordLift est arrivé sur ce site

Après plusieurs tentatives pour intégrer du marquage sémantique sur ce blog, aucune des méthodes essayées précédemment n’était suffisamment satisfaisante.L’essai en cours est de très loin le plus satisfaisant: nous avons intégré l’extension WordLift à ce blog.WordLift propose automatiquement à l’auteur … Continuer la lecture

Publié dans DBPedia, Marquage sémantique, Outils | Un commentaire

CORS, web sémantique et données liées

Dans ce billet, j’aborde CORS et je parle des solutions pour utiliser des données provenant d’autres sites.Le développement du web sémantique et de l’usage des données liées passe assurément par le développement de sites web qui exploitent des données rendues disponibles … Continuer la lecture

Publié dans DBPedia, SPARQL, Tutoriel, Virtuoso | Un commentaire

Tuto – Théâtre et représentation sémantique RDFa: l’exemple de l’Avare

J’ai entrepris de représenter des pièces de théâtre d’une façon exploitable par des logiciels. Même si les applications envisagées à court terme n’ont pas besoin de représentations sémantiques très évoluées, j’ai décidé de m’appuyer sur les techniques du web sémantique afin de: … Continuer la lecture

Publié dans Cultural data, DBPedia, Tutoriel, Visualisation | Marqué avec , | Laisser un commentaire

Quelques requêtes SPARQL sur DBPedia

Je propose ici quelques requêtes SPARQL qui ont servis à alimenter la réflexion qui aboutit à l’article, testées sur le point d’accès français (http://fr.dbpedia.org/sparql)https://onsem.wp.imt.fr/2015/05/15/creer-des-connaissances-formalisees-pour-le-web-semantique-a-partir-de-dbpedia/L’idée est de s’en resservir pour d’autres types d’éléments ou pour compléter des données dans des interfaces … Continuer la lecture

Publié dans Cultural data, DBPedia, SPARQL | Laisser un commentaire

Créer des connaissances formalisées pour le Web Sémantique à partir de DBPedia

Cet article est le deuxième d’une série qui a commencée sur un autre blog par l’articlehttps://ilot.wp.imt.fr/2014/11/26/une-exploration-de-dbpedia-au-sujet-des-monuments-avec-laide-de-sparql/L’idée est de voir comment étendre les connaissances représentées dans DBPedia en exploitant des connaissances implicitement présentes dans DBPedia lui-même. Transposition directe d’une requête précédente … Continuer la lecture

Publié dans DBPedia, SPARQL | 3 commentaires

Visualiser l’ontologie de DBPedia sous forme de graphe avec d3

Dans le cadre d’un projet exploitant DBPedia, j’ai ressenti le besoin de me faciliter l’exploration de l’ontologie de DBPedia.Bien sûr, j’ai commencé par la télécharger.  J’ai pu constater qu’une fois décompressé, ‘il s’agit d’un fichier de 2,3 Mo, au format … Continuer la lecture

Publié dans DBPedia, Visualisation | Laisser un commentaire

Données ouvertes: les accès Wifi de la Ville de Paris

Tutoriel d’exploitation Web d’un jeu de données JSONJ’ai décidé d’entamer une série de billets sur l’utilisation de données ouvertes. Pourquoi ce thème sur un site dédié à la sémantique: je fais un lien profond entre le web sémantique et les … Continuer la lecture

Publié dans Données publiques, Visualisation | Laisser un commentaire

Publications des ontologies de programmes scolaires français

Nous avons entrepris de publier les ontologies de programmes scolaires français sur lesquelles nous travaillons. Bien que ces ontologies doivent connaitre dans les prochains mois des évolutions significatives, nous pensons que les versions actuelles, considérées comme des versions ‘beta’, permettront … Continuer la lecture

Publié dans Uncategorized | Laisser un commentaire

Quelques points d’accès SPARQL français

 Un court billet, qui subira surement quelques mises à jour au fil du temps, pour lister des points d’accès SPARQL qui ont un rapport significatif avec la France, par exemple: données émises par un organisme français données concernant des ressources … Continuer la lecture

Publié dans SPARQL | Marqué avec , , , , | Un commentaire