Archives de l’auteur : Moissinac

À propos de Moissinac

Maitre de conférence à Télécom ParisTech, Département Signal et Image, Groupe Multimédia Jean-Claude Moissinac mène des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Principaux axes de recherche actuel : représentations sémantiques, adaptation de documents multimédias à des contextes variés d’utilisation ; utilisation du multimédia pervasif

Pourquoi un dépôt local de publications?

Le projet SemBib porte l’idée d’une fédération de dépôts locaux de publications scientifiques. Mais pour commencer, on peut se poser la question: pourquoi un dépôt local de publications?Je ne vais pas donner ici toutes les justifications, mais commencer par une: … Continuer la lecture

Publié dans Données publiques, Marquage sémantique, Outils, SemBib | Laisser un commentaire

Désactivation de Wordlift

Dans le billet https://onsem.wp.imt.fr/2016/04/20/wordlift-est-arrive-sur-ce-site/, j’annonçais l’utilisation de l’extension Wordlift. J’étais un des adopteurs précoces de cet outil qui permet de marquer sémantiquement les billets d’un blog WordPress, facilement sous la supervision de l’auteur de l’article.J’ai le regret de devoir la désactiver. … Continuer la lecture

Publié dans Uncategorized | Laisser un commentaire

Lancement du projet Data&Musée

Nous démarrons pour deux ans le projet Data&Musée avec une dizaine de partenaires. Ce projet porte sur les données produites et utilisées par les musées et institutions culturelles: billetterie, traces de visite du site web, livre d’or, parcours…Evidemment, nous allons … Continuer la lecture

Publié dans Cultural data, Marquage sémantique | Laisser un commentaire

Identifiants IdRef de chercheurs

Dans le post Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur, j’avais identifié IDREF comme source possible d’identifiants pour le projet SemBib.J’ai obtenu une liste de 195 personnels de Télécom ParisTech impliqués dans la recherche. J’ai utilisé la … Continuer la lecture

Publié dans Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Où Telecom ParisTech publie régulièrement: un peu de technique

Dans l’article Où Telecom ParisTech publie régulièrement, j’ai montré un exemple d’utilisation de la représentation sémantique de notre bibliographie: un graphique qui permet de voir les séries de conférences principalement utilisées par les chercheurs de Télécom ParisTech pour publier des résultats … Continuer la lecture

Publié dans Marquage sémantique, SemBib, SPARQL, Visualisation | Laisser un commentaire

Où Telecom ParisTech publie régulièrement?

(cliquer pour voir en grand)Notre base bibliographique ne permet pas de faire ressortir aisément les conférences et journaux où nous publions souvent. L’approche sémantique que nous avons entamé avec le projet SemBib apporte des réponses.Dans le cadre du projet SemBib, … Continuer la lecture

Publié dans Marquage sémantique, SemBib, Visualisation | Un commentaire

Analyser les publications de Telecom ParisTech: les données disponibles

Cet article fait suite à https://onsem.wp.imt.fr/2016/04/20/co-auteurs-des-publications-dune-institution-scientifique-telecom-paristech/.Dans cet article, nous visualisions les liens entre chercheurs matérialisés  par des publications scientifiques communes.J’utilise les données obtenues de la base bibliographique de Telecom ParisTech.Mon idée est de tirer des informations utiles -j’espère- de cet ensemble … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Laisser un commentaire

Essais avec l’API Mendeley

Mendeley est un outil d’aide aux chercheurs pour organiser les références qu’ils consultent. Mendeley dispose d’une API. Ce billet rend compte des premiers essais effectués avec cette API. Je vais accéder à quelques données depuis un programme Python.Il est nécessaire … Continuer la lecture

Publié dans Outils, SemBib | Laisser un commentaire

Identifiants LOD pour Télécom ParisTech

Télécom ParisTech est une des principales écoles d’ingénieur du numérique en France; c’est aussi une grande institution de recherche. Le slogan affiché est assez représentatif de ses objectifs « Innover et entreprendre dans un monde numérique ».La dénomination de Télécom ParisTech a … Continuer la lecture

Publié dans DBPedia, Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Expérimentation en Python pour accéder à ISTEX

ISTEX a pour ambition de « construire le socle de la bibliothèque scientifique numérique nationale. » Il s’agit d’une initiative dans le cadre des « Investissements d’Avenir » soutenus par l’Etat français.ISTEX acquiert et structure de grandes quantités de documents scientifiques pour les rendre … Continuer la lecture

Publié dans Données publiques, SemBib, Uncategorized | Laisser un commentaire

Identificateurs uniques de chercheurs versus Uniques identificateurs de chercheurs

Comme mentionné dans l’article « Premier contact avec les outils de l’ABES » , pour le projet SemBib, j’ai commencé par utiliser mes propres identifiants pour les chercheurs. Ensuite, j’ai voulu utiliser des identifiants provenant de sources de références, à commencer par … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Un commentaire

Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur

Dans le cadre du projet SemBib, j’ai été amené à choisir un identifiant unique pour chaque auteur. Suivant ma stratégie habituelle, j’ai commencé par utiliser des identifiants définis dans notre espace de nommage, avec notre préfixe. Ainsi, il a été … Continuer la lecture

Publié dans Données publiques, SemBib | 2 commentaires

Premiers contacts avec l’accès SPARQL de l’éditeur Springer

Dans le cadre du projet SemBib, je vais découvrir avec vous l’accès SPARQL public de l’éditeur scientifique Springer à l’adresse http://lod.springer.com/sparql-form/index.html. Pour un premier contact, il faut faire connaissance et quelques requêtes classiques vont nous y aider.D’abord, découvrir les propriétés … Continuer la lecture

Publié dans Données publiques, SemBib, SPARQL | Laisser un commentaire

Sémantique de la virgule

Il y a quelques temps, dans une rame de métro, mon regard a été attiré par une petite affiche avec le contenu suivant:Le ciel bleu sur nous peut s’effondrer Et la terre peut bien s’écrouler Peu m’importe si tu m’aimes … Continuer la lecture

Publié dans Cuisine traitement de textes, Marquage sémantique | Laisser un commentaire

Thèse sur l’enrichissement sémantique de livres numériques

Vous êtes invités à la soutenance de thèse de Vincent Gros, intitulée « Modélisation d’un livre numérique adaptable par enrichissement sémantique des contenus – Réalisation par le  standard EPUB », menée dans le cadre d’un partenariat CIFRE entre Hachette Livre et Telecom ParisTech.Elle … Continuer la lecture

Publié dans Livre numérique, Marquage sémantique, Outils | Laisser un commentaire

Statistiques sur DBPedia-Fr

J’ai eu besoin du nombre d’entités distinctes décrites dans dbpedia-fr. Nous allons voir un problème à prendre en compte lors de l’utilisation des données liées faisant appel à des points d’accès publics.Ma première tentative a été d’obtenir cette information avec … Continuer la lecture

Publié dans DBPedia, SPARQL, Tutoriel | Laisser un commentaire

Héberger une instance de Fuseki sur OpenShift

Nous allons voir comment héberger une instance de serveur RDF Fuseki sur OpenShift, l’hébergement de RedHat.Vous devez avoir un compte sur OpenShift (possibilité de comptes gratuits).Sur la console d’administration OpenShift, créez une application de type ‘Do It Yourself’. Cela va … Continuer la lecture

Publié dans Outils, SPARQL, Tutoriel | Laisser un commentaire

Utiliser NLTK sur Heroku avec Python

Sur le principe du billet « Extraire le texte de PDF avec Python« , je vais créer un service qui utilise le package NLTK. NLTK est un ensemble d’outils pour construire en Python des programmes de traitement des langues. Il nécessite donc … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | Laisser un commentaire

Extraire le texte de PDF avec Python

Dans le cadre de notre projet d’analyse de la production scientifique de Télécom ParisTech, je récupère beaucoup de fichiers PDF. Pour en analyser le contenu, j’ai notamment besoin d’en récupérer le texte brut. Par ailleurs, comme indiqué dans le billet … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | 2 commentaires

Un pays sans guerre

J’ai vu passer la question « y a-t-il un pays qui n’a jamais été en guerre? » qui renvoie à « World peace? These are the only 11 countries in the world that are actually free from conflict« et je me suis dit, voilà un … Continuer la lecture

Publié dans DBPedia, Marquage sémantique, SPARQL, Tutoriel | Laisser un commentaire