Archives de catégorie : SemBib

Identificateurs uniques de chercheurs versus Uniques identificateurs de chercheurs

Comme mentionné dans l’article « Premier contact avec les outils de l’ABES » , pour le projet SebBib, j’ai commencé par utiliser mes propres identifiants pour les chercheurs. Ensuite, j’ai voulu utiliser des identifiants provenant de sources de références, à commencer par … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Laisser un commentaire

Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur

Dans le cadre du projet SemBib, j’ai été amené à choisir un identifiant unique pour chaque auteur. Suivant ma stratégie habituelle, j’ai commencé par utiliser des identifiants définis dans notre espace de nommage, avec notre préfixe. Ainsi, il a été … Continuer la lecture

Publié dans Données publiques, SemBib | Laisser un commentaire

Premiers contacts avec l’accès SPARQL de l’éditeur Springer

Dans le cadre du projet SemBib, je vais découvrir avec vous l’accès SPARQL public de l’éditeur scientifique Springer à l’adresse http://lod.springer.com/sparql-form/index.html. Pour un premier contact, il faut faire connaissance et quelques requêtes classiques vont nous y aider.D’abord, découvrir les propriétés … Continuer la lecture

Publié dans Données publiques, SemBib, SPARQL | Laisser un commentaire

Utiliser NLTK sur Heroku avec Python

Sur le principe du billet « Extraire le texte de PDF avec Python« , je vais créer un service qui utilise le package NLTK. NLTK est un ensemble d’outils pour construire en Python des programmes de traitement des langues. Il nécessite donc … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | Laisser un commentaire

Extraire le texte de PDF avec Python

Dans le cadre de notre projet d’analyse de la production scientifique de Télécom ParisTech, je récupère beaucoup de fichiers PDF. Pour en analyser le contenu, j’ai notamment besoin d’en récupérer le texte brut. Par ailleurs, comme indiqué dans le billet … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | Un commentaire

Des services pour l’analyse bibliographique

Je présente ici les besoins liés à notre démarche d’analyse de la production et la publication de documents scientifiques -essentiellement des articles- par Telecom ParisTech. Les articlesTélécom ParisTech dispose d’une base bibliographique qui recense l’essentiel de nos publications. Pour chaque publication, … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib, Uncategorized, Virtuoso | Laisser un commentaire