Archives de catégorie : SemBib

Pourquoi un dépôt local de publications?

Le projet SemBib porte l’idée d’une fédération de dépôts locaux de publications scientifiques. Mais pour commencer, on peut se poser la question: pourquoi un dépôt local de publications?Je ne vais pas donner ici toutes les justifications, mais commencer par une: … Continuer la lecture

Publié dans Données publiques, Marquage sémantique, Outils, SemBib | Laisser un commentaire

Identifiants IdRef de chercheurs

Dans le post Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur, j’avais identifié IDREF comme source possible d’identifiants pour le projet SemBib.J’ai obtenu une liste de 195 personnels de Télécom ParisTech impliqués dans la recherche. J’ai utilisé la … Continuer la lecture

Publié dans Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Où Telecom ParisTech publie régulièrement: un peu de technique

Dans l’article Où Telecom ParisTech publie régulièrement, j’ai montré un exemple d’utilisation de la représentation sémantique de notre bibliographie: un graphique qui permet de voir les séries de conférences principalement utilisées par les chercheurs de Télécom ParisTech pour publier des résultats … Continuer la lecture

Publié dans Marquage sémantique, SemBib, SPARQL, Visualisation | Laisser un commentaire

Où Telecom ParisTech publie régulièrement?

(cliquer pour voir en grand)Notre base bibliographique ne permet pas de faire ressortir aisément les conférences et journaux où nous publions souvent. L’approche sémantique que nous avons entamé avec le projet SemBib apporte des réponses.Dans le cadre du projet SemBib, … Continuer la lecture

Publié dans Marquage sémantique, SemBib, Visualisation | Un commentaire

Analyser les publications de Telecom ParisTech: les données disponibles

Cet article fait suite à https://onsem.wp.imt.fr/2016/04/20/co-auteurs-des-publications-dune-institution-scientifique-telecom-paristech/.Dans cet article, nous visualisions les liens entre chercheurs matérialisés  par des publications scientifiques communes.J’utilise les données obtenues de la base bibliographique de Telecom ParisTech.Mon idée est de tirer des informations utiles -j’espère- de cet ensemble … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Laisser un commentaire

Essais avec l’API Mendeley

Mendeley est un outil d’aide aux chercheurs pour organiser les références qu’ils consultent. Mendeley dispose d’une API. Ce billet rend compte des premiers essais effectués avec cette API. Je vais accéder à quelques données depuis un programme Python.Il est nécessaire … Continuer la lecture

Publié dans Outils, SemBib | Laisser un commentaire

Identifiants LOD pour Télécom ParisTech

Télécom ParisTech est une des principales écoles d’ingénieur du numérique en France; c’est aussi une grande institution de recherche. Le slogan affiché est assez représentatif de ses objectifs « Innover et entreprendre dans un monde numérique ».La dénomination de Télécom ParisTech a … Continuer la lecture

Publié dans DBPedia, Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Expérimentation en Python pour accéder à ISTEX

ISTEX a pour ambition de « construire le socle de la bibliothèque scientifique numérique nationale. » Il s’agit d’une initiative dans le cadre des « Investissements d’Avenir » soutenus par l’Etat français.ISTEX acquiert et structure de grandes quantités de documents scientifiques pour les rendre … Continuer la lecture

Publié dans Données publiques, SemBib, Uncategorized | Laisser un commentaire

Identificateurs uniques de chercheurs versus Uniques identificateurs de chercheurs

Comme mentionné dans l’article « Premier contact avec les outils de l’ABES » , pour le projet SemBib, j’ai commencé par utiliser mes propres identifiants pour les chercheurs. Ensuite, j’ai voulu utiliser des identifiants provenant de sources de références, à commencer par … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib | Un commentaire

Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur

Dans le cadre du projet SemBib, j’ai été amené à choisir un identifiant unique pour chaque auteur. Suivant ma stratégie habituelle, j’ai commencé par utiliser des identifiants définis dans notre espace de nommage, avec notre préfixe. Ainsi, il a été … Continuer la lecture

Publié dans Données publiques, SemBib | 2 commentaires

Premiers contacts avec l’accès SPARQL de l’éditeur Springer

Note du 14/5/2018: l’accès SPARQL mentionné dans cet article a disparu; nous allons prochainement étudier la nouvelle politique d’accès aux données de SpringerDans le cadre du projet SemBib, je vais découvrir avec vous l’accès SPARQL public de l’éditeur scientifique Springer … Continuer la lecture

Publié dans Données publiques, SemBib, SPARQL | Laisser un commentaire

Utiliser NLTK sur Heroku avec Python

Sur le principe du billet « Extraire le texte de PDF avec Python« , je vais créer un service qui utilise le package NLTK. NLTK est un ensemble d’outils pour construire en Python des programmes de traitement des langues. Il nécessite donc … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | Laisser un commentaire

Extraire le texte de PDF avec Python

Dans le cadre de notre projet d’analyse de la production scientifique de Télécom ParisTech, je récupère beaucoup de fichiers PDF. Pour en analyser le contenu, j’ai notamment besoin d’en récupérer le texte brut. Par ailleurs, comme indiqué dans le billet … Continuer la lecture

Publié dans Cuisine traitement de textes, SemBib | 2 commentaires

Des services pour l’analyse bibliographique

Je présente ici les besoins liés à notre démarche d’analyse de la production et de la publication de documents scientifiques -essentiellement des articles- par Telecom ParisTech. Les articlesTélécom ParisTech dispose d’une base bibliographique qui recense l’essentiel de nos publications. Pour chaque … Continuer la lecture

Publié dans Marquage sémantique, Outils, SemBib, Virtuoso | Un commentaire

Co-auteurs des publications d’une institution scientifique, Telecom ParisTech

Cet article fait partie d’une série concernant l’analyse de la production scientifique d’une communauté scientifique à partir de ses publications. Il s’agit d’un travail entrepris par Cyril Concolato et Jean-Claude Moissinac pour donner divers points de vue sur notre production … Continuer la lecture

Publié dans Marquage sémantique, SemBib, Uncategorized, Visualisation | Un commentaire