Archives de catégorie : SemBib

Pourquoi un dépôt local de publications?

Publié le 13/12/2017 par Moissinac

Le projet SemBib porte l’idée d’une fédération de dépôts locaux de publications scientifiques. Mais pour commencer, on peut se poser la question: pourquoi un dépôt local de publications? Je ne vais pas donner ici toutes les justifications, mais commencer par … Continuer la lecture →

Publié dans Données publiques, Marquage sémantique, Outils, SemBib | Laisser un commentaire

Identifiants IdRef de chercheurs

Publié le 14/09/2017 par Moissinac

Dans le post Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur, j’avais identifié IDREF comme source possible d’identifiants pour le projet SemBib. J’ai obtenu une liste de 195 personnels de Télécom ParisTech impliqués dans la recherche. J’ai utilisé … Continuer la lecture →

Publié dans Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Où Telecom ParisTech publie régulièrement: un peu de technique

Publié le 23/08/2017 par Moissinac

Dans l’article Où Telecom ParisTech publie régulièrement, j’ai montré un exemple d’utilisation de la représentation sémantique de notre bibliographie: un graphique qui permet de voir les séries de conférences principalement utilisées par les chercheurs de Télécom ParisTech pour publier des résultats … Continuer la lecture →

Publié dans Marquage sémantique, SemBib, SPARQL, Visualisation | Laisser un commentaire

Où Telecom ParisTech publie régulièrement?

Publié le 23/08/2017 par Moissinac

(cliquer pour voir en grand) Notre base bibliographique ne permet pas de faire ressortir aisément les conférences et journaux où nous publions souvent. L’approche sémantique que nous avons entamé avec le projet SemBib apporte des réponses. Dans le cadre du … Continuer la lecture →

Publié dans Marquage sémantique, SemBib, Visualisation | Un commentaire

Analyser les publications de Telecom ParisTech: les données disponibles

Publié le 14/08/2017 par Moissinac

Cet article fait suite à https://onsem.wp.imt.fr/2016/04/20/co-auteurs-des-publications-dune-institution-scientifique-telecom-paristech/. Dans cet article, nous visualisions les liens entre chercheurs matérialisés par des publications scientifiques communes. J’utilise les données obtenues de la base bibliographique de Telecom ParisTech. Mon idée est de tirer des informations utiles -j’espère- … Continuer la lecture →

Publié dans Marquage sémantique, Outils, SemBib | Laisser un commentaire

Essais avec l’API Mendeley

Publié le 2/08/2017 par Moissinac

Mendeley est un outil d’aide aux chercheurs pour organiser les références qu’ils consultent. Mendeley dispose d’une API. Ce billet rend compte des premiers essais effectués avec cette API. Je vais accéder à quelques données depuis un programme Python. Il est … Continuer la lecture →

Publié dans Outils, SemBib | Laisser un commentaire

Identifiants LOD pour Télécom ParisTech

Publié le 28/07/2017 par Moissinac

Télécom ParisTech est une des principales écoles d’ingénieur du numérique en France; c’est aussi une grande institution de recherche. Le slogan affiché est assez représentatif de ses objectifs « Innover et entreprendre dans un monde numérique ». La dénomination de Télécom ParisTech … Continuer la lecture →

Publié dans DBPedia, Données publiques, Marquage sémantique, SemBib | Laisser un commentaire

Expérimentation en Python pour accéder à ISTEX

Publié le 6/06/2017 par Moissinac

ISTEX a pour ambition de « construire le socle de la bibliothèque scientifique numérique nationale. » Il s’agit d’une initiative dans le cadre des « Investissements d’Avenir » soutenus par l’Etat français. ISTEX acquiert et structure de grandes quantités de documents scientifiques pour les … Continuer la lecture →

Publié dans Données publiques, SemBib, Uncategorized | Laisser un commentaire

Identificateurs uniques de chercheurs versus Uniques identificateurs de chercheurs

Publié le 30/01/2017 par Moissinac

Comme mentionné dans l’article « Premier contact avec les outils de l’ABES » , pour le projet SemBib, j’ai commencé par utiliser mes propres identifiants pour les chercheurs. Ensuite, j’ai voulu utiliser des identifiants provenant de sources de références, à commencer par … Continuer la lecture →

Publié dans Marquage sémantique, Outils, SemBib | Un commentaire

Premier contact avec les outils de l’Agence Bibliographique de l’Enseignement Supérieur

Publié le 27/01/2017 par Moissinac

Dans le cadre du projet SemBib, j’ai été amené à choisir un identifiant unique pour chaque auteur. Suivant ma stratégie habituelle, j’ai commencé par utiliser des identifiants définis dans notre espace de nommage, avec notre préfixe. Ainsi, il a été … Continuer la lecture →

Publié dans Données publiques, SemBib | 2 commentaires

Premiers contacts avec l’accès SPARQL de l’éditeur Springer

Publié le 3/12/2016 par Moissinac

Note du 14/5/2018: l’accès SPARQL mentionné dans cet article a disparu; nous allons prochainement étudier la nouvelle politique d’accès aux données de Springer Dans le cadre du projet SemBib, je vais découvrir avec vous l’accès SPARQL public de l’éditeur scientifique … Continuer la lecture →

Publié dans Données publiques, SemBib, SPARQL | Laisser un commentaire

Utiliser NLTK sur Heroku avec Python

Publié le 3/06/2016 par Moissinac

Sur le principe du billet « Extraire le texte de PDF avec Python« , je vais créer un service qui utilise le package NLTK. NLTK est un ensemble d’outils pour construire en Python des programmes de traitement des langues. Il nécessite donc … Continuer la lecture →

Publié dans Cuisine traitement de textes, SemBib | Laisser un commentaire

Extraire le texte de PDF avec Python

Publié le 2/06/2016 par Moissinac

Dans le cadre de notre projet d’analyse de la production scientifique de Télécom ParisTech, je récupère beaucoup de fichiers PDF. Pour en analyser le contenu, j’ai notamment besoin d’en récupérer le texte brut. Par ailleurs, comme indiqué dans le billet … Continuer la lecture →

Publié dans Cuisine traitement de textes, SemBib | 2 commentaires

Des services pour l’analyse bibliographique

Publié le 28/05/2016 par Moissinac

Je présente ici les besoins liés à notre démarche d’analyse de la production et de la publication de documents scientifiques -essentiellement des articles- par Telecom ParisTech. Les articles Télécom ParisTech dispose d’une base bibliographique qui recense l’essentiel de nos publications. Pour … Continuer la lecture →

Publié dans Marquage sémantique, Outils, SemBib, Virtuoso | Un commentaire

Co-auteurs des publications d’une institution scientifique, Telecom ParisTech

Publié le 20/04/2016 par Moissinac

Cet article fait partie d’une série concernant l’analyse de la production scientifique d’une communauté scientifique à partir de ses publications. Il s’agit d’un travail entrepris par Cyril Concolato et Jean-Claude Moissinac pour donner divers points de vue sur notre production … Continuer la lecture →

Publié dans Marquage sémantique, SemBib, Uncategorized, Visualisation | Un commentaire