Pourquoi un dépôt local de publications?

Le projet SemBib porte l’idée d’une fédération de dépôts locaux de publications scientifiques. Mais pour commencer, on peut se poser la question: pourquoi un dépôt local de publications?

Je ne vais pas donner ici toutes les justifications, mais commencer par une: quelle représentation a chacun de nos chercheurs dans les dépôts publics généralistes?

Et, pour faire un test, je vais commencer par moi.

Interrogeons la base de meta-données bibliographiques de Telecom ParisTech à mon sujet (requête). On obtient 71 références, donc, 71 publications publiées dans le cadre de Télécom Paristech; cela ne compte donc pas d’autres publications, comme ma thèse de 1984.

Interrogeons

  • Google Scholar (requête): 139 résultats. Il est difficile de trouver les publications effectives, car même lorsqu’on indique à Scholar de ne pas afficher les citations, il en affiche malgré tout, ainsi que des documents qui n’ont rien à voir.
  • Microsoft Academic Graph (requête): 36 résultats.
  • Arxiv (formulaire): 0 résultat.
  • DBLP (requête): 25 résultats
  • BibSonomy (requête): 26 résultats
  • CiteULike (requête): plus de 800 résultats!
  • Worldcat (requête): 43 résultats
  • Sudoc (requête): 7 résultats
  • CiteSeerx (requête): 0 résultat
  • Semantic Scholar (requête): 38 résultats
  • IdRef (requête): 10 résultats

Je pourrais continuer avec bien d’autres dépôts. La conclusion est claire: la plupart des dépôts ne reconnaissant qu’entre un quart et un tiers de mes publications, sauf ceux qui renvoient énormément de bruit…

Avoir un dépôt local, c’est fournir une source de référence complète, sur laquelle on peut appliquer des critères de qualité et avoir une certaine finesse d’analyse.

 

 

 

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Données publiques, Marquage sémantique, Outils, SemBib. Vous pouvez le mettre en favoris avec ce permalien.