Thèse sur l’enrichissement sémantique de livres numériques

Vous êtes invités à la soutenance de thèse de Vincent Gros, intitulée « Modélisation d’un livre numérique adaptable par enrichissement sémantique des contenus – Réalisation par le  standard EPUB », menée dans le cadre d’un partenariat CIFRE entre Hachette Livre et Telecom ParisTech.

Elle aura lieu le 29 septembre à 15h00 à Télécom ParisTech, salle H2.

Modélisation d’un livre numérique adaptable par enrichissement sémantique des contenus – Réalisation par le standard EPUB

Résumé : Avant le fort développement du Web, le livre était la source d’information privilégiée et ce depuis l’invention de l’imprimerie. Les qualités du livres sont diverses : entre autres, les informations sont réunies en un ensemble cohérent, avec pour la plupart des ouvrages un fil conducteur du début jusqu’à la fin, qui se traduit par une lecture linéaire du contenu page après page. Mais un livre imprimé ne peut s’adapter directement aux besoins particuliers d’un individu : c’est un objet statique, imprimé une fois pour toute. L’évolution numérique a certes permis l’émergence de formats comme le standard EPUB, offrant davantage de fonctionnalités, notamment en termes d’interactivité et de multimédia. Mais le comportement des livres numériques ne diffèrent pas des principes du livre papier. Peut-on définir le livre numérique comme un objet dynamique, qui peut s’adapter aux besoins de l’utilisateur ?

Nous proposons de réfléchir à des livres dont les modes d’interaction et la présentation s’adaptent à l’utilisateur selon ses objectifs. C’est particulièrement intéressant pour les livres pratiques : les utilisateurs ne sont pas tous intéressés par les mêmes informations et n’ont pas les mêmes attentes, capacités ou centres d’intérêts. Pour cela, si le livre numérique tire ses origines depuis le livre papier, l’hypertexte, défini par Nelson dès 1965, peut en être une référence majeure. Des approches prometteuses dans la recherche viennent notamment des systèmes hypermédias adaptatifs et des documents virtuels personnalisables. Nous définissons le livre numérique comme un ensemble autonome de contenus organisé selon trois représentations : une représentation sémantique des données, une représentation logique de la structure du livre et la mise en forme esthétique du contenu présenté à l’utilisateur. Nous proposons ensuite d’intégrer un mécanisme d’adaptation du contenu au sein des livres numérique, déterminé par des caractéristiques utilisateurs. Nous implémentons cette approche en utilisant le standard EPUB et en facilitant la construction des fichiers par un workflow XML étendu par des règles de mise en correspondance entre la source et les représentations internes au livre.

 

Mots clés : Interaction homme-machine, Ingénierie documentaire, Ingénierie des connaissances, technologies XML, Web Sémantique, Hypermédia adaptatif, EPUB, chaîne de production éditoriale.

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Livre numérique, Marquage sémantique, Outils. Vous pouvez le mettre en favoris avec ce permalien.