Données des musées et analyses de Tweets

Dans le cadre du projet Data&Musée, nous avons notamment accès à des messages laissés par des visiteurs sur des « livres d’or » électroniques. L’observation de ces messages montre qu’ils sont composés de textes courts, souvent elliptiques, avec une orthographe incertaine et de nombreux éléments qui ne relèvent pas de la langue courante -émoticônes, ponctuations multiples…

Ainsi, ces messages s’apparentent beaucoup à de la messagerie instantanée, tweets ou autres. Ce billet présente quelques remarques en liaison avec cette observation.

Analyse de tweets par MuseumWeek

Dans le cadre de l’initiative MuseumWeek, liée au Labex « Les passés dans le présent« , une expérimentation a été menée visant à analyser les tweets échangés pendant cette manifestation culturelle.

On trouve des résultats de cette expérimentation ici et un article décrivant l’expérimentation et ses résultats ici (« Automatic Classification of Tweets for Analyzing Communication Behavior of Museums »).

Comme il s’agit d’analyser le comportement de représentants des musées pendant une manifestation, nous sommes un peu loin de ce qui concerne le projet Data&Musée. Cependant, certains aspects du nettoyage et de la mise en forme des données peuvent être une source d’inspiration.

Projets et publications sur l’analyse de tweets

#Idéo2017 : une plateforme citoyenne dédiée à l’analyse des tweets lors des événements politiques
de Claudia Marinica, Julien Longhi, Nader Hassine, Abdulhafiz Alkhouli, Boris Borzic

peut aussi être une source d’inspiration.

Depuis quelques années, la grande conférence annuelle sur les technologies du Web –lien vers la dernière occurence– fait la part belle aux réseaux sociaux. On y trouve probablement des publications liées aux tweets.

Sur Google Scholar, une recherche de ‘tweet analysis’ donne 6300 publications rien que pour 2018!

Par exemple, « HashCount at SemEval-2018 Task 3: Concatenative Featurization of Tweet and Hashtags for Irony Detection » à la conférence SemEval-2018. Dans cet évènement, trois taches parmi 12 portaient sur l’analyse de tweets et ont donné lieu à des publications:

Affect and Creative Language in Tweets

Bref, en cherchant un peu, on trouve vite des pistes. Il n’y a plus qu’à travailler!

 

 

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Uncategorized. Vous pouvez le mettre en favoris avec ce permalien.