Les âges sur des livres d’or de musées

Dans le cadre du projet Data&Musée, nous avons des données déposées sur les livre d’or électronique -fournis par Guestviews– de certaines institutions. Ces données proviennent pour le moment de membres de Paris Musées.

Note: Bien sûr, nous avons anonymisé ces données.

Il y a environ 27000 contributions. 19761 n’ont pas renseigné leur genre; 4220 femmes et 3111 l’ont fait. 19308 n’ont pas renseigné leur région d’origine et ceux qui l’ont fait viennent essentiellement de la région parisienne, mais aussi, dans une moindre mesure des départements 69 (Lyon), 13 (Marseille), 33 (Bordeaux).

Ces données ont été traitées pour alimenter un graphe de connaissances.

Pour commencer à jouer un peu avec les données, j’ai produit la requête SPARQL suivante:

select ?tranchedage (count(?s) as ?c){
graph <http://givingsense.eu/datamusee/onto/guestbook_notices/> {
?s <http://xmlns.com/foaf/0.1/age> ?age
bind(FLOOR(?age/20) as ?tranchedage)
}
}
group by ?tranchedage
order by desc(?c)

Le résultat est

tranchedage,c
1,2659
2,2078
0,2008
3,1657
4,592

Ce qui peut se lire

0 est la tranche 0/20 ans qui comporte 2008 contributeurs, 1 est la tranche 20/40 ans, 2 est la tranche 40/60 ans, 3 est la tranche 60/80 ans, 4 est la tranche 80/100 ans

Bien sûr ne sont prises en compte ici que les personnes qui ont laissé un message sur un livre d’or ET qui ont accepté de donner leur âge (sans tricher :-)) ?).

Nous allons devoir nous atteler à l’analyse des commentaires laissés par les contributeurs (voir à ce sujet Données des musées et analyses de Tweets).

A propos Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes
Ce contenu a été publié dans Data Musée, SPARQL. Vous pouvez le mettre en favoris avec ce permalien.