Dans le cadre du projet Data&Musée, nous avons des données déposées sur les livre d’or électronique -fournis par Guestviews– de certaines institutions. Ces données proviennent pour le moment de membres de Paris Musées.
Note: Bien sûr, nous avons anonymisé ces données.
Il y a environ 27000 contributions. 19761 n’ont pas renseigné leur genre; 4220 femmes et 3111 l’ont fait. 19308 n’ont pas renseigné leur région d’origine et ceux qui l’ont fait viennent essentiellement de la région parisienne, mais aussi, dans une moindre mesure des départements 69 (Lyon), 13 (Marseille), 33 (Bordeaux).
Ces données ont été traitées pour alimenter un graphe de connaissances.
Pour commencer à jouer un peu avec les données, j’ai produit la requête SPARQL suivante:
select ?tranchedage (count(?s) as ?c){ graph <http://givingsense.eu/datamusee/onto/guestbook_notices/> { ?s <http://xmlns.com/foaf/0.1/age> ?age bind(FLOOR(?age/20) as ?tranchedage) } } group by ?tranchedage order by desc(?c)
Le résultat est
tranchedage,c 1,2659 2,2078 0,2008 3,1657 4,592
Ce qui peut se lire
0 est la tranche 0/20 ans qui comporte 2008 contributeurs, 1 est la tranche 20/40 ans, 2 est la tranche 40/60 ans, 3 est la tranche 60/80 ans, 4 est la tranche 80/100 ans
Bien sûr ne sont prises en compte ici que les personnes qui ont laissé un message sur un livre d’or ET qui ont accepté de donner leur âge (sans tricher :-)) ?).
Nous allons devoir nous atteler à l’analyse des commentaires laissés par les contributeurs (voir à ce sujet Données des musées et analyses de Tweets).