entête
entête

Journée Fulbi 2015

« Bib Data, Smart Culture. Exploiter des données dans les bibliothèques, centres de doc, archives et musées » – Conservatoire national des arts et métiers - 22 janvier 2015

Emmanuel Brandl

L’amphithéâtre Paul Painlevé du CNAM (Paris) a fait salle comble pour cette nouvelle journée d’étude de la Fulbi 1concentrée cette fois-ci sur la question du recueil et de l’exploitation des « data ». Présentation de projets très concrets, études menées par des équipements, et « pas de côté » universitaire se croisent ici pour permettre d’appréhender une réalité aujourd’hui partagée mais cependant encore nouvelle, complexe et aussi très variable selon les équipements. De fait, nombre de questions sont encore en suspens, et des solutions restent à trouver, notamment lorsqu’il s’agit de passer des « big data » (les données recueillies et analysées) aux « smart data » (à de nouveaux services) 2.

Data : de quoi parle-t-on et « à quoi ça sert ? » 3

Dominique Cotte, enseignant-chercheur à l’université de Lille 3, consultant au Cabinet Ourouk et animateur du GT exploratoire du GFII « Big data, smart data » 4, confirme que nous entrons dans une situation nouvelle par la masse des données (data) aujourd’hui disponibles au traitement, et la manière nouvelle de faire parler ces données. Et si les data sont si importantes aujourd’hui c’est parce qu’elles sont sources de promesses : promesse « technique » (celle des « 4V » 5) et promesse d’« usages » (les domaines d’application sont bien réels : marketing et vente, comportement clients, santé, épidémiologie, tourisme sécurité…).

Xavier Guillot, bibliothécaire à la médiathèque départementale du Puy-de-Dôme – CUTO 6, quant à lui porte son attention sur la question de l’harmonisation des données à des fins comparatives. En effet, les items, leurs contenus, les libellés de paramétrage, etc., varient énormément d’un équipement et d’une institution à l’autre. Ce qui empêche d’agréger les données. C’est pourquoi Xavier Guillot propose plusieurs pistes de réflexion, et notamment la création d’un groupe de travail au sein de la Fulbi portant spécifiquement sur ces questions d’harmonisation.

Quant à Cécile Touitou, responsable marketing de la bibliothèque de Sciences-Po Paris 7, le grand intérêt de sa présentation des enquêtes « user-oriented » menées à Sciences-Po a été de présenter très concrètement l’apport de ces enquêtes pour la stratégie marketing de la BU, ou comment on passe de l’enquête à des produits et des services (re)pensés à partir des données recueillies.

Web participatif et changement de mentalités

Quatre projets de crowdsourcing ont inauguré l’après-midi de cette journée d’étude. Pauline Moirez, conservatrice du patrimoine à la BnF et experte des techniques documentaires numériques et services en ligne, a présenté le projet « CORRECT » (correction et enrichissement de textes), dont les objectifs sont de mettre à disposition des utilisateurs des outils de correction et d’enrichissement de documents numérisés et de s’appuyer sur un réseau social pour en soutenir et en organiser la collaboration. Lisa Chupin, doctorante au Laboratoire DICEN-IdF CNAM Paris, présente un projet tout à fait différent d’herbier collaboratif 8développé par le Muséum d’histoire naturelle de Paris, permettant d’aider les chercheurs à transcrire les étiquettes des planches d’herbier qui ont été numérisées 9. Le contraste provoqué par l’ordre de présentation de ces deux projets (finalement très éloignés l’un de l’autre dans leur objet) vient d’emblée donner toute sa force à la notion de crowdsourcing : on constate ici que le crowdsourcing vient transcender les projets « eux-mêmes » pour s’imposer comme une véritable méthodologie.

Cette impression sera renforcée par les deux présentations suivantes. Julie Guillaumot, responsable du pôle patrimoine et éditeur du site participatif Ciclic, Agence régionale « livre, image, culture numérique » en région Centre, présente le site collaboratif de service d’archives de films amateurs locaux 10. Ces films étant rarement référencés (les lieux des vidéos sont souvent inconnus), ils nécessitent de faire appel aux habitants du territoire qui seuls peuvent identifier ces vidéos et enrichir, donc, le référencement des archives (la place de l’expert s’inverse). Projet encore tout autre, Maïlis Frebillot et Thomas Schlotter, bibliothécaires à la Ville de Haguenau, présentent la mise en place d’un jeu vidéo urbain géolocalisé 11basé sur le principe d’une valorisation du patrimoine historique de la Ville.

De prime abord, les problématiques qui sont au cœur de ces projets paraissent bien différentes. Si, pour Lisa Chupin, la question fondamentale porte sur les mécanismes de contrôle de la qualité des contributions des internautes – puisqu’il ne faut en aucun cas que la qualité des données scientifiques contenues dans l’herbier soient mises à mal –, la question principale de Julie Guillaumot ou de Maïlis Frebillot et Thomas Schlotter est celle de l’attrait ludique du site pour les habitants, et alors celle de sa « gamification ». Mais ces différences ne sont en réalité qu’apparentes, car ce qui est sous-jacent ici c’est la question de la participation, de la visibilité des contributions, donc de la valorisation des contributeurs. Si chacun a présenté ses solutions propres, l’échange qui a suivi les présentations à bien montré que ces idées en forme de « bonnes pratiques » peuvent (et doivent !) être partagées par tous (les intervenants se livrant eux-mêmes au jeu des questions-réponses). Ce que montrent enfin, et plus fondamentalement, ces interventions c’est que nous assistons à un profond changement de mentalités : d’une séparation initiale et hiérarchisée des savoirs et des connaissances, on passe progressivement à l’idée d’une complémentarité dans la production de la connaissance.

Rappel universitaire et innovation méthodologique

Cette présentation de projets de crowdsourcing sera complétée par deux interventions universitaires : Bertrand Müller, directeur de recherche au CNRS 12, montre qu’une data ne naît pas ex nihilo mais qu’elle est toujours l’objet d’un travail de construction préalable résultant de cultures professionnelles amenées, aujourd’hui, à communiquer. Antoine Courtin, ingénieur au Labex Les Passés dans le Présent 13, avec Brigitte Juanals, maître de conférences habilitée à diriger des recherches en sciences de l'information et de la communication (université Paris Ouest Nanterre La Défense) 14, et Jean-Luc Minel, professeur des universités (université Paris Ouest Nanterre La Défense) 15, proposent une enquête originale en analysant le succès d’un évènement comme « MuseumWeek », car son succès repose exclusivement sur une communication par Twitter 16. L’analyse de quelque 550 tweets, via une méthodologie innovante, livre des résultats originaux et précurseurs : l’analyse de contenu des hashtags montre par exemple que ce sont ceux qui jouent sur le plan émotionnel qui sont les plus utilisés.

En guise de conclusion

On ressort de cette journée avec le sentiment, pas si souvent ressenti, d’avoir obtenu de vrais éléments de réponse aux questions que posait cette journée d’étude, avec (sans langue de bois) des interventions d’une qualité remarquable. Ce que souligne aussi cette journée c’est, la place primordiale que prend aujourd’hui l’usager dans la conception de l’organisation des équipements, des services, et des savoirs. Elle invite alors à rebondir sur cette notion d’« usager », rarement définie, pour dire qu’ici elle semble bien renvoyer à l’idée d’une personne active participant d’une co-construction des services publics (et non à celle d’une personne réduite à sa dimension de « client »).