Du 7 juillet au 27 août 2015, petits et grands sont conviés à se rendre dans les parcs départementaux de l'Île Saint-Germain à Issy-les-Moulineaux et de la Vallée-aux-Loups à Châtenay-Malabry, pour la 4e édition d’« Un brin de lecture ».
Cette opération propose chaque mardi, mercredi et jeudi (après-midi) de s’installer dans des salons de lecture à ciel ouvert afin de lire romans, contes, nouvelles, bandes dessinées et presse quotidienne. Le grand public pourra aussi bénéficier des conseils de lecture des bibliothécaires présents sur le site. Chacun pourra également participer aux différentes animations proposées autour du autour du livre et de la lecture (lectures de contes, ateliers, etc.).
En plus de la sélection d'ouvrages, des conseils avisés et des animations gratuites, « Un brin de lecture » proposera :
Au parc de l’Île Saint-Germain :
deux spectacles les 7 et 8 juillet,
une rencontre-lecture le 23 juillet.
Au domaine départemental de la Vallée-aux-Loups - Maison de Chateaubriand :
un rendez-vous pas comme les autres le 7 juillet.
un spectacle bilingue langue des signes et français le 27 août.
« Un brin de lecture » sera également présent le 6 août à Albert-Kahn, musée et jardin à Boulogne-Billancourt.
Cette opération estivale en plein air et en accès libre est organisée en partenariat avec les bibliothèques et médiathèques d’Antony, Boulogne-Billancourt, Châtenay-Malabry, Issy-les-Moulineaux et Sceaux et le conseil départemental des Hauts-de-Seine.
On connaît les « Little Free Library » ou « bibliothèques de rues », les « Ideas Box » de l'association Bibliothèques sans frontières, les « biblio-cabines », les « bibliobus » ou encore les bibliothèques de plage. Désormais on pourra également parler des « biblio-vélo ».
Les conseils de quartier et les associations du CRAC (Collectif des ressources alternatives et citoyennes) de la ville de Bagneux viennent en effet de lancer un concept original. Ils ont installé une bibliothèque (prenant la forme d’une boîte) sur le porte-bagages d’un vélo stationnant quotidiennement dans le centre-ville. Tout comme pour le « bookcrossing », les livres sont à la disposition de tous. Les passants peuvent prendre un ouvrage, le lire puis le rapporter afin de le partager avec d’autres, ou bien le garder ainsi que le donner à quelqu’un d’autre, sans oublier d’en placer alors un nouveau dans la boîte servant de mini-bibliothèque. Pour les habitants de la ville et des alentours, c’est donc l’occasion de faire du tri dans leurs rayonnages, de partager leurs coups de cœur mais aussi de découvrir de nouveaux auteurs.
Le collectif songe à agrandir cette mini-bibliothèque pour pouvoir répondre au plus grand nombre de demandes possibles : le vélo devrait bientôt être accompagné d’un triporteur.
La bibliothèque de Sciences Po Paris est engagée depuis une dizaine d’années dans un processus continu d’évaluation de la satisfaction et des usages de ses – environ – 12 000 lecteurs actifs. Deux bibliothèques principales à Paris (une bibliothèque de recherche de 85 places et une bibliothèque d’étude répartie sur neuf niveaux d’environ 800 places et deux bâtiments) permettent à l’établissement de disposer d’une place en bibliothèque pour 16 étudiants. Ce ratio doit être compris dans un contexte d’extrême variation de l’occupation des places selon les mois, les semaines et les heures du calendrier pédagogique. On assiste ainsi à des variations du taux d’occupation (calculé régulièrement par comptage des personnes installées en salles de lecture) allant de moins de 10% les matins de juillet, à plus de 100% à 13h aux mois de novembre ou avril, au moment des révisions qui précèdent les examens.
Trois enquêtes Libqual+ ont été menées en 2009, 2011 et 2014. Elles ont permis de mesurer l’impact de l’ouverture d’une nouvelle bibliothèque ultra-moderne de 400 places sur la satisfaction des usagers en 2010. Cependant, cinq ans après son inauguration, l’effet « nouveauté » s’est érodé. La satisfaction des usagers sur l’aspect « bibliothèque comme lieu » est en baisse, et principalement celle de la sous-population des masters dont le niveau d’attente sur ces questions est le plus élevé parmi celui des différentes sous-populations étudiées dans l’enquête. A défaut de pouvoir améliorer rapidement ce problème de pénurie de places qui nécessiterait des travaux très lourds, difficilement envisageables dans le contexte d’une bibliothèque implantée au cœur du 7ème arrondissement parisien, la bibliothèque s’est engagée dans une expérimentation d’élargissement des horaires d’ouverture jusqu’à proposer une ouverture de 8 heures à 23 heures, 16 semaines par an au cours de la présente année universitaire. Cette mesure a bénéficié d’un excellent écho et d’une fréquentation soutenue au point qu’elle sera sans doute pérennisée tout au long de la période pédagogique dans les années à venir.
Les trois enquêtes Libqual+ nous ont permis d’avoir une mesure assez fine (par sous-population d’usagers) de l’évolution de l’usage des ressources sur place et à distance de la bibliothèque. Les graphiques ci-dessous confirment le basculement de la priorité de l’accès distant. Les répondants du premier cycle étaient 91 % en 2009 à déclarer consulter sur place les ressources de la bibliothèque au moins une fois par semaine, ils ne sont plus que 74% en 2014. Pour les masters et doctorants on est passé de 83 à 75%. Dans le même temps, les répondants du collège universitaire étaient en 2009 80% à déclarer consulter via Internet les ressources de la bibliothèque au moins une fois par semaine, ils sont 84% en 2014. Pour les masters et doctorants, on est passé de 82 à 84%.
La consultation des ressources qui se faisaient d’abord sur place en 2009, se fait d’abord via internet en 2014.
La bibliothèque de Sciences Po bénéficie donc d’une fréquentation de plus en plus soutenue dans un contexte d’usage des collections imprimées en baisse (aussi bien pour le prêt que pour la consultation sur place mesurée au travers de semaines test de la consultation conduites régulièrement depuis 2007) mais d’un usage des ressources en ligne en croissance exponentielle.
Alors que le prêt de documents sur les sites parisiens suivait la courbe présentée ci-contre, le nombre de visites dénombrées à la bibliothèque passait de 630 000 en 2009 à 1,2 million en 2014.
C’est dans ce contexte qui peut paraître paradoxal que nous avons décidé en 2014 d’explorer plus avant comment les usagers des bibliothèques du 27 et 30 rue Saint-Guillaume (qu’on appellera 27 et 30RSG) s’appropriaient les espaces offerts. En janvier 2014, la bibliothèque de Sciences Po Paris a donc initié cette enquête auprès de 2 400 étudiants environ, d'abord par la réalisation d'une étude de faisabilité puis par la mise en œuvre effective de l'enquête dès la mi-février. L'enquête a été pilotée par la Mission Marketing de la bibliothèque, assistée en janvier d'une stagiaire de l'Enssib en formation initiale des bibliothécaires d’État, cosignataire de cet article.
« Sweeping the library » ou la bibliothèque au tamis
Dans ce contexte de diminution des prêts et de baisse de la consultation sur place, plusieurs bibliothèques, à l'instar de Sciences Po, ont constaté que leur fréquentation ne suivait pas cette pente descendante, mais, au contraire, avait tendance à croître. Elles ont souhaité savoir quels étaient les « nouveaux » usages des lieux, la difficulté étant, qu’à la différence du prêt et du retour des documents, ces nouveaux usages sont difficiles d’une part à identifier et d’autre part à quantifier.
L’objectif général de cette méthodologie d’enquête appelée « Sweeping the library » (littéralement « balayer la bibliothèque »), que l'on pourrait traduire par « la bibliothèque au tamis », est de cartographier l’organisation physique de la bibliothèque et l’utilisation des espaces au moyen d'une grille d'observation des profils, matériels et activités des usagers installés dans la bibliothèque. Cette approche ethnographique, initialement utilisée par les aménageurs étudiant par exemple l’appropriation des espaces commerciaux par les clients, a ensuite été appliquée aux bibliothèques.
Les résultats de ce type d’étude peuvent être employés comme aide à la décision pour l’aménagement à court et à long terme des espaces, pour une meilleure adéquation des services aux attentes des usagers de la bibliothèque, ou pour remodeler l'espace des interactions sociales au sein de la bibliothèque selon les comportements d'utilisation des différents types d’usagers.
Étude de faisabilité de l'enquête à Sciences Po
Benchmarking : les enquêtes « Sweeping the library » en France et dans le monde
La première phase du projet a consisté en l'étude comparée des enquêtes Sweeping déjà menées en France et à l'étranger par six bibliothèques municipales (ou réseaux) et dix bibliothèques universitaires, aux profils très hétérogènes. Les pays anglo-saxons (Canada, USA et Angleterre) et les pays scandinaves (Norvège et Finlande) ont expérimenté ce type d'enquêtes largement et dès 1999 pour les bibliothèques de Toronto et Vancouver. Dans les pays francophones, seule la Belgique et la France semblent s'y être essayées plus récemment mais de manière très marginale (une seule bibliothèque en Belgique, à Louvain, comme en France, à Toulouse Le Mirail). Cette recherche a été faite à partir de recherches menées sur le web et de l’étude des bibliographies et des références mentionnées dans les rapports trouvés et étudiés.
Bibliothèques étudiées
Bibliothèques municipales de Toronto et Vancouver (Canada)
Edmonton public library (Canada)
Réseau des bibliothèques municipales de Nova Scotia (Canada)
Bibliothèque municipale de Drammen (Norvège)
Li Ka Shing Library (Singapour)
Bibliothèque universitaire de Mount Royal (USA)
James A. Gibson Library, Brock University (Canada)
Bibliothèque de l'université catholique de Louvain (Belgique)
Goddard Library de la Clark University (USA)
Joyner Library de la East Carolina University (USA)
Krupp Library, Bryant University (USA)
Pilkington Library, Université de Loughborough (Angleterre)
Oslo University College Learning Centre
Bibliothèque universitaire de l'université de Tampere (Finlande)
Bibliothèque universitaire de l'université Toulouse Le Mirail (France)
L’étude des travaux publiés a permis de dégager des tendances et d'établir les premières préconisations méthodologiques pour une application de l'étude à la bibliothèque de Sciences Po. Les points observés ont été la durée et la période de l'étude, l'organisation des rondes d'observation, le personnel participant à l'étude, le mode de collecte ou les outils techniques utilisés, le nombre de personnes observées et la population de référence, l'utilisation d'autres enquêtes complémentaires, la communication mise en œuvre autour de l'enquête. Les grilles d’observation utilisées par les bibliothèques ayant expérimenté la méthode « Sweeping the library » ont également été analysées afin d’élaborer une grille d’observation applicable au contexte de Sciences Po Paris . On a ainsi relevé entre 15 et 25 activités listées par grille. Les effets personnels et le profil de l’usager sont renseignés dans la majorité des études et, si on observe de légers changements dans la formulation ou le niveau de détail des activités listées, celles-ci sont globalement similaires (lecture, écriture, utilisation d’ordinateur, de téléphone…)
A l'issue de cette synthèse, une première grille d'observation applicable à Sciences Po a été construite selon les préconisations suivantes :
Distinguer le lieu où se déroule l’activité (27 rue St-Guillaume, 1er étage, 30 rue St-Guillaume Rez-de-chaussée...) et le mobilier ou équipement où se trouve l'usager (table de travail avec ou sans ordinateur, fauteuil…) de l’activité elle-même (lire, écrire, consulter un ordinateur… : une liste de 20 à 25 activités a été établie).
On entend par mobilier les pièces d'ameublement (tables, chaises, etc.) et par équipement le matériel à disposition (photocopieurs, automates de prêt/retour, ordinateurs, etc.).
Diviser la grille en cinq catégories : Profil, Lieu de l’observation, Mobilier & équipement, Effets personnels, Activités en cours de réalisation
Tests du questionnaire
Afin de vérifier sa pertinence et faire les modifications nécessaires, nous avons testé cette première grille d'observation avec un formulaire papier le jeudi 9 janvier 2014 au matin au cours duquel six personnes ont été observées. Un formulaire avec l'outil Modalisa (de la société Kynos) a ensuite été créé et de nouveaux tests ont été effectués sur le terrain, dans les deux bibliothèques, les 14 et 16 janvier 2014. Une tablette Ipad a été utilisée pour renseigner le formulaire en ligne. Ces deux phases de tests nous ont conduits à modifier et affiner la grille d'observation (elle le sera régulièrement jusqu'au début effectif de l'étude), par exemple en remplaçant le champ libre Age par deux options à cocher (18-25 ans et Autre). Nous avons également choisi de conduire les observations en binôme afin de diviser les tâches et de tendre vers une observation la plus exhaustive possible. Pendant qu'un des observateurs procède à l’observation uniquement, en circulant le plus discrètement possible près de la personne observée, sans tenir de tablette ni de formulaire papier susceptible d’attirer l’attention, le second observateur renseigne le formulaire dans l’Ipad, selon les informations transmises par le premier observateur, en se tenant un peu à l’écart de la personne observée. Avant de valider le formulaire, le second observateur fait une dernière observation rapide pour éventuellement compléter celle de son binôme.
Le benchmarking et les premiers tests d'observation sur le terrain ont confirmé la pertinence et la faisabilité d'une telle enquête à Sciences Po. La suite du projet s'est donc concentrée sur la définition de ses modalités pratiques et méthodologiques, à travers la cartographie des espaces et l'organisation des rondes d'observation.
Cartographie des deux sites de la bibliothèque
L'objet d'une enquête de type « Sweeping the library » est de déterminer les usages des publics en fonction des différents espaces de la bibliothèque afin de remodeler ces derniers pour une meilleure adéquation espaces / usages. Bien connaître les espaces, mobiliers et équipements des deux sites de la bibliothèque était donc un préalable indispensable.
Mise à jour des plans de la bibliothèque
En parallèle de l'élaboration de la grille d'observation et des premiers tests, un important travail de cartographie des espaces de la bibliothèque a donc été réalisé d’après les plans fournis par le département Support de la bibliothèque. Selon le site concerné, ces plans dataient de 2010 ou 2011 et n'avaient pas été modifiés en fonction des changements d'agencement, ajouts ou suppressions de matériels survenus depuis. Une comparaison entre les plans et les espaces réels a donc été effectuée sur le terrain afin de les mettre à jour. Un code couleur a été utilisé sur les plans papiers pour différencier les espaces avant une mise à jour des plans au format électronique qui ont ensuite été mis à la disposition du personnel de la bibliothèque sur le serveur des fichiers communs.
Inventaire des mobiliers et équipement
L’actualisation des plans s'est accompagnée d'un inventaire des différents équipements et mobiliers ainsi que du nombre de places assises dans la bibliothèque. 24 mobiliers et équipements différents ont été répertoriés.
Les deux sites de la bibliothèque disposaient selon ce comptage de 703[1] places dont 397 au 27SG et 306 au 30SG. Toutefois, il semble difficile de faire une estimation précise du nombre de places, celles-ci variant légèrement au gré des ajouts ou retrait de chaises, notamment les chaises pliantes (dites « flottantes »). Sans considérer ces chiffres comme absolus et officiels, ils donnent un ordre d'idée des places assises disponibles à la bibliothèque et de leur répartition au sein des différents espaces. C'est par exemple sur ce dernier point que les résultats de l'enquête peuvent influer afin de permettre un réajustement du type d'assise (fauteuils, chaises, canapés...) en fonction du type d'activité observé.
Zonage des espaces par étages
Après avoir cartographié les espaces et compté les places disponibles niveau par niveau, chaque niveau a été divisé en grandes zones permettant de circonscrire, outre le mobilier ou l’équipement utilisé par l’usager et l’étage où il se trouve, une zone plus précise au sein de l’étage. Selon les étages, trois à six zones ont été définies. L’objectif de ce zonage plus fin est de permettre de dégager des zones plus ou moins fréquentées ou favorisant un certain type d'activité, indépendamment du mobilier ou de l’équipement. En effet, certains mobiliers ou équipements pouvant se retrouver à différents endroits de l’étage observé (par exemple les tables de travail), ne renseigner que l’étage et le type de mobilier utilisé ne permet pas toujours de localiser exactement l’usager dans l’espace. En déterminant des zones pour chaque niveau, on peut ainsi, par exemple, déterminer si les tables de travail situées à droite de la banque d’accueil sont plus utilisées que celles situées à gauche.
Les zones déterminées comprennent les mobiliers et équipement mais également le sol qui se doit d’être cartographié comme un espace observable (notamment lorsque l’usager se tient debout ou assis sur le sol, sans utiliser d’équipement). On a toutefois choisi d’exclure les carrels (ou salles de travail en groupe) de l’étude car il y est impossible d’y faire des observations discrètes.
Organisation des rondes d'observation
Élaboration d'un circuit d'observation
A l'issue de ce zonage, un circuit d'observation décrivant l'itinéraire à emprunter par chaque binôme, niveau par niveau, a été établi. L'objectif d'un circuit précis à suivre est de s'assurer le plus d'objectivité possible dans l'observation. Tous les observateurs procèdent de la même manière selon une méthodologie précise, déterminée en amont. Suivre un circuit pré-déterminé permet également de s'assurer de balayer chaque zone et, dans chacune de ces zones, d’observer une personne sur chaque type de mobilier ou équipement. Quelques principes ont par ailleurs été définis :
Ne pas porter de signes indiquant son appartenance aux membres du personnel (badge)
En cas de faible affluence, observer au moins une personne dans chaque zone, voire une place occupée par des affaires si l’usager est absent.
En cas de forte affluence, il n’est pas possible d’observer chaque individu. On observe alors systématiquement la 3ème personne entrant dans son champ de vision dans chaque zone afin de limiter la subjectivité dans le choix des individus à observer.
A l’issue de chaque ronde d’observation, le binôme peut prendre des notes sur l’Ipad pour renseigner des observations générales sur le taux de fréquentation ou l’ambiance générale dans la bibliothèque. Par exemple, « ambiance particulièrement bruyante », « nombre important d’usagers assis par terre ».
L’Ipad est rangé à un emplacement prévu à cet effet où chaque binôme vient prendre la tablette, la ranger et la recharger avant et à l’issue de chaque ronde.
Planning de mise en œuvre de l’étude
Des réunions spécifiques ont eu lieu lors de la semaine du 27 au 31 janvier avec des membres du groupe de travail impliqué dans la Mission Marketing, notamment la responsable de l'encadrement des vacataires, afin de déterminer les modalités calendaires de déroulement de l'enquête, l'objectif étant de couvrir les différentes périodes d'affluence à la bibliothèque et d'atteindre un nombre suffisant de personnes observées pour pouvoir être représentatif[2].
Les modalités de mise en œuvre de l'enquête qui ont été choisies sont les suivantes :
Observations pendant le 2ème semestre, de février à septembre 2014, sur 9 semaines
Collecte couvrant tous les jours d’ouverture de la semaine, soit du lundi au vendredi ou samedi selon les semaines
Autant de rondes d’observation qu’il est nécessaire pour coller au mieux à la saisonnalité heures/jour/mois de la fréquentation de la bibliothèque soit 49 rondes au 30SG et 54 au 27SG pour un total de 103 rondes (une ronde pouvait durer de 30 minutes à 1H30)
En moyenne, 24 personnes observées par ronde (en situation réelle), soit 28 personnes au 27SG et 20 au 30SG
Base de 6 binômes d’observateurs, soit 12 observateurs
49 rondes d'observation qui se déroulent simultanément au 27SG et au 30SG pour permettre une comparaison des observations selon le site et 5 observations supplémentaires dans la bibliothèque du 27SG plus fréquentée.
Un binôme doublon est prévu par créneau en cas de désistement d’un ou des deux observateurs.
Semaines d’observation
Semaine 1 : 24 au 28 février (vacances)
Semaine 2 : 3 au 8 mars (retour de vacances)
Semaine 3 : 31 mars au 5 avril (cours)
Semaine 4 : 14 au 18 avril (cours)
Semaine 5 : 12 au 17 mai (examens)
Semaine 6 : 26 au 30 mai (oraux)
Semaine 7 : 16 au 20 juin (vacances)
Semaine 8 : 30 juin au 4 juillet (vacances)
Semaine 9 : 8 septembre au 13 septembre (rentrée)
Les semaines d'observation choisies couvrent l'ensemble des différentes périodes et permettent une représentation homogène de l'année universitaire.
A l'exception des deux premières semaines qui se suivent, on a choisi d'espacer les semaines de déroulement de l'étude afin de ne pas mobiliser les observateurs sur plusieurs semaines d'affilée et de permettre des pauses pendant l'enquête pour faciliter des phases d'analyse partielle des résultats en cours d'étude.
Recrutement et formation des observateurs
A l'issue de la validation de ce calendrier en comité de direction, des observateurs volontaires ont été sollicités auprès de l'ensemble du personnel de la bibliothèque. Les observateurs se sont inscrits dans les créneaux de leur choix entre le 31 janvier et le lancement de l'enquête le 24 février dans un fichier mis à disposition dans l'outil Google Drive.
Le lancement de l’étude a été précédé d'une formation à l’utilisation du formulaire sur Ipad et au parcours de circulation dans les différents espaces. On a veillé également à bien expliciter les termes du formulaire pour éviter toute ambiguïté et une collecte des données différente selon les observateurs. Des phases de tests ont été réalisées par les observateurs afin qu'ils se familiarisent sur le terrain avec le formulaire et le parcours. Un Guide de l'observateur, reprenant les éléments méthodologiques nécessaires à l'observation (principes généraux, circuit d'observation, zones, calendrier) a été élaboré à cette fin.
Les résultats des observations
Il convient de garder à l’esprit les limites induites par ce type d’observation. Un des biais est qu’il peut surreprésenter les activités qui se déroulent dans la durée (par exemple la rédaction) par rapport à des activités courtes (envoyer un sms). L’observation capture un cliché des activités auxquelles l’étudiant est occupé. L’observateur ne s’arrêtant que quelques secondes ou minutes devant chaque étudiant, il paraît évident que les activités les plus engageantes dans le temps seront celles qui seront le plus fréquemment observées.
Au cours des 8 mois de l’étude, on constate que la présence des étudiants est forte tout au long de la période pédagogique, mais surtout en mars (période de cours) et jusqu’aux examens de mai, puis à la rentrée ; la présence des plus âgés est proportionnellement plus importante en juin et juillet ; les places fantômes sont significativement importantes lors des examens du mois de mai (9% du total des observations). C’est donc au moment où la pression sur les places est la plus importante que les étudiants « gardent » leurs places en y laissant leurs affaires pour pouvoir la retrouver à leur retour.
A l’issue des six mois d’enquête nous disposions de 2407 observations collectées dans tous les espaces, à toutes les heures de tous les jours de la semaine. Ces données, collectées avec l’outil Modalisa, ont pu être traitées et analysées par cet outil qui permet à la fois de définir des sous-populations et de croiser toutes les (39) questions possibles. Le champ de l’analyse qui s’ouvrait à nous était donc … vertigineux ! La première investigation a porté sur le portrait de l’usager …
Une bibliothèque fréquentée par les étudiants…
« Les premières impressions, c’était plus : il faut y aller parce qu’il faut travailler et il faut être sérieux. Et avec les années et l’apprentissage de comment travailler, par exemple, en deuxième année, je travaillais beaucoup plus chez moi et je venais à la bibliothèque que quand j’avais besoin de certains livres. Maintenant, en Master, c’est l’endroit où je travaille ».
L’usager observé est plutôt une fille – à 52% - (57% de jeunes filles sur le campus de Paris); 89% avaient l’âge d’être étudiant[3] . Les 133 personnes observées qui n’avaient plus visiblement l’âge d’être étudiantes, étaient à 72% des hommes, 15% avaient des documents sur leur table de travail, ils fréquentaient plus souvent la bibliothèque du 30 rue Saint-Guillaume, ils ont été plus significativement observés en juillet que le reste de la population observée, plus souvent sans ordinateur (à 47%), plus souvent engagés dans une opération de prêt/retour.
A contrario, les plus jeunes (identifiées dans notre grille comme faisant partie de la catégorie 18-25 ans) – soit 2136 individus – se distinguaient de la catégorie précédente comme étant plus souvent une femme, consultaient plus souvent Facebook, est plus souvent installé pour travailler en groupe, utilisaient plus souvent un smartphone, étaient plus souvent installé dans la bibliothèque du 27 rue Saint-Guillaume.
Ces deux populations ayant été décrites dans leurs différences distinctives[4], retenons que les caractéristiques générales de nos usagers, telles que l’observation nous les a montrées, sont les suivantes :
84,5% sont installés pour travailler seuls
41% disposent d’un ordinateur personnel (dont 15% sont installés à des postes avec ordinateur de la bibliothèque)
35% ont un smartphone visible (ou en cours d’usage)
28% ont des livres ou périodiques disposés sur leur table
…Qui étudient …
Répartition de l’activité observée selon le type (2407 observations)
Ce qui est frappant dans les observations est la prépondérance des activités scolaires dans lesquelles sont investis les usagers étudiés. Au moins les trois-quarts d’entre eux se consacraient à une activité scolaire. Dans une étude similaire menée en 2011 dans deux universités du Long Island, portant sur l’observation de 730 utilisateurs de la bibliothèque (où 90% des utilisateurs observés avaient moins de 25 ans) Lawrence Paretta[5] et Amy Catalano ont mis en lumière que 60% des observations concernaient des activités liées aux études (lecture/rédaction). Cependant, bien que les étudiants étaient engagés dans des activités académiques, ils consultaient également Internet pour des activités non scolaires[6]. Dans notre enquête, les 375 étudiants engagés dans une activité considérée comme « privé-ludique » plus souvent que le reste de la population étudiée téléphonaient (42/375), dormaient (21/375), avaient un smartphone (45/375) étaient dans le sas d’entrée, dans les escaliers ou encore dans les fauteuils rouges situés à l’entrée de la bibliothèque du 27, consultaient Facebook (88/375) ou Youtube (14/375). Si on distingue les usages selon les espaces, on constate que les activités privés-ludiques ont constitué 29% des observations faites dans les escaliers, le jardin ou les entrées mais 14% des espaces de travail.
…dans les espaces réservés à cet usage …
La grille d’observation que nous avons construite permettait également de creuser les rapprochements entre type d’usage et type de mobilier ou espace. L’outil Modalisa nous permettait également, comme dans l’exemple du tableau suivant de souligner les liens PEM et « d'estimer la force de l'attraction entre deux modalités ». Ci-dessous, la variation du vert clair ou vert foncé souligne les PEM significatifs dans un classement croissant : on voit ainsi que la banque Prêt/Retour ou les rayonnages sont fortement corrélés à un usage académique ou scolaire. Les zones de transit (escalier, ascenseurs) ou de détente (canapés alcôve, fauteuils rouges) génèrent de façon significative des usages privés ou ludiques (ou simplement de repos ou de circulation). Certains types de mobilier, compte tenu de leur disposition, n’ont pas permis aux observateurs de spécifier l’activité de l’étudiant (par terre ou dans les canapés) : ils ont donc choisi la catégorie « Ne sait pas ».
SI ces résultats peuvent apparaître comme sans suprise, ils permettent de vérifier cependant que le choix de mobilier complémentaire, plus ou moins confortable, plus ou moins propice au travail a un réel effet sur l’appropriation qui en est fait par les étudiants et sur les usages de repos que s’autorisent ces étudiants soumis à la lourde pression du temps et du travail.
Les activités ont été jugées bruyantes dans 7,3% des cas. 50 des 176 cas qualifiés de « bruyants » se sont déroulés dans les escaliers, 82/176 dans des espaces de circulation ou d’interaction avec le personnel de la bibliothèque. Cependant la variation de cet indicateur tout au long des huit mois de l’observation varie peu (10% d’activités jugées bruyantes pendant les examens de mai ou 10,6% pendant la période de cours de mars ; et 4 ou 5% pendant les mois d’été).
Si l’on regarde l’espace ou le mobilier qu’occupent les usagers, on constate que plus la bibliothèque est saturée, plus les usagers occupent l’ensemble des espaces et du mobilier offert. Par défaut, et en premier choix, ils utilisent les places sur table collective et les tables individuelles. C’est également – bien entendu – ce mobilier qui est largement majoritaire dans la bibliothèque (en nombre offert : 324 places de travail individuelles sans ordinateur / 253 places de travail individuelles avec ordinateur).
Le mobilier plus confortable qui a été proposé dans l’idée de diversifier les usages n’est largement utilisé qu’au moment où la bibliothèque est fortement occupée, comme le montre le graphique suivant qui rapproche la courbe des entrées par mois et le nombre d’observations d’étudiants faites sur ces fauteuils. Hors des périodes d’affluence, l’usage des mobiliers confortables reste minoritaire et réservé aux activités de loisirs.
Certains espaces ne sont occupés que dans les périodes de saturation : il s’agit des bancs du sas d’entrée de la bibliothèque du 30RSG, le sol (les étudiants ont été vus installés à même le sol surtout en avril, mai et septembre), et, comme on vient de le décrire les sièges BLA[7], les canapés Alcôve, les fauteuils rouges et les fauteuils gris.
Selon la règle du cumul …
C’est donc un usage très convenu des espaces que font les étudiants observés, respectant, dans l’énorme majorité des cas, la norme du silence imposée par la pression des camarades installés pour travailler. Les auteurs américains cités précédemment se sont beaucoup intéressés à la place des réseaux sociaux dans le temps scolaire de ces étudiants de la génération Y que l’on dit hyper connectés[8]. Comme l’écrit également Sylvie Octobre[9] : « Le numérique a introduit une mutation du rapport au temps : les technologies permettent d’abolir la linéarité et la mono-occupation des temps culturels ». Notre époque est donc « marquée par une porosité croissante des temps privés, publics, scolaires ou professionnels, extra-scolaires ou extra-professionnels, et le brouillage des frontières. » C’est cette porosité « en régime de polyactivité et de sociabilité importante » qu’ont pu mesurer nos collègues américains dans les études précédemment citées. Il n’y a pas concurrence entre la consultation de Facebook et travail scolaire, les deux se font la plupart du temps en parallèle. Ce que nous avons constaté est que l’usage du téléphone pour envoyer des SMS, la consultation des réseaux sociaux constituent – éventuellement - des activités complémentaires au travail, rarement une activité exclusive. Ces résultats nous engagent à considérer ces activités comme non exclusives les unes des autres pour ces générations qui pratiquent le cumul systématique du temps privé et du temps scolaire. De là à penser les espaces des bibliothèques sur ce mode-là, c’est ce que font certains auteurs[10] qui décrivent le continuum d’activités privées et scolaires qui composent le temps de l’étudiant, à l’instar de R. Applegate[11] "an effective library is one that addresses the entire spectrum of student needs, [and] does so as part of the entire student space-use ecology on a campus" (p. 345).
Dernier angle d’observation : les activités. La grille nous autorisait 29 activités. Un étudiant pouvait, bien entendu, être investi dans plusieurs activités simultanées (c’est d’ailleurs le cas pour la majorité des observations) : ces 29 activités ont généré 322 combinatoires pour les 2407 observations. Les observateurs ont vu des usagers engagés dans les monoactivités suivantes :
Lit ; 5,4% des observations
Emprunte-rend un document : 1,2%
Butine dans les rayonnages : 3%
Interagit avec le personnel : 1,9%
Utilise un ordinateur pour consulter les ressources hors Sciences Po : 6,2%
Rédige une note/un document : 5,4%
Utilise un ordinateur pour consulter les ressources de Sciences Po : 3,4%
Téléphone : 1,7%
Prend des notes : 1,4%
Se déplace dans la bibliothèque : 0,9%
Dort : 1%
Range ses affaires : 0,4%
Au total 38% des 2407 observations ont concerné un usager investi dans une seule activité. Les 1540 autres usagers observés faisaient plus d’une chose à la fois (au moment où on les a observés).
La distribution des activités en part du total (en faisant abstraction de ces combinatoires trop difficiles à présenter) est la suivante - la lecture (d’imprimés ou de ressources en ligne) arrive en tête des activités observées avec 36% des usagers engagés dans une activité de lecture (en plus ou non d’autres activités) :
« Personnellement, je travaille à la bibliothèque presque tout le temps parce que, déjà, on n’a pas la place pour une table à la maison. Du coup, je fais ma vie à la bibliothèque. Mais je ne suis jamais à côté des collections qui m’intéressent. La plupart du temps, si j’ai besoin de quelque chose, je vais l’emprunter et ensuite, je vais travailler où je trouve de la place »
Au total, un minimum de 62% des activités observées individuellement l’une de l’autre peuvent être assimilées à des activités scolaires (en part du total). Cependant, ce pourcentage est sans doute supérieur si l’on totalise les pluriactivités.
L’observation des activités selon les mois du calendrier universitaire ne révèle pas de différence flagrante dans la hiérarchie des activités.
La lecture (d’imprimés ou d’écrans) demeure tout au long de l’année l’activité principale qui cède un peu le pas, au moment de la préparation des travaux à rendre, à la rédaction de documents qui est alors proportionnellement un peu plus souvent observée. La période estivale, période de plus forte présence des élèves qui préparent les concours, accueille plus d’usagers en situation de lecture.
Pour conclure
« Du coup, c’est moins les livres que l’espace de travail, le fait qu’autour, les gens travaillent, qui est important. C’est l’ambiance. Les livres, ça peut arriver quand j’en ai besoin. Mais je ne viens pas pour ça. Je viens vraiment pour trouver un endroit calme pour travailler. »
Jeffrey Gayton[12] d’une part, Francine May et Alice Swabey[13] d’autre part, évoquent ce qui selon eux est le plus utile et attractif pour les usagers des bibliothèques universitaires : des lieux qui encouragent l’étude et permettent une activité, certes solitaire et contemplative, mais en compagnie des autres étudiants plongés eux-mêmes dans cette activité studieuse.
A la lumière des premiers résultats de notre enquête menée auprès de 2407 étudiants et sous réserve de ce qu’ils pourront nous dire lors de prochains focus groups, il semble que nos étudiants cherchent d’abord un lieu pratique (non loin des salles de cours, de la cafétéria et du cœur du campus), où il pourront se plonger silencieusement dans une activité de lecture et/ou de révision et/ou de rédaction sans nécessairement consulter les ressources imprimées ou dématérialisées de la bibliothèque.
Ils cherchent le calme et la concentration, un lieu où l’on puisse imprimer, bénéficier du wifi, utiliser un ordinateur, jouir d’un espace lumineux, propice à l’étude, où il ne fait ni trop chaud, ni trop froid. Les tables de travail sont d’abord utilisées, avant les mobiliers confortables qui sont éventuellement réservés à des moments de pause, ou, quand la bibliothèque est saturée, jouent le rôle de place de travail comme une autre.
[1] Ont volontairement été retirés de ce comptage les 32 places disponibles dans les salles de travail en groupe, ainsi que les chaises disponibles dans le jardin.
[2] La bibliothèque de Mount Royal au Canada a observé 9 268 personnes pour une population de 41 000 étudiants ; celle de Louvain 2 692 personnes pour un effectif de 28 344 personnes …Le critère pour nous était de procéder à un nombre de rondes permettant de coller au mieux à la fréquentation annuelle de nos salles de lecture.
[3] On ne compte donc qu’une minorité d’enseignants dans nos murs, si cette conclusion peut être extrapolée des observations sur l’âge des usagers. Ils ne sont d’ailleurs que 35% à avoir déclaré lors de l’enquête Libqual+ fréquenter au moins une fois par semaine la bibliothèque.
[4] Modalisa permet de calculer le Pourcentage de l'Ecart Maximum (PEM) qui permet d'estimer la force de l'attraction entre deux modalités dans un tableau de contingence.
[5] Lawrence T. Paretta et Amy Catalano. What Students Really do in the Library: An Observational Study. The Reference Librarian. Volume 54, Issue 2, 2013 : “The authors observed 730 collegiate students in the library and recorded their study (or non-study) activities. Approximately 60% of behaviors were study related. The most commonly observed behavior was reading print material (18.8%). The second most common behavior was the use of social media (11.4%)”.
[6] Les observations de cette étude menée par L. T. Paretta et A. Catalano ont permis de mesurer les usages suivants : The most frequently recorded primary behavior (Behavior 1) was reading print materials–school related (18.8%, n = 137), followed by typing or working on a document (12.3%, n = 90), Facebook/social media (11.4%, n = 83) followed by perusing non-educational websites/games (9.3%, n = 68) viewing online library materials (5.9%, n = 43), working collaboratively (5.6%, n = 41) and visiting educational websites (4.9%, n = 36). Other behaviors included sleeping (.7%, n = 5), reading news–online (2.6%, n =19), reading news–print (n = 24), and visiting YouTube (2.1%, n = 15).
[7] Il s’agit de sièges pivotants avec tablette intégrée.
[8] Monique Dagnaud. Génération Y : les jeunes et les réseaux sociaux de la dérision à la subversion. Paris : Presses de Sciences Po, 2013
[9] Sylvie Octobre, « Les enfants du numérique : mutations culturelles et mutations sociales », Informations sociales 1/2014 (n° 181) , p. 50-60
URL : www.cairn.info/revue-informations-sociales-2014-1-page-50.htm. : « En dix ans, entre 1988 et 2008, la part des 15-29 ans qui utilisent l’ordinateur tous les jours a été multipliée par onze, passant de 5 % à 55 %, d’après les enquêtes Pratiques culturelles des Français. C’est dire l’ampleur du mouvement en cours, d’une rapidité sans précédent dans l’histoire des pratiques culturelles depuis la seconde moitié du XXe siècle ».
[10] CUNNINGHAM, Heather V.; TABUR, Susanne. Learning space attributes: reflections on academic library design and its use. Journal of Learning Spaces, [S.l.], v. 1, n. 2, jun. 2012. ISSN 21586195. Available at: <http://libjournal.uncg.edu/index.php/jls/article/view/392/283>. Date accessed: 11 Apr. 2015.
[11] Applegate, R. (2009). The library is for studying: Student preferences for study space. Journal of Academic Librarianship, 35(4), 341-346
[12] Jeffrey T. Gayton, "Academic Libraries: 'Social' Or 'Communal?' The Nature and Future of Academic Libraries," Journal of Academic Librarianship 34, no. 1 (2008): 60.
[13] May , Francine et Swabey, Alice : Using and Experiencing the Academic Library: A Multi-Site Observational Study of Space and Place. En ligne : http://crl.acrl.org/content/early/2014/11/26/crl14-683.full.pdf
Laurence Engel, la médiatrice du livre, vient de valider les modèles d'abonnement de livres numériques en streaming développés par trois start-up françaises.
A la suite de l’arrivée de l’offre « Kindle Unlimited » d’Amazon, en décembre 2014, la ministre de la Culture et de la Communication Fleur Pellerin avait demandé à Laurence Engel de juger de la légalité de ce type d’offre. Un premier avis rendu en février 2015 avait déclaré ces offres illégales, celles-ci ne respectant pas la loi sur le livre de 2011 (qui permet aux éditeurs de fixer les prix des ouvrages). La médiatrice du livre avait alors lancé une négociation individuelle avec les plateformes YouScribe, Youboox, Izneo, Amazon et Cyberlibris ; des accords ont été trouvés avec les trois premières.
YouScribe (1 million d'inscrits), et Youboox (750 000 inscrits) ont accepté de revoir leur modèle d’abonnement : elles proposent désormais à chaque éditeur un barème à la page, directement imputé sur les abonnements des internautes. Misant sur un équilibre entre « gros » et « petits » lecteurs, les plateformes ont mutualisé leurs abonnés afin de créer une limite de consommation globale et non individuelle, en fonction de ce barème. Izneo, plateforme spécialisée en bandes dessinées, a quant à elle choisi une autre solution : elle proposera une offre illimitée mais comprenant uniquement des ouvrages du même éditeur, Laurence Engel ayant précisé que les offres illimitées se basant sur un éditeur unique étaient légales.
Les trois plateformes YouScribe, Youboox et Izneo ont désormais six mois pour appliquer les propositions validées par la médiatrice du livre.
Dans une période où les « moyens financiers de nombreuses collectivités territoriales s’amenuisent », plusieurs fermetures de bibliothèques et diminutions d’horaires sont annoncées. L’ABF a donc décidé de faire un « appel à l’esprit de responsabilité des décideurs » pour ne pas « sacrifier un service public essentiel ». Dans ce communiqué, l’association souligne notamment que :
diminuer les effectifs, c’est réduire les services rendus à la population,
diminuer les horaires d’ouverture, augmenter les tarifs d’inscription ou introduire une tarification, c’est écarter des publics, c’est restreindre l’utilisation de lieux publics essentiels à toute la population, en particulier les publics jeunes et les publics défavorisés.
Afin de ne pas voir se dégrader ce « service public essentiel », l’Association des bibliothécaires de France a donc décidé d’attirer l’attention des décideurs sur différents points. En voici quelques-uns :
Les bibliothèques jouent un rôle essentiel dans l’appropriation de la culture, de la connaissance et de l’information, dans la formation tout au long de la vie, dans le débat citoyen et constituent des espaces publics irremplaçables pour faire société dans la vie d’aujourd’hui. Elles sont des portes locales d’accès aux savoirs et savoir-faire.
Avec plus de 16 000 lieux ouverts au public, les bibliothèques constituent le premier réseau culturel de notre pays. Cependant, on sait leur qualité inégale, et la question n’est pas tant le nombre de points d’accès que la pertinence du maillage territorial et la qualité du service rendu à la population.
Toute bibliothèque doit proposer, dans une surface adaptée à la zone desservie, des espaces d’accueil pour le public, une offre actualisée de livres et autres documents tous supports ainsi que des accès à des ressources et moyens numériques et à internet. La qualité des services rendus est notamment conditionnée par l’emploi de personnels qualifiés.
L’adaptation des horaires d’ouverture aux rythmes de vie et aux besoins des différents types de public est essentielle. Le développement des services en ligne constitue un complément indispensable et non un substitut à l’ouverture des locaux.
La gratuité des services des bibliothèques, à l’heure où nombre de services en ligne sont gratuits pour leurs utilisateurs, est essentielle pour faciliter l’usage régulier ou occasionnel de tous types d’usagers.
Présentant également les résultats d’une étude sur le secteur, le SNE a indiqué que si le livre audio ne représentait encore que 1 % environ du marché du livre français, il était un « marché d’avenir pour le secteur de l’édition ». En effet, s’adressant à tous les publics, le livre audio est accessible sur de nombreux formats, adapté à la mobilité et à « la nouvelle gestion du temps et des loisirs ». Il constitue également une « nouvelle expérience de lecture », rendant accessible « par la magie de la voix des ouvrages réputés complexes » et favorisant « la création de contenus nouveaux grâce aux apports du numérique ».
Cette nouvelle commission des éditeurs de livres audio aura pour objectifs :
de promouvoir le livre audio auprès de tous les acteurs de la chaîne du livre, des médias, des institutions culturelles ainsi que du grand public, adulte et jeunesse.
de faire connaître aux enseignants le formidable outil pédagogique que représente le livre audio pour l’acquisition, la consolidation et la maîtrise de la langue.
Une plateforme de critiques d’ouvrages, intitulée Blablalivre, vient d’ouvrir. Dédié à la littérature, ce nouveau réseau social propose de partager des avis sur n’importe quel livre en lui attribuant une note et en lui rédigeant une courte critique de 140 caractères maximum, à la manière de Twitter.
Ainsi, le chroniqueur ne propose que l’essentiel de son ressenti sur l’ouvrage, ce qui permet aux utilisateurs de se faire, grâce aux différentes critiques proposées, une opinion rapide et de choisir facilement leurs prochaines lectures. Pour utiliser cette plateforme, il suffit de créer un compte, puis de rechercher le livre souhaité, renseigner la critique puis de la publier. Si l’ouvrage n’est pas présent sur Blablalivre, il est possible de l’ajouter à la base de données en renseignant son code ISBN.
Blablalivre donne aussi la possibilité de renseigner son profil utilisateur avec les livres lus et les critiques postées. Tout en faisant gagner du temps aux internautes en quête de nouvelles lectures, ce réseau social fait également le pari de démocratiser la critique de livres.
A partir du 19 juin prochain 2015, la bibliothèque de la ville de Beaune organisera la deuxième édition de l’opération « Livres voyageurs ».
Pour l’occasion, l’établissement mettra gratuitement à disposition dans la ville entière des ouvrages de toutes sortes et pour tous les goûts. L’ensemble de ces livres sera facilement repérable grâce à la mention : « Ouvrez-moi ! Je ne suis pas perdu ». Sur le modèle du « bookcrossing », chacun pourra se servir, lire et déposer à son tour les ouvrages dans l’endroit public de son choix, afin d’en faire profiter un autre lecteur inconnu.
Proposant également une plateforme web pour signaler les livres et laisser des commentaires, « Livres voyageurs » permet de partager ses coups de cœur littéraires avec le plus de personnes possibles, tout en suivant ensuite l'itinéraire des ouvrages en question.
Les documents numérisés par les bibliothèques font très souvent l’objet d’une océrisation, c’est à dire d’un traitement informatique de reconnaissance optique de caractères (OCR) qui va chercher à identifier à quel caractère correspond la photographie de tel caractère. La finalité de cette opération est généralement de permettre la production de fichiers pour liseuses, l’indexation par les moteurs, la recherche en texte intégral, la réutilisation, l’exploitation scientifique ou encore la fouille de textes (text mining). Malheureusement, ce type de traitement génère de nombreuses erreurs. Ainsi, une disparité, une déformation, une décoloration, une tâche, un trou dans le papier, des annotations manuscrites, des typographies anciennes, originales, irrégulières ou mal imprimées ou encore une numérisation de mauvaise qualité vont cacher ou déformer l'aspect d'un caractère et tromper le logiciel qui identifiera un autre caractère que celui réellement présent. Les multiples erreurs générées par le logiciel OCR pourront être partiellement corrigées avec l’aide d’une confrontation des textes avec des dictionnaires de mots, mais un contrôle humain demeurera nécessaire car, à l’issue du processus automatisé, jusqu’à 20 % d’erreurs demeureront et seule une correction non automatique sera susceptible de réduire ce pourcentage, dans la mesure où les solutions logicielles ne sont pas encore capables de rivaliser avec les capacités humaines. En ce qui concerne les écritures manuscrites en particulier 1, l’OCR n’existe encore qu’à l’état expérimental (« Intelligent Word Recognition ») et il est fort probable qu’il le demeure encore quelque temps.
Pour toutes ces raisons, les bibliothèques externalisent aujourd’hui ce travail de correction manuelle de l’OCR auprès de prestataires qui font appel à de la main d’œuvre à bas coût, à Madagascar, en Inde ou encore au Viêt Nam. Une alternative à ces coûteuses et parfois critiquables prestations est de faire appel au crowdsourcing, c’est à dire d’externaliser ces opérations auprès de la foule des internautes en les engageant à corriger les textes numérisés volontairement (crowdsourcing explicite), contre rémunération, sous la forme de jeux (gamification) ou encore sans qu’ils en aient conscience (crowdsourcing implicite) 2.
A partir d’un panorama des principaux projets dans le cadre de bibliothèques numériques publiques ou privées, notre étude propose une taxonomie originale des grands types de projets et cherche à en évaluer le rendement en termes financiers.
Taxonomie des formes de crowdsourcing utilisées
Le crowdsourcing explicite
Les projets de correction participative de l’OCR comme de transcription participative de manuscrits, peuvent être qualifiés de crowdsourcing explicite lorsque les internautes bénévoles qui y participent le font volontairement.
La correction participative de l’OCR
Concernant la correction participative et volontaire de l’OCR, en particulier, nous pouvons évoquer succinctement des projets comme Distributed Proofreader (l’un des plus anciens projets de crowdsourcing dans le domaine de la numérisation et qui consiste à ce que les bénévoles produisent des ebooks pour le projet Gutenberg et pour Internet Archive) Wikisource utilisé en France dès 2008 par la Bibliothèque de l’Ecole Nationale Vétérinaire de Toulouse puis par la Bibliothèque nationale de France en avril 2010, l’Australian Newspapers Digitisation Program (TROVE) (l’un des plus importants projets de correction participative de l’OCR avec près de 130 millions de lignes corrigées en mai 2014), le projet California Digital Newspaper Collection (CDNC) et le projet FUI12 Ozalid porté par la Bibliothèque nationale de France.
La transcription participative de manuscrits
S’agissant de la transcription participative et volontaire de manuscrits, nous pouvons citer le projet Transcribe Bentham qui consiste à transcrire les manuscrits du philosophe utilitariste afin de pouvoir les publier, le projet What’s on the menu ? (WOTM) qui propose une transcription participative de 45 000 menus de restaurant depuis 1840, le projet Ancient Lives qui consiste en une transcription de papyrus égyptiens, le projet ArcHIVE de transcription de catalogues d'archives, le projet What’s the score (WTS) pour des partitions de musique, le projet Monasterium Collaborative Archive (MOM-CA), pour les manuscrits médiévaux ou encore le projet Citizen Archivist Dashboard pour les archives nationales des USA.
La correction classique dans le contexte répond bien aux besoins d’internautes qui souhaitent profiter de leur travail bénévole pour mieux prendre connaissance de textes qui les intéressent. Par contre, elle serait moins performante que la correction hors contexte qui permettrait d’obtenir des résultats optimisés comme proposé, par exemple, par le projet COoperative eNgine for Correction of ExtRacted Text (CONCERT) développé par IBM Israël :
Le “tapis” ci-dessus affiche toutes les occurrences d'un même caractère trouvé dans le livre et identifiés comme suspects par le logiciel OCR. Au lieu de corriger chacun de ces caractères indépendamment dans leur contexte, le système permet à l’internaute d’identifier très rapidement les caractères qui ne correspondent pas. Dans l’exemple ci-dessus, un caractère est illisible, on lit 4 caractères “t” et 1 caractère “n”, tous les autres sont bien des caractères “h”. A partir des résultats obtenus au cours de cette étape, le système va apprendre, grâce à l’usager, à mieux effectuer son OCR.
Le crowdsourcing rémunéré
Au lieu de faire appel au travail gratuit et bénévole des internautes, il est également possible de rémunérer leur travail. Des plateformes de crowdsourcing rémunéré comme l’Amazon Mechanical Turk Marketplace, leader sur ce marché, mais aussi Guru, crowdflower et, pour la France, FouleFactory, permettent ainsi à des institutions et à des sociétés de proposer aux internautes des microtâches rémunérées à accomplir. Généralement, il s’agit de tâches difficiles à automatiser avec des programmes informatiques comme l’indexation d’images, la classification, la transcription audio, la rédaction de résumés, l’identification d’images obscènes, l’ajout de « likes », de relations, d’avis ou de commentaires sur les réseaux sociaux et, parfois même, la correction de l’OCR.
Concernant l’utilisation de l’Amazon Mechanical Turk Marketplace au bénéfice de projets de numérisation du patrimoine des bibliothèques, une expérimentation de transcription de manuscrits aurait permis d’obtenir des coût de 60 $ pour la transcription de 200 pages de manuscrits quand cette prestation aurait coûté 400 $ avec un prestataire traditionnel 3
La gamification
Il est également possible de faire jouer les internautes au bénéfice des projets de numérisation en leur faisant corriger l’OCR brute grâce à des jeux avec une finalité (“games with a purpose”). Ainsi, la Bibliothèque nationale de Finlande, à travers le projet Digitalkoot, propose le jeu “Mole Hunt” (ou chasse aux taupes) qui consiste à ce que des taupes sortent de leurs trous pour exposer à l’internaute une image du mot et une proposition de transcription. L’internaute doit déterminer le plus rapidement possible si ce sont bien les mêmes mots en le validant ou en le refusant. Ce faisant, il corrige les résultats de l’OCR brut.
Le deuxième jeu “Mole Bridge” (ou pont des taupes) consiste à transcrire les mots images pour construire un pont et faire traverser une armée de taupes. A chaque bonne réponse, une brique du pont à construire s’ajoute aux précédentes. En cas d’erreur, une brique du pont explosera et les taupes risqueront de tomber dans l’eau. A l’instar de n’importe quel jeu d’arcades, les décors, les vitesses, les distances… changent en fonction des changements de niveaux, ce qui stimule les joueurs à poursuivre leur progression et à continuer de jouer.
Nous pourrions également évoquer TypeAttack, un jeu Facebook permettant de faire corriger l’OCR de textes numérisés par des internautes, le jeu Word Soup Game ou encore le projet COoperative eNgine for Correction of ExtRacted Text (CONCERT) précédemment mentionné, car il fait également largement appel aux ressorts de la gamification.
Le crowdsourcing implicite
Enfin, il est également possible de bénéficier des contributions involontaires et inconscientes des internautes sous la forme de crowdsourcing implicite.
Ainsi, reCAPTCHA dont le slogan est "Stop spam, read books" et dont la vocation première est de vérifier qu’il s’agit bien d’un humain et non d’un robot malveillant qui souhaite ouvrir un compte sur un site web a été astucieusement utilisé par le New York Times puis par Google Books et Google Street View afin de faire corriger les textes océrisés ou les numéros de rues par les internautes 4. Ces derniers ignorent bien souvent qu’ils participent à corriger les textes de Google Books, alors qu’ils effectuent leurs saisies exclusivement pour des raisons de sécurité et non pour participer à un projet culturel, C’est la raison pour laquelle on parle de crowdsourcing implicite. Les mots océrisés dans le cadre de ces projets de numérisation et non reconnus par des dictionnaires sont alors soumis aux internautes pour correction. Ainsi, reCAPTCHA affiche aux internautes systématiquement 2 mots sous forme d’images distordues : un mot en OCR à corriger par l’internaute et un mot en OCR déjà corrigé afin de vérifier que l’internaute n’est pas un robot.
Le même mot à corriger est soumis à 3 internautes différents dans le monde et avec des distorsions différentes à chaque fois afin d’éviter qu’elles génèrent les mêmes erreurs. Leurs saisies sont ensuite confrontées. Si elles sont identiques, le mot est alors considéré comme corrigé. Sinon, le mot est soumis à d’autres internautes, chaque humain comptant pour 1 vote et chaque identification d’OCR pour 0,5 vote, jusqu’à ce qu’une hypothèse obtienne le total de 2,5 voix. Il est possible, pour les internautes de demander à reCAPTCHA d’afficher un autre mot au cas où ils ne parviendraient pas à le lire. Si le même mot est rejeté 6 fois, il est considéré comme illisible.
Calculs, bénéfices et coûts
D’après les statistiques de reCAPTCHA, 68 % des mots sont corrigés avec l’aide de seulement 2 internautes, 18 % en nécessitent 3, 7 % en nécessitent 4, 3 % en nécessitent 5, 4 % en nécessitent 6 ou plus. Le résultat obtenu est un OCR corrigé à 99,1 %. En 2012, chaque jour, près de 200 millions de mots reCAPTCHA auraient ainsi été saisis par les internautes qui y auraient consacré 12 000 heures de travail par jour et ce rythme, annoncé comme croissant, pourrait être bien supérieur aujourd’hui.
Si nous souhaitons calculer les quantités que reCAPTCHA évite à Google Books de dépenser en correction de l’OCR, nous pouvons proposer les calculs suivants :
Si 68 % des mots nécessitent 2 internautes, chaque jour 200 millions de mots x 0,68 = 136 millions de mots saisis permettent d’obtenir 136 millions de mots / 2 internautes = 68 millions de mots validés.
Si 18 % des mots nécessitent 3 internautes, chaque jour 200 x 0,18 = 36 millions de mots saisis permettent d’obtenir 36 / 3 = 12 millions de mots validés.
Si 7 % des mots nécessitent 4 internautes, chaque jour 200 x 0,07 = 14 millions de mots saisis permettent d’obtenir 14 / 4 = 3,5 millions de mots validés.
Si 3 % des mots nécessitent 5 internautes, chaque jour 200 x 0,03 = 6 millions de mots saisis permettent d’obtenir 6 / 5 = 1,2 millions de mots validés.
Si 4 % des mots nécessitent au moins 6 internautes, chaque jour 200 x 0,04 = 8 millions de mots saisis permettent d’obtenir 8 / 6 = 1,33 millions de mots validés que nous pouvons arrondir à 1,3 millions dans la mesure où ils nécessitent 6 internautes ou parfois plus.
Au total, nous aurions donc 68+12+3,5+1,2+1,3 = 86 millions de mots validés par jour.
Si nous considérons qu’il y a 75 000 mots en moyenne dans un livre de 300 pages comportant 250 mots par page, chaque jour, l’équivalent de 86 millions / 75 000 = 1147 livres seraient ainsi corrigés chaque jour à un taux OCR de 99,1 %.
Si Google Books semble désormais ralentir le rythme de son programme de numérisation, son programme n’est pas encore achevé et il dépasse déjà de beaucoup les objectifs de 15 millions de livres annoncés début 2005 et qui semblaient, à l’époque, irréalistes. Le nombre de livres numérisés par Google Books dépasserait aujourd’hui les 30 millions de livres. Afin de corriger l’OCR de ces 30 millions de livres, il faudrait donc 30 millions / 1147 livres corrigés par jour = un peu plus de 70 ans au rythme de 2008. Leonid Taycher, ingénieur chez Google, évaluait sur son blog le 5 août 2010, à 129 864 880 le nombre total de livres imprimés depuis le début de l’imprimerie. La correction de l’OCR de tous ces ouvrages imprimés prendrait quant à elle 310 ans toujours au rythme de 2008.
Néanmoins, ce rythme est sans commune comparaison avec celui de correction de l’OCR pratiqué par les bibliothèques et qui est effectué à la main par des prestataires faisant appel à des pays en voie de développement comme Madagascar, le Viêt-Nam ou l’Inde. Si, à l’instar des bibliothèques, Google faisait appel à ce type de main d’oeuvre au lieu d’utiliser le crowdsourcing implicite des internautes via reCAPTCHA, et s’il finançait la correction de l’OCR pour un prix à la page compris entre 1 € et 1,5 € soit entre 300 € et 450 € pour un livre de 300 pages, il lui faudrait payer entre 300 € x 1147 livres = 344 100 € et 450 € x 1147 livres = 516 150 €. On peut donc raisonnablement considérer que reCAPTCHA évite à Google de dépenser plus de 400 000 € par jour, soit 146 millions d’euros par an.
En complétant ces estimations avec celles de Panagiotis Ipeirotis 5, de Brian Geiger et Frederick Zarndt 6 et de Frederick Zarndt 7, nous avons évalué les coûts que les projets suivants auraient eu à dépenser pour la correction humaine de l’OCR s’ils avaient fait appel à un prestataire classique :
Ces coûts non dépensés doivent toutefois être relativisés et être rapportés aux coûts qui ont eux été dépensés pour développer les systèmes de crowdsourcing, les administrer, assurer la communication des projets, le community management des volontaires et, parfois, pour réintégrer les données produites par les internautes dans la bibliothèque numérique.
Communitysourcing plutôt que crowdsourcing ?
Force est de constater que si les projets de crowdsourcing explicite s’adressent en théorie à des foules importantes d’internautes indifférenciés et anonymes, en pratique, la majeure partie du travail est généralement l’œuvre d’une minorité de bénévoles motivés qui contribuent régulièrement aux projets, communauté de fidèles volontaires qui s’assistent mutuellement 8, 9
Une manière originale et intéressante d’illustrer ce phénomène est proposée par le projet de transcription d’observation météorologiques Old Weather porté par la Citizen Science Alliance. Dans ce graphique, la taille de chaque carré est proportionnelle au nombre de notices transcrites. Sur le 1,6 millions de notices transcrites par 16 000 volontaires, un dixième l’a été par seulement 20 contributeurs :
Les participants aux projets Trove, California Digital Newspaper Collection ou Cambridge Public Library sont, pour le majeure partie d’entre eux, des généalogistes, des retraités aisés s’intéressant à l’histoire locale 10. Dans ces conditions, il est donc préférable de parler, pour tous ces projets, de communitysourcing ou encore de nichesourcing plutôt que de crowdsourcing 11.
Conclusion
Crowdsourcing explicite, rémunéré, gamification ou crowdsourcing implicite, la correction et la transcription participatives peuvent prendre des formes variées.
Les limites du temps de travail bénévole susceptible d’être mobilisé par le crowdsourcing explicite semblent se profiler et, avec la disparition prévisible des générations de retraités passionnés de généalogie et d’histoire locale, et avec l’amélioration des capacités des logiciels de reconnaissance de caractères, la correction participative de l’OCR pourrait avoir atteint un seuil critique à partir duquel les possibilités offertes par le crowdsourcing explicite seraient en train de se resserrer. Ainsi, comme le constate Marie-Louise Ayres 12, malgré une croissance continue du nombre de textes dont la correction est proposée par l’un des plus importants projets de correction participative de l’OCR, le projet TROVE, le nombre de corrections a finalement cessé de croître depuis 2011.
Bien que moins enrichissant intellectuellement pour les internautes, le crowdsourcing implicite sur le modèle de celui mis en œuvre par reCAPTCHA semble avoir de beaux jours devant lui. Néanmoins, le 3 décembre 2015 Google a annoncé 13 son remplacement par “No CAPTCHA reCAPTCHA”, un système de sécurité faisant désormais plutôt appel à la logique humaine.
Le crowdsourcing implicite tient compte du fait que seule une infime minorité d’internautes participe à Wikipedia ou à d’autres projets de crowdsourcing explicite et philanthropique et qu’il est, par conséquent, plus astucieux et beaucoup plus efficace, de recycler l’énergie des internautes dans leurs activités courantes sur le web. L’utilisation de ce système de Captcha par d’autres grandes bibliothèques numériques comme Internet Archive 14 pourrait donc être prometteur et apporter des corrections complémentaires à celles obtenues via la voie plus classique du crowdsourcing explicite et volontaire. Mais il ne pourra s’adresser qu’aux programmes de numérisation de masse. Pour les bibliothèques numériques plus modestes à la recherche de solutions simples et pragmatiques, en dehors de l’étude précédemment mentionnée 15 le crowdsourcing rémunéré avec l’aide de l’Amazon Mechanical Turk Marketplace a encore assez peu été expérimenté. Il devrait faire l’objet de nouvelles expérimentations très prochainement.
1. Brokfeld, Jens. 2012. « Die digitale Edition der „preußischen Zeitungsberichte“: Evaluation von Editionswerkzeugen zur nutzergenerierten Transkription handschriftlicher Quellen ». Master Informationswissenschaften, 148 p
2. Andro, Mathieu, Saleh, Imad. 2014. « Bibliothèques numériques et crowdsourcing : une synthèse de la littérature académique et professionnelle internationale sur le sujet ». Colloque International sur le Document Numérique, CIDE 17, 10 p.
3. Lang, Andrew S. I. D., Rio-Ross, Joshua. 2011. « Using Amazon Mechanical Turk to Transcribe Historical Handwritten Documents ». Code4lib Journal, vol. 15, 10-31.
4. Von Ahn, Luis, Maurer, Benjamin, Mcmillen, Colin, Abraham, Davis, Blum, Manuel. 2008. « reCAPTCHA: Human-Based Character Recognition via Web Security Measures ». Science no 321, 1465-1468. doi:10.1126/science.1160379.
5. Ipeirotis, Panagiotis G. 2011. « Managing Crowdsourced Human Computation ». WWW2011 tutorial, 29 March 2011, 196 p.
6. Geiger, Brian, Zarndt, Frederick. 2012. « No tempest in my teapot: analysis of crowdsourced data and user experience at the California Digital Newspaper Collection ». http://fr.slideshare.net/cowboyMontana/20121105-no-tempest-in-my-teapot-dlf-forum-denver
7. Zarndt, Frederick. 2014. « Crowdsourcing family history, and long tails for libraries ». http://fr.slideshare.net/cowboyMontana/20140628-crowdsourcing-family-history-and-long-tails-for-libraries-ala-annual-las-vegas
8. Owens, Trevor. 2013. « Digital Cultural Heritage and the Crowd ». Curator: The Museum Journal, vol. 56, 121–130. doi:10.1111/cura.12012.
9. Carletti, Laura, Giannachi, Gabriella, Price, Dominic, McAuley, Derek. 2013. « Digital Humanities and Crowdsourcing: An Exploration ». MW2013: Museums and the Web 2013: The annual conference of Museums and the Web, April 17-20, 2013, Portland, USA. 18 p.
10. Hagon, Paul. 2013. « Trove crowdsourcing behaviour ». http://www.information-online.com.au/pdf/Tuesday_Concurrent_2_1125_Hagon.pdf
11. Causer, Tim, Wallace Valerie. 2012. « Building A Volunteer Community: Results and Findings from Transcribe Bentham ». Digital Humanities Queterly, vol. 6, no 2, 26 p.
12. Ayres, Marie-Louise. 2013. « ‘Singing for their supper’: Trove, Australian newspapers, and the crowd ». IFLA World Library and Information Congress. Singapore. 9 p.
13. http://googleonlinesecurity.blogspot.fr/2014/12/are-you-robot-introducing-no-captcha.html
14. Gary, Nicolas. 2013. « Exclusif : Un Captcha pour Internet Archive, concurrent de Google Books ». ActuaLitté. https://www.actualitte.com/usages/exclusif-un-captcha-pour-internet-archive-concurrent-de-google-books-45939.htm
15. Lang, Andrew S. I. D., Rio-Ross, Joshua. 2011. « Using Amazon Mechanical Turk to Transcribe Historical Handwritten Documents ». Code4lib Journal, vol. 15, 10-31.
Bibliograhie
Andro, Mathieu, Saleh, Imad. 2014. « Bibliothèques numériques et crowdsourcing : une synthèse de la littérature académique et professionnelle internationale sur le sujet ». Colloque International sur le Document Numérique, CIDE 17, 10 p.
Ayres, Marie-Louise. 2013. « ‘Singing for their supper’: Trove, Australian newspapers, and the crowd ». IFLA World Library and Information Congress. Singapore. 9 p.
Brokfeld, Jens. 2012. « Die digitale Edition der „preußischen Zeitungsberichte“: Evaluation von Editionswerkzeugen zur nutzergenerierten Transkription handschriftlicher Quellen ». Master Informationswissenschaften, 148 p.
Carletti, Laura, Giannachi, Gabriella, Price, Dominic, McAuley, Derek. 2013. « Digital Humanities and Crowdsourcing: An Exploration ». MW2013: Museums and the Web 2013: The annual conference of Museums and the Web, April 17-20, 2013, Portland, USA. 18 p.
Causer, Tim, Wallace Valerie. 2012. « Building A Volunteer Community: Results and Findings from Transcribe Bentham ». Digital Humanities Queterly, vol. 6, no 2, 26 p.
Ipeirotis, Panagiotis G. 2011. « Managing Crowdsourced Human Computation ». WWW2011 tutorial, 29 March 2011, 196 p.
Lang, Andrew S. I. D., Rio-Ross, Joshua. 2011. « Using Amazon Mechanical Turk to Transcribe Historical Handwritten Documents ». Code4lib Journal, vol. 15, 10-31.
Owens, Trevor. 2013. « Digital Cultural Heritage and the Crowd ». Curator: The Museum Journal, vol. 56, 121–130. doi:10.1111/cura.12012.
Von Ahn, Luis, Maurer, Benjamin, Mcmillen, Colin, Abraham, Davis, Blum, Manuel. 2008. « reCAPTCHA: Human-Based Character Recognition via Web Security Measures ». Science no 321, 1465-1468. doi:10.1126/science.1160379.
« Inscrit dans la continuité d'une dynamique de réflexion sur les horaires d'ouverture des bibliothèques » (…) initiée par l'Etat depuis plusieurs années, cette étude fait suite à la parution de l’ouvrage Ouvrir grand la médiathèque, coédité par le ministère de la Culture et de la Communication et l’Association des bibliothécaires de France.
Dans un premier temps, le rapport présente « les bilans de projets d’aménagement des horaires d’ouverture » de six bibliothèques et médiathèques territoriales qui ont augmenté leurs horaires d'accueil au cours des dernières années et qui sont aujourd'hui ouvertes plus de trente heures par semaine :
Aire-sur-l’Adour
Bordeaux (Mériadeck)
Cergy (Visages du Monde)
Lons-le-Saunier (centre culturel des Cordeliers)
Montreuil (Robert-Desnos)
Orvault (Ormédo)
Dressés à partir de témoignages des usagers, des professionnels et des tutelles, les différents bilans de ces projets d’aménagement sont dans un second temps « confrontés aux retours d’expérience de 145 établissements interrogés dans le cadre d’une enquête en ligne ».
Si cette étude confirme que « les effets de l'extension des horaires sont clairement positifs », elle souligne également que « l'extension en elle-même ne suffit pas toujours à créer un effet durable et gagne à s'inscrire dans une démarche stratégique mobilisant d'autres leviers ». Elle démontre aussi que les difficultés d'applications de l’extension des horaires sont d’ordre financier, organisationnel et social.
Le document propose également des recommandations pour les bibliothèques envisageant une extension de leurs horaires. Enfin, cette étude sera complétée par le rapport confié par Fleur Pellerin, ministre de la Culture et de la Communication, à la sénatrice Sylvie Robert sur « l’adaptation des horaires d’ouverture des bibliothèques de lecture publique aux rythmes de vie des Français ».