Statistiques de l’intellect

Lois puissances inverses en sciences humaines et sociales

par Jacques Magaud

Thierry Lafouge

Stéphanie Pouchot

Paris, Publibook.com, 236 p., 24 cm
Coll. « Information & communication. Télécommunications »
ISBN 978-2-7483-9722-2 : 29 €

Il ne fait de doute pour personne que les ajustements d’observations à des lois statistiques spécifiques dépendent des types de phénomènes observés. La loi (autrement dit la fonction mathématique) qui s’ajuste le mieux à des « données collectées » présente un intérêt certain : son utilisation peut permettre de schématiser, de modéliser le phénomène étudié.

Dans tous les champs de l’observation dans lesquels sont rassemblées des informations ou « collectées des données », la modélisation et donc la simplification à travers des fonctions à caractères connus, est l’objet central de l’analyse statistique.

Dans le domaine des comportements humains, en sciences sociales, très divers sont les types de fonction et donc de lois statistiques qui sont, ou ont été, utilisées pour schématiser lesdits comportements.

L’ouvrage se limite à approcher les analyses à une seule variable ; c’est sagesse pour ce type d’ouvrage ; il est toutefois bien vrai que la plupart des progrès du dernier demi-siècle en analyse statistique des comportements humains ont été le fait d’analyses plus complexes, maintenant largement banalisées, et souvent, trop souvent, instrumentalisées.

Après deux chapitres de rappels, de mathématiques puis de probabilités élémentaires, la suite de l’ouvrage donne un bon nombre d’exemples d’ajustements satisfaisants dans son champ central d’application (la bibliométrie ou les analyses de citations) en utilisant des ajustements par des lois souvent connues sous le nom de lois hyperboliques, lois de Pareto et nommées ici lois puissances inverses.

Les exemples sont utiles ; le placage mathématique l’est souvent moins.

On peut regretter l’absence complète de dégagement sur la nature des variables : l’analyse d’énoncés (écrits ou verbaux) ne recourra pas aux mêmes « lois » que l’analyse de données déjà normalisées, mesurables ou pas, ordonnées ou pas.

La conclusion laisse perplexe : si l’on ne peut que se féliciter de la « mise en garde des étudiants quant à l’exploitation des chiffres », on ne peut que regretter un certain nombre de dérapages : avancer que les lois « expliquent » les phénomènes au lieu de dire qu’elles les « représentent » plus ou moins bien, n’est pas tout à fait neutre. La charge contre la « moyenne » est bien inutile : il existe de nombreuses « caractéristiques de tendance centrale » attachées à toute loi de probabilité ; la moyenne n’est qu’une d’elles et n’est pas en cause en tant que telle ; son usage abusif pour « résumer une situation » peut l’être.

Les auteurs ont manifestement traité un grand nombre de cas dans leur domaine de prédilection ; on peut souhaiter qu’ils présentent systématiquement leur démarche empirique et leurs résultats, la formalisation et généralisation de ceux-ci relevant probablement d’autres approches.