Échantillon rime avec sélection et objectivation

mercredi 13 décembre 2017

PARTAGER

L’utilisation de l’échantillon est indispensable à la recherche. Mais elle présente de nombreuses difficultés et parfois même de grands risques : mal maîtrisé, l’échantillonnage pourrait nous conduire à découvrir que Roosevelt buvait du Saint-Émilion 82 à l’arrière de sa 4L. Ou pas.

Une chronique de Paul Pascal

Lire la chronique

Ah, l’échantillon… Qui a bien pu avoir cette idée saugrenue de prendre une petite partie d’un élément quelconque, de l’étudier et d’en tirer des conclusions sur l’ensemble ? C’est bien de ça qu’il s’agit : un chercheur qui s’estime légitime à étudier trois grains de sable, jusque-là tout va bien. Le problème débute quand il se permet d’en déduire la composition de la plage, et d’en prévoir son origine, son avenir et, pourquoi pas, le nôtre avec. Alors qu’on aurait été tellement tranquille s’il avait étudié la plage grain par grain, jusqu’au dernier…

Je sens bien que la plage ne vous convient pas totalement comme exemple. Soyons donc inventif : imaginons que vous étudiez, je sais pas moi, le Saint-Émilion Grand-cru millésime 82 ! Ah, elle est tout de suite plus séduisante, l’idée d’analyser la totalité de la production plutôt qu’une demi-bouteille d’échantillon, non ?

Je m’égare.

L’échantillonnage s’inscrit dans un processus analytique plus large, mais il en est un élément clé, capable, s’il est mal maîtrisé, de plomber l’ensemble d’une recherche. Alors c’est quoi un bon plan d’échantillonnage ? C’est d’abord de s’assurer que les échantillons puissent, en moyenne, représenter la composition de ce qui est en train d’être analysé. Avec une contrainte inverse : que l’échantillon soit d’une taille suffisamment réduite pour être prélevé, transporté si nécessaire, manipulé, analysé. Pire : il faut, en plus, effectuer ce prélèvement, ce transport et sa manipulation de façon à ce que la composition de cet échantillon ne change pas jusqu’au moment de l’analyse.
Reprenons l’exemple qui vous plaisait tant : le breuvage rouge et tannique bordelais précédemment évoqué. Le prélever dans une barrique ne s’improvise pas.

Utiliser une louche en plomb encore imbibée de produit vaisselle n’est PAS une bonne idée.

Le transvaser dans une vieille canette de bière mal rincée EST FORTEMENT DÉCONSEILLÉ.

Il n’est enfin pas très judicieux de poser le tout sur la lunette arrière de votre 4L pendant votre sieste au soleil parce que bon, au labo, ils peuvent bien attendre jusqu’à demain, les échantillons…

Donc, un échantillon une fois prélevé, ça se soigne, ça se dorlote. Même si je n’ai parlé que de matériel d’étude relativement sans défense.

Les choses se compliquent encore quand on s’attaque au vivant. Et c’est pourtant à ce casse-tête que les chercheurs en sciences humaines sont confrontés tous les jours. D’abord, parce qu’un échantillon de population tiendra difficilement sur la lunette arrière d’une 4L. Ensuite, parce qu’en matière humaine, les biais sont potentiellement nombreux.

Le petit Larousse nous indique que l’échantillon est un « ensemble représentatif d’une ‘population mère’ possédant les mêmes caractéristiques. Il est constitué soit au hasard, soit suivant la méthode des quotas ». Bon, là, c’est un peu court, jeune semeuse, il y a une multitude de façons de constituer un échantillon : les méthodes non-probabilistes (par exemple les échantillons de convenance, ou les échantillons boules de neige quand la personne sondée indique d’autres personnes susceptibles d’être interrogées) ; il y a aussi les échantillons aléatoires, par tirage au sort strict ou par échantillonnage stratifié : on divise alors la population en grandes catégories et les tirages au sort s’effectuent au sein de chacune de ces catégories.

Mais quelque soit la méthode, il convient de prendre quelques précautions pour s’assurer du bien-fondé de nos choix.

Parmi les biais célèbres d’un échantillon figure celui du Literary Digest. En 1936, dans ce qui constitua une des premières tentatives de sondages politiques, ce magazine américain a décidé d’appeler deux millions de numéros de téléphone au hasard. Grossière erreur : les possesseurs de téléphone n’étaient pas du tout représentatifs de l’ensemble de électorat de l’époque. Et pendant ce temps, un échantillon de seulement 50 000 personnes sélectionnées par George Gallup a correctement prédit le résultat… Roosevelt a été élu avec 46 états sur 48 et 11 millions de voix d’avance, et le Lierary Digest est rapidement tombé dans l’oubli.

Mais en tout état de cause, et quelque soit l’échantillon, aux dernières nouvelles, aucune recherche scientifique sérieuse n’a établi de manière irréfutable que Roosevelt buvait du Saint-Émilion 82 à l’arrière de sa 4L…