La petite histoire du T-test

La petite histoire du T-test

Le T-test est un test statistique qui permet d’effectuer une comparaison entre deux échantillons de petite taille. Cela en fait un test très utile, puisqu’il est évidemment plus simple d’obtenir de petits échantillons que l’inverse !
Dans beaucoup de situations, on ne dispose que de quelques dizaines de points statistiques.
Pour donner un exemple typique d’utilisation, prenons le cas de tests pharmaceutiques. S’il s’agit par exemple de tester un placebo, il est possible d’avoir des échantillons de populations importants puisque personne n’est mis en danger. En revanche lors de tests pour des maladies graves et potentiellement mortelles, il est difficilement envisageable de réunir plusieurs milliers de personnes malades et de ne donner le traitement à tester qu’à une fraction.
Prenons un exemple où l’on mesure une température corporelle moyenne de deux groupes de patients ayant suivi différents traitements. Si les moyennes sont 38.6° et 37.6°, lorsque l’on dispose de plusieurs centaines de patients, il sera plus confortable de conclure à l’efficacité du produit testé et de généraliser que lorsque ces résultats sont obtenus sur un échantillon de 6 patients. Le T-test permet de quantifier la solidité de la conclusion en fonction de la taille des échantillons.
Si l’utilité de ce test n’est plus à démontrer, c’est bien son histoire qui en fait une curiosité. Le T-test est aussi appelé test de Student. D’après son créateur Monsieur Student ? Eh bien non !
Le vrai nom de ce Monsieur Student est en fait William Sealy Gosset. William Gosset était en charge au début du vingtième siècle des expérimentations et du contrôle qualité à la brasserie Guinness à Dublin. Un statisticien brasseur donc. Lorsque qu’un jour son chef vint à lui en lui demandant s’il était possible d’évaluer la qualité d’une tonne de houblon en analysant seulement un échantillon, William s’attaqua au problème en bon scientifique. Il fit une première expérience sur une mesure du ‘degré saccharimétrique’. Disposant d’une population assez conséquente pour laquelle la mesure précise et complète du fameux degré était de 133, il entreprit des simulations pour essayer d’estimer les chances que l’estimation de la moyenne soit proche de celle de la population. En prenant des échantillons de taille 2, il s’aperçut que dans 80% des cas la moyenne se rapprochait à moins de 0,5 degrés de celle de la population. En passant à une taille de 3, ce pourcentage montait à 87,5, puis à 4 plus de 92%.
Cette expérience lui fit naitre l’intuition d’une théorie mathématique alors inconnue et il demanda alors à Guinness de l’autoriser à poursuivre ses recherches. Guinness l’envoya alors auprès de Pearson – un statisticien très connu qui dispose, lui, d’un test en son vrai nom – où il passa un an à développer sa théorie et le fameux test de Student.