Lorsqu'on a affaire à une v.a. continue, on travaille toujours sur des échantillons. La question se pose alors de savoir si l'échantillon est représentatif de la population, c'est à dire dans quelle mesure et avec quelle assurance on peut affirmer que les grandeurs estimées sur l'échantillon s'approchent des grandeurs correspondantes de la population.
Dans tout ce qui précède on a supposé que les grandeurs caractéristiques de la population étaient connues et l'on a obtenu des informations sur le comportement des échantillons. Maintenant on renverse le problème, l'échantillon seul est connu.
En utilisant le théorème central limite, on peut simplifier le problème en supposant des échantillons assez grand pour que leur comportement soit approximativement normal.
Désignons
et
la moyenne et l'écart-type de
v.a.
de la population. Grandeurs que nous cherchons.
Désignons
{
}
les v.a. associées aux individus d'un échantillon (on suppose
l'indépendance des choix)
On a
on désigne
alors
suit une loi normale centrée réduite.
et donc, en prenant 3 comme plus haut
L'événement considéré s'écrit aussi:
![]()
et puis
![]()
et finalement
![]()
Ceci veut dire que la valeur de
a 99.3 % de chance de se trouver dans l'intervalle défini par
,
, n
(la taille de l'échantillon).
Ces 3 paramètres déterminent
une fourchette de valeurs pour la vraie valeur
.
On appelle cet intervalle l'intervalle de confiance au seuil de 99.3 %.
.Le raisonnement serait le même pour un autre seuil de confiance.