Retour
Répondre à cette question c'est se demander si la
fréquence d'un caractère dans un
échantillon tiré au hasard
"représente" la fréquence dans la population
totale. La première question à se poser est la
façon dont le sondage est réalisé.
"Choisir au hasard" l'échantillon dans la population peut se
faire de bien des façons ; dans la
réalité les instituts de sondage utilisent la
méthode des quotas
Pour notre part, intéressons nous à un tirage au
hasard, au sens où chaque individu de la population est
équiprobable.
Considérons une population dans laquelle un
caractère A (les intentions de vote pour le candidat A, par
exemple) a une proportion p
inconnue.
On effectue un sondage, c'est à dire un tirage au hasard de n individus dans la
population, et soit f
la frequence du caractère A dans l'échantillon.
On considère alors Xi la variable aléatoire de
Bernouilli qui prend la valeur 1 pour un électeur de A et 0
sinon dans l'échantillon. La variable X, moyenne des Xi est
un estimateur ponctuel de p
sans biais et convergent puisque E(X) = p et Var (X ) = p(1 - p)/n
On démontre que la loi de la variable :
peut être approchée par une loi normale N(0,1)
De ce fait, la fourchette obtenue pour estimer la proportion p au niveau de
confiance 1- t est
:
où u
se lit dans la table de la loi normale.
Ainsi avec t = 0,05
on a u = 1,96.
Regardons une simulation :
Intervalles de confiance