Retour

Répondre à cette question c'est se demander si la fréquence d'un caractère dans un échantillon tiré au hasard "représente" la fréquence dans la population totale. La première question à se poser est la façon dont le sondage est réalisé. "Choisir au hasard" l'échantillon dans la population peut se faire de bien des façons ; dans la réalité les instituts de sondage utilisent la méthode des quotas

Pour notre part, intéressons nous à un tirage au hasard, au sens où chaque individu de la population est équiprobable.

Considérons une population dans laquelle un caractère A (les intentions de vote pour le candidat A, par exemple) a une proportion p inconnue.

On effectue un sondage, c'est à dire un tirage au hasard de n individus dans la population, et soit f la frequence du caractère A dans l'échantillon. On considère alors Xi la variable aléatoire de Bernouilli qui prend la valeur 1 pour un électeur de A et 0 sinon dans l'échantillon. La variable X, moyenne des Xi est un estimateur ponctuel de p sans biais et convergent puisque E(X) = p et Var (X ) = p(1 - p)/n

On démontre que la loi de la variable :
normale
peut être approchée par une loi normale N(0,1)

De ce fait, la fourchette obtenue pour estimer la proportion p au niveau de confiance 1- t  est  :
intervalle de confiance
u se lit dans la table de la loi normale.
Ainsi avec t = 0,05 on a u = 1,96.

Regardons une simulation :

Intervalles de confiance

Quelques calculs : entrez la taille de l'échantillon, la fréquence observée. Le programme calcule l'intervalle de confiance au seuil de 5% et au seuil de 1%. Echantillon :
Valeur observée :

Intervalle de confiance au seuil de 5% : ,
Intervalle de confiance au seuil de 1% : ,