Qu’est-ce qu’un échantillon aléatoire?
Un échantillon aléatoire est un échantillon choisi au hasard. On pourrait plus précisément l’appeler un échantillon choisi au hasard. Des échantillons aléatoires sont utilisés pour éviter les biais et autres effets indésirables. Bien sûr, ce n’est pas aussi simple qu’il n’y paraît: choisir un échantillon aléatoire n’est pas aussi simple que de choisir 100 personnes parmi 10 000 personnes. Vous devez être sûr que votre échantillon aléatoire est vraiment aléatoire!
Notez que le mot « aléatoire » dans un échantillon aléatoire ne correspond pas exactement à la définition du dictionnaire du mot. Si vous Google « define:random », vous lirez que cela signifie:
fait, fait, qui se passe ou choisi sans méthode ou décision consciente.
» un échantillon aléatoire de 100 ménages »
Il n’est pas vrai qu’un échantillon aléatoire soit choisi « sans méthode de décision consciente. »Un simple échantillonnage aléatoire est un moyen de choisir un échantillon aléatoire.
Qu’est-ce qu’un échantillon aléatoire Simple?
Un échantillon aléatoire simple est souvent mentionné dans les classes de statistiques élémentaires, mais c’est en fait l’une des techniques les moins utilisées. En théorie, c’est facile à comprendre. Cependant, dans la pratique, c’est difficile à réaliser.
Techniquement, un échantillon aléatoire simple est un ensemble de n objets dans une population de N objets où tous les échantillons possibles sont également susceptibles de se produire. Voici un exemple de base de la façon d’obtenir un échantillon aléatoire simple: mettez 100 boules de bingo numérotées dans un bol (c’est la population N). Sélectionnez 10 boules dans le bol sans regarder (c’est votre échantillon n). Notez qu’il est important de ne pas regarder comme vous pourriez (sans le savoir) biaiser l’échantillon. Bien que la méthode du « bol de loterie » puisse fonctionner correctement pour les populations plus petites, en réalité, vous aurez affaire à des populations beaucoup plus importantes.
Échantillonnage aléatoire simple d’un échantillon « n » de 3 parmi une population « N » de 12. Image: Dan Kernler / Wikimedia Commons
Imaginez que les personnes illustrées dans l’image ci-dessus sont des pièces de jeu. Placez les 12 pièces de jeu dans un bol et (encore une fois, sans regarder) choisissez 3. Il s’agit d’un simple échantillonnage aléatoire.
Image: CSUS.edu
Un échantillon aléatoire simple est choisi de telle sorte que chaque ensemble d’individus a une chance égale d’être dans l’échantillon sélectionné. Cela semble facile, mais SRS est souvent difficile à utiliser dans des enquêtes ou des expériences. De plus, il est très facile pour le biais de se glisser dans des échantillons obtenus avec un simple échantillonnage aléatoire. Parfois, il est impossible (financièrement ou en termes de temps) d’obtenir une base d’échantillonnage réaliste (la population à partir de laquelle l’échantillon doit être choisi). Par exemple, si vous vouliez étudier tous les adultes aux États-Unis qui avaient un taux de cholestérol élevé, la liste serait pratiquement impossible à obtenir à moins d’avoir interrogé chaque personne du pays. Par conséquent, d’autres méthodes d’échantillonnage seraient probablement mieux adaptées à cette expérience particulière.
L’exemple le plus simple de SRS serait de travailler avec des choses comme des dés ou des cartes — lancer le dé ou distribuer des cartes à partir d’un jeu peut vous donner un échantillon aléatoire simple. Mais dans la vraie vie, vous avez généralement affaire à des gens, pas à des cartes, et cela peut être un défi.
Comment Effectuer un Échantillonnage Aléatoire Simple: Exemple
Une population plus importante pourrait être « Toutes les personnes qui ont eu des accidents vasculaires cérébraux aux États-Unis. »Cette liste de participants serait extrêmement difficile à obtenir. Où trouveriez-vous une telle liste en premier lieu? Vous pouvez contacter des hôpitaux individuels (dont il y a des milliers et des milliers…) et demander une liste de patients (vous fourniraient-ils même ces informations? Si vous pouviez en quelque sorte obtenir cette liste, vous vous retrouverez avec une liste de 800 000 personnes que vous devrez ensuite mettre dans un « bol » et choisir des personnes au hasard pour votre échantillon. Ce type de situation est le type de situation réelle que vous rencontrerez et c’est ce qui rend l’obtention d’un échantillon aléatoire simple si difficile à entreprendre.
Exemple de question: Décrivez les étapes pour obtenir un échantillon aléatoire simple pour les résultats des accidents vasculaires cérébraux dans les hôpitaux de traumatologie américains.
Étape 1: Faites une liste de tous les hôpitaux de traumatologie aux États-Unis (il y en a plusieurs centaines: le CDC tient une liste).
Étape 2: Attribuez un numéro séquentiel à chaque centre de traumatologie (1,2,3nn). Il s’agit de votre base d’échantillonnage (la liste à partir de laquelle vous tirez votre échantillon aléatoire simple).
Étape 3: Déterminez la taille de votre échantillon. Voir: (Taille de l’échantillon) (comment en trouver un).
Étape 4: Utilisez un générateur de nombres aléatoires pour sélectionner l’échantillon, en utilisant votre base d’échantillonnage (taille de la population) de l’étape 2 et la taille de votre échantillon de l’étape 3. Par exemple, si la taille de votre échantillon est de 50 et que votre population est de 500, générez 50 nombres aléatoires entre 1 et 500.
Avertissement: Si vous faites des compromis (par exemple, en n’incluant pas TOUS les centres de traumatologie dans votre base d’échantillonnage), vos résultats pourraient être biaisés.
Échantillon aléatoire simple vs. Échantillon aléatoire
Un échantillon aléatoire simple est similaire à un échantillon aléatoire. La différence entre les deux est qu’avec un simple échantillon aléatoire, chaque objet de la population a les mêmes chances d’être choisi. Avec un échantillonnage aléatoire, chaque objet n’a pas nécessairement les mêmes chances d’être choisi. L’échantillonnage de probabilité inégal n’est généralement pas abordé dans les cours de statistique de base.
Échantillonnage biaisé en racine carrée
L’échantillonnage biaisé en racine carrée n’est pas une technique largement utilisée, et il est douteux que vous y soyez testé dans n’importe quelle statistique élémentaire ou classe de statistiques AP. Cela dit, il s’agit d’une technique intéressante qui tente de résoudre le problème du profilage lors des contrôles aéroportuaires.
Je suis sélectionné pour une « projection supplémentaire » chaque fois que je voyage en avion. Je suppose que c’est parce que j’ai des dreadlocks, mais je n’en ai vraiment aucune idée. Tout ce que je sais, c’est que la sécurité me tire de côté à chaque fois. En plus de ne pas être juste, cela prend également des ressources qui pourraient être mieux dépensées pour regarder d’autres personnes qui pourraient être à la hauteur des activités terroristes!
Les statisticiens s’efforcent de choisir des personnes au hasard pour les enquêtes et les expériences. Cet échantillonnage aléatoire ne se produit pas lors des contrôles dans les aéroports, probablement parce que les personnes qui « regardent » d’une certaine manière sont plus susceptibles d’être des terroristes. C’est un problème que William H. Press tente de résoudre avec un échantillonnage biaisé à la racine carrée. Il déclare:
« … les ressources sont gaspillées pour le dépistage répété d’individus plus probables, mais innocents. »
En d’autres termes, le profilage par origine ethnique, le fait d’avoir le même nom que quelqu’un sur une liste de surveillance (ou dans mon cas, d’avoir des dreadlocks) n’est pas un moyen mathématiquement solide d’attraper un terroriste.
L’échantillonnage biaisé en racine carrée ajoute un échantillonnage aléatoire simple au profilage. L’échantillonnage aléatoire simple est l’endroit où les individus sont choisis complètement par hasard dans une population. L’ajout de SR augmente les chances qu’un coupable soit trouvé. Cela devrait également signifier que les voyageurs innocents sont plus susceptibles de passer par la sécurité. Le système fonctionne en attribuant le même profilage. Au lieu qu’un passager profilé soit sélectionné pour le contrôle à chaque fois, il peut être retiré moins fréquemment. Par exemple, si une personne est 10 fois plus susceptible d’être un terroriste, le système actuel la retirerait dix fois plus souvent qu’un passager non profilé. Cela signifie essentiellement que chaque fois que cette personne profilée voyage, elle sera mise de côté. L’ajout de SRS signifie que le passager ne sera retiré que trois fois plus souvent.
Autres moyens d’obtenir un échantillon aléatoire:
Échantillon aléatoire stratifié
Échantillonnage en grappes en une étape
Agresti A. (1990) Analyse des données catégorielles. John Wiley et ses fils, New York.
Dodge, Y. (2008). The Concise Encyclopedia of Statistics. Springer.
Gonick, L. (1993). Le Guide de dessin animé des statistiques. HarperPerennial.
William Press.
Stephanie Glen. « Échantillon aléatoire Simple: Définition et exemples » De StatisticsHowTo.com : Statistiques élémentaires pour le reste d’entre nous! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/simple-random-sample/
—————————————————————————
Besoin d’aide pour une question de devoirs ou de test? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites!