Sampling

Sampling

Home > Archive > Sampling

The sampling is one of the keys to build a good survey. If your sampling is inadequate regarding the goals of the survey, you are confronted with a major flaw. Each method have it's own advantages and inconveniences.

When choosing a method of creating a sample you should keep in mind that to understand the characteristics of your population is a paramount issue. Then, it will be easier to be sure no significant part of the population will be ignored by your sampling.

The webmaster : Frédéric D'Astous

List of articles within : Sampling

Note : As soon as an article is translated, its title and description will be translated accordingly.

No list ? Use the cluster (or area) random sampling. You can't use a list ? You might want to try the cluster sampling. Even when a list is available, it is sometimes an interesting technique.

L'échantillonnage non-aléatoire Il ne faut pas sous-estimer les avantages reliés aux techniques non-aléatoires. Voici en quoi elles peuvent aider le sondeur.

L'échantillonnage accidentel Les sondeurs n'ont pas toujours sous la main des listes permettant de réaliser une sélection aléatoire des répondants. C'est là que l'échantillonnage accidentel peut être utile.

If you have a comment about any article or other comments, you can use this link to reach my "comments page".

No list ? Use the cluster (or area) random sampling.

In ideal conditions, you have a list of names to help you to carry out a survey. A list makes it possible to do a random sampling that will follow the rules of statistics. Moreover, it is the respect of these rules which makes it possible to do an evaluation of the margin of error of the survey.

But, it is not always possible to be in ideal conditions. Then, if we wish to do a random sampling without any list, it will be necessary to use a technique called the area random sampling, or cluster sampling. What characterizes this technique it is that, instead of choosing individuals randomly, you are choosing groups randomly. That can be done with a map. Thus, each group is a geographical unit. It then remains to choose geographical units randomly and then, to reach all the residents of each selected geographical unit.

This technique can be useful each time it is possible to reach identifiable groups. For example, if you wish to make a survey about the students of a university, you do not need to obtain the list of all the students. Instead, you can work with the list of all courses. Consequently, an enormous gain is obtained. Since the information related to each individual is regarded as personal, it is protected by various national, territorial or state laws. On the other hand, the list of the courses is available to everyone. Thus, the researcher only have to talk with each teacher in order to obtain the authorization to see the students in each selected groups.

You should thus build a good random sampling, since the participants were selected randomly. But, everything is not perfect. There may be some inconveniences.

In my opinion, the most important one is related to the quantity of units you will have, after the random sampling. Sometimes, all members of a group can have a tendency to behave toward common trends. And when various behaviors are present, it might be possible that they are following a cleavage related to the actual characteristics of the group. Those characteristics might not be present in the same proportion that what can be found in the global environment. So, even if 30 individual cases is considered by some as the minimum for the rules of probabilities to apply, that minimum might not work at all with this sampling method.

To ensure that the cluster (or area random sampling) is having the characteristics of a truly random sampling, the logic leads us to think that it may be necessary to have more than 30 individual cases. How much? If each group is perfectly homogeneous, we theoretically need a minimum of 30 groups. If each group is heterogeneous, when we have 30 respondents, everything is fine. In real life the solution lies between the last two and I doubt that there is an indisputable manner to evaluate how many cases you will need. It is the know how of the researcher that should be useful here.

In the "real life", let us say that we will trust the usual formulas to calculate the characteristics of such a survey. And you will have to trust the experience of the researcher to be decide if these calculations can represent accurately the reality...

Your webmaster : Frédéric D'Astous

L'échantillonnage non-aléatoire

Les stratégies visant la réalisation d'un échantillonnage non-aléatoire sont parfois désignées en utilisant l'expression "stratégies non-probabilistes". L'usage de ces termes fait référence au fait que l'on ne se base pas sur les lois du hasard pour créer notre liste de personnes à joindre. L'utilisation de ces stratégies est le fruit d'une orientation méthodologique totalement à l'opposé des stratégies aléatoires.

On peut décrire la base méthodologique des stratégies non-aléatoires de la manière suivante : c'est un peu comme si le chercheur partait du principe selon lequel un échantillonnage contient inévitablement un biais, si petit soit-il. Alors, plutôt que tenter d'éviter l'inévitable, le chercheur décidera de le contrôler en choisissant volontairement un biais particulier. Dans certaines circonstances, cette manière de voir est utile. Mais, adopter inconditionnellement cette approche est hasardeux. Si un biais est effectivement inévitable, il est rare qu'on ne puisse le contrôler en le réduisant à une taille contrôlable.

Mais, pour celui qui décide de procéder de cette manière, il importera de porter attention à certaines contraintes. Précisons que les méthodes non-aléatoires sont toujours le résultat d'un choix de la part du chercheur. Ces techniques sont à utiliser avec prudence. Mal contrôlées, elles sont susceptibles de déformer gravement les résultats.

La réussite dépendra impérativement de la précision de la méthodologie et des objectifs poursuivis par le sondeur. C'est à partir de là que le sondeur sera en mesure de décider s'il est logique d'utiliser ce type de méthodes. Une circonstance où cela sera pertinent, sera lorsque le chercheur désire joindre une clientèle précise dont les membres ont des liens entre eux. On utilisera alors le réseau formé des contacts propres à cette clientèle. L'existence de ce réseau sera même une aubaine pour le sondeur qui aura alors une plus grande facilité à recueillir son information. Cependant, il sera essentiel de se faire accréditer par ce réseau pour bénéficier de ses avantages. On voit, dès lors, le danger d'une recherche dont l'orientation ne plairait pas au réseau.

Il ne faut jamais oublier qu'un réseau effectue une forme de filtrage chez ses membres. Chaque groupe possède ses règles. Leur transgression provoque inévitablement une mise à distance de l'individu. Cette mise à distance sera d'autant plus grande si l'écart de conduite est perçu comme grave par les membres ou les élites du groupe. On aura donc un effet d'amplification de certaines attitudes au détriment de certaines autres.

Là où cette approche ne conviendra pas, c'est lorsqu'on tente de juger de certaines proportions. Par exemple, on peut imaginer les effets d'une technique de cette sorte pour mesurer les opinions politiques à l'intérieur d'un village. Notre recherche se transformerait en mini-élection dans le village. On ne mesurerait plus les opinions présentes dans le village mais bien l'effet combiné des organisations politiques et des tendances d'opinions. Nos résultats ne signifieraient plus grand chose. Par contre, si l'on tente de mettre en évidence les tendances dans le parti politique A ou le B, là on obtiendra des résultats utiles. On ne sera pas en mesure de juger de l'importance (en pourcentage) de chaque tendance, tout au plus sera-t-il possible de distinguer les tendances fréquentes de celles qui ne le sont pas.

Le choix d'une méthode à adopter est donc toujours lié à la nature des résultats qui sont attendus. Je vous souhaite une bonne recherche !

Votre conseiller : Frédéric D'Astous

L'échantillonnage accidentel

Les personnes qui font un sondage n'ont pas toujours sous la main des listes de noms permettant de réaliser une sélection aléatoire des répondants. Les sondeurs sont alors obligés d'utiliser des techniques qui font appel à des compromis. C'est là qu'entre en ligne de compte le jugement du sondeur pour éviter que les compromis ne mettent en péril la validité du travail.

L'échantillonnage accidentel fait justement partie de ces techniques à employer avec circonspection. En gros, la technique accidentelle consiste à se placer à un endroit donné et à questionner chaque première personne d'un nombre "x" de personnes rencontrées. Par exemple, un commercent peut mettre en pratique cette méthode en questionnant le premier client de chaque série de 10 clients.

Ce qui semble rassurant dans cette procédure, c'est qu'on a tendance à considérer que les personnes (ou les clients de notre exemple) se présentent sans un ordre particulier. On a donc l'impression que le hasard est à l'oeuvre et qu'en conséquence : la procédure est totalement neutre et objective. Or, rien n'est plus faux. Le rythme de vie de nos sociétés est soumis à des cycles et des horaires. Dans la pratique cela signifie que, à certains moments, on rencontrera un type de clientèle qui sera inexistant à une autre moment.

On se pensera alors que le commerçant de notre exemple n'aura qu'à réaliser ses entrevues pendant toute une journée. Ainsi, les variations horaires seraient éliminées et on obtiendrait un portrait adéquat de l'ensemble de la clientèle de l'établissement. Mais encore là, la prudence est de mise. Certains types de clientèle vont varier en fonction du jour de la semaine alors que d'autres suivent de lentes variations saisonnières.

Dans la pratique que devra faire le sondeur ? Tout d'abord, il sera essentiel de vérifier à quel groupe de personnes le sondage s'adressera puis de vérifier comment ce groupe se divise. Cela peut se faire en contactant les personnes qui interagissent avec les gens qu'on veut joindre. Ces informations ne nous donneront pas un portrait précis de la situation mais à tout le moins nous saurons quelles sont les principales caractéristiques à surveiller. Dans notre exemple, les vendeurs du commerce ont probablement remarqué la présence de certains types de clientèle à des moments particuliers. Cette information nous permettra de définir les moments où il faudra réaliser la démarche de sondage. Si les vendeurs n'ont pas noté de différence entre la clientèle de chacune des soirées de semaines, on réalisera une économie en ne sélectionnant qu'une seule soirée. Et on fera ainsi pour chacune des périodes qui semblent se distinguer.

Si on décide de s'arrèter là, on obtiendra un portrait de chacun des moments importants où il est possible de rencontrer un type ou un autre de la clientèle ciblée. Mais, il est possible que le commercant de notre exemple cherche à obtenir des résultats pour l'ensemble de sa clientèle. Il lui faudra alors pondérer ses résultats pour tenir compte du pourcentage de clients qui correspond à chaque moment particulier de fréquentation de son établissement. Ainsi, si la clientèle du soir représente 30% de la fréquentation du commerce, on considérera que les résultats de nos entrevues d'une soirée représentent l'état de 30% de la clientèle. Et on procèdera de cette manière pour l'ensemble de nos résulats (clientèle de fin de semaine, d'après-midi, de matinée, ...) Il est possible d'utiliser des logiciels statistiques (par exemple, du genre tableur) pour arriver à pondérer nos résultats.

Il reste une seule chose à régler et c'est la source des données servant à notre pondération. Dans notre exemple, il sera important d'utiliser le nombre de clients qui fréquentent le magasin. En effet, si notre commercant utilise son chiffre d'affaire, il introduira une distortion provenant de la taille des ventes individuelles , laquelle n'est probablement pas constante pour tous les types de clientèle. S'il utilise le nombre de ventes ce sera la même chose car certains types de clientèle sont plus difficiles que d'autres. En utilisant ce dernier indicateur, certaines portions de la clientèle seraient probablement sous-estimées au bénéfices de certaines autres.

Bon sondage.

Le responsable de ce site : Frédéric D'Astous.

To the top of this page

Topics of the archive [attitude and ethics] [behavior of groups] [data collection] [lists of names] [sampling]

Other pages [my curriculum vitae] [comments and questions] [e-mail] [legal information and copyrights]