Simulation d'un échantillon

Bonjour à tous,

J'espère que vous allez bien.

Je sollicite votre aide car je suis confronté à une problématique que je n'arrive pas à résoudre, si vous avez la possibilité de m'éclairer sur mon problème, je vous en serait très reconnaissant.

Voici ce que j'essaie de faire :

Je souhaite enquêter les individus d'une ville pour leur soumettre un questionnaire de satisfaction.

Pour cette enquête, j'ai besoin de sélectionner un certains nombre d'individus selon leur âge.
Ainsi je connais la répartition de ma population selon sa catégorie d'âge (<20 ans, 25-35 ans, 35-45 ans...).

Je souhaiterai réaliser une simulation pour me permettre de sélectionner les individus que je dois enquêter en priorisant ceux dont la catégorie d'age est la plus représentée.

Pour ce faire, j'avais pensé à calculer la probabilité que l'individu sélectionnée appartiennent à telle catégorie , mais je voudrai que cela se fasse sous forme d'un algorithme (en faisant plusieurs tirages), mais je ne sais pas comment m'y prendre.

Est-ce que vous pouvez m'aider ?

N’hésitez pas à me demander des renseignements si cela n'est pas clair.

Merci d'avance

Réponses

  • Bonjour.

    Je suppose que tu as tous les renseignements nécessaires sur tous les individus (sinon, s'il faut aller à la pêche, une rectification par quotas est bien plus simple). Je n'ai pas trop compris ce que tu appelles " prioriser ceux dont la catégorie d'age est la plus représentée". Mais s'il s'agit d'avoir dans ton échantillon une proportion par classe d'âge correspondant à celle de la population, tu tries tes individus par classes d'âges, puis tu choisis au hasard dans chaque tranche d'âge ne nombre voulu. Par exemple si tes pourcentages sont 20%, 33%, 35% et 12%, et que tu veux un échantillon de 400, tu en prends au hasard 80 dans la première classe, 132, 140 et 48 dans les autres.

    Mais j'ai un fort soupçon que ta situation n'est pas aussi simple que ce que tu as dit, d'autant que tu parles de simulation. Mais si la "simulation" est un simple tirage au hasard dans un fichier, c'est assez élémentaire : tirage avec rejet des "déjà tirés", jusqu'à avoir le bon nombre. Et donc, après avoir indexé le fichier de 1 à n, tirage d'un entier à l'aide d'un générateur pseudo-aléatoire.

    Cordialement.
  • Merci beaucoup gerard0 pour ta réponse.

    Alors pour répondre à tes questions, je dispose en effet d'information sur mes individus.

    Concernant la constitution de mon échantillon, disons que la constitution va se faire progressivement, c'est à dire dans un premier temps je simule un tirage sur un petit nombre d'individus (par exemple 5 individus), ce premier échantillon qui n'est pas du tout exhaustif doit me permettre de prioriser les individus qui ont le plus grand poids dans la population.

    Ensuite je réalise une deuxième simulation en repartant sur l'échantillon existant, et en prenant en compte les individus qui on déjà été tiré (Exemple, ma population totale est de 500 individus, la catégorie des 25-35 ans représente 35% de la population, soit 175 individus.

    Je fais une première simulation sur un échantillon de 5 individus (très petit, mais le nombre augmentera au fil du temps), normalement je devrai sélectionner 2 individus dans la catégorie 25-35 ans (5*0.35 =1,75). Mais comme je suis sur un échantillon très petit, je souhaiterai que mon échantillon "maximise" la catégorie qui est la plus importante, et pourquoi pas avoir 4 individus appartenant à cette même catégorie.

    Ensuite les autres simulations s'adapterons en prenant en compte les individus déjà tirés, ce qui ferait plus que 171 individus de la classe 25-35 ans. Et normalement la probabilité de sélectionner les individus dans cette catégorie, devrait diminuer au fur et à mesure des tirages.


    Pour résumé, je souhaiterai constituer un échantillon progressif, qui se focalisera dans un premier temps sur 1 ou 2 catégorie la plus importante de la population, et qui ensuite viendra s'équilibrer lorsque le nombre d'individus sera suffisamment grand.


    Je ne sais pas si mes propos sont plus clairs, mais n'hésites pas à me poser d'autres questions si besoin, en tout cas je te remercie de prendre le temps de répondre aux messages du forum
  • Bon,

    tu sembles savoir ce que tu vas faire, où est le problème ?

    Je ne comprends toujours pas pourquoi tu parles de simulation, alors que tu parles d'un tirage réel.
  • Bonjour,
    Je voudrais savoir pourquoi utiliser cette méthodologie : se focaliser sûr les classes d'âge les plus représentées pour réaliser au final la méthode des quotas. Pourquoi cette première étape (contraintes de temps, d'argent, manageriale,...) ? Pour constituer l'échantillon représentatif au cours de la première étape ? Est-ce que les estimations habituelles pour les sondages ne seront pas affectées par votre procédure ? Je ne comprends pas.
    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.