J'ai besoin de qq rappels

Bonjour,

Je suis un peu rouillée en pratique de test statistiques (j'en ai pas fait depuis au moins 4 ans). Du coup, j'ai un peu oublié comment ça marche :-(

Ma question est:
Je travaille sur 2 populations (Hommes/Femmes). Pour chaque population, je calcule la part vivant en région parisienne et autre.
Exemple:
           IDF      AUTRE
Homme      54%      46%                         =100%
Femme      51%      49%                         =100%


On voit que le %hommes est + élevés que le %femmes en région parisienne.
J'aimerais savoir si cette différence est significative statistiquement parlant. Mais comment faire ???

Pour moi, il faut utiliser un test du chi2 : qui compare 2 pourcentages de 2 populations indépendantes. Le souci est que je n'en suis pas sure : est-ce le bon test ? N'y a-t-il pas d'autres tests possibles ? Si c'est le cas, qu'est-ce qui est mieux ?

Merci de vos réponses
Sissie

Réponses

  • Bonsoir Sissie.

    Effectivement, le test du Khi-deux est le test adapté. A vue de nez, il ne devrait pas conclure à une différence significative. Je vérifie ...
  • J'ai regardé : Évidemment, il me manque une donnée, la taille de la population (total hommes+femmes), car tu ne donnes que les pourcentages. mais pour des tailles classiques (quelques dizaines ou centaines d'hommes et de femmes), la différence n'est pas significative.
    En prenant des populations d'hommes et de femmes égales, il faut presque 2500 hommes et femme (1250 de chaque) pour que la différence devienne significative au seuil 5%.

    Cordialement.
  • Merci beaucoup pour la réponse rapide :)

    Cela va me permettre de me remettre dans les tests statistiques.

    Sissie
  • Je me pose une autre question au sujet du khi2. Est-il necessaire que les populations aient les mêmes effectifs. Car dans mon exemple, les effectifs entre les 2 groupes sont différents : groupe(femmes)> groupe(hommes).

    Peut-on toujours utiliser le test du khi2?

    Sissie
  • Bonjour,

    Eh oui, c'est encore moi, avec d'autres questions (comme quoi je suis rouillée en tests statistiques).
    Question 1 :
    Je ne me rappelle plus à quoi sert le degré de liberté. Pour mon étude ci-dessus, j'ai utilisé 1ddl. Mais pourquoi je n'utiliserais pas 2 ou 3 ddl ? Comment choisit-on le ddl ?

    Question 2 :
    Je fais une étude sur les banques et le sexe et j'aimerais savoir si les répartitions sont significativement différentes de la moyenne.
    Exemple :
                     Hommes Femmes
    BNP Paribas       7,0%  93,0%
    Société générale  8,8%  91,2%
    Banque Postale    8,6%  91,4%
    Banque Populaire  9,4%  90,6%
    Crédit agricole   9,1%  90,9%
    LCL               8,5%  91,5%
    Autres Banques    8,8%  91,2%
    Total             8,5%  91,5%
    
    J'aimerais savoir (par exemple) si la répartition des Hommes de la BNP Paribas (7% d'hommes) est significativement différente de la moyenne (8.5% d'hommes au total).
    Quel test dois-je utiliser ?
    Pour moi, je ne peux pas utiliser le test du Khi2 car les 2 groupes ne sont pas indépendants ( hommes de la BNP sont inclus dans le groupe total)

    Merci d'avance
    Sissie
  • Bonjour.

    Question 1 : Les ddl correspondent au nombre de valeurs du modèle qui peuvent être choisies indépendamment. Dans ton cas, on prend comme modèle l'idée d'une répartition égalitaire, mais dans tous les cas de modèles, comme on connaît le nombre d'hommes, une fois choisi le nombre d'hommes IDF, les autres sont fixés (le total d'hommes est connu). Et aussi le nombre de femmes IDF, puisqu'on connaît le total hommes +femmes IDF, et par là même le nombre de femmes autres. Il y a donc un seul nombre qui peut être choisi pour modéliser.

    Question 2 : Si la question est bien "la répartition des Hommes de la BNP Paribas (7% d'hommes) est [-elle] significativement différente de la moyenne ?", tu peux utiliser un test de comparaison de moyennes. Là encore, le test sain se fera plutôt sur les effectifs (Une petite différence de pourcentage n'est significative que sur un grand effectif). Ceci suppose que tes résultats sont des calculs sur des échantillons aléatoires.
    Par contre, si tu as les résultats exhaustifs, ce n'est plus une question de test : 7% est différent de 8,5%. la notion de "significatif" n'a plus rien à voir avec cela. Tout au plus, on pourrait tester l'hypothèse "les salariés de la BNP ont été pris "au hasard" dans la population globale des employés de banques (en intégrant dans ce total la BNP, ou pas). Vu la taille des effectifs nationaux, je parie pour la réponse non.

    Cordialement
  • Bonjour
    Comme te l'a dit Gérard les pourcentages ne suffisent pas pour conclure il faut connaître les effectifs.


    Pourrais-tu demander aux diverse banques leurs effectifs respectifs, ça ferait plus sérieux pour ton travail.
    C'est peut-être disponible sur le Net ?
    Les stat donnent une proba qui est un nb assorti d'une incertitude, généralement avec 5 chances sur 100 de se tromper, si en plus on calcule sur des nb dont on n'est pas certain c'est la douce rigolade.
    Cordialement
    Koniev
  • Bonjour
    Le net consulté me donne pour LCL le total de 15000 collaborateurs.
    A toi de trouver les autres données.
    Attention tu veux comparer les % à la moyenne. Le % moyen n'est pas la somme des % divisé par le nb des banques. La moyenne des moyennes n'est exacte que si les effectifs en jeu sont égaux.
    Il faut dans ton cas calculer le nb d'h dans chaque banque, leur somme, puis le total des employés dans toutes les banques le rapport donne la moyenne des hommes.. Dürkheim a fait la confusion.
    Ton tableau qui additionne les % mérite un zéro pointé. Tu as fait des stat, dis-tu, ton prof ne t'a pas appris cela ? L'étude des stat comme des math ne doit pas se contenter de la théorie abstraite mais se coltiner à la pratique concrète qui illumine la théorie et la justifie. Larousse a écrit qu'un dictionnaire sans exemple est un squelette. Un livre de stat sans exemple numérique est lui aussi un squelette. Le livre de stat répondant à mon désir est à écrire, malheureusement à 85 balais c'est trop tard pour moi.
    Cordialement
    Koniev
  • Bonjour,

    Merci pour toutes ces réponses. ça m'a permis de me remettre dans le bain :).

    Pour info, effectivement, je ne donne jamais de chiffres numériques. Mais la raison est très simple : dans mon travail, cette donnée est CONFIDENTIELLE. D'ailleurs j'ai un peu modifié les %.

    J'avais juste besoin de qq rappels.

    Donc encore merci et désolée pour les chiffres.


    Sissie
  • Pas de problème Sissie.

    Il me fallait être sûr que tu prenais le problème par le bon bout. Reviens quand tu veux poser des questions, même un peu ésotériques.

    Cordialement
Connectez-vous ou Inscrivez-vous pour répondre.