Comparer deux pourcentages

Bonjour, je souhaite savoir si l'on peut comparer objectivement deux pourcentages sachant que les échantillons sont de

tailles différentes. Par exemple sur une promotion de 30 élèves 10 ont leur bac ce qui fait 33,33 % de réussite.

Et sur une promotion de 120 élèves 37 ont leur bac ce qui fait 30,83 % de réussite

Ma question est : peut on comparer ces deux promotions et si oui comment ?

Merci

Réponses

  • Bien sûr, on peut comparer deux pourcentages. Par exemple ici, 33,33% est supérieur à 30,83 %.
    La question qui se pose alors c'est "Et alors ?". Autrement dit, peut-on en tirer des conclusions. Généralement, non.
    Ici, il est possible de faire une comparaison, en utilisant le fait que le pourcentage est une moyenne (0,3333 est la moyenne de la variable statistique qui vaut 1 pour un élève qui a réussi et 0 pour un élève qui a échoué). On peut par exemple appliquer le test de Student. Je n'ai pas fait le calcul, mais on risque de trouver la différence des pourcentages non significative.

    Cordialement.
  • Merci, pour la réponse étant étudiant en médecine, je n'ai aucune base en statistique. Pourriez-vous m'éclairer sur ce test de Student afin que je puisse faire le calcul pour voir si on peut tirer des conclusions ou non, sur ces deux pourcentages.
    Cordialement.
  • Bonjour
    On peut comparer les % de 2 échantillons de taille différente. La proba d'avoir ces données est 0.607 les % sont donc "comparables". Si on avait 0.03 l'une serait sup à l'autre. Le logiciel MINITAB calcule cela en 1 seconde.
    Cordialement
    Koniev
  • Salut,

    La réponse de Koniev semble un peu tombé du ciel et je ne retrouve pas ça dans R.
    Pour expliquer la proposition de gerard0 :
    Il te propose en fait de considérer la variable comme le succés/échec au bac. Donc cette variable prend la valeur 0 ou 1 et d'en faire la moyenne pour tes deux populations d'étudiants.
    Cela revient donc ensuite à une simple comparaison de moyenne qui s'effectue par le test de student.
    t.test(x= rep(c(1,0),c(10,20)),y=rep(c(1,0),c(37,83)))
    
            Welch Two Sample t-test
    
    data:  rep(c(1, 0), c(10, 20)) and rep(c(1, 0), c(37, 83)) 
    t = 0.2571, df = 43.57, p-value = 0.7983
    alternative hypothesis: true difference in means is not equal to 0 
    95 percent confidence interval:
     -0.1710  0.2210 
    sample estimates:
    mean of x mean of y 
       0.3333    0.3083
    

    La p-value associée à ce test est de 0.7983. On ne peut donc rejeter l'hypothèse nulle d'égalité des moyennes. Les deux pourcentages sont donc statistiquement équivalents.
  • Merci Nik,

    d'avoir fait le test à ma place. Mon intuition était donc bien la bonne.

    Pour Resakoo :
    Attention, le fait d'avoir traité ce cas ne doit pas te faire croire qu'on peut traiter tous les cas. Il faut des effectifs suffisants (et les connaître, pas seulement les pourcentages).
    Une bonne lecture : Daniel Schwartz "Le jeu de la science et du hasard" Champs Flamarion. je te le conseille pour pouvoir dire "je sais un peu ce qu'on fait en statistiques". Et c'est un prof en fac de médecine.

    Cordialement.
  • Bonjour
    La méthode statistique relativise la notion > ou < en faisant intervenir les effectifs que ce soit des % ou des moyennes,...
    En stat 10 n'est pas inf à 12, cela dépend des effectifs en jeu.
    Cordialement
    Koniev
  • Bonsoir, j'ai trouvé la réponse à ma question sur ce site http://www.unilim.fr/sceduc/IMG/pdf/Cours_no5_La_comparaison_de_deux_pourcentages.pdf
    Le deuxième exemple illustre parfaitement mon cas. Par contre je voudrais savoir si ces calculs son corrects.

    Cordialement
  • Bonjour.

    Ce type de calcul est classique et admis généralement. Même si on doit être prudent quand les effectifs sont faibles ou lorsque $\epsilon$ est proche de 1,96. En particulier, la conclusion de l'exercice 1 me semble très osée. En effet, il y a utilisation d'approximations dans la méthode, donc le fait de trouver quasiment 1,96 doit amener à refuser de conclure.

    Ce qui s'applique à ton cas est le deuxième cas qui, présenté ainsi doit être réservé à de grands effectifs (supérieurs à 100). Sinon, le 1,96 doit être remplacé par des valeurs supérieures (légèrement : 2 ou 2,2), d'autant plus grandes que l'effectif est faible.

    Le test correspondant (test de Fischer, ou test t de Student) se trouve facilement.

    Cordialement.

    [La case LaTeX. :) AD]
  • Je prends note, merci.
  • tu peux utiliser le test d proportion suivant la procédure de marascuilo sous stata. La commande est très simple: marasc var1 var2.
    Il te compare les Nij/Ni et les Nij/Nj avec les statistiques de test, les conclusions à tirer, et les p-value. Très interessant pour approndir une analyse descriptive.
  • Bonjour,

    pour rebondir sur la question de Rezakoo : peut-on appliquer le test de Student sur des ppm de la même façon que que sur des pourcentages ?

    Merci

    Leod
  • Bonjour Leod.

    A priori, les ppm (parties pas millions ?) ne sont pas des fréquences (des pourcentages des effectifs). Donc comme il s'agit d'une classique mesure, je ne vois pas à priori où il y aurait un problème, si les conditions du test de Student sont réunies.

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.