Influence et statistiquement significatif

Bonjour,

1) j'ai un critère allant de 0 à 10 réparti dans des intervalles ([0;2,5[; [2,5;5[ ...) qui est mesuré sur des hommes et des femmes.
On a un croisement de 2 variables (X: femmes/hommes et Y : critère de 0 à 10)
On me demande quelle approche statistique est à utiliser pour tester si être un homme ou une femme influence le critère Y.
Que dois-je répondre ?

2) J'ai deux variables X et Y qui peuvent chacune prendre deux valeurs (oui ou non pour chacune).
On a des effectifs croisés pour ces variables (4 effectifs donc).
On me demande de vérifier l'existence d'un lien statistiquement significatif entre ces deux variables.
Que dois-je faire ?

Merci.

Réponses

  • Bonjour.

    Ces deux questions sont des applications directes d'un cours, il suffit de l'apprendre.
    Au cas où tu aurais à répondre à ces questions dans un cadre autre qu'une formation qui comporte des statistiques, rien ne t'interdit de lire un cours de base de statistiques descriptives, en te centrant sur les séries doubles (2 variables).

    Cordialement.
  • Bonjour,

    Je n'ai pas le cours mais il s'agit du niveau L1.

    Premièrement, je pense que il faut rendre les valeurs qualitatives sous forme quantitatives (oui => 1; non =>0)

    Mais après, dois-je calculer le coefficient de corrélation?
    Dois-je faire un test d'hypothèses? lequel?

    SI quelqu'un possède un cours sur ce sujet, il peut m'indiquer le lien.

    Merci
  • Bonjour,
    math65 a écrit:
    Premièrement, je pense que il faut rendre les valeurs qualitatives sous forme quantitatives (oui => 1; non =>0)

    Mais après, dois-je calculer le coefficient de corrélation?

    De mon expérience, associer du qualitatif à du quantitatif est rarement une bonne idée, ça donne souvent lieu à des calculs qui n'ont pas de sens...
  • Bonjour Math65.

    Je ne comprends pas l'intérêt de faire un exercice sans savoir à quoi il fait référence ("Je n'ai pas le cours"). Cet exercice est fait pour contrôler qu'on a appris les bases de la statistique inférentielle, si on n'a rien appris, pourquoi le faire.
    D'autant que lire un cours de statistiques inférentielles n'est pas du temps perdu. Lis un tel cours, et tu verras qu'il y a directement la réponse. Inutile d'inventer des méthodes farfelues (genre numériser du non numérique).
  • J'ai lu des cours et je pense que :

    1) pour tester si être un homme ou une femme influence un critère quantitatif Y, il faut utiliser une analyse de variance (ANOVA) car il s'agit d'une étude de liaison entre une variable qualitative et une quantitative.

    2) Pour étudier la liaison entre deux variables qualitatives, on doit utiliser le test khi-deux (qui n'a pas l'air d'être au programme de L1)
  • Bonjour,

    1) D'après ce que j'ai compris pour faire l'ANOVA, il faut calculer la moyenne pour chaque facteur (homme ou femme) soit respectivement $m_h$ et $m_f$ (je suppose que les valeurs à prendre sont les milieu des intervalles) et $m$ la moyenne globale.

    On pose les hypothèses :
    $H_0$:$m_h=m_f=m$
    $H_1$:$m_h\neq m $ ou $m_f \neq m$

    Puis calculer la somme des carrés expliqués :
    $SCE =(m_h-m)^2 + (m_f-m)^2$

    Puis calculer la somme des carrés résiduels :
    $SCR=\sum_{homme}(x_i-m_h)^2 + \sum_{femme}(x_i-m_f)^2$

    On calcule ensuite les carrés moyens :

    $CME= \frac{SCE}{2-1}$
    $CMR= \frac{SCR}{8-2}$ (il y a 8 valeurs en tout soit 4 pour chacun des deux facteurs)

    On calcule $F= \frac{CME}{CMR}$ qui suit la loi de Fischer à 2-1 et 8-2 degrés de liberté

    Si la valeur observée dans la table de Fischer est inférieure à $F$ alors on rejette $H_0$, c'est à dire qu'être un homme ou une femme n'influence pas $Y$.

    2) Les deux variables $X$ et $Y$ prennent chacune les valeurs "oui" et "non". On veut savoir si il existe un lien statistiquement significatif entre ces deux variables.

    Les effectifs sont :
    X=non,Y=non : 322
    X=non,Y=oui : 64
    X=oui,Y=non : 67
    X=oui,Y=oui : 277

    On doit calculer les effectifs théoriques (si il n'y a pas de lien entre les variables):
    X=non,Y=non : 205,7
    X=non,Y=oui : 180,3
    X=oui,Y=non : 183,3
    X=oui,Y=oui : 160,7

    On pose les hypothèses :
    $H_0$: les variables sont indépendantes
    $H_1$: les variables sont liées

    On calcule le coefficient $Q^2= \frac{(205,7-322)^2}{205,7} + \frac{(180,3-64)^2}{180,3} + \frac{(183,3-67)^2}{183,3} + \frac{(277-160,7)^2}{160,7} = 298,7$

    $Q^2$ suit approximativement la loi Khi-deux à $(2-1)(2-1)=1 $ ddl car l'effectif total est supérieur à $30$ et les effectifs théoriques sont tous supérieurs à 5.

    Sur une table Khi-deux, on sait que $P(Q^2>10,8)=0,001$
    On en déduit que $P(Q^2>298,7)<0,001<0,05$
    Cela est plus faible que le niveau de 5% choisi. On doit donc rejeter $H_0$, les variables sont donc liés.

    Est-ce bon?
Connectez-vous ou Inscrivez-vous pour répondre.