Test du khi-2

Bonjour,

J'ai besoin d'aide pour faire un test du Khi-2. Je pense avoir bien assimiler le principe du teste de même que son mode de calcul.
Cependant je me retrouve devant un exercice ou la question est assez atypique et sur laquelle je bloque totalement.

Excecice :
On demande d'effectuer un test du khi entre de tableau de donnée (jusqu'ici rien de bien compliqué).
La question : en effectuant un test du khi-2 l'adéquation est-elle retenue à 5%? à 3%?
Cette question est suivi du tableau
ddl    1%      3%      5%      10%
1       0,0002 0,001  0,004   0,02
2       0,02   0,05   0,1     0,21
3       0,11   0,22   0,35     ,58
En général du moins jusqu'ici c'est toujours ainsi que j'ai fait le test) on cherche la valeur à droite de la courbe du khi-2 qui donne la proba de rejet ... Ici le tableau de l'exo donne les % à droite de la courbe du khi-2. => Si je procède au test comme à mon habitude, je rejette l'hypothèse (et ça serait quasiment toujours le cas vu les valeurs faibles du khi-2 ...)

Quelqu'un pourrait m'éclairer sur le raisonnement à tenir dans un tel cas ?

Réponses

  • Je voulais dire : Ici le tableau de l'exo donne les % à gauche de la courbe du khi-2
  • Bonjour.

    Tu as le tableau normal des fractiles de la loi du Khi-deux. Il te suffit d'appliquer la méthode. Comme tu ne donnes ni le Khi-deux calculé ni le nombre de degrés de liberté, difficile de t'aider; mais disons que si, par exemple on a trouvé 0,3 comme khi-deux calculé et qu'il y a trois ddl, alors l'hypothèse H0 est rejetée aux seuils 1% et 3% et acceptée au seuil 5% (comparaison de 0,3 avec 0,11, 0,22 et 0,35.

    Cordialement.
  • Merci beaucoup pour votre répondre.
    J'avais bien compris la méthode. Et justement c'est de là que vient ma question.
    Pour ces trés petites valeurs du khi-2 (si l'on prend un ddl on est à peine à 0,02 par exemple), on sera quaziment toujours systématiquement au dessous----> et on rejettera l'hypothèse systématiquement.
    A l'inverse si l'on prend une proba de reje trés faible (1%) on ne rejettera quaziment jamais l'hypothèse car le khi-2 sera trés grand (et souvent plus grand que l'écart obseervé).
    Je ne comprend donc pas bien l'interet de faire un test du khi-2 sur ces trés petites valeurs (de même que pour les grands).
    J'espère m'etre bien fait comprendre
    Stéphane
  • je me corrige encore, je voulais dire
    on sera quaziment toujours systématiquement au dessous----> et on rejettera l'hypothèse systématiquement.
  • je me corrige encore, je voulais dire
    on sera quaziment toujours systématiquement au dessus----> et on rejettera l'hypothèse systématiquement.
  • Bonjour.

    "Pour ces trés petites valeurs du khi-2 (si l'on prend un ddl on est à peine à 0,02 par exemple), on sera quaziment (sic) toujours systématiquement au dessous [dessus]----> et on rejettera l'hypothèse systématiquement. "

    Absolument pas ! D'ailleurs le cas 1 ddl arrive très régulièrement quand on examine les liens entre variables à deux modalités. Si les effectifs sont importants, le Khi-deux peut parfaitement être très petit.
    mais il est vrai que l'exigence est assez rigoureuse pour ne pas rejeter l'indépendance, tout simplement parce qu'on fait une statistique sur peu de cas. Il est bien plus facile de voir que deux variables sont liées lorsqu'elles ont de nombreuses modalités.

    Une remarque : Avant de critiquer l'emploi d'une méthode, il faut connaître ses utilisations.

    Cordialement.
  • Du calme
    Je ne critique pas mais j'essaye simplement de comprendre un point encore flou
  • Lorsque l'on prend une proba de 5% par exemple, cela signifie (si j'ai bien saisi le principe bien sûr) que l'on a une probabilité de rejeter le modèle à tort (rejeter H0 quand H0 est vrai) de 95%. Je ne comprends donc pas l'intérêt de tester le khi-2 avec un niveau de proba de 5%.
    Si quelqu'un pouvait m'éclairer ça serait vraiment sympa
  • Bonsoir
    En général pour un pb courant on considère que si la proba d'obtenir la répartition est p inf à 0.05 est l'indication que le hasard n'est pas seul en cause de la différence constatée. Mais on peut être plus exigeant et prendre 0.025 ou 0.01 ou 0.001. E. Borel a préconisé pour les pb à l'échelle individuelle 0.05, à l''échelle d'une nation 0.01 et pour l'Univers (collision d'astres) 0.001 ou même moins.(je cite de mémoire).
    0.05 n'est pas un résultat de calcul mais une convention.
    On prend le risque .001 comme négligeable quand on aborde sans marquer l'arrêt un croisement peu fréquenté
    mais comme une chance possible quand on achète un billet de loterie avec un gagnant sur 1000 billets vendus.
    Donc en résumé : si le résultat d'un test est inf à 0.05 cela veut dire qu'on considère que sur 100 cas on verra de 1 à 5 fois ce même résultat par l'effet du hasard.
    C'est une démarche intellectuelle spéciale aux proba et aux stat, mais on s'y fait d'autant plus que p sert souvent à comparer des situations d'après les chances qu'on a de les voir se réaliser.
    Cordialement
    Koniev.
  • Bonsoir Msteph_2.

    Tu as apparemment changé de question (ou je n'avais rien compris à tes premiers messages qui parlaient spécifiquement de valeurs du Khi-deux et de ddl faibles).
    Le risque choisi est une obligation dans les tests statistiques, car le hasard fait que des cas peu probables arrivent (*), comme le tirage de 10 pile successifs avec une pièce équilibrée, par exemple.
    Donc quand on teste avec un échantillonnage, il est possible que l'échantillon soit "trompeur". On en tient compte dans la théorie. Les seuils les plus courants sont 5% et 1%. Pourquoi ? Simplement parce que ce sont des valeurs raisonnablement intermédiaires entre un risque fort (on rejette souvent H0 quand elle est vraie) et un risque très petit (on accepte souvent H0 alors qu'elle est fausse). Aucun raisonnement mathématique ne justifie ce seuil, c'est simplement la pratique courante. Dans certaines circonstances, on prendra un risque très faible (ce n'est pas gênant d'accepter H0 à tort - cartes de contrôle, par exemple), plus rarement un risque de 10 ou 20% (ce n'est pas gênant de rejeter H0 à tort), suivant ce qu'on veut faire du test.

    Cordialement.

    (*) J'ai vécu personnellement la distribution d'un jeu de belote avec seulement trois couleurs (la quatrième avait été retirée- restent 24 cartes) à trois joueurs, chacun obtenant une main de 8 cartes de la même couleur.
  • Merci beaucoup pour vos réponses
  • Bonsoir
    Au 18ème siècle on estimait la proba ainsi 8/12 pour 8 chances de succès contre 12 chances de perte. C'est de Moivre qui a proposé de faire le quotient des chances de gain (par le total nb de gain + nb de perte) . ou 8/20 ou 0.4. La proba varie de 0 = impossibilité à 1 = certitude..
    La proba obtenue par un test permet de choisir le processus expérimental le plus probable c'est-à-dire celui qui offre une proba supérieure aux autres.
    Cordialement
    Koniev
Connectez-vous ou Inscrivez-vous pour répondre.