Test d'ajustement

Bonjour,

j'ai un petit problème qui est en fait assez gênant dans la mesure où il m'empêche d'avancer.

Pour le test d'ajustement du Khi deux, je n'arrive absolument pas à déterminer les pi. Je vous montre

On veut tester les hypothèses
H0 : L(X)=N(21476.1, 26686.6)
et
H1 : L(X) ne suit pas N (21476.1, 26686.6)

On calcule les effectifs théoriques
Capital initial    Nombre d'entreprise    pi
[1000,1500[              67              0.2266
[1500,7500[              109             0.0749 
[7500,15000[             108             0.1036  
[15000,37500[            90              0.3206 
[37500,75000[            54              0.2520
[75000 et 150000         22              0.0222
Et c'est là que le bât blesse... Je n'arrive absolument pas à déterminer de quelle manière on obtient ces pi... J'ai essayé via le centre des classes (Ci) puis lecture de la table de la loi normale, ça ne passe pas... Idem on remplaçant Xn dans (Xn-21476.1)/26686.6 par les extrem des bornes, ça ne passe pas également.

Merci d'avance de votre aide qui me sera très précieuse...

Réponses

  • Effectivement, les $p_i$ ne sont ni les fréquences observées, ni les fréquences théoriques sous l'hypothèse $H_0$.
    D'où sort ton énoncé ?
  • Bonjour.

    Moi non plus, je ne vois pas ce que sont les "pi". En effet, on dirait des fréquences ou des probabilités (Leur total fait pratiquement 1). Mais ce ne sont ni les fréquences des classes, ni les probabilités d'être dans ces classes dans le modèle (on calcule ces probabilités comme d'habitude avec une loi Normale).
    Je soupçonne une erreur (inversion des d'eux premières valeurs ? autre chose ?).

    Cordialement.

    NB : L'hypothèse est nettement fantaisiste : avec une moyenne de 21000 et un écart type de 26000, plus de 15% des entreprises auraient un capital initial . . négatif !
  • salut Gérard,

    Tu as certainement raison, je viens de vérifier : la fréquence théorique (sous l'hypothèse $H_0$) de la classe $[15\,000\,;\,37\,500[$ est correcte (je trouve $0,3205$).
    Mais j'ai vraiment la flemme de vérifier toutes les autres, si, en plus, on doit les remettre dans l'ordre...

    Sur le fond, encore une modélisation probabiliste osée.. et, quitte à accepter d'avoir des entreprises au capital initial négatif, pourquoi ne pas arrondir les paramètres ? Ces $21\,476,1$ et $26\,686,6$ (admirez la précision !) me paraissent bouffons.
  • Effectivement Aleg.

    Je n'avais pas voulu intervenir encore une fois sur les concrétisations débiles, mais celle-ci est gratinée !

    Nicholson : Peux-tu nous dire quel est l'auteur ? A moins que tu refuses la délation ;)

    Cordialement
  • Merci beaucoup pour vos réponses.

    Ecoutez ! je vais vous mettre le sujet en entier... Et vous me direz ce que vous en pensez. Et effectivement la somme des pi est = à 1.

    Enoncé
    Nous nous intéresserons dans cette partie au capital initialement investi.
    Une étude faite sur un échantillon aléatoire de 450 nouvelles entreprises a donné les résultats suivants :
    Capital initial    Nombre d'entreprise   
    [1000,1500[              67             
    [1500,7500[              109            
    [7500,15000[             108            
    [15000,37500[            90              
    [37500,75000[            54             
    [75000 et 150000         22        
    
    Peut-on, au niveau de confiance 0,90, considérer que la loi du capital initialement investi est normale ?
    On utilisera un test du Khi-deux pour répondre à cette question.

    Et voilà le corrigé
    • Soit W l'ensemble des nouvelles entreprises. Sa taille est N.
    • Soit X la variable aléatoire qui à toute entreprise de W associe le capital initial ayant permis la création de d'entreprises. On note M son espérance et s son écart-type.
    • X prend ses valeurs dans les classes Ci, 1 ≤ i ≤ 6.
    • On pose pi=P(X ∈ Ci)
    • On considère l'échantillon aléatoire (X1,…, Xn) de taille n=450 associé à X.
    • On estime les paramètres de la loi de X à partir des données de l'échantillon dont on dispose, soit M=x =21 476,1 et =S=26 686,6
    • Alors le nombre de paramètres estimés à partir de l'échantillon est m=2.
    • On veut tester les hypothèses

    H0 : L(X)=N(21 476,1 ; 26 686,6)
    et
    H1 : L(X)≠N(21 476,1 ; 26 686,6)

    • Sous l'hypothèse H0, on calcule les effectifs npi de l'échantillon théorique de taille n=450, représentant la population. On obtient la distribution d'effectifs théoriques F((np1, ..., np6), calculée dans le tableau suivant:
    Capital initial    Nombre d'entreprise    pi         npi
    [1000,1500[              67              0.2266      101.98
    [1500,7500[              109             0.0749      33.71
    [7500,15000[             108             0.1036      46.64
    [15000,37500[            90              0.3206      144.26 
    [37500,75000[            54              0.2520      113.42
    [75000 et 150000         22              0.0222      10
                            [b]450[/b]              [b]1[/b]           [b]450[/b]
    
    • Tous les effectifs théoriques sont supérieurs ou égaux à 5, donc on retient un nombre de classes égal à k=6.
    • On obtient la distribution des effectifs théoriques F = (np1, ..., np6)
    • On considère la variable aléatoire Ni, 1=< i =< 6 , qui à tout échantillon de n=450 nouvelles entreprises de W, associe l'effectif ni de la classe Ci dans cet échantillon.
    • On pose Fn=(N1, ..., N6) la distribution des effectifs observés.
    • On définit aussi la variable aléatoire Dn=d(Fn ,F)=Σ (Ni-npi)2/npi
    • Comme n>30 L(Dn)# ki deux avec 3 degrés de liberté
    • Soit p = 6,25
    Règle de décision
    • Si d > ou = à 6.25 , alors on rejette H0 au risque de 10%.
    • Si d < 6,25 alors on accepte H0 au seuil de 10%.

    d=326,88 > 6,25, donc on rejette H0 au risque de 10%.
    Au risque de 10% on considère que la loi de X n'est pas la loi normale
    L(X)=N(21 476,1 ; 26 686,6)

    Voilà et merci d'avance.

    PS : c'est un partiel d'avril 2006 donné à l'IAE de Lyon.
  • Zut mon tableau est bancal, désolé. Ce que j'ai surligné dans le tableau sont les sommes des nombres d'entreprises (n=450), des pi=1 et des npi =450.

    Voili.

    [Pour conserver le cadrage des tableaux, utilise le bouton "code" (entre l'enveloppe et les " au dessus de la fenêtre d'édition). ;) AD]
  • Merci Nicholson.

    * Le problème est évidemment idiot (voir ma remarque sur les CI négatifs). Un modèle genre loi béta ou lognormale serait plus raisonnable, car la distribution est positive, et fortement étalée à droite (peu d'entreprises à fort capital initial, mais de très grands CI possibles)
    * La première classe doit être "capital initial inférieur à 1500", ce qui explique les 22% (composés essentiellement de capitaux négatifs) du modèle. De même la dernière comporte tous les CI supérieurs à 75 000.
    * Le reste est une mise en application des méthodes classiques (Loi de gauss, test de Khi-deux, ..).

    Si tu as des questions pratiques, on peut t'éclairer.

    Cordialement
  • Merci Gérard.

    Il s'agit en fait d'un partiel pour petit étudiants en gestion. Nous n'avons par conséquent jamais vu la loi béta et lognormal.

    J'avais réussi à calculer le premier pi (0.2266) en prenant le centre des classes (1250) et en appliquant la loi normale (1250 - 21476.1)/26686.6 = - 0.76

    Par lecture de la table de la loi normale, je trouvais effectivement 0.2266

    Cela dit, cette technique ne marche pas pour les autres classes. J'aimerais savoir concrètement comment arriver à trouver ces pi, parce que je suis encore totalement dans le flou...


    Merci encore pour votre site qui est une vraie mine d'or et qui me sauvera peut être la vie.;)
  • Bonsoir Nicholson

    Le calcul des $p_i$, c'est tout simplement d'après la loi $\mathcal N(21476;26687)$ l'effectif dans la classe $C_i$, c'est à dire
    $$p_i=\frac 1{\sqrt{2\pi}\sigma} \int_{\min C_i}^{\max C_i} \exp\big( -\tfrac{(x-m)^2}{2\sigma^2}\big) \mathrm dx$$
    En considérant que la borne $\min$ de $C_1$ est $-\infty$. On obtient le tableau de nombres :
    $\begin{array}{ll}
    loi\ normale & p_i \\
    0,2271 & 0,2266 \\
    0,0732 & 0,0749\\
    0,1039 & 0,1036 \\
    0,3218 & 0,3206 \\
    0,2517 & 0,252 \\
    0,0224 & 0,0222
    \end{array}$
    On retrouve bien les valeurs donnée pour $p_i$ dans le corrigé.
    Quand on affiche sur un même graphique les fréquences (nombre d'entreprises échelle de gauche; $p_i$ et loiNormale échelle de droite), on se rend compte que modéliser le nombre d'entreprises par la loi normale citée n'est pas satisfaisant.

    Alain
    9125
  • Bonsoir AD et merci beaucoup d'avoir pris le temps de me répondre.

    Malheureusement, vous surestimez mon niveau de mathématique d'un petit étudiant en DEUG de gestion.

    Parce que la formule que vous m'avez donné ne me parle pas du tout.:-(

    Concrètement par exemple, le 0.3218 que vous trouvez [15000 ; 37500[ quel est le calcul exact à faire (avec des valeurs...)

    Cordialement
  • Re-bonsoir Nicholson

    Bien sûr tu ne calcules pas l'intégrale (:P). Il faut utiliser la table donnant la loi normale réduite.
    Par exemple, pour l'intervalle $[15000 ; 37500[$
    Tu ramènes $15000$ à la valeur réduite : $\dfrac{15000 - 21476}{26687}=-0,24$
    Tu regardes dans la table $\Phi(0,24)=0,5948$ donc $\Phi(-0,24)=1-\Phi(0,24)=0,4052$
    Pour l'autre borne $37500$, tu fais pareil :
    Tu ramènes $37500$ à la valeur réduite : $\dfrac{37500 - 21476}{26687}=0,60$
    Tu regardes dans la table $\Phi(0,60)=0,7258$
    Et tu prends l'effectif entre ces 2 bornes : $0,7258-0,4052=0,3206$ qui n'est pas loin de $0.3218$ qui t'est donné.

    Tu fais ceci pour tous tes intervalles. Sachant que la borne max de l'un est la borne min du suivant, tu n'as que 6 fois à chercher dans la table (la première borne est $-\infty$, en plus je viens de traiter 2 bornes !) pour retrouver tes $p_i$.

    Alain
  • OK C'est bon j'ai compris.(tu)

    Merci pour cette extrêmement précieuse et gentille. Excellente soirée.
  • bonjour,je suis un jeune etudiant dans le domaine energetique,mais cependant j'ai fort à faire avec l'estimation d'une prevision de consommation d'electricite.
    je ne dispose cependant pas d'un modele econometrique fiable pour pouvoir etablir ma prevision ou alors tout simplement j'ai du mal à en etablir un.
    j'aimerais donc dans la mesure du possible avoir des indications ou alors references fiables pouvant m'aidre dans mon probleme.
  • Bonjour Tatsi.

    A priori, sur ce forum, des gens peuvent t'aider. Mais si tu te contentes de généralités, que pouvons nous faire ?

    Cordialement
  • Bonsoir Nicholson,

    Merci pour vos réponses claires et très pertinentes. Cela simplifie vraiment les choses.

    J'ai un problème semblable à celui là (la correction) sauf que cette fois-ci, la loi théorique de la variable à étudier est inconnue : on a juste qq chose du genre genre

    i(x) = constante/ x^2.

    On prélève des valeurs de i(x) environs 120 données pour différentes valeurs de x fixées.
    Je ne sais pas comment procéder au test de khi-deux.

    La question de l'exercice est : La distribution observée est elle significativement différentes de la distribution théorique ? avec un risque 5%.
Connectez-vous ou Inscrivez-vous pour répondre.