Question concernant une régression linéaire

Bonjour à tous,

Je suis actuellement en train de rédiger la partie statistique concernant mon mémoire en économie.

Pour l'une de mes régression, j'observe que l'échantillon ne suit pas une distribution normale et qu'en plus le test sur l'hétéroscédasticité m'indique des résidus hétéroscédastiques. J'ai conscience que la régression est un modèle "robuste" et que la taille de l'échantillon (50 dans mon cas) permet de réduire l'influence de ces hypothèses non respectées. Mais est-ce justifié de tout de même garder ce modèle dans mon mémoire, sachant que j'ai pas le temps pour recommencer un échantillon.

Je me demande aussi s'il est possible de tout de même tester la robustesse de mon modèle de régression, en d'autres termes existe-t-il des tests pour prouver en quelques sortes que malgré le non respect de ces 2 hypothèses, le modèle reste valable ?

Merci d'avance et bonne semaine

Réponses

  • Je n'ai pas le temps pour recommencer un échantillon.

    Peut-être qu'un ajournement à la deuxième session te fournirait le temps nécessaire ?

    Cordialement, Pierre.
  • Bonjour.

    "Pour l'une de mes régression, j'observe que l'échantillon ne suit pas une distribution normale" Oui, et alors ? C'est généralement le cas, surtout dans ce genre de situation.

    "et qu'en plus le test sur l'hétéroscédasticité m'indique des résidus hétéroscédastiques." ?? Ça ne veut rien dire, les résidus sont des nombres, pas des séries statistiques (hétéroscédastiques = de variances très différentes).

    "Je me demande aussi s'il est possible de tout de même tester la robustesse de mon modèle de régression," Oui, avec d'autres données, pas utilisées pour fabriquer le modèle.

    Cordialement.
  • Salut Pierre,

    Je me permet de te tutoyer vu que tu ne t'es pas gêné pour le faire.

    Alors si tu veux tout savoir, constituer l'échantillon m'a demandé 6 mois de travail et la lecture de l'ensemble des prospectus de chaque entreprise ayant décidée de réaliser une IPO. Sachant qu'un prospectus fait au minimum 350 pages, je te laisse estimer le travail que ça m'a demandé.
    Donc non, je n'ai pas le temps de recommencer un échantillon.

    Aussi et au vu de ta réponse plus qu'antipathique, je te conseille le livre de Sophie Marie Larrouy "Comment ne pas devenir un vieux con".

    Merci pour votre réponse Gerard, qui m'apporte un début de piste à mes questions. En réalité je pensais que le fait pour un échantillon de devoir suivre une loi normale était une condition sine qua non à une régression. Concernant l'hétéroscédasticité, j'ai dans mon cours d'économétrie un chapitre sur ce thème qui indique que homoscedasticité des résidus doit être respectées afin d'avoir des estimateurs sans biais. J'ai donc réalisé un test de white qui m'indique qu'ils sont hétéroscédastiques, d'où ma question de savoir si un échantillon suffisamment grand pourrait réduire ce biais ?
  • Tu nous demandes comment bricoler ton mémoire pour qu'il donne l'impression de rentrer dans les clous... et tu n'es pas content de la réponse. Peut-être devrais-tu te préparer à ne pas apprécier non plus la réponse des personnes qui, à la fin des fins, évalueront ton mémoire.

    La question à se poser n'est pas "combien de temps as-tu passé à compiler des prospectus", mais de savoir si (1) le résultat est un échantillon ou non et si (2) les variables utilisées sont additives ou non.

    Le fait de se poser ce genre de questions après coup, et non pas avant d'y passer six mois, n'est pas bon signe.

    Cordialement, Pierre.
  • La méthodologie a été validée par mon promoteur, ce qui implique que j'ai réalisé une étude de la façon dont il me l'a demandé.

    Et non, je n'essaye pas de rentrer dans les clous, je pose juste la question de savoir si le fait de ne pas spécialement respecter toutes les hypothèses est un problème ou pas.

    La réponse est NON, à titre d'exemple même si la distribution des résidus n'est pas gaussienne et que mes résidus sont hétéroscédastiques, l'interprétation reste toujours possible. Mon échantillon est de 80 et pas de 50, je m'étais trompé de tests. Bref grâce aux propriétés asymptotiques, plus on a de données à disposition, plus on peut supporter un écart important aux hypothèses. Et selon lui un échantillon de 80 individus permet cela.
    Je souhaitais simplement avoir un avis d'autres personnes sur la question.

    Ceci dit, j'avais conscience de la possibilité de ne pas avoir de résultats significatifs, ce à quoi il m'a répondu :" L'absence de résultat est un résultat en soit."
  • Je constate que j'ai toujours autant de mal à comprendre ce qui se raconte en économétrie. Et je suis toujours aussi surpris de voir cette exigence de Normalité de l'échantillon, qui n'a aucune utilité pratique en dehors du coeur de la théorie de base. D'ailleurs, les tests de Normalité ne prouvent jamais la normalité, ni même la non normalité (qui est seulement présumée lorsque le test est significatif).

    Cordialement.
  • gerard0 a écrit:
    Et je suis toujours aussi surpris de voir cette exigence de Normalité de l'échantillon, qui n'a aucune utilité pratique en dehors du coeur de la théorie de base
    +1000 (tu)

    S'il fallait des échantillons gaussiens pour faire de la régression, ça ferait longtemps que tout l'apprentissage statistique serait par terre ...
  • Merci beaucoup pour vos réponses qui m'éclairent. C'est également pour ça que je cherche à comprendre un peu plus loin que ce qui se dit dans mes cours, souvent trop théoriques et éloignés de toute réalité.
  • ilovemoumou ecrivait:
    > Pour l'une de mes régression, j'observe que l'échantillon ne suit pas une distribution normale
    > (...) Mais est-ce justifié de tout de même garder ce modèle dans mon mémoire, sachant
    > que j'ai pas le temps pour recommencer un échantillon.

    Salut,

    Qu'en pense la personne qui t'encadre dans ton stage ?
    (aussi bien du coté mathématique que du coté stratégie à adopter dans le temps restant)
Connectez-vous ou Inscrivez-vous pour répondre.