Régression = critères ?

Bonjour
Je me tourne vers vous avec une question, peut être simple pour certain, néanmoins je ne trouve ma réponse nul part :

Je souhaiterais faire une régression entre 2 variables.
Pour pouvoir faire une régression, dois-je obligatoirement avoir des distributions normales ? Ou cela ne rentre pas du tout dans les critères d'utilisation ?

Je possède deux distributions qui ne suivent pas une loi normale, une régression peut-elle être possible ?
Merci d'avance.

Réponses

  • Bonjour.

    En statistiques descriptives, on fait de l'ajustement linéaire (ou autre) entre deux variables sur les mêmes individus, ajustement dont on mesure la qualité par le coefficient de corrélation linéaire. Les variables statistiques ne sont pas des variables aléatoires, donc de n'est que par approximation qu'on peut parler de "Normal", et la plupart du temps, ça n'a pas de sens.

    En statistique inférentielle, on peut analyser la situation où une variable $y_i$ est modélisée, en fonction d'une autre variable $x_i$ (contrôlée) par un modèle linéaire $Y=aX+b+\varepsilon$, où $\varepsilon$ est une variable aléatoire Normale, de moyenne nulle et de variance minimale. Dans ce cas, c'est $\varepsilon$ qui est gaussien (on pourra éventuellement le contrôler avec des résidus). On a aussi le cas où les deux variables en cause sont non contrôlées, et où le fait qu'elles soient gaussiennes simplifie fortement le problème. Ce qui fait qu'on présente souvent ce seul cas, alors que l'on peut traiter quand même correctement le sujet : calculer une mesure de régression.

    Donc si tes deux séries (distributions) sont une vraie série double, représente-la (nuage de points) pour savoir si une régression linéaire (ou autre) est utile, et dans ce cas, calcule.

    Cordialement.
  • Effectivement ce que gerard appelle statistique descriptive fait appel uniquement à la géométrie (pas de proba), on cherche à minimiser le critère des moindres carrés, ce qui revient à chercher La meilleur projection orthogonale de Y sur l'espace engendré oar les colonnes de X. On mesure ensuite la qualité d'ajustement linéaire par le cosinus carré de l'angle entre Y et la projection que l'on vient de mentionner.

    Si la loi de Y sachant X est gaussienne alors le maximum de vraisemblance nous retourne les mêmes paramètres que ceux retournés par minimisation du critère des moindres carrés et on peut en plus parler d'intervalle de confiance, de test... bref de la stat inférentielle.
Connectez-vous ou Inscrivez-vous pour répondre.