Indépendance et corrélation linéaire
dans Statistiques
Bonjour je trouve une phrase dans le Saporta qui dit : pour un million d'individus hypothèse d'indépendance entre deux variables sera rejeté au risque 5 % si le coefficient de corrélation linéaire est supérieure en valeur absolue à 0.002.
Je souhaiterais quelques précisions ici sur ce qu'il appelle hypothèse d'indépendance, veut-il simplement dire test de corrélation linéaire ?
D'ailleurs indépendance et corrélation linéaire ne sont pas la même chose (il existe des liaisons non linéaires) donc n'y a-t-il pas un abus de langage (ps: dans le cas très particulier où l'on fait l'hypothèse de 2 loi normales ; mais ce n'est pas précisé ici, il me semble que lorsque la corrélation linéaire est nulle entre deux variables on a l'indépendance entre ces deux variables ceci voudrait-il dire que lorsque je trace le biplot de la réalisation de deux variables aléatoires gaussiennes, si j'obtiens une forme en U (corrélation linéaire nulle) alors mes 2 V.A. sont indépendantes ?) ?
Quel est le test mentionné pour arriver à ce résultat numérique ?
Je souhaiterais quelques précisions ici sur ce qu'il appelle hypothèse d'indépendance, veut-il simplement dire test de corrélation linéaire ?
D'ailleurs indépendance et corrélation linéaire ne sont pas la même chose (il existe des liaisons non linéaires) donc n'y a-t-il pas un abus de langage (ps: dans le cas très particulier où l'on fait l'hypothèse de 2 loi normales ; mais ce n'est pas précisé ici, il me semble que lorsque la corrélation linéaire est nulle entre deux variables on a l'indépendance entre ces deux variables ceci voudrait-il dire que lorsque je trace le biplot de la réalisation de deux variables aléatoires gaussiennes, si j'obtiens une forme en U (corrélation linéaire nulle) alors mes 2 V.A. sont indépendantes ?) ?
Quel est le test mentionné pour arriver à ce résultat numérique ?
Réponses
-
Tu devrais relire le contexte. Le test $\beta_1=0$ est fait en supposant les populations gaussiennes; donc on est dans ton "cas très particulier".
Cordialement. -
Bonjour Gérard nos deux messages se sont croisés puisque j'ai modifié le message original qui me semblait peu clair.
J'ai en effet encore un peu de mal à comprendre la différence entre la simple observation de la corrélation linéaire entre deux variables aléatoires et la régression linéaire qui sous-entend une relation de causalité.
Lorsque je parlais des coefficients bêta 1 beta zéro je faisais implicitement allusion à une régression linéaire. Or le test de corrélation linéaire sous-entend uniquement un lien linéaire entre les deux variables mais pas de causalité. Y a-t-il un lien entre ces deux approches?
Autrement, quel est le graphique d'un biplot issue de variable gaussienne ?
Puisque indépendance et corrélation linéaire Nulle sont équivalentes dans le cas gaussien et qu'on peut montrer que certaines formes comme une forme en U peut aboutir à une corrélation nulle cela veut-il dire que l'on ne pourra jamais avoir un biplot de variable aléatoire gaussienne dont la forme est un U (ce dernier signifiant une corrélation linéaire nulle mets [mais ?] sous-entendant une dépendance non linéaire) ?
Il me semble qu'on obtient généralement des ellipsoïde. Si j'obtiens ellipsoïde en forme de boule j'aurais donc à faire à deux variables aléatoires gaussiennes indépendantes il semble que ce soit la seule forme qui conduisent à l'indépendance de nos deux variables aléatoires gaussiennes. Est-ce juste ? -
Là, ça dépasse mes modestes compétences.
Ce que je sais, c'est que le modèle linéaire élémentaire suppose une relation linéaire entre les variables modifiées par un écart aléatoire de type gaussien. Ce qui est une supposition assez risquée dans la plupart des cas. Mais comme on retrouve justement les paramètres d'un ajustement statistique par les moindres carrés (régression de Y en X), on pratique ainsi.
Dans l'estimation de la qualité d'un ajustement, on ne se contente pas du coefficient de corrélation, on fait aussi une étude des résidus, qui parfois montrent que le modèle choisi n'est pas le bon (courbe des résidus en U, par exemple).
La fin de ton message semble mélanger variables aléatoires et variables statistiques. Cependant, examiner des échantillons de tirages d'une variable aléatoire gaussienne est très instructif ; le faire pour deux, soit indépendantes (nuage "en gros" sans forme) soit dépendantes devrait aussi être utile.
Cordialement. -
Une relation de causalité !!! Là, il y a un gros problème.
Bonne continuation.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 7 Collège/Lycée
- 21.8K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 52 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres