Quelle loi pour une distribution asymétrique

Bonjour,
Je me remets doucement aux statistiques... et je rame un peu quand même.

Pour commencer je ne vois pas vraiment de différence entre la Loi Normale et la Loi Binomiale, et que dire du théorème central limite.

En fait j'aimerais appliquer des statistiques (descriptives) sur un échantillon d'environ 200 valeurs (mon programme utilisant une table limitée en taille de 200 cases).
Ces données évoluent dans le temps, la 201ème est perdue (et ne fait plus partie de la table) au profit d'une nouvelle valeur qui arrive, et ainsi de suite. La distribution peut être centrée, mais en général elle est asymétrique.

Pour l'instant, je fais ça de façon un peu basique, je calcule la moyenne, la variance, l’écart-type, puis le coefficient de Fisher pour voir si elle est plus ou moins asymétrique à gauche ou à droite.

Comment décrire cette distribution, quelle loi puis-je utiliser pour en tirer des probabilités en un point donné ? par exemple P(X<Moyenne-1.5*Ecart-type) ?

Merci.

Réponses

  • Bonjour,

    Pour commencer une variable suivant une loi binomiale ne peut prendre qu'un nombre fini de valeurs (généralement $\{ 0,...,n\}$), alors qu'une variable suivant une loi normale peut prendre pour valeur n'importe quel réel.

    Le théorème central limite dit en gros que pour $n$ suffisamment grand, la loi binomiale va ressembler à une loi normale. Ceci est dû au fait qu'une variable de loi binomiale est la somme de $n$ variables indépendantes qui suivent une loi de Bernouilli. Le théorème central limite peut s'appliquer pour d'autres lois que la loi binomiale, pourvu qu'elle admette un moment d'ordre 2.

    Ensuite pour déterminer par quelle loi tu peux approcher ta distribution réellement observée, commence par te poser des questions simples : Les valeurs de ta variable sont elles minorées? Majorées? Peut-elle prendre un nombre infini de valeurs? Est-ce que cela a une importance? Quelles approximations suis-je prêt à faire? Combien de temps aie-je passer sur cette modélisation?

    Une fois que tu as une idée des valeurs que prend ta variable, choisis-toi une classe de lois dans laquelle tu vas choisir ta loi, et détermine par une méthode (type maximum de vraisemblance par exemple) pour sélectionner la loi la plus appropriée.

    Par exemple : je veux modéliser le nombre de jours sans pluie à Bouvier-les-troufignols chaque année. La variable qui va modéliser ce nombre de jours est bornée, je pourrai donc prendre une variable uniforme pour le modéliser. Mais ça ne me parait pas juste car il pleut souvent à Bouvier-les troufignols, dont il y a plus de chances d'avoir 50 jours de pluie que 0. Donc je vais plutôt avoir recours à une loi binomiale avec de paramètres $p$ et $n=365$. J'ajuste le $p$ en fonction des données. Et en plus je suis feignant et $365$ c'est quand même grand comme nombre alors j'utilise une approximation par une loi normale de ma binomiale et tant pis si je peux avoir un nombre de jours de pluie négatif (de toute façon selon mon approximation cette éventualité est très peu probable).

    Bon après c'est une méthode, bonne ou mauvaise à toi de juger (ou d'utiliser des tests statistiques pour voir si le modèle est bon), et il en existe d'autres.

    En espérant t'avoir plus éclairer qu'embrouiller.
  • J'avoue que je reste dans le flou.

    Voici ce que je pense comprendre pour l'instant :

    - La loi Normale peut être une approximation d'autres loi pour le cas où le nombre de tests est suffisament grand.
    - La loi Binomiale (fonction continue) peut permettre de modèliser un événement discontinu (bargraphe) et de calculer des probabilités sur la survenu de cet événement pour une valeur particulière.

    Mais la loi Binomiale est centrée, alors comment modéliser un évément asymétrique ?

    Les lois de Fisher, du chki2, ou Gama, ont l'air de servir à comparer des Variances si j'ai bien compris, donc 2 echantillons différents, c'est pas du tout ce que je cherche, J'ai 1 seul échantillon mais sa distribution n'est pas Gaussien.
  • Vu ce que tu écris je pense qu'il te serait utile de reprendre un cours sur les probabilités de base. Tu te remets aux statistiques par plaisir? Pour des raisons professionnelles?

    Par exemple tu dis que la binomiale est centrée. Le plus souvent la binomiale est définie comme cela :

    soient $X_1$, ..., $X_n$ des variables aléatoires indépendantes pouvant prendre comme valeur $0$ avec probabilité $1-p$ et $1$ avec probabilité $p$, alors la variable $X=\sum_{i=1}^nX_i$ suit une loi binomiale de paramètres $p$ et $n$.
    Je te laisse voir pourquoi :
    1) cette variable n'est pas centrée (définition de variable centrée : variable d'espérance nulle)
    2) L'asymétrie de cette variable n'est (sauf pour $p=1/2$) pas nulle (l'asymétrie a un sens précis en statistiques, c'est le moment centré réduit d'ordre 3)

    Tu dis aussi que la loi normale est une bonne approximation d'autres loi quand il y a un échantillon suffisamment grand. La loi normale n'est pas une approximation de la loi d'origine, mais de la somme de variables aléatoires indépendantes suivant une même loi. Par exemple si tu pars de la loi de Bernouilli, la somme donne une binomiale qui peut être approchée par une loi normale.
Connectez-vous ou Inscrivez-vous pour répondre.