Quelle loi pourrait-ce être ?

Réponses

  • Personne n'a une idée ? J'hésite entre une log normale, une gamma ou un $\chi^2$, et j'aimerais ensuite trouver les bons paramètres et faire un test d'adéquation...
  • Est ce que la provenance des données peut aider ? Dans quel cadre de modélisation es tu ? Sinon, as tu nécessairement besoin d'être dans une approche paramétrique pour la suite ?
  • pour trouver les parametres, pourquoi ne pas faire une regression (maximum de vraisemblance par exemple) et regarder alors comment la loi trouvee approxime tes donnees ? C'est peu etre simpliste, mais c'est rapide et ne demande pas trop d'effort.. C'est deja implemente dans pas mal de logiciel (Weibull, Log-normal, etc..)
  • Bonjour Zantac.

    Il est difficile de répondre à partir d'un graphique. Par exemple les données sont-elles complètes, ou est-ce un zoom sur la zone ou les fréquences sont importantes ?
    Une deuxième étape peut être de lisser un peu les données pour éliminer les effets mineurs de hasard (Voir estimateurs à noyaux). Mais la première t'a été donnée par Ben : L'origine des données.
    Un bon logiciel de statistiques te fera du "fitage", mais ce sera à toi de choisir les modèles (en général ceux que tu as cités) et de choisir en fonction du degré de confiance celui qui te semble utile.

    Cordialement
  • D'accord, je vais me rabattre sur les logiciels. SAS peut faire ça ou non ? Si oui, quelle est la commande à faire ?

    Car au bureau, on a que Excel, licences obligent.

    Ces données proviennent des Best Estimate d'engagements en assurance vie... Je doute que ça vous aide beaucoup :]

    Merci pour ces premières réponses.
  • Bonjour

    c'est marrant je pensais que c'étaient des données de non-vie (j'aime bien ce mot).

    Question étrange ceci-dit.

    S
  • Tu fais de l'assurance, samok ?
  • Je faisais, pour des questions d'accord avec moi même, j'ai arrêté pour devenir prof de maths.

    S
  • "pour des questions d'accord avec moi même"

    J'avoue ne pas comprendre la tournure. De mon côté, je commence :)
  • Voilà j'ai trouvé une loi qui convient, il s'agit d'une loi gamma (j'ai fait des changements d'échelle mais bon).

    J'ai 100 données, en faisant un Kolmogorov Smirnov je trouve une valeur de $D = 0.107$ donc ça accepte l'hypothèse qu'ils sont de la même loi.

    Cela dit, ce qui me chagrine est un peu est que si je vous montre la courbe, je doute que vous me croyez si je vous dis "c'est la même loi".

    Et pourtant, K-S passe... Que dire ?

    L'image est jointe, et moins bruitée (j'ai plus de données) : histogramme = empirique, courbe = théorique.
    9847
  • En fait ça ne marche pas, j'avais oublié que la stat de test est de la forme $\sqrt{n}D$, et non $D$ tout seul lol.

    Bon, je vais voir avec SAS si on peut chercher. Quelles sont les commandes à taper en SAS pour pouvoir chercher s'il s'agit d'une loi de Weibull, gamma, log normale (où SAS cherche les paramètres) ?
  • Bonjour,

    Pour voir si c'est une loi log-normale tu passes les données au log et tu fais un test de normalité sur les résultats obtenus. Je te conseille d'utiliser R plutôt que SAS.

    Par ailleurs, pourquoi veux-tu trouver une distribution qui s'ajuste à tes données ?
  • Oui bonne idée que de passer en log, j'aurais dû y penser plus tôt.

    Je cherche la distribution suivie par les Best Estimate des engagements d'une société d'assurannce vie, dans un certain modèle et sous certaines hypothèses.
  • Et finalement ça marche nickel, j'ai fait un test de Kolmogorov-Smirnov, avec un échantillon de $n = 2000$ simulations.

    Ma statistique de test vaut $\sqrt{2000} D = 0.96 < 1.358$ donc on accepte l'hypothèse (sans souci) que la distribution sur une loi log-normale de paramètres $(\mu,\sigma^2)$.

    La boucle est bouclée ! La loi gamma en tout cas ne convient pas.

    Je vous envoie la courbe qui se marie le mieux aux données également.
    9849
  • J'ai encore une petite question. Dire qu'on fait un K-S bilatéral, ça veut dire qu'on considère la valeur absolue de la différence des fonctions de répartition ? Et unilatéral, c'est sans la valeur absolue, ou alors ?

    Merci encore pour vos conseils et aides !
  • Pour info: je soupçonnais qu'une log-normale s'ajuste mieux qu'une Gamma, car j'ai vu que la courbe de ta Gamma s'écrase trop vite, et il me semble qu'en général, la log-normale s'écrase plus doucement (loi "heavy-tailed" en anglais)
  • Salut Zantac.

    Effectivement, l'unilatéral revient à négliger la valeur absolue. En fait, on teste des hypothèses du genre x= a contre x >a (ou x < a). Pour un test d'adéquation, je ne vois pas d'utilité (vérifier par un KS que la fonction de répartition "monte moins vite" que celle d'une loi Normale ???). De plus, comme le sens de l'inégalité n'est pas évident, il vaut mieux revenir à la signification du test.

    Cordialement.
  • Oui en fait je connaissais la notion de test d'unilatéral de façon générale, mais je voyais pas trop l'intérêt dans le cadre qui est celui de K-S.

    Quoiqu'il en soit, merci beaucoup à tous !
  • Autre chose Zantac :

    Je viens de regarder ton graphique. les deux pics les plus élevés me paraissent bizarre. J'espère que tu as d'autres données pour valider ton modèle.

    Cordialement
  • En effet les deux pics sont un peu bizarres, mais d'une part K-S passe à l'aise, d'autre part c'est le résultat "attendu", je vais pas chercher plus loin, 4 000 simulations ce n'est pas grand chose, et si je réessaye j'aurais sûrement autre chose !
  • Moi je ne trouve pas que ces pics sont bizarres, ils sont situés là où la densité est la plus haute.

    Tu peux essayer de simuler 4000 réalisations d'une loi log-normale et voir si ces pics apparaissent, à mon avis c'est souvent le cas.

    Si tu réessayes, tu auras autre chose ? De quoi parles-tu ?
  • Oui c'est vrai que c'est bizarre, euh.. ce sont des simulations ? Si tu sais simuler ta v.a. tu peux théoriquement calculer sa loi, il suffit de démonter le processus de simulation étape par étape.

    Donc soit tu cherches une expression analytique de ta densité, auquel cas il faut faire ce calcul, soit tu veux calculer numériquement des moments ou un quantile du style VaR, et dans ce cas les simulations suffisent, et tu n'as pas vraiment besoin de connaître la loi ?
  • Bonsoir Egoroff.

    Méfie - toi, c'est peut - être plus compliqué que ça. Je vois faire mes collègues chercheurs en gestion de production. Leurs simulations sont des processus très complexes utilisant plusieurs générations de valeurs aléatoires et des procédés genre tri, affectations par des algorithmes divers, usage de méthodes d'optimisation, etc. Et dans un mélange qui peut être lui aussi aléatoire ! Ce qui fait qu'ils sont bien incapables de théoriser la variabilité des résultats.
    Il est possible que Zantac soit dans cette situation.

    Cordialement
  • En effet, le modèle sur lequel je bosse (3000 lignes de code VBA) n'est pas théorisable proprement...
  • Bonjour Zantac,
    quelle instruction SAS as-tu utilisée pour identifier les paramètres de ta distribution ?

    Merci

    Yann
Connectez-vous ou Inscrivez-vous pour répondre.