Écart à une distribution Dirac
Bonjour,
(Je précise d'entrée que je ne suis pas mathématicien théorique : pardon si la question est mal formulée.)
Ma question générale : existe-t-il une façon de mesurer l'écart / la divergence entre une distribution Dirac $\delta_a$ et une distribution empirique $\hat{F}_n$ ? Vu que ni le Kolmogorov-Smirnov ni la distance de Kullback ne peuvent fonctionner avec un Dirac, je ne vois pas bien comment procéder.
--
Voici le contexte (que j'espère arriver à formuler correctement) :
Une expérience consiste à obtenir à la suite un grand nombre de mesures, qui devraient toutes être égales à $a$. Lors des expériences réalisées, il y a toujours effectivement une bonne majorité de mesures qui sont exactement égales à $a$, mais en raison d'artefacts, certaines d'entre elles seront légèrement inférieures (NB : elles ne peuvent jamais être supérieures), et certaines peuvent même être franchement inférieures. Bref, le résultat d'une expérience consiste donc en une série de nombres inférieurs ou égaux à $a$.
- Une expérience idéale serait une expérience où tous les nombres seraient égaux à $a$ (mesures parfaites) : c'est un Dirac en $a$.
- Une expérience "moyennement réussie" serait une expérience avec un nombre non-négligeable de nombres légèrement inférieurs à $a$, mais très peu de nombres vraiment inférieurs à $a$.
- Une expérience très ratée serait une expérience avec très peu de nombres égaux à $a$, et une quantité non-négligeable de nombres très inférieurs à $a$ (mesures vraiment ratées).
D'où mon idée : si on construit la fonction de répartition empirique $\hat{F}_n$ des valeurs obtenues à chaque expérience, hé bien plus une expérience est réussie, plus sa fonction de répartition se rapproche de la fonction de répartition d'un Dirac en $a$. (Vous confirmez ?)
Néanmoins, comment puis-je "quantifier" cet écart entre ma fonction empirique et mon Dirac en $a$, pour classer mes expériences de la plus réussie à la plus ratée ?
Merci !
(Je précise d'entrée que je ne suis pas mathématicien théorique : pardon si la question est mal formulée.)
Ma question générale : existe-t-il une façon de mesurer l'écart / la divergence entre une distribution Dirac $\delta_a$ et une distribution empirique $\hat{F}_n$ ? Vu que ni le Kolmogorov-Smirnov ni la distance de Kullback ne peuvent fonctionner avec un Dirac, je ne vois pas bien comment procéder.
--
Voici le contexte (que j'espère arriver à formuler correctement) :
Une expérience consiste à obtenir à la suite un grand nombre de mesures, qui devraient toutes être égales à $a$. Lors des expériences réalisées, il y a toujours effectivement une bonne majorité de mesures qui sont exactement égales à $a$, mais en raison d'artefacts, certaines d'entre elles seront légèrement inférieures (NB : elles ne peuvent jamais être supérieures), et certaines peuvent même être franchement inférieures. Bref, le résultat d'une expérience consiste donc en une série de nombres inférieurs ou égaux à $a$.
- Une expérience idéale serait une expérience où tous les nombres seraient égaux à $a$ (mesures parfaites) : c'est un Dirac en $a$.
- Une expérience "moyennement réussie" serait une expérience avec un nombre non-négligeable de nombres légèrement inférieurs à $a$, mais très peu de nombres vraiment inférieurs à $a$.
- Une expérience très ratée serait une expérience avec très peu de nombres égaux à $a$, et une quantité non-négligeable de nombres très inférieurs à $a$ (mesures vraiment ratées).
D'où mon idée : si on construit la fonction de répartition empirique $\hat{F}_n$ des valeurs obtenues à chaque expérience, hé bien plus une expérience est réussie, plus sa fonction de répartition se rapproche de la fonction de répartition d'un Dirac en $a$. (Vous confirmez ?)
Néanmoins, comment puis-je "quantifier" cet écart entre ma fonction empirique et mon Dirac en $a$, pour classer mes expériences de la plus réussie à la plus ratée ?
Merci !
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Est-ce vraiment utile de parler de Dirac, alors que la fonction de répartition idéale est une bête fonction constante par morceaux (fonction de Heaviside translatée) ? C'est à dire H(x)=0 si x<a et H(x)=1 si x>=a.
Ce qui te donne immédiatement une mesure (*) de l'écart en intégrant $H(x)-F_n(x)$ sur $\mathbb R$. A toi de voir si elle te convient, d'autres sont tout aussi envisageables (par exemple l'amplitude de la série, ou l'écart absolu maximum à a, ou l'écart absolu moyen à a, ou l'écart quadratique à a, ou ...)
Cordialement.
(*) mesure signée, donc on peut passer en valeur absolue si nécessaire.
En effet, merci pour cette idée ! Donc, tout bêtement, calculer l'aire comprise entre ma fonction de répartition et la fonction de Heaviside translatée en $a$. Un peu comme dans le test de Kolmogorov-Smirnov, finalement !
Ça me semble convenir très bien, merci à toi (tu)