Semi-variogramme, minimum log vraisemblance
Bonjour à tous
Je suis hydrogéochimiste et je mène un projet d'étude sur une nappe d'eau souterraine alimenté par à 100 % des eaux de surface. Je cherche à évaluer le temps de transfert des eaux de surface vers la nappe grâce au suivi d'un traceur chimique.
Les variations de ce traceur dans les eaux souterraines correspondent à celles dans les eaux de surface via une fonction de transfert. A partir ce de postulat une méthode statistique a été développé pour isoler cette fonction de transfert et déterminer un temps de transfert.
Je viens sur ce forum à la recherche de connaissances et de compétences pour m'aider à mieux comprendre cette méthode statistique en développant ses différentes étapes progressivement.
On considère un transport linéaire entre la rivière et les puits d'observations. La réponse y(t) dans un puits d'observation peut être définie par la convolution suivante : $$ y(t) = \int_0^T g(\tau) x(t-\tau)d\tau \qquad (Eq 1)
$$ avec $g(\tau)$ la fonction de transfert, qui décrit la réponse du système à une variation observée dans la rivière $x$ (type Dirac) $T$ son intervalle de définition. L'objectif de l'étude est de définir cette fonction grâce aux enregistrements en continu de $x$ et $y$.
Après discrétisation on obtient un vecteur x nx X 1 et un vecteur y ny X 1 de mesures d'observations dans la rivière et le puit d'observation et un vecteur g ng X 1 des valeurs discrètes de la fonction de transfert.
L'équation 1 de convolution devient: y = Xg (Eq 2)
avec Xij = $\Delta$txi-j+1
dans laquelle la matrice X ny X ng est créer par la modification du signal entrant x par l'incrément $\Delta$t
On suppose que $g(\tau)$ est une fonction de second ordre de type semi variogramme linéaire :
\begin{align*}
g(\tau)&=\beta+g'(\tau)& ~~~&(Eq 3) \\
E[g'1 (\tau)]&=0,\quad\forall \tau & & (Eq 4) \\
E[\tfrac{1}{2}(g'(\tau+h)-g'(\tau))^{2})] &=\phi_g (h)= \theta |h|,&& (Eq 5)
\end{align*}
avec $\beta$ moyenne uniforme inconnu et $g'(\tau)$ l'écart à la moyenne, $\phi_g(h)$ le semi-variogramme et $\theta$ la pente du variogramme.
Maintenant la fonction de densité de probabilité en appliquant le théorème de Baye est :
$p(g\mid x,y)=\dfrac{p(y|x,g)p(g)}{p(y)} ,\qquad(Eq 6)$
avec $p(g\mid x,y)$ est la vraisemblance du signal de sortie $y$ donné par le signal d'entrée $x$ et la fonction de transfert $g$.
$p(g)$ est la densité de probabilité $g$, et $y$ un scalaire qui ne dépend pas de $g.$
En supposant une fonction de probabilité multi gaussienne pour la vraisemblance et en exprimant $g$ par sa moyenne $\beta$ et son écart $p(g')$. Le logarithme négatif de $ p(g\mid x,y) $ devient : $$
L(g',\beta\mid x,y)= \frac{(y-X(g'+u\beta)).(y-X(g'+u\beta))}{\sigma^2_{ep}} \qquad - g'^{-T}\Gamma^{-1}_{gg} g' + const $$ (Eq 7)
dans laquelle $u$ est un vecteur ng X 1et $\sigma^2_{ep}$ et la variance des écart entre $y$ et le meilleur modèle en sortie. $\sigma^2_{ep}$ quantifie l'erreur épistémique (erreur de mesure/erreur numériques/erreurs hypothèses). On considère cet erreur identique pour tous les éléments de y. $\Gamma_{gg}$ est la matrice discrète ng X ng des valeurs du semi variogramme obtenu pour les paires d'éléments dans $g$.
Les éléments $(i,j)$ de $\Gamma_{gg}$ sont définis par $\Gamma_{gg}(i,j)= \phi_g(|t_i- t_j|),\qquad (Eq 8) $.
Le minium du log de vraisemblance permettra donc de définir la meilleure solution de $g$.
Je souhaite comprendre un peu mieux cette première partie avec votre aide, à savoir l'utilité d'une fonction semi-variogramme et savoir comment est obtenu l'équation numéro 8 à partir des équation 4, 5, 6 et 7 que je comprends
Merci à vous.
Si des informations nécessaires supplémentaires sont nécessaires, n'hésitez pas.
Je suis hydrogéochimiste et je mène un projet d'étude sur une nappe d'eau souterraine alimenté par à 100 % des eaux de surface. Je cherche à évaluer le temps de transfert des eaux de surface vers la nappe grâce au suivi d'un traceur chimique.
Les variations de ce traceur dans les eaux souterraines correspondent à celles dans les eaux de surface via une fonction de transfert. A partir ce de postulat une méthode statistique a été développé pour isoler cette fonction de transfert et déterminer un temps de transfert.
Je viens sur ce forum à la recherche de connaissances et de compétences pour m'aider à mieux comprendre cette méthode statistique en développant ses différentes étapes progressivement.
On considère un transport linéaire entre la rivière et les puits d'observations. La réponse y(t) dans un puits d'observation peut être définie par la convolution suivante : $$ y(t) = \int_0^T g(\tau) x(t-\tau)d\tau \qquad (Eq 1)
$$ avec $g(\tau)$ la fonction de transfert, qui décrit la réponse du système à une variation observée dans la rivière $x$ (type Dirac) $T$ son intervalle de définition. L'objectif de l'étude est de définir cette fonction grâce aux enregistrements en continu de $x$ et $y$.
Après discrétisation on obtient un vecteur x nx X 1 et un vecteur y ny X 1 de mesures d'observations dans la rivière et le puit d'observation et un vecteur g ng X 1 des valeurs discrètes de la fonction de transfert.
L'équation 1 de convolution devient: y = Xg (Eq 2)
avec Xij = $\Delta$txi-j+1
dans laquelle la matrice X ny X ng est créer par la modification du signal entrant x par l'incrément $\Delta$t
On suppose que $g(\tau)$ est une fonction de second ordre de type semi variogramme linéaire :
\begin{align*}
g(\tau)&=\beta+g'(\tau)& ~~~&(Eq 3) \\
E[g'1 (\tau)]&=0,\quad\forall \tau & & (Eq 4) \\
E[\tfrac{1}{2}(g'(\tau+h)-g'(\tau))^{2})] &=\phi_g (h)= \theta |h|,&& (Eq 5)
\end{align*}
avec $\beta$ moyenne uniforme inconnu et $g'(\tau)$ l'écart à la moyenne, $\phi_g(h)$ le semi-variogramme et $\theta$ la pente du variogramme.
Maintenant la fonction de densité de probabilité en appliquant le théorème de Baye est :
$p(g\mid x,y)=\dfrac{p(y|x,g)p(g)}{p(y)} ,\qquad(Eq 6)$
avec $p(g\mid x,y)$ est la vraisemblance du signal de sortie $y$ donné par le signal d'entrée $x$ et la fonction de transfert $g$.
$p(g)$ est la densité de probabilité $g$, et $y$ un scalaire qui ne dépend pas de $g.$
En supposant une fonction de probabilité multi gaussienne pour la vraisemblance et en exprimant $g$ par sa moyenne $\beta$ et son écart $p(g')$. Le logarithme négatif de $ p(g\mid x,y) $ devient : $$
L(g',\beta\mid x,y)= \frac{(y-X(g'+u\beta)).(y-X(g'+u\beta))}{\sigma^2_{ep}} \qquad - g'^{-T}\Gamma^{-1}_{gg} g' + const $$ (Eq 7)
dans laquelle $u$ est un vecteur ng X 1et $\sigma^2_{ep}$ et la variance des écart entre $y$ et le meilleur modèle en sortie. $\sigma^2_{ep}$ quantifie l'erreur épistémique (erreur de mesure/erreur numériques/erreurs hypothèses). On considère cet erreur identique pour tous les éléments de y. $\Gamma_{gg}$ est la matrice discrète ng X ng des valeurs du semi variogramme obtenu pour les paires d'éléments dans $g$.
Les éléments $(i,j)$ de $\Gamma_{gg}$ sont définis par $\Gamma_{gg}(i,j)= \phi_g(|t_i- t_j|),\qquad (Eq 8) $.
Le minium du log de vraisemblance permettra donc de définir la meilleure solution de $g$.
Je souhaite comprendre un peu mieux cette première partie avec votre aide, à savoir l'utilité d'une fonction semi-variogramme et savoir comment est obtenu l'équation numéro 8 à partir des équation 4, 5, 6 et 7 que je comprends
Merci à vous.
Si des informations nécessaires supplémentaires sont nécessaires, n'hésitez pas.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Il est inutile de poster le même message dans des rubrique différentes.
Il est préférable de mettre un message demandant à un modérateur de changer de rubrique.
AD
Désolé je découvre le fonctionnement du forum et ne sait pas exactement sous quelle rubrique lancer cette discussion