Calcul différentiel
Comment trouve-t-on le gradient (en w) du quotient de Rayleigh suivant: $r(w)=(w^tAw)/(w^tBw)$ ? Avec $A$ et $B$ symétriques définies positives)
Je trouve que $\nabla(w^tAw)=(A+A^t)w=2Aw$ et idem pour $B$.
$\nabla(d:(x,y) \to x/y)=(-x/y^2,1/y)^t$
Après j'imagine qu'avec la chain rule ça devrait se dérouler mais force est de constater que je n'y arrive pas !
Je trouve que $\nabla(w^tAw)=(A+A^t)w=2Aw$ et idem pour $B$.
$\nabla(d:(x,y) \to x/y)=(-x/y^2,1/y)^t$
Après j'imagine qu'avec la chain rule ça devrait se dérouler mais force est de constater que je n'y arrive pas !
Réponses
-
En fait ma question vient du fait que je cherche à maximiser ce quotient de Rayleigh (sous la contrainte w de norme 1). Et ça fait 1h que je cherche en vain!)
-
Bonjour,
Est-ce une bêtise d'écrire, sans réfléchir et à la physicienne, $\displaystyle {\partial \over \partial w} r(w) = {\partial \over \partial w} {w^TAw \over w^TBw} = {2(w^TBw)A w - 2(w^TAw) Bw \over (w^TBw)^2}.$ L'optimum est obtenu pour le vecteur (unitaire) qui rend $\displaystyle Aw$ et $\displaystyle Bw$ colinéaire : $\displaystyle Aw = r(w) B w.$ -
Il se fait tard je donne le resultat
$$\nabla r(w)= \frac 2{w^TBw} [{A w - r(w)Bw }]$$Le 😄 Farceur -
Merci, bon bizarrement mon enseignant qui a donné juste le résultat n'obtient pas la même chose:il obtient $w$ proportionnel à $B^{-1}(\mu_1-\mu_2)$. (avec $A=(\mu_1-\mu_2)(\mu_1-\mu_2)^t$ et $B=\pi_1\Sigma_1+(1-\pi_1)\Sigma_2)$
@ Yves M: tu as l'air très à l'aise avec le calcul différentiel (ce qui n'est pas mon cas). Peux tu dévelloper un tout petit peu plus ton calcul ?
Car je vois bien que tu utilises la formule $(u'v-uv')/v^2$ où $v$ désigne le dénominateur, alors que moi je repasse par les étapes qui est composé avec quoi, puis je calcul la différentielle (par la formule de composition) et enfin le gradient.
Je suis toujours impressionné par la rapidité de calcul des physiciens!
@Gebrane: si tu es aussi ok pour dévelloper ton résultat ça m'interesse pour comparer à la méthode de Yves M! -
Commence par calculer le gradient de $x\to x^T Ax$Le 😄 Farceur
-
Ton professeur a raison. Posons $m=\mu_1-\mu_2$ pour simplifier. Alors $A=mm^t$ (et ne dis pas que $A$ est definie positive, svp}. Il faut resoudre $Aw\langle w,Bw\rangle=Bw\langle w,Aw\rangle$ ou $$m\langle m,w\rangle\langle w,Bw\rangle=Bw\langle w,m\rangle^2$$ Ecartons la solution $\langle m,w\rangle=0$ et simplifions:$$m\langle w,Bw\rangle=Bw\langle w,m\rangle $$ et donc $w=cB^{-1}m$ ou $c$ est le nombre $ \langle w,Bw\rangle/\langle w,m\rangle $ On prend $c=1/\|B^{-1}m\|$
-
À gebrane: quelle est la suite de compositions que tu effectues avant d'appliquer la formule de composition ? Peux-tu détailler ton calcul ?
Moi j'obtiens le résultat au prix de 10 lignes ! -
$A$ est symetrique et positive, ca oui, mais definie positive pour $n>1$, non. Quant a la valeur de $c,$ verifie que $c=1/\|B^{-1}m\|$ donne la meme valeur avec l'autre expression qui utilise $w.$
-
Pourquoi ne veux-tu pas montrer tes calculs? La flemme d'ecrire?Le 😄 Farceur
-
Non.
-
Illisible pour moiLe 😄 Farceur
-
Comment t y prends tu toi?
-
Si je note $F(x)=\dfrac {x^T A x}{x^T Bx},\quad \forall x\in\R^n$ alors $F(x)=\dfrac {\sum_{i=1}^n \sum_{j=1}^n a_{i,j} x_i x_j}{\sum_{i=1}^n \sum_{j=1}^n b_{i,j} x_i x_j}$ et tu calcules $\dfrac {\partial F}{\partial x_k}$Le 😄 Farceur
-
La forme que je t'ai donné te prouve facilement que lorsque A est symétrique , $\nabla (x^T Ax)=2Ax$ ce que tu as utilisé sans le prouver dans ton envoiLe 😄 Farceur
-
Bonjour, après m'être affûté au calcul différentielle je reviens fièrement vous présenter ma preuve
J'utilise les règles classiques du calcul différentiel.
https://snag.gy/OYKeur.jpg -
$g\circ f$ s'applique à un vecteur de $\R^n$ donc dans les premières lignes de la formule de composition on devrait lire des $w$ et non des $x$
-
sinon mis à part cette "imprécision" (pas dramatique car il s'agit de variables muettes), ça m'a l'air juste.
-
Bonjour,
Qu'uelles sont les points critiques du quotient de [large]R[/large]ayleigh ? Puis je dire que si $B$ est inversible ce sont les vecteurs propres de $B^{-1}A$
[John William Strutt, baron Rayleigh (1842-1919) prend toujours une majuscule. AD] -
Si B=I (Matrice identité), c'est vrai. Dans ton cas il faut refaire les calculsLe 😄 Farceur
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.2K Toutes les catégories
- 9 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 63 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 313 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 773 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres