Calcul différentiel

student2 · October 2017

Comment trouve-t-on le gradient (en w) du quotient de Rayleigh suivant: $r(w)=(w^tAw)/(w^tBw)$ ? Avec $A$ et $B$ symétriques définies positives)
Je trouve que $\nabla(w^tAw)=(A+A^t)w=2Aw$ et idem pour $B$.
$\nabla(d:(x,y) \to x/y)=(-x/y^2,1/y)^t$
Après j'imagine qu'avec la chain rule ça devrait se dérouler mais force est de constater que je n'y arrive pas !

student2 · October 2017

En fait ma question vient du fait que je cherche à maximiser ce quotient de Rayleigh (sous la contrainte w de norme 1). Et ça fait 1h que je cherche en vain!)

YvesM · October 2017

Bonjour,

Est-ce une bêtise d'écrire, sans réfléchir et à la physicienne, $\displaystyle {\partial \over \partial w} r(w) = {\partial \over \partial w} {w^TAw \over w^TBw} = {2(w^TBw)A w - 2(w^TAw) Bw \over (w^TBw)^2}.$ L'optimum est obtenu pour le vecteur (unitaire) qui rend $\displaystyle Aw$ et $\displaystyle Bw$ colinéaire : $\displaystyle Aw = r(w) B w.$

gebrane · October 2017

Il se fait tard je donne le resultat
$$\nabla r(w)= \frac 2{w^TBw} [{A w - r(w)Bw }]$$

student2 · October 2017

Merci, bon bizarrement mon enseignant qui a donné juste le résultat n'obtient pas la même chose:il obtient $w$ proportionnel à $B^{-1}(\mu_1-\mu_2)$. (avec $A=(\mu_1-\mu_2)(\mu_1-\mu_2)^t$ et $B=\pi_1\Sigma_1+(1-\pi_1)\Sigma_2)$
@ Yves M: tu as l'air très à l'aise avec le calcul différentiel (ce qui n'est pas mon cas). Peux tu dévelloper un tout petit peu plus ton calcul ?
Car je vois bien que tu utilises la formule $(u'v-uv')/v^2$ où $v$ désigne le dénominateur, alors que moi je repasse par les étapes qui est composé avec quoi, puis je calcul la différentielle (par la formule de composition) et enfin le gradient.

Je suis toujours impressionné par la rapidité de calcul des physiciens!

@Gebrane: si tu es aussi ok pour dévelloper ton résultat ça m'interesse pour comparer à la méthode de Yves M!

gebrane · October 2017

Commence par calculer le gradient de $x\to x^T Ax$

P. · October 2017

Ton professeur a raison. Posons $m=\mu_1-\mu_2$ pour simplifier. Alors $A=mm^t$ (et ne dis pas que $A$ est definie positive, svp}. Il faut resoudre $Aw\langle w,Bw\rangle=Bw\langle w,Aw\rangle$ ou $$m\langle m,w\rangle\langle w,Bw\rangle=Bw\langle w,m\rangle^2$$ Ecartons la solution $\langle m,w\rangle=0$ et simplifions:$$m\langle w,Bw\rangle=Bw\langle w,m\rangle $$ et donc $w=cB^{-1}m$ ou $c$ est le nombre $ \langle w,Bw\rangle/\langle w,m\rangle $ On prend $c=1/\|B^{-1}m\|$

student2 · October 2017

@P on a du omega des deux côtés de l' égalité; ça me perturbe... êtes vous certain qu' on puisse poser c comme vous le faite?

A est symetrique et positive; non?

student2 · October 2017

À gebrane: quelle est la suite de compositions que tu effectues avant d'appliquer la formule de composition ? Peux-tu détailler ton calcul ?

Moi j'obtiens le résultat au prix de 10 lignes !

P. · October 2017

$A$ est symetrique et positive, ca oui, mais definie positive pour $n>1$, non. Quant a la valeur de $c,$ verifie que $c=1/\|B^{-1}m\|$ donne la meme valeur avec l'autre expression qui utilise $w.$

gebrane · October 2017

Pourquoi ne veux-tu pas montrer tes calculs? La flemme d'ecrire?

student2 · October 2017

Non.

gebrane · October 2017

Illisible pour moi

student2 · October 2017

Comment t y prends tu toi?

gebrane · October 2017

Si je note $F(x)=\dfrac {x^T A x}{x^T Bx},\quad \forall x\in\R^n$ alors $F(x)=\dfrac {\sum_{i=1}^n \sum_{j=1}^n a_{i,j} x_i x_j}{\sum_{i=1}^n \sum_{j=1}^n b_{i,j} x_i x_j}$ et tu calcules $\dfrac {\partial F}{\partial x_k}$

student2 · October 2017

Merci. Ah oui en fait c'est aussi fastidieux que ce que j' ai fait... je suis curieux de savoir comment Yves a procédé ?

@Yves??

gebrane · October 2017

La forme que je t'ai donné te prouve facilement que lorsque A est symétrique , $\nabla (x^T Ax)=2Ax$ ce que tu as utilisé sans le prouver dans ton envoi

student2 · December 2017

Bonjour, après m'être affûté au calcul différentielle je reviens fièrement vous présenter ma preuve

J'utilise les règles classiques du calcul différentiel.

https://snag.gy/OYKeur.jpg

math2 · December 2017

$g\circ f$ s'applique à un vecteur de $\R^n$ donc dans les premières lignes de la formule de composition on devrait lire des $w$ et non des $x$

math2 · December 2017

sinon mis à part cette "imprécision" (pas dramatique car il s'agit de variables muettes), ça m'a l'air juste.

student2 · February 2018

Bonjour,

Qu'uelles sont les points critiques du quotient de [large]R[/large]ayleigh ? Puis je dire que si $B$ est inversible ce sont les vecteurs propres de $B^{-1}A$

[John William Strutt, baron Rayleigh (1842-1919) prend toujours une majuscule. AD]

gebrane · February 2018

Si B=I (Matrice identité), c'est vrai. Dans ton cas il faut refaire les calculs

Calcul différentiel

Réponses

Bonjour!

Catégories

In this Discussion

Qui est en ligne 31