Stricte convexité d'une fonction
dans Analyse
Bonsoir.
Je suis un peu bloqué (pour ne pas dire perturbé) sur une question d'un DM d'optimisation. Pourriez-vous m'aiguiller s'il vous plaît ?
On s'intéresse à l'ensemble $K$ des matrices symétriques définies positives de $M_{d}(\mathbb{R})$ (muni de la norme de Frobenius).
On montre que $K \cup \lbrace 0 \rbrace$ est un cône convexe, on calcule l'adhérence de $K$. On montre que $K$ est ouvert dans l'espace des matrices symétriques.
Soit $f : A \mapsto - \log(\det (A))$ définie sur $K$. On montre que $f$ est continue sur $K$ et que pour tout $B \in \partial K$ (qui est la frontière dans l'espace des matrices symétriques ?), on a : $$\lim_{A \in K ,\ A \to B} f(A) = + \infty .
$$ Soient $A \in K$, $M$ une matrice symétrique et $T > 0$ tels que pour tout $t \in [-T,T]$, on a $A + TM \in K$.
Pour $t \in [-T,T]$, on a alors $( \star )$ : $$ f(A+tM) = f(A) - \Sigma_{i} \log (1 + t \mu_{i}) ,
$$ où les $\mu_{i}$ sont les valeurs propres de $A^{-1/2} M A^{-1/2}$.
On en déduit que $f$ est différentiable au sens de Gateaux sur $K$ et que le gradient en $A$ vaut $-A^{-1}$.
En utilisant $( \star )$ (en utilisant ou en remontrant $( \star )$ plutôt ?), on montre que pour $A$ et $B$ dans $K$, la fonction $g : t \mapsto f(A+tB)$ est de classe $C^{2}$. On calcule sa dérivée et sa dérivée seconde à l'aide des valeurs propres de $A^{-1/2} B A^{-1/2}$.
Il est alors demandé d'en déduire que $f$ est strictement convexe. Il m'est difficile de voir pourquoi $g$ joue un rôle pertinent dans cette question, j'ai l'impression que le fait que $B$ soit dans $K$ est assez contraignant. J'ai du mal à voir la déduction demandée.
Merci d'avance pour vos réponses.
Amicalement.
Je suis un peu bloqué (pour ne pas dire perturbé) sur une question d'un DM d'optimisation. Pourriez-vous m'aiguiller s'il vous plaît ?
On s'intéresse à l'ensemble $K$ des matrices symétriques définies positives de $M_{d}(\mathbb{R})$ (muni de la norme de Frobenius).
On montre que $K \cup \lbrace 0 \rbrace$ est un cône convexe, on calcule l'adhérence de $K$. On montre que $K$ est ouvert dans l'espace des matrices symétriques.
Soit $f : A \mapsto - \log(\det (A))$ définie sur $K$. On montre que $f$ est continue sur $K$ et que pour tout $B \in \partial K$ (qui est la frontière dans l'espace des matrices symétriques ?), on a : $$\lim_{A \in K ,\ A \to B} f(A) = + \infty .
$$ Soient $A \in K$, $M$ une matrice symétrique et $T > 0$ tels que pour tout $t \in [-T,T]$, on a $A + TM \in K$.
Pour $t \in [-T,T]$, on a alors $( \star )$ : $$ f(A+tM) = f(A) - \Sigma_{i} \log (1 + t \mu_{i}) ,
$$ où les $\mu_{i}$ sont les valeurs propres de $A^{-1/2} M A^{-1/2}$.
On en déduit que $f$ est différentiable au sens de Gateaux sur $K$ et que le gradient en $A$ vaut $-A^{-1}$.
En utilisant $( \star )$ (en utilisant ou en remontrant $( \star )$ plutôt ?), on montre que pour $A$ et $B$ dans $K$, la fonction $g : t \mapsto f(A+tB)$ est de classe $C^{2}$. On calcule sa dérivée et sa dérivée seconde à l'aide des valeurs propres de $A^{-1/2} B A^{-1/2}$.
Il est alors demandé d'en déduire que $f$ est strictement convexe. Il m'est difficile de voir pourquoi $g$ joue un rôle pertinent dans cette question, j'ai l'impression que le fait que $B$ soit dans $K$ est assez contraignant. J'ai du mal à voir la déduction demandée.
Merci d'avance pour vos réponses.
Amicalement.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Peut-être que des détails m´échappent, mais puisque $K$ est ouvert, non, ce n´est pas contraignant que $B\in K$, puisqu´on étudie ce qui se passe pour $A+tB$, avec $t = 0$.
Visiblement on veut que l'on regarde $g'$ ou $g''$, $B$ interviendra automatiquement, non ?
Ta fonction $f$ est définie sur un ouvert d´un sous-espace vectoriel. (ici les matrices symétriques)
C´est sur ce sous-espace vectoriel que sa différentielle est définie, et sa hessienne est est définie sur ce sev aussi.
Si $d>1$, on peut considérer la suite $( 1/n E_{1,2} )$ qui converge vers la matrice nulle qui est symétrique.
Il faudrait voir comment l´énoncé s´exprime exactement au début du sujet, mais à coup sûr, ça doit bien être ça.
PS : Nul part on fait mention de l'espace des matrices symétriques sinon dans cette définition de "relativement ouvert". Au tout début de l'énoncé, on munit $M_{d} (\mathbb{R} )$ de la norme de Frobenius et on précise que c'est une norme euclidienne associée à un produit scalaire sur $M_{d} (\mathbb{R} )$.
Si ça marche pas , désolé pour le bruit ( je suis de passage)
Voici ce que j'ai trouvé.
Soient $A$ et $B$ deux matrices distinctes de $K$. Soit $\phi : t \mapsto \dfrac{f(A + t (B-A)) - f(A)}{t}$ définie sur $]0,1]$. On veut montrer que $\phi$ est strictement croissante. Pour $t \in ]0,1]$, on a $$ \phi (t) = \frac{f(A + tB) - f(A)}{t} - \sum_{i} \frac{\log(1+t \mu _{i})}{t} ,
$$ où les $\mu _{i} < 0$ sont les valeurs propres de $- (A + tB)^{-1/2} A (A+tB)^{-1/2}$.
Or, si $i \in \lbrace 1,\ldots,d \rbrace$, on a $t \mapsto - \log( 1 + t \mu _{i} )$ convexe donc $t \mapsto \dfrac{- \log( 1 + t \mu _{i} )}{t}$ croît.
$g$ étant strictement convexe, $f$ l'est donc également.
$$(\det{A})^{1-\alpha} < \det{(\alpha I+(1-\alpha)A)} .
$$ Pour le voir, tu as toutes les valeurs propres de $A$ sont strictement positives, notons-les, $\lambda_i$, $\ \det{A} = \prod_i \lambda_i$ , on a
$\det{(\alpha I+(1-\alpha )A)} = \prod_i (\alpha +(1-\alpha )\lambda_i)$ et trivialement tu peux voir que $0< \lambda_i^{1-\alpha } < \alpha +(1-\alpha )\lambda_i . $
Ajout d'une manière générale, on a $a^\alpha b ^{1-\alpha} \le \alpha a +(1-\alpha)b ,\quad \forall a,b \ge 0, \ \forall 0\lt \alpha\lt 1$
Soient $A, B \in K$, $A \neq B$ et $t \in ]0,1[$. Il vient : $$ f(tA + (1-t) = f(B) - \log (\det ((1-t)I + tB^{-1/2} A B^{-1/2} ) ) = f(B) - \Sigma _{i} \log (1-t + t \mu _{i}) ,$$
où les $\mu _{i}$ sont les valeurs propres de $B^{-1/2} A B^{-1/2} \in K$.
Par stricte convexité de la fonction $- \log$, on a donc $ f(tA + (1-t) < f(B) -t \Sigma _{i} \log \mu _{i}$, car un des $\mu _{i}$ est différent de $1$, d'où la stricte convexité de $f$.
Finalement, la proposition $(\star )$ aurait peut-être due être posée autrement je pense. Merci pour votre coopération !