Convexité

student2 · November 2017

Bonjour
Un peu d'apprentissage.

Cadre: la régression logistique et le réseau de neurones à une couche.
Exercice 1: http://cedric.cnam.fr/vertigo/Cours/ml2/tpDeepLearning1.html
La fonction de coût utilisée pour comparer une distribution supervisée discrète $\hat{y_i}$ et la véritable distribution (1 sur la composante qui est la bonne catégorie) $y_i^*$ est donnée par l'entropie croisée : $\mathcal{L}_{\mathbf{W},\mathbf{b}}(\mathbf{\hat{y_i}}, \mathbf{y_i^*}) = -\sum\limits_{c=1}^{10} y_{c,i}^* \log(\hat{y}_{c,i}) = - \log(\hat{y}_{c^*,i})$.

Le résultat final du coût est donné par : $\ \mathcal{L}_{\mathbf{W},\mathbf{b}}(\mathcal{D}) = - \frac{1}{N}\sum\limits_{i=1}^{N} \log(\hat{y}_{c^*,i}),$
où l'on rappelle que : $ \widehat{y_{c,i}}=\big(:= p(\widehat{y_{c,i}} \mid \mathbf{x_i}) \big) \dfrac{e^{\langle \mathbf{x_i} ; \mathbf{w_{c}}\rangle + b_{c}}}{\sum\limits_{c'=1}^{10} e^{\langle \mathbf{x_i} ; \mathbf{w_{c'}}\rangle + b_{c'}}} $

Peut-on dire que $\mathcal{L}_{\mathbf{W},\mathbf{b}}(\mathcal{D}) $ est convexe en $W,b$ ? J'ai envie de dire non mais bizarrement en le traçant sous géogebra dans un cas simple : une dimension on voit une fonction qui est bien convexe dans le cas d'un unique exemple. Alors je me dis que mon intuition est peut être fausse..

student2 · November 2017

En tout cas la fonction $-\log$ est bien convexe, je dois donc vérifier que la fonction softmax est bien convexe [Faux] (la convexité est, il me semble, stable par composition).

Je vais devoir procéder autrement

student2 · November 2017

Pour préciser la question: montrer que J :
http://ufldl.stanford.edu/wiki/images/math/7/6/3/7634eb3b08dc003aa4591a95824d4fbd.png
est convexe en $\theta$ (on notera que le biais à disparu car il est désormais inclus dans $\theta$ )

student2 · November 2017

Une fonction de plusieurs variables est strictement convexe si sa hessienne est définie positive. Peut être qu'en explicitant le déterminant de la hessienne... pas évident!

Convexité

Réponses

Bonjour!

Catégories

In this Discussion

Qui est en ligne 19