Dérivée d'une application entre ev?
dans Algèbre
J'essaye de m'initier à la topologie différentielle, mais ils ont l'air de présupposer qu'on sait ce qu'est une application $C^n$ entre deux espaces vectoriels.
Or je ne sais pas :-(
Et je ne sais pas où on définit ça, vu qu'en topologie différentielle, ils présupposent ça connu. Alors j'ai essayé d'inventer.
Je sais bien ce qu'est la dérivée, par exemple, d'un $f: \R \to \R$. Mais si $E$ et $F$ sont deux espaces vectoriels sur $\R$ de dimension finie et $f: E \to F$, je ne sais pas ce qu'est la dérivée éventuelle de $f$ en un point $\vec a \in E$.
Je me souviens qu'en physique on faisait des choses comme des gradients (quand $F = \R$, des divergences, des rotationnels... Mais on faisait tout ça avec les dérivées partielles. Ça présuppose qu'on a définit des bases, ce que j'aime autant éviter, et en plus, beaucoup de choses semblaient fonctionner «par magie».
Alors j'ai essayé d'inventer.
Je me suis dit que $f'(\vec a)$ doit être un élément de $E^* \otimes F$, ou, ce qui revient au même, une application linéaire $E \to F$.
En termes «de physicien», j'ai pensé qu'il faut que «pour une petite variation $d \vec a$ de $\vec a$», on devait avoir $f'(a)(d \vec a) = d f(\vec a)$. En termes plus rigoureux, avec des limites ça donnerait, que pour tout $\vec u \in E$, on doit avoir:
$f'(\vec a)(\vec u) = \lim_{k \to 0} \frac {f(\vec a + k \vec u) - f(\vec a)} k$
C'est ça?
Si c'est ça, il faut aussi montrer que cet $f'(\vec a)$ (quand il existe) est linéaire. Pour $f'(\vec a)(k \vec u) = k f'(\vec a)(\vec u)$, ça semble facile, mais j'ai l'impression que pour l'addition des vecteurs, ce n'est pas trivial, voire qu'il faut des conditions supplémentaires pour que ce soit vrai.
Vous pouvez me dire si je me mets le doigt dans l'oeil? Et aussi, dans quel domaine de mathématiques on définit ça?
Or je ne sais pas :-(
Et je ne sais pas où on définit ça, vu qu'en topologie différentielle, ils présupposent ça connu. Alors j'ai essayé d'inventer.
Je sais bien ce qu'est la dérivée, par exemple, d'un $f: \R \to \R$. Mais si $E$ et $F$ sont deux espaces vectoriels sur $\R$ de dimension finie et $f: E \to F$, je ne sais pas ce qu'est la dérivée éventuelle de $f$ en un point $\vec a \in E$.
Je me souviens qu'en physique on faisait des choses comme des gradients (quand $F = \R$, des divergences, des rotationnels... Mais on faisait tout ça avec les dérivées partielles. Ça présuppose qu'on a définit des bases, ce que j'aime autant éviter, et en plus, beaucoup de choses semblaient fonctionner «par magie».
Alors j'ai essayé d'inventer.
Je me suis dit que $f'(\vec a)$ doit être un élément de $E^* \otimes F$, ou, ce qui revient au même, une application linéaire $E \to F$.
En termes «de physicien», j'ai pensé qu'il faut que «pour une petite variation $d \vec a$ de $\vec a$», on devait avoir $f'(a)(d \vec a) = d f(\vec a)$. En termes plus rigoureux, avec des limites ça donnerait, que pour tout $\vec u \in E$, on doit avoir:
$f'(\vec a)(\vec u) = \lim_{k \to 0} \frac {f(\vec a + k \vec u) - f(\vec a)} k$
C'est ça?
Si c'est ça, il faut aussi montrer que cet $f'(\vec a)$ (quand il existe) est linéaire. Pour $f'(\vec a)(k \vec u) = k f'(\vec a)(\vec u)$, ça semble facile, mais j'ai l'impression que pour l'addition des vecteurs, ce n'est pas trivial, voire qu'il faut des conditions supplémentaires pour que ce soit vrai.
Vous pouvez me dire si je me mets le doigt dans l'oeil? Et aussi, dans quel domaine de mathématiques on définit ça?
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
(Ce que je veux dire, c'est que j'ai envie d'éviter la case «dérivées partielles», autant que possible. Au moins au niveau des définitions de base.)
e.v.
une telle application $f$ est différentiable en $a \in U$ s'il existe une application linéaire continue $L : E \to F$ telle que pour $||h||_E$ suffisamment petit pour que ça ait un sens, $$f(a+h)=f(a)+L(h)+o(||h||).$$ Cette application linéaire, nécessairement unique, est appelée différentielle de $f$ en $a$, et notée, selon les auteurs, $df_a$, $D_af$, $df(a)$ ou encore $Df(a)$.
Dans le cas où $E = \mathbb R$ on retrouve la notion de dérivabilité usuelle : ici $D_af$ est juste l'application linéaire $h \mapsto f'(a)h$.
Ensuite on peut essayer de généraliser aux ordres supérieurs, mais tu devrais déjà méditer sur cette définition.
(e.v.: une variable vectorielle est une variable, une! On peut évidemment lui faire correspondre une application de l'ensemble des bases vers l'ensemble des n-uplets de scalaires, mais à qui viendrait-il une telle idée? :-D)
Il semblerait que ton espace vectoriel de départ est de dimension finie \( n \), si j'ai bien compris.
L'avantage de travailler avec des scalaires, c'est qu'on peut diviser par iceux si toutefois ils ont la délicatesse d'être non nuls. Pour les vecteurs, c'est une farine d'un autre sac.
Sinon, Poirot - que je salue - écrit les variables scalaires avec une seule lettre, ce qui devrait te faire plaisir.
e.v.
Mais si on travaille avec les scalaires, on est toujours obligés de se demander si le résultat qu'on obtient ne dépend pas du choix de la base. Ça fait une étape de plus.
Quand j'étais petit, j'ai potassé la relativité générale avec partout des tenseurs écrits avec plein d'indices en haut et en bas, pour distinguer ce qui venait de l'espace vectoriel et du dual. C'était super désagréable, et décourageant. Je me souviens qu'on tombait des fois sur des objets qui avaient l'air de tenseurs mais n'en étaient pas (les christoffels, ça s'appelait, je crois) parce qu'ils ne se transforment pas comme il faut dans les changements de base. Tout ça était un énorme désordre.
Là j'ai envie de tout revoir ça en plus propre, et en particulier sans tous ces indices. Je ne dis pas que je ne veux jamais entendre parler de bases, mais que dans l'idéal ça soit juste un outil passager pour une démonstration, quand c'est nécessaire; ou pour mieux visualiser quelque chose.
1) Si $E$ est euclidien, $E\rightarrow \R$, $x\mapsto \langle x_0,x\rangle,$ puis $x\mapsto \|x\|$
2) Si $E$ est un espace vectoriel reel de dimension finie et si $L$ est l'espace des endomorphismes de $E$ , $L\rightarrow \R$, $x\mapsto \mathrm{trace} \, x$, puis $ x\mapsto \det x$
3) $L\rightarrow L$, $x\mapsto x^2$, puis $x\mapsto x^n$.
4) Si $G$ est l'ensemble des elements inversibles de $L$, $G\rightarrow G$, $x\mapsto x^{-1}$
Et on parlera de $L\rightarrow G$ , $x\mapsto e^x$ plus tard.
Concernant la formule donnée par Poirot:
$f(a+h)=f(a)+L(h)+o(||h||)$
ça fait intervenir la norme. Or on est dans un espace vectoriel de dimension finie, qui a une topologie canonique (l'unique qui en fasse un espace vectoriel topologique), et l'introduction d'une norme devrait être superflue. (Même si de fait, le résultat sera le même, quelle que soit la norme choisie.)
J'ai l'impresssion que la formule que j'avais suggérée, qui ne fait pas intervenir de norme, devrait être équivalente:
$L(h) = \lim_{k \to 0} \frac {f(a + kh) - f(a)} k$
$\forall \vec u \in E,\ f'(\vec a)(\vec u) = \lim_{k \to 0} \frac {f(\vec a + k \vec u) - f(\vec a)} k$
Plus précisément, je dis que c'est la dérivée de $f$ en $\vec a$ quand cette limite existe (pour $k \in \R \backslash \{ 0 \}$) et que (condition dont je ne sais pas si elle n'est pas superflue) le résultat (c'est-à-dire $f'(\vec a)$ ainsi défini) est bien linéaire.
Pour parler de limite, je supposais sans le dire que $F$ est muni de sa topologie canonique d'espace vectoriel topologique de dimension finie.
Si ma définition est juste, elle se fait sans choix de base et sans spécification de norme. Elle ne dépend que des deux structures d'espace vectoriel.
Considère la fonction $f:\R^2\to \R$ définie par $f(x,y)=0$ si $x\leq 0$ et $f(x,y)=y\ln(x)$ si $x>0$. Selon toi, cette fonction est dérivable à l'origine et sa dérivée est l'application linéaire nulle.
Merci. C'est ce que je demande depuis le début
Donc les deux définitions ne sont pas équivalentes.
« Si tu as pour but d'étudier la topologie différentielle, le minimum serait que tu utilises la même définition de fonction différentiable que tout le monde.»
Je n'ai pas l'intention de réinventer les mathématiques, et je serai bien obligé de connaître et utiliser les méthodes et notion déjà établies, mais je n'ai pas non plus l'obligation de rester toujours sur des rails avec des oeillères. Paul Halmos disait:
«Don't just read it; fight it! Ask your own questions, look for your own examples, discover your own proofs. Is the hypothesis necessary? Is the converse true? What happens in the classical special case? What about the degenerate cases? Where does the proof use the hypothesis?»
et c'est bien un peu (modestement) dans cet esprit que je tente d'avancer.
Je crois avoir lu un jour que Gromov (je crois) avait dit (je vais probablement beaucoup déformer) que l'égalité (hautement accidentelle !) $2+2 = 2\times 2$ était très, très intéressante ! D'ailleurs, si quelqu'un voit de quoi je parle, connaissez-vous la citation exacte ?
Je ne sais donc pas ce que GaBuZoMeu voulait montrer par cet exemple.
Sauf que ça illustre bien la nécessité de spécifier, dans ma définition, que l'objet «dérivée en un point» doit être linéaire. Ce fait se voit encore mieux sur une application $f: \R^2 \to \R, (x, y) \mapsto (x = y = 0\ ?\ 0 : \frac {xy} {\sqrt {x^2 + ÿ^2}})$, qui est continue et a partout des dérivées partielles du premier ordre, et est en fait «dérivable selon n'importe quelle direction», mais telle que ces dérivées «selon une direction» ne permettent pas de constituer une application linéaire, au moins à l'origine (la fonction n'a pas de gradient à l'origine, en somme).
À la réflexion, il m'apparaît bien qu'en fait, les deux définitions - la mienne et la définition officielle avec $o(...)$ - sont équivalentes; sauf que la seconde s'applique aussi dans le cas d'un espace à dimension infinie, nécessitant alors le choix d'une norme.
Une expression mathématique est censée nommer une entité. $o(x)$ ne nomme pas une entité (la valeur d'une fonction $o$ en $x$), mais un comportement.
Si on écrit $a(x) = b(x) + o(x)$ et $c(x) = d(x) + o(x)$, on doit être en droit d'en conclure que $a(x) - b(x) = c(x) - d(x)$. Or en fait, non. Le fait qu'on ne puisse pas implique une entorse à toutes les règles concernant la notion d'égalité, ce qui n'est pas rien.
Ce n'est pas une question de purisme. Je n'ai pas de problème avec les notations impropres quand elles sont utilisées de manière informelle, mais pas quand elles sont gravées dans le marbre.
Mais bon, si les gens l'utilisent...
@Poirot: Le livre que tu cites, de Wolfgang Bertram, semble effectivement très intéressant. D'autant que ce qui m'intéresse en pratique c'est bien la dimension finie (si j'ai bien compris, les variétés différentielles se limitent à ça; en tout cas, le problème en relativité générale est en dimension 4).
@GaBuZoMeu: Tu dis «J'ai l'impression que tu te mets toi-même des oeillères avec tes "je ne veux pas de coordonnées", "je ne veux pas de norme", "je ne veux pas de o" ...» ? Je ne dis pas «je ne veux pas», je dis «je préfère éviter, voyons si c'est possible.» De façon générale, les contraintes peuvent être fécondes. De plus, il y a un lien entre l'habitude de définir une base d'espace vectoriel et notre habitude de raisonner en physique dans un référentiel. C'est une habitude qui tend à nous faire adopter un point de vue particulier, subjectif, au détriment du raisonnement sur l'objet en soi.
> Considère la fonction $f:\R^2\to \R$ définie par
> $f(x,y)=0$ si $x\leq 0$ et $f(x,y)=y^2\ln(x)$ si
> $x>0$. Selon toi, cette fonction est dérivable à
> l'origine et sa dérivée est l'application
> linéaire nulle.
C'est faux.
Correction: En fait, effectivement non. Dans le cas de la définition «officielle», ça ne marche pas; quand on fait tendre la direction de dérivation vers l'axe des x, le $||h||$ a besoin d'être de plus en plus proche de l'origine pour que ça converge.
Question: toutes les topologies séparées compatibles avec la structure d'espace vectoriel découlent-elles de normes?
(En effet: ma question de départ concernait la dérivation d'une application linéaire d'un espace vectoriel de dimension quelconque vers un autre. Cela présuppose qu'on ait muni ces espaces d'une topologie. Si la définition de la dérivée implique forcément la norme, et qu'il existe des topologies qui ne dérivent pas de normes, alors elle ne s'applique pas dans tous les cas.)
Et pour le $o(x)$, tu peux définir $o(x)$ comme étant l'ensemble des fonctions qui divisées par $x$ tendent vers $0$, et donc au lieu d'écrire $a(x) = o(x)$, tu peux écrire $a(x) \in o(x)$, ce qui devient correct ! Moi non plus, je n'aime pas ces notations. Et souvent, je note $\epsilon(x)$ la fonction qui divisée par $x$ tend vers $0$, et je la mène au bout du calcul. Mais bon... Je rêve d'être un jour virtuose en manipulation de $o$ !
Non je regrette. Toute distance équivalente (qui fournira la même topologie) à une distance bornée est elle-même bornée. Donc toute distance fournissant la même topologie que celle proposée ne proviendra pas d'une norme. Donc une topologie métrique avec une distance bornée quelconque founrit un exemple de topologie ne provenant pas d'une norme.
Ceci est faux, et je l'ai expliqué au-dessus.
Si ça ne te convainc pas, il y a un exercice classique de topologie qui demande de montrer que $|.|$ et $(x,y) \mapsto |\arctan(x)-\arctan(y)|$ fournissent les mêmes topologies.
Bonne journée :)o