Continuité des racines d'un polynôme — Les-mathematiques.net The most powerful custom community solution in the world

Continuité des racines d'un polynôme

Modifié (7 Mar) dans Analyse
Salut à tous
En me baladant sur internet, j'ai lu ceci sur un forum.
Question. Je suis certainement un peu fatigué mais comment montrer de manière optimale la continuité des racines (complexes) par rapport à un polynôme non nul ?

Réponse. Avec des outils hors programme (fonctions holomorphes) il y a une belle démo.
Voir un article de Nicolas Tosel dans la RMS 120-4.
Je pense qu'il veut dire qu'il suffit de montrer que les racines d'un polynôme sont holomorphes. Je suis très intéressé, avez-vous un lien pour en savoir plus s'il vous plaît !

Réponses

  • Il paraît qu'on peut utiliser Rouché ou le théorème d'inversion locale. Les deux méthodes m'intéressent si quelqu'un a des liens pour avoir un énoncé rigoureux et une preuve rigoureuse.
  • J'ai vu qu'il y avait une application aux valeurs propres. Au voisinage d’une matrice réelle $A$ possédant $n$ valeurs propres réelles distinctes les matrices $M$ gardent $n$ valeurs propres distinctes et que ces dernières peuvent s’exprimer comme des fonctions $C^{\infty}$ de $M$.
  • La dernière application, c'est juste le théorème des fonctions implicites.
    Si tu veux une vraie application de la continuité des racines : il existe $n$ fonction continues $\lambda_1\leq \lambda_2\leq ... \leq \lambda_n$ de l'ensemble $S_n$ des matrices symétriques réelles de taille $n$ dans $\mathbb R$ telles que pour tout $M\in S_n$, $\lambda_1(M),\ldots,\lambda_n(M)$ sont les valeirs propres de $M$ (comptées avec multiplicités).

    Une démonstration de la continuité des racines (elle est chez Bourbaki, je crois). On considère l'application $(P^1(\mathbb C))^n\to P^n(\mathbb C)$ donnée par
    $$ ((a_i:b_i))_{i=1,\ldots,n} \longmapsto \prod_{i=1}^n (a_iX-b_iY)\;,$$
    en identifiant l'ensemble des polynômes non nuls homogènes de degré $n$ en $X,Y$, à un facteur scalaire près, à $P^n(\mathbb C)$
    Cette application est continue et induit une bijection continue en passant au quotient par l'action du groupe symétrique : $(P^1(\mathbb C))^n/\mathfrak{S}_n\to P^n(\mathbb C)$. Comme c'est une bijection continue entre espaces compacts, c'est un homéomorphisme.
    Cet homéomorphisme se restreint en un homéomorphisme de $\mathbb C^n/\mathfrak{S}_n$ sur l'espace des polynômes unitaires de degré $n$ en une variable.
  • side, tu n'as pas dû bien lire. Le résultat est bien sûr vrai, relis-le.
  • Pour Side, je pense qu'il faut comprendre que les polynômes sont de même degré.

    Je ne connaissais pas la démo de Bourbaki.

    Rouché fonctionne très bien, le TFI aussi dans le cas des racines simples.

    Voici un argument très élémentaire qui devrait fonctionner, enfin qui en tout cas établit un énoncé "proche" : si une suite $(P_n)_n$ converge vers un polynôme $P$, il y a convergence des coefficients de $P_n$ vers ceux de $P$ qui sont donc tous bornés par une constante absolue $M$. Maintenant, si l'on prend une suite $(\lambda_n)_n$ t.q. $P_n(\lambda_n)=0$, les coefficients de $P_n$ étant uniformément bornés, il en est de même de ses racines, de sorte que la suite $(\lambda_n)_n$ est bornée. Par extraction, elle a donc une limite $\lambda$, et en passant à la limite dans $P_n(\lambda_n)=0$ (sur la suite extraite bien sûr) on obtient $P(\lambda)=0$. Ainsi toutes les suites de racines ont des valeurs d'adhérence, qui ne peuvent être que des racines de $P$.
  • Gentil : les racines d'un polynômes ne sont pas des fonctions holomorphes des coefficients, même si le degré du polynôme est constant. Prend par exemple la famille de polynômes $P_t(X) = X^2-t$, pour $t \geq 0 $ on trouve $\{\pm \sqrt t\}$ comme ensemble de racines et il est bien connu que la racine carrée n'est pas holomorphe en $0$. Si je ne dis pas de bêtises on peut montrer que les racines d'un polynôme de degré $n$ sont $1/n$-hölderiennes en les coefficients du polynôme, mais pas mieux.

    Avec le théorème des résidus on a aussi un démonstration simple. Soit $(P_t)_{t\in \R}$ une famille de polynômes de degré $n$, continue en $t$ et soit $\lambda$ une racine de $P_0$ de multiplicité $k$. Pour tout $r>0$ assez petit on sait que $P_0$ n'a pas d'autres racines dans $\overline D(\lambda,r)$, d'après le théorème des résidus on a donc
    \[\frac{1}{2i\pi}\int_{\partial D(\lambda,r) } \frac{P'_0(z)}{P_0(z)} dz = k \]

    Puisque $P_0$ ne s'annule pas sur le compact $\partial D(\lambda,r)$ et que c'est une fonction continue il existe un réel $\varepsilon >0 $ tel que $|P_0|$ soit supérieur à $\varepsilon$ sur $\partial D(\lambda,r)$. Par conséquent l'application
    \[
    t\mapsto \frac{P'_t}{P_t}
    \]
    est continue sur $\partial D(\lambda,r)$ pour la norme $\| \cdot\|_\infty$ et donc bornée sur un voisinage de $0$. Par continuité sous l'intégrale la fonction
    \[t\mapsto \frac{1}{2i\pi}\int_{\partial D(\lambda,r) } \frac{P'_t(z)}{P_t(z)} dz \]
    est continue sur un voisinage de $0$, comme cette intégrale ne prend que des valeurs entières la fonction est constante sur un voisinage de $0$. Les racines de $P_t$ varient donc bien continûment par rapport à $t$.
  • Bah si on ne fixe pas le degré, comme tu le fais remarquer on aura un problème de nombres de racines, mais en plus on va travailler sur l'e.v. des polynômes, pour lequel on devra préciser la topologie [ce qui n'est bien entendu pas nécessaire si on se restreint à un degré fixé].
  • Corto je n'ai pas compris le passage avec la compacité.
    Si $P_0$ ne s'annule pas sur le cercle alors $t\mapsto P'_t/P_t$ est continue en $0$ pour la norme infinie donc bornée au voisinage de ce point non?
  • Dans le message de GaBuZoMeu, qu'est-ce que les ensembles $P_i(\mathbb{C})$ avec $i=1$ ou $n$?

    Quelle topologie on met dessus ?

    Merci
  • L'application \[
    t\mapsto \left\| \frac{P'_t}{P_t}\right\|_{L^\infty(\partial D(\lambda,r))}
    \]
    est effectivement continue au voisinage de $0$, mais ce n'est pas complètement évident. La compacité de $\partial D(\lambda,r)$ permet d'en donner une démonstration. Par exemple la fonction $1/(1+t)^2$ est strictement positive sur $\R$ mais $1/f$ n'y est pas bornée.
  • Ok je vois la non annulation de $P_0$ ne donne pas la continuité directement.

    Je ne comprends pas ton argument avec la compacité, autrement je ne comprends pas pourquoi $|P_0|$ supérieur à $\varepsilon$ implique la continuité de $t\mapsto \left\| \frac{P'_t}{P_t}\right\|_{L^\infty(\partial D(\lambda,r))}$.

    Peux-tu détailler ?
  • $P_1(\mathbb C)$ est la droite projective complexe (la sphère de Riemann), et $P_n(\mathbb C)$ est l'espace projectif de dimension $n$ sur $\mathbb C$, réalisé ici comme le projectifié de l'espace vectoriel des polynômes homogènes de degré $n$ en $X,Y$ (qui est bien un espace vectoriel de dimension $n+1$).

    Je reviens sur le contre-exemple-qui-n'en-est-pas-un de side, parce qu'il permet de bien voir le rôle de l'homogénéisation qui permet de récupérer l'argument magique de compacité.

    Je me permets de le modifier un tout petit peu, et j'homogénéise :
    $$P_{\epsilon}=\epsilon X^2+ (1+\epsilon)XY+ Y^2=(\epsilon X+Y)(X+Y)\;.$$Quand $\epsilon\to 0$, on se retrouve avec $P=Y(X+Y)$.
    Du côté des zéros projectifs, on a les zéros $(-1:\epsilon)$ et $(-1:1)$ pour $P_{\epsilon}$ et les zéros $(-1:0)$ et $(-1:1)$ pour $P$. Aucun problème pour la continuité des zéros. Mais quand on déshomogénéise, un des zéros ($-1/\epsilon$) part à l'infini, et ça correspond à la chute de degré à la limite. Grâce à l'homogénéisation et au travail dans le projectif, on évite ce phénomène.
  • Smith : ce n'est pas très dur, il suffit montrer que si les coefficients de $P_t$ convergent vers ceux de $P_0$ alors $\|P_t-P_0\|_{L^\infty (K)}$ converge vers $0$ pour tout compact $K$ fixé (en fait bornée est suffisant ici) lorsque $t \to 0$. Je te laisse essayer, ça se fait bien avec l'inégalité triangulaire. Avec ces deux résultats on en déduit que $|P_t(z)|>\varepsilon/2$ pour tout $z \in \partial D (\lambda,r)$ et tout $t$ assez proche de $0$, notre fonction est donc bien dominée (par une constante) et on a bien continuité de l'intégrale à paramètre.
  • Donc l'argument de GaBuZoMeu dit qu'une suite de fonctions rationnelles $f_n$ converge dans $\Bbb{C}(z)^*$ (localement uniformément, en tant que fonctions analytiques $P^1(\Bbb{C}) \to P^1(\Bbb{C})$) ssi leurs zéros/pôles convergent (*) et que $f_n(a)$ converge pour un $a$ ssi $f_n = \frac{P_n}{Q_n}$ avec $P_n,Q_n \in \Bbb{C}[z]$ de degré $ \le n$ dont les coefficients convergent et que la limite est un polynôme non-nul

    (*) pour quelle topologie sur $Div^0(P^1(\Bbb{C}))$
  • Bon, ce n'est pas mon argument. Et ensuite, comment lui fais-tu dire ça ? Ce n'est pas ce qu'il dit sorti d'usine. Quelle modification lui fais-tu subir ?
  • Ben je l'ai dit, je vois les polynômes comme des fonctions rationnelles comme des fonctions analytiques $P^1(\Bbb{C}) \to P^1(\Bbb{C})$

    On a l'isomorphisme entre les fonctions rationnelles non-nulles et leurs diviseur de zéros/pôles plus leur valeur en un point, isomorphisme continu pour les bonnes topologies.
  • Je ne comprends toujours pas le rapport avec l'argument de Bourbaki que j'ai présenté. Peux-tu être plus explicite ?
  • Voici ci-dessous une autre démonstration élémentaire de la continuité des racines.

    Soient $(P_n)$ une suite de polynômes unitaires complexes de même degré $d\in\mathbb{N}^\ast$ convergeant vers un polynôme $P$. On fixe une racine $z\in\mathbb{C}$ de $P$, et on note $z_n\in\mathbb{C}$ la racine la plus proche de $z$ pour tout $n\in\mathbb{N}$. Par définition de $z_n$, on a
    $$\forall n\in\mathbb{N},\quad |z-z_n|^d\leq P(z_n).$$
    On en déduit que la suite $(z_n)$ converge vers $z$. On en déduit le résultat global par récurrence sur $d$.
  • Je ne comprends pas la dernière démonstration lorsque $P$ a des racines multiples. On aura convergence d'une suite de racines, mais ça ne prouve pas que les autres racines vont aussi être proches. Sans en plus insister sur le fait que "la" racine la plus proche n est pas nécessairement définie, même si ça ne change rien pour la suite.
  • Je suis allez un peu vite sur la fin.

    On note $Q_n$ le quotient de $P_n$ par $X-z_n$ pour tout $n\in\mathbb{N}$ et $Q$ le quotient de $P$ par $X-z$. La suite $(Q_n)$ converge vers $Q$, car les coefficients de $Q_n$ sont des polynômes en les coefficients de $P_n$ et de $z_n$ (on le remarque simplement en posant la division euclidienne). En particulier, on peut itérer le raisonnement précédent avec $Q_n$ et $Q$.
  • $\newcommand \abs[1] {\left | #1 \right |}$

    Soit $P,Q$ des polynômes unitaires et de même degré $d$ à coefficients dans $\C$. Soient $a_1,...,a_d$ les racines de $P$ comptées avec multiplicité. Soit $b$ une racine de $Q$.
    Alors $$\left (\min_{1\leq k \leq d} \abs{b-a_k} \right) ^ d \leq \prod_{k=1}^d \abs{b-a_k }= \abs{P(b)}= \abs{P(b)-Q(b)} \tag{*}$$

    D'autre part, si $F=: \sum_{k=0}^{r-1} f_k X^k +X^r$ est un polynôme unitaire de degré $r$ et si $z\in \C$ est une racine de $F$ de module supérieur à $1$, alors $\abs z ^r = \abs{\sum_{k=0}^{r-1} f_k z^k}$ et donc en divisant par $z^{r-1}$, on voit que $$\abs z = \abs{\sum_{k=0}^{r-1} \frac{f_k}{z^{r-1-k}}} \leq \sum_{k=0}^{r-1} \abs{f_k} \tag{**}$$
    Soit donc $M>0$ un réel, $d\in \N$, et $P,Q$ deux polynômes dont tous les coefficients sont inférieurs en valeur absolue à $M$. $(**)$ entraîne que toutes les racines de $P,Q$ sont dans le disque de centre $0$ et rayon $\max(1,dM)$. Compte tenu de $(*)$, si on note $a_1,...,a_d$ (resp $b_1,...,b_d$) les racines (éventuellement multiples) de $P$ (resp $Q$), on voit que pour tout $j\in \{1,...,d\}$, $$\min_{1\leq k \leq d} \abs{a_j - b_k} \leq \abs {Q(a_j) - P(a_j)}^{\frac{1}{d}}\leq \left (\sup_{|z| \leq \max(1,dM)} \abs{Q(z)-P(z)} \right)^{\frac{1}{d}}$$
    et de même $$\min_{1\leq k \leq d} \abs{b_j - a_k} \leq \abs {P(b_j) - Q(b_j)}^{\frac{1}{d}}\leq \left (\sup_{|z| \leq \max(1,dM)} \abs{P(z)-Q(z)} \right)^{\frac{1}{d}}$$
    On voit donc que ($d$ étant fixé) l'application qui à un polynôme unitaire de degré $d$ fait correspondre l'ensemble de ses racines, est localement uniformément continue lorsqu'on munit l'ensemble des parties finies de $\C$ de la distance de Hausdorff.
    Le résultat se généralise aux corps algébriquement clos et valués quelconques.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Bonjour Foys
    Veux-tu détailler ce message http://www.les-mathematiques.net/phorum/read.php?14,1164805,1164827#msg-1164827 qui se rapporte à un même thème
    Le 😄 Farceur


  • Techniquement le message que j'ai posté plus haut fournit une preuve de l'affirmation en lien. Est-ce que tu peux être plus spécifique?
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Petite remarque : la continuité pour la distance de Hausdorff sur l'ensemble des parties finies de $\mathbb C$ oublie la multiplicité des racines. Elle n'est pas non plus adaptée en cas de "clusters" de racines.
    La "bonne" distance sur le multi-ensemble des racines est celle que l'on trouve fréquemment dans les ouvrages : la distance entre $\{x_1,\ldots,x_n\}$ et $\{y_1,\ldots,y_n\}$ (où il peut y avoir des répétitions dans les $x_i$ ou dans les $y_i$) est le minimum de $\max|x_i-y_{\sigma(i)}|$ où $\sigma$ décrit l'ensemble des permutations de $\{1,\ldots,n\}$.

    Par exemple, pour cette distance, $\{1.01, 10.02, 9.99\}$ est loin de $\{1,1,10\}$, alors que la distance de Hausdorff écrase tout.
  • Foys, belle démonstration. Juste deux typos inoffensifs ( Soient $a_1,\ldots,a_d$ et$ \min_{1\leq k \leq d} \vert a_j - b_k\vert \leq \vert P(a_j) - Q(a_j)\vert ^{\frac{1}{d}}\leq \left (\sup_{|z| \leq \max(1,dM)} \vert P(z)-Q(z)\vert \right)^{\frac{1}{d}}.$

    GaBuZoMeu: avec cette distance l'application n'est plus (localement uniformément) continue, non ?
  • @Krokop : pourquoi ?

    Au fait, comment une application continue d'un espace métrique localement compact dans un autre ferait-elle pour ne pas être localement uniformément continue ?
  • Je n'ai rien dit l'espace est localement compact, donc par continuité, ça marche.

    Ah ! Tu es trop rapide.
  • Bonjour,

    Je reviens sur le sujet. J'avais lu en diagonal et n'avais pas réfléchi aux bonnes choses.
    Déjà je suppose qu'on identifie polynômes et fonctions polynomiales.


    Pour celle de Foys je comprends l'énoncé comme:


    Soit $d\in \mathbb{N}$. Soit $E$ l'ensemble des polynômes complexes unitaires de degrés $d$ muni de la distance $d_E(f,g):=\max(\vert a_0-b_0\vert,\ldots,\vert a_n-b_n\vert).$ Soit $F$ l'ensemble des racines d'un polynôme muni de la distance de Hausdorff (ou celle donné par GaBuZoMeu).
    Si on note $\Psi: P\mapsto \mbox{racines de P}$ alors $\Psi$ est uniformément localement continue.

    Pour celle de Corto je ne comprends pas quel énoncé est prouvé.

    On part d'une suite $(P_t)_{t\in\mathbb{R}}$ de polynômes continues en $t$ et la conclusion est: les racines varient continûment par rapport à $t.$ Je ne vois pas l'équivalence avec le résultat démontré par Foys par exemple.

    De même quand on dit "$(P_t)_{t\in\mathbb{R}}$ de polynômes continues en $t$", l'espace d'arrivé c'est l'ensemble des fonctions de $\mathbb{C}\to \mathbb{C}$ ? Avec la topologie produit ?
  • Juste pour savoir à mon petit niveau: que veut dire l'expression "continuité des racines" ? Merci !:-)
  • Pour la continuité de la famille de polynôme je voulais dire que les coefficients du polynôme varient continûment.

    Le résultat que je démontre est le suivant : Soit $\lambda $ une racine de $P$ de multiplicité $k$, pour tout réel $\varepsilon >0$ il existe un temps $\eta>0$ tel que pour tout $t\in ]-\eta;\eta[$ le polynôme $P_t$ possède exactement $k$ racines (comptées avec multiplicité) dans le disque $B(\lambda, \varepsilon)$.

    Ce résultat est bien équivalent aux autres définitions de continuité des racines (enfin, pas celle avec la distance de Hausdorff mais GBZM à déjà expliqué où était l'erreur).
  • Une façon d'exprimer la continuité des racines par rapport aux coefficients:

    Soit $P = \sum_{k=0}^N a_x X^k$ un polynôme unitaire de degré $N$. On note $\alpha_1,\ldots,\alpha_N$ ses racines : $P = (X-\alpha_1) \cdots (X-\alpha_N)$. Alors pour tout $\varepsilon >0$, il existe $\delta > 0$ tel que pour tout polynôme $Q = \sum_{k=0}^N b_x X^k$ unitaire de degré $N$ satisfaisant $\vert a_k - b_k \vert < \delta$ pour tout $k$, on puisse écrire $Q = (X-\beta_1) \cdots (X-\beta_N)$ avec $\vert \alpha_k - \beta_k \vert < \varepsilon$ pour tout $k$.
  • @Hehehe : merci je crois que j'ai compris . Quand les coefficients du polynôme "bougent", les racines" bougent" mais on peut contrôler la distance autant que l'on veut.
  • totem, tu peux lire aussi ce document http://iecl.univ-lorraine.fr/~Olivier.Garet/agreg/continuiteracines.pdf c'est bien expliqué.

    [Activation du lien. :-) AD]
    Le 😄 Farceur


  • Je suis d'accord avec le fait que c'est évidemment faux si on ne fixe pas le degré à moins de changer le problème original. Cependant Corto je ne comprends pas ton argument, pourquoi le fait que le nombre de racines soit fixe avec multiplicité dans tout disque impliquerait-il la continuité?
    Prends par exemple la fonction
    f_t(x)=x+t pour t réel non rationnel
    f_t(x)=x-t pour t rationnel.
    aura une racine dans tout intervalle [-a,a] pour t assez petit. Pourtant la solution de f_t=0 ne dépend pas continûment de $t$.
    Est-ce que je t'ai mal lu? ou quelque chose m'échappe?
    M.
  • @gebrane: merci mais j'ai peur que le niveau soit un peu trop relevé pour moi (je suis à L2/ L3 pas plus, vous avez bien vous en rendre compte depuis le temps 8-) ).
  • Mauricio : la fonction qui à $t$ associe $t$ si $t\in \Q$ et $-t$ sinon est bien continue en $0$, pas de contradiction donc. En effet je ne démontre que la continuité en un point, pas sur l'intervalle $]-\eta ; \eta[$.
  • Merci pour ta réponse Corto.
  • Modifié (7 Mar)
    Pourriez vous m’indiquer d’autres applications de la continuité des racines ?
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!