Polynôme caractéristique: c'est quoi?

Si j'ai une matrice carrée $A = (a_{ij})_{i, j = 1 \ldots n}$ d'ordre $n \in \N_1$ sur un corps commutatif $K$, on me dit (J.-P. Escofier, Toute l'algèbre de la licence) que son polynôme caractéristique est:

$\chi_A(\lambda) = \begin{vmatrix}
a_{11} - \lambda & a_{12} & \ldots & a_{1n}\\
a_{21} & a_{22} - \lambda & \ldots & a_{2n}\\
\ldots & \ldots & \ldots & \ldots\\
a_{n1} & a_{n2} & \ldots & a_{nn} - \lambda
\end{vmatrix}$

Mais ça, ce n'est pas un polynôme, c'est une fonction polynôme. Et de fait, ayant une fonction - c'est-à-dire une application $K \to K$ - il n'est pas trivial de remonter au polynôme, s'il y en a un, dont c'est la fonction polynôme, et surtout, sur les corps finis, il peut y avoir plusieurs tels polynômes.

On peut bien sûr développer le déterminant, et en regroupant les termes obtenir une expression avec les divers $\lambda^k$ qui «a la tête» d'un polynôme; et remplacer les $\lambda$ par des $X$ pour obtenir un vrai polynôme. Mais l'opération est artificielle, et pose encore quelques problèmes quand on parle non de matrices mais d'endomorphismes.

La nuance entre polynômes et fonctions polynômes est a priori peu pertinente, tant qu'on se sert de l'objet pour calculer les valeurs propres de la matrice, qui sont les zéros de la fonction caractéristique, et en même temps les racines du polynôme dont elle est la fonction polynôme. Mais plus loin, on me parle du théorème de Cayley-Hamilton, qui dit qu'on a toujours $\chi_A(A) = 0$; ou, pour un endomorphisme $\phi$, qu'on a $\chi_\phi(\phi) = 0$. Or ces expressions n'ont de sens que si $\chi_A$ ou $\chi_\phi$ sont de vrais polynômes, et non des applications $K \to K$. Partant de fonctions polynômes, on n'a pas de définition directe de ces expressions.

Je me suis demandé de manière générale comment poser le cadre pour arriver à définir des déterminants du genre:

$\begin{vmatrix}
X_{11} & X_{12} & \ldots & X_{1n}\\
X_{21} & X_{22} & \ldots & X_{2n}\\
\ldots & \ldots & \ldots & \ldots\\
X_{n1} & X_{n2} & \ldots & X_{nn}
\end{vmatrix}$

La valeur d'un tel déterminant serait un polynôme dans l'algèbre des polynômes à $n^2$ variables qui commutent. Ce serait bien de pouvoir définir cette expression à travers quelque chose comme analogue aux formes $n$-linéaires alternées, sur un «espace vectoriel» de «vecteurs colonnes» dont les coordonnées seraient des $X_{ij}$. Est-ce qu'il existe des développements en ce sens?

Réponses

  • Alors en principe, pour définir le polynôme caractéristique, il faut bien mettre des $X$ et pas des $\lambda$.

    Les $\lambda$ apparaissent quand on cherche les racines du polynôme caractéristique.

    Le livre de JP Escofier, je l'ai, et franchement, il est assez incomplet pour "toute la licence" et d'un niveau assez faible en général. Certes il contient beaucoup d'informations pratiques, mais méfie-toi un peu de ce livre quand même.
  • Oui, le polynôme caractéristique est bien un polynôme. Le mieux est de le définir comme le déterminant de la matrice $$\begin{vmatrix}

    a_{11} - X & a_{12} & \ldots & a_{1n}\\

    a_{21} & a_{22} - X & \ldots & a_{2n}\\

    \ldots & \ldots & \ldots & \ldots\\

    a_{n1} & a_{n2} & \ldots & a_{nn} - X

    \end{vmatrix}$$ à coefficients dans $K[X]$ (ou $K(X)$ si tu as peur de parler de déterminant de matrices à coefficients dans un anneau qui n'est pas un corps). Le fait que c'est un polynôme découle immédiatement de la définition du déterminant : si $M(a_{i,j})_{1 \leq i,j \leq n}$ est une matrice alors $$det(M) = \sum_{\sigma \in \mathfrak S_n} \varepsilon(\sigma) \prod_{i=1}^n a_{i, \sigma(i)}.$$

    Ça permet également de montrer que l'application déterminant et l'application polynôme caractéristique sont des fonctions régulières (dans le sens que tu préfères) dans beaucoup de cas, par exemple continues, lisses, analytiques etc. quand on travaille sur $\mathbb R$ ou $\mathbb C$.
  • Et dire que la semaine prochaine, j'avais l'intention de noter $\lambda$ le nom de mon indéterminée.
  • Ben a priori ton indéterminée tu la notes comme tu veux :-D

    C'est juste un inconvénient quand on n'est pas sûr de ce dont on parle, et si David Olivier a compris qu'il y a une différence entre polynôme formel et fonction polynomiale, ce n'est de loin pas le cas de tous les étudiants quand on leur introduit la notion de polynôme caractéristique... donc autant garder des notations avec lesquelles on ne s'embrouille pas.
  • Bonjour,


    à la fin d'une histoire $\chi (A)=0$ ce qui* est très joli mais est aussi très troublant par rapport à ce que vous exposez ci-avant. Je crois que c'est grâce à ce forum que j'ai compris que c'était troublant.

    S

    *[Merci pour la modification de khi en chi sieur Poirot, mais pourquoi c'est chi et pas khi :) ?]
  • Mais ça, ce n'est pas un polynôme, c'est une fonction polynôme.
    En tout cas, $\chi_A(\lambda)$ n'est sûrement pas une fonction polynôme. Si c'était une fonction polynôme, on l'appellerait $\lambda \mapsto \chi_A(\lambda)$, ou plutôt tout simplement $\chi_A$.
  • $\DeclareMathOperator{\Id}{Id} \DeclareMathOperator{\det}{det}$J'ai l'impression que concernant les polynômes, il y a eu trois stades historiques:

    1) Le stade, disons naïf, au [small]XVIII[/small]e et [small]XIX[/small]e siècles par exemple, où un polynôme c'était une «expression», ou une fonction, par exemple $3 x^2 + x - 1$, et on ne cherchait pas plus loin.

    2) Le stade où on a voulu distinguer les les polynômes des fonctions polynômes. On s'est mis à parler de «la variable formelle $X$». C'est ce qu'on m'a enseigné en Maths Sup, en 1974-75, et ça a failli me dégoûter des maths. L'idée de «variable formelle» ne veut rien dire.

    3) On a voulu faire mieux, et maintenant on a l'algèbre des polynômes sur un corps, défini par sa propriété universelle. L'objet $X$ n'a alors rien d'une «variable»; c'est juste un certain élément de l'ensemble de base de l'algèbre.

    Avec le stade 3, on a troqué l'horrible furoncle du la «variable formelle» contre l'élégante abstraction de la propriété universelle. Sauf que tout le monde continue à penser à l'ancienne manière, celle de la «variable formelle». Sinon, comment expliquer que vous trouviez si facile de mettre $X$ à la place de $\lambda$ dans l'écriture d'un déterminant?

    La différence entre les $\lambda$ et les $X$ n'est pas que le premier a juste un bras en l'air et l'autre deux. C'est que quand on parle de $\lambda$ on entend un élément du corps de base, alors que $X$ est tout autre chose. Par exemple, si notre corps $K$ est $\Z/2\Z$, pour tout $\lambda \in K$, on a $\lambda^2 = \lambda$. Malgré ça, dans $K[X]$, on n'a pas du tout $X^2 = X$.

    On ne peut pas simplement mettre $X$ dans un déterminant à la place de $\lambda$, parce que c'est un objet d'une autre nature. Personnellement, je sais aussi bien que n'importe qui «faire comme si», et développer un «déterminant» où on a mis des $X$ à la place des $\lambda$, mais j'aimerais savoir ce que ce faisant je fais. Le déterminant d'un endomorphisme est défini comme un élément du corps de base. Il s'ensuit que notre fonction caractéristique $\lambda \mapsto \chi_\phi(\lambda)$ est simplement ça: une fonction. Avec $K = \Z/2\Z$, pour un certain $\phi$ on peut avoir $\chi_\phi(\lambda) = \det (\phi - \lambda \Id)$ valant identiquement $0$; mais alors, $\chi_\phi(\lambda)$ peut aussi bien s'écrire $0$ que $\lambda^2 + \lambda$ ou $\lambda^7 + \lambda$. Quel est alors le polynôme caractéristique: $0$, ou $X^2 + X$, ou $X^7 + X$?
  • Je pense que tu te trompes quand tu dis :
    David Olivier a écrit:
    C'est que quand on parle de $\lambda$ on entend un élément du corps de base, alors que $X$ est tout autre chose.
    Bien sûr, ça dépend qui « on » est. Assurément, le polynôme caractéristique sur un corps fini n'est pas une fonction polynomiale, précisément pour la raison que tu pointes – la fonction ne détermine pas le polynôme vu que la fonction $x\mapsto x^q-x$ est uniformément nulle.

    Pour éviter cet écueil, il suffit d'utiliser la construction présentée par Poirot en utilisant la fonction polynomiale déterminant définie sur les matrices à coefficients dans $K[X]$ (ou $K[\lambda]$, je n'ai aucune raison de me priver de l'une des deux notations a priori).

    PS : Pour ces questions, le livre d'Escoffier (qui se place peut-être bien d'entrée sur un sous-corps des complexes) n'est pas la meilleure référence possible : à tort ou à raison, ces questions ne sont guère dans l'esprit d'un cours de L2 standard.
  • David Olivier a écrit:
    On ne peut pas simplement mettre $X$ dans un déterminant à la place de $\lambda$, parce que c'est un objet d'une autre nature.

    Tu n'as visiblement pas lu mon message, ou tu ne l'as pas compris !

    Le polynôme caractéristique de $A$ est un polynôme $P \in K[X]$. Formellement, quand on développe le déterminant, on calcule les coefficients de ce polynôme. Ensuite, on peut bien sûr évaluer ce polynôme en un élément du corps $\lambda$ via le morphisme $eval_{\lambda} : P \mapsto P(\lambda)$. Il n'y a rien de scandaleux là-dedans, c'est notamment via ce morphisme que l'on peut faire le lien entre valeurs propres de la matrice et polynôme caractéristique.

    Et comme il a déjà été signalé plusieurs fois dans le fil, appeler $\lambda$ son indéterminée est parfaitement acceptable, de sorte que tu calcules un polynôme $P$ élément de $K[\lambda]$ si ça te chante.

    Ce que je ne comprends pas, c'est que tu fais la distinction entre polynômes et fonctions polynomiales, ce qui est très bien, mais tu ne sembles pas accepter qu'en développant le déterminant ci-dessus, tu calcules bien un polynôme, et non une fonction polynomiale !
  • @David : Je te propose le point de vue suivant. Considérons $A_n := \mathbb{Z}\big[X_{i,j}, \mid i,j \in \{1,\ldots ,n\}\big]$. On pose $\det_n := \Pi_{\sigma \in \mathfrak{S}_n} \epsilon(\sigma) X_{\sigma_1}\ldots X_{\sigma_n}$.
    $\det_n$ est donc un polynôme à coefficients entiers en $n^2$ variables.

    Maintenant, soit $B$ un anneau commutatif unitaire. Il est naturellement muni d'une structure de $\mathbb{Z}$-algèbre. À notre niveau, on peut tout à fait identifier $B^{n^2}$ et $M_n(B)$ en tant que $B$-modules.

    Alors pour toute $M \in M_n(B)$, d'après la propriété universelle des $\mathbb{Z}$-algèbres de polynômes, il existe un unique morphisme $A_n \rightarrow B$ appelé évaluation et qui, à $P(X_{11},\ldots ,X_{nn})$ associe $evdet_n(M) := P(M_{11},\ldots ,M_{nn})$ qui est bien un élément de $B$.

    À présent, il n'y a aucun problème à prendre $B := k[X]$, et à prendre $M := XI_n - N$ pour une matrice $N \in M_n(k)$. Alors $evdet_n(M)$ n'est autre que le polynôme caractéristique de $N$ !
  • @Poirot: J'avais bien lu ton message, mais je n'y avais répondu que de manière oblique.

    Tu m'invites à considérer le déterminant comme un polynôme, et c'est effectivement ce que je veux. Tu m'encourages à n'avoir pas peur d'un déterminant sur un anneau; ben justement, si, j'ai un peu peur. Parce que c'est un terrain non balisé pour moi, et pour le lecteur lambda (ou X) de ce fichu bouquin.

    Il y a deux approches du déterminant, celle que tu cites ($\sum_{\sigma \in \mathfrak S_n} \epsilon(\sigma) \prod \ldots$) et celle basée sur les formes $n$-linéaires alternées. Elles donnent le même résultat, dans le cas classique du déterminant sur un corps. Mais sur un anneau, est-ce le cas? Les formes $n$-linéaires alternées sur un module - puisqu'on n'est plus dans un espace vectoriel - je ne les ai pas étudiées.

    Et aussi, il manque tous les raisonnements pour montrer comment tout cela s'articule avec le problème d'origine, qui concerne les endomorphismes d'espace vectoriel. J'ai l'impression que les raisonnements que je suis censé ingurgiter son remplis de trous, où l'«évidence» remplace en catimini le raisonnement détaillé.

    Bon, je cesse de me plaindre. Je crois que j'ai compris ce chapitre (sur la diagonalisation) au moins autant que n'importe quel étudiant, et je vais me satisfaire de ça pour le moment. Merci à toustes pour vos réponses.
  • C'est marrant que vous parliez de cela... C'est précisément ce que l'inspecteur m'a reproché d'avoir dit à mes élèves.

    En gros, j'avais commencé mon cours de diagonalisation par la définition de la fonction "polynôme caractéristique", puis j'avais simplifié la notation en écrivant (oh, l'hérésie !) $\det(X I_n-A)$, en précisant bien aux élèves que l'on faisait "comme si"... mais l'inspecteur est arrivé 5 minutes après et n'a vu que la dernière écriture au tableau.
    Il m'a expliqué que c'était s'aventurer bien loin des sentiers battus de Math Spé (PSI) que d'oser envisager un calcul de déterminant d'une matrice à coefficients dans $\mathbb{K}[X]$... et mes explications n'ont pas semblé le convaincre.

    Bref, attention à vous, jeunes imprudents : ne calculez des déterminants que dans un corps au programme !
  • C'est bien vrai, ça. Si j'ai le déterminant suivant (à coefficients entiers)
    $$
    \left|\matrix {3 & 7\cr 2 & 5\cr}\right|
    $$
    à calculer, je vais m'empresser de considérer la matrice à coefficients dans $\Q$, cela sera quand même vachement plus simple.
  • ben ouais $\det(A-A\times I_n)=0$

    évident ! Non?

    $\chi(A)=0$

    Mais pourquoi chi à la place de de khi ?

    S
  • @bisam : et lui dire que les coefficients de cette matrice vivent dans le corps $\mathbb K[X]$ ne l'aurait pas convaincu ?
  • Non Poirot : les espaces vectoriels de MPSI ne vivent que sur $\R$ et $\C$. Je cite le programme de 2013 (MPSI et PSI :
    Dans tout le cours d’algèbre linéaire, le corps $\mathbf K$ est égal à $\R$ ou $\C$.
    Dans toute cette partie, $\mathbf K$ désigne $\R$ ou $\C$.
    Vérité en-deçà des Pyrénées, erreur au-delà : ce que tu proposes est peut-être OK à Madrid mais ici, c'est hérétique.
  • @Poirot : S'il lui avait dit ce que tu lui dis, ça aurait mal fini pour lui !

    @David : Ca dépend de ce que tu veux faire, mais parfois, la définition du déterminant avec la formule suffit, et il n'y a pas besoin de parler de formes multilinéaires alternées sur des modules. Tu n'as qu'à utiliser cette définition, et poursuivre le cours concernant le polynôme caractéristique avec cette définition, et voir si à un moment, il y a besoin de formes multilinéaires alternées.
Connectez-vous ou Inscrivez-vous pour répondre.