Formule du binôme matricielle

Un de mes élèves a inventé l'exercice suivant. Il est assez amusant donc je vous le soumets.

Soit $m \geq 2$ et $n \geq 2$ entiers. Soit $A \in \mathcal{M}_n(\mathbb{K})$ (où $\mathbb{K}$ est un corps quelconque) telle que
$\forall B \in \mathcal{M}_n(\mathbb{K}), \; (A+B)^m=\sum_{k=0}^m \binom{m}{k} A^k B^{m-k}.$
Montrer que $A$ est scalaire.

Réponses

  • Pour le carré, on obtient déjà $2AB = (A+B)^2 - A^2 - B^2 = AB+BA$, d'où $AB = BA$, qui doit être valable pour tout $B \in \mathcal M_n(\mathbb K)$.
  • Tout à fait. Cela ne fait pas beaucoup progresser vers le cas général, cependant.
  • Bonjour,

    je pense que prendre $B=\delta_{ij}$, matrice dont seul le coefficient d'indices $i$ et $j$ est non nul doit alors pouvoir permettre de conclure.

    Cordialement.
  • $m$ est fixé, donc on ne peut pas forcément le choisir égal à $2$.
  • @marco : Je sais bien, je voulais juste lancer la discussion. Je n'ai malheureusement pas du tout le temps d'y réfléchir ces jours-ci. Cela dit, rien ne t'empêche de chercher aussi...
  • Je répondais à Jean-Eric. Désolé...
  • Il me semble avoir vu un sujet d’algèbre ens il y a quelques années où il y avait des expressions du même genre $A^k B^{m-k}$.
  • Je l'ai démontré dans le cas où $A$ est diagonalisable en considérant $A$ diagonale telle que $a_{i,i}\neq a_{j,j}$ avec $B=E_{i,j}$ puis $B=E_{j,i}$.

    Mais je n'ai pas réussi à en déduire la démonstration quand $A$ est quelconque.
  • Bonjour !
    Un peu longuet mais s'il n'y a rien d'autre...
    En se plaçant dans une clôture algébrique de $\K$ on peut supposer $A$ trigonale.
    En écrivant $A=\begin{pmatrix}a&L\\0&A_1\end{pmatrix}, \; L$ matrice ligne on peut montrer que $A_1$ vérifie aussi la propriété du binôme pour le même $m$.
    En effet, si $B=\begin{pmatrix}0&-L\\0&B_1\end{pmatrix},\;B_1$ arbitraire en taille $n-1$, on calcule facilement les blocs de $A^k,B^k,A^kB^{m-k},(A+B)^m$.
    Il en résulte, par récurrence sur la taille $n$ de $A$, la propriété demandée.

    Comme @jandri, on montre que si une matrice de taille 2 est diagonalisable, les valeurs propres sont égales.
    Ensuite pour $A=\begin{pmatrix}a&b\\0&a\end{pmatrix},\;B=\begin{pmatrix}0&1\\0&0\end{pmatrix}$ les matrices $A,A+B$ ont même polynôme caractéristique donc il y a des constantes $\lambda_m,\mu_m$ telles que $(A+B)^m=\lambda_m(A+B)+\mu_mI_2,\;A^m=\lambda_mA+\mu_mI_2$.
    On en déduit que nécessairement $a=0$.
    Edit, 21:09 : Une erreur ici. Le choix de $B$ ne donne pas de contradiction avec $a\neq0$, je m'y remets...

    Enfin pour $A=\begin{pmatrix}0&b\\0&0\end{pmatrix},\;B=\begin{pmatrix}1&0\\0&2\end{pmatrix}$ on arrive à une contradiction si $b\neq0$ toujours par comparaison des polynômes caractéristiques de $B,A+B$.
  • Enfin des choses consistantes !

    La récurrence n'est pas tout à fait en place : il faudrait expliquer comment passer du caractère scalaire de $A_1$ à celui de $A$.

    En peut se passer de récurrence, si $A$ est trigonalisable et non scalaire il est facile de voir qu'elle est semblable à une matrice de la forme
    $\begin{pmatrix}
    B & ? \\
    0 & ?
    \end{pmatrix}$ avec $B \in \mathcal{M}_2(K)$ non scalaire mais triangulaire supérieure.
    On est alors directement ramené au cas de matrices de taille $2$.

    Une remarque, incidemment : si $A$ vérifie la propriété alors $A+\lambda I_n$ la vérifie pour tout scalaire $\lambda$. Cela permet par exemple de réduire l'étude dans le cas $n=2$.

    Cependant, si $K$ est fini de petit cardinal par rapport à $m$ alors on ne peut pas étendre le corps des scalaires aussi facilement que cela et une autre démarche de démonstration semble nécessaire.
  • Bonjour et merci @DSP pour tes remarques.
    En reprenant pour mon erreur et, en tenant compte de ta remarque judicieuse concernant ma récurrence pas finie, je me suis rendu compte qu'on pouvait faire une démonstration pour les deux.
    Donc pour l'initialisation de récurrence ($n=2$) il suffit d'enlever les blocs de taille $n-2$ de ma démonstration.

    Le calcul par blocs a montré que, sous hypothèse de récurrence, le bloc $A_1$ est une matrice scalaire.
    Par conséquent, $A=\begin{pmatrix}a& L \\0 & bI_{n-1} \end{pmatrix}$.

    Supposons $a\neq b$. Il existe un vecteur propre associé à $b$ et, par similitude, on peut prendre
    $A=\begin{pmatrix}a & 0 & L \\ 0 & b & L' \\0 & 0 & bI_{n-2} \end{pmatrix}$.

    Soit $U=\begin{pmatrix}a& 0 \\0 & b \end{pmatrix},\;V=\begin{pmatrix}0& 1 \\0 & 0 \end{pmatrix},\;W=\begin{pmatrix}0& 0 \\1 & 0 \end{pmatrix}$.
    On note $\lambda_kX+\mu_k$ le reste de la division de $X^k$ par $(X-a)(X-b)$.

    Les polynômes caractéristiques de $U,U+V,U+W$ étant les mêmes on a $U^k=\lambda_kU+\mu_kI_2,\;(U+V)^k=\lambda_k(U+V)+\mu_kI_2,\;(U+W)^k=\lambda_k(U+W)+\mu_kI_2 $ donc, si $B=\begin{pmatrix}V & 0 \\ 0 & 0_{n-2}\end{pmatrix}$ on a $A+B=\begin{pmatrix}U+V & * \\ 0 & bI_{n-2}\end{pmatrix}$ et $$(A+B)^m=\begin{pmatrix}U+V & * \\ 0 & bI_{n-2}\end{pmatrix}^m=\begin{pmatrix}\lambda_m(U+V)+\mu_mI_2 & * \\ 0 & b^mI_{n-2}\end{pmatrix}$$ et, puisque $B^2=0$,
    $$\sum_{0\leqslant k\leqslant m}\binom mkA^{m-k}B^k=\begin{pmatrix}\lambda_{m}U+\mu_mI_2 & * \\ 0 & b^mI_{n-2}\end{pmatrix}+m\begin{pmatrix}\lambda_{m-1}U+\mu_{m-1}I_2 & * \\ 0 & b^{m-1}I_{n-2}\end{pmatrix}B$$
    On a $UV=bV$ et $UW=aW$ d'où la relation: $\lambda_mV=m(b\lambda_{m-1}+\mu_{m-1})V $
    De même, avec $A+B^T$ on aurait $\lambda_mW=m(a\lambda_{m-1}+\mu_{m-1})W$.
    Il en résulte $a=b$.

    Il me manque la démonstration de $A$ diagonale : j'ai une solution quand la première ligne de $A$ ne contient qu'un terme non nul, à part $a$ évidemment...
    Peux-tu donner des détails pour ta méthode sans récurrence ?

    .....................................
    Pour $n=2$ il reste à montrer que si $A=\begin{pmatrix} a & b \\0 & a \end{pmatrix}=aI_2+bD$ le coefficient $b$ est nul.
    Soit $B=\begin{pmatrix} -a & 0 \\b & -a \end{pmatrix}=-aI_2+bD^T$.
    Alors, $(A+B)^m=b^m(D+D^T)^m$ et
    $(D+D^T)^m=\begin{cases}I_2, & \text{si $m\equiv0\pmod2$;} \\D+D^T, & \text{si $m\equiv1\pmod2$.}\end{cases}$.

    $D,D^T$ sont de carré nul donc $A^k=a^kI_2+kbD,\;B^k=(-a)^kI_2+kbD^T$. Alors,
    \begin{align*}
    \sum_{0\leqslant k\leqslant m}\binom mkA^{m-k}B^k= &
    \sum_{0\leqslant k\leqslant m}\binom mk(-1)^k(a^{m-k}I_2+(m-k)bD)(a^kI_2-kbD^T) \\
    &a^m\sum_{0\leqslant k\leqslant m}(-1)^k\binom mk\,I_2+a^{m-1}b\sum_{0\leqslant k\leqslant m}(-1)^k(m-k)\binom mk\,D \\
    &-a^{m-1}b\sum_{0\leqslant k\leqslant m}(-1)^k\binom mk\,D^T+a^{m-2}\sum_{0\leqslant k\leqslant m}(-1)^kk(m-k)\binom mk\,D^T
    \end{align*}
    Tous les coefficients de la formule précédente sont nuls car, pour des réels $x,y$,
    \begin{align*}
    f(x,y)&=(x-y)^m=\sum_{0\leqslant k\leqslant m}(-1)^k\binom mk\,x^{m-k}y^k\\
    \dfrac{\partial f}{\partial x}(x,y)&=m(x-y)^{m-1}=\sum_{0\leqslant k\leqslant m}(-1)^k(m-k)\binom mk\,x^{m-k-1}y^k\\
    \dfrac{\partial f}{\partial y}(x,y)&=-m(x-y)^{m-1}=\sum_{0\leqslant k\leqslant m}(-1)^kk\binom mk\,x^{m-k}y^{k-1}\\
    \dfrac{\partial^2 f}{\partial y\partial x}f(x,y)&=-m(m-1)(x-y)^{m-2}=\sum_{0\leqslant k\leqslant m}(-1)^km(m-k)\binom mk\,x^{m-k-1}y^{k-1}
    \end{align*}
    (inutile de changer les bornes des sommations car les "apparents" exposants négatifs de $x,y$ ont des coefficients nuls).
    On a donc bien $b=0$ puisque $(D+D^T)^m\neq 0$.
  • Voici un plan de démonstration directe sans récurrence pour le cas d'un corps algébriquement clos.

    (1) Si $A$ vérifie la propriété alors $\alpha A+\beta I_n$ aussi pour tout $(\alpha,\beta)\in \C^2$ (calcul facile que je ne détaille pas).

    (2) Si $A$ vérifie la propriété alors toute matrice semblable à $A$ la vérifie également.

    (3) Si $A$ vérifie la propriété et s'écrit $A=\begin{pmatrix}
    A_1 & ? \\
    0 & ?
    \end{pmatrix}$ (triangulaire supérieure par blocs) alors $A_1$ vérifie la propriété (pour les matrices carrées de même format que $A_1$, et le même entier $m$).

    (4) Si $A$ est non scalaire elle est semblable à une matrice de la forme précédente avec $A_1 \in \mathcal{M}_2(K)$ triangulaire supérieure non scalaire : en effet, soit $A$ admet deux valeurs propres distinctes, auquel cas il suffit de consider le plan vectoriel engendré par deux vecteurs propres associés, soit $A$ ne possède qu'une seule valeur propre $\lambda$ auquel cas il suffit de considérer un vecteur $x$ de $\mathrm{Ker}(A-\lambda I_n)^2 \setminus \mathrm{Ker} (A-\lambda I_n)$ puis de prendre le plan $\mathrm{Vect}(A(x),x)$.

    (5) Pour conclure, la combinaison des points précédents montre qu'il suffit d'invalider la propriété pour deux matrices particulières de taille $2$, à savoir $A_1=\begin{pmatrix}
    1 & 0 \\
    0 & 0
    \end{pmatrix}$ et $A_2=\begin{pmatrix}
    0 & 1 \\
    0 & 0
    \end{pmatrix}$. Pour la première, on remarque que $B={}^tA_2$ fournit un contre-exemple, pour la deuxième que $B=A_1$ en fournit un.

    Il reste à traiter le cas des corps finis, mais là il faut changer de méthode...
  • Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • Très belle démonstration de dSP.

    Une coquille au (3) pour pouvoir l'utiliser au (4): le bloc en bas à droite est quelconque et pas forcément nul.

    Au (5), $(A_1+A_2)^m$ et $(A_2+A_1)^m$ montrent que ni $A_1$ ni $A_2$ ne vérifie la propriété.
  • Au (5), cela dépend quand même de la caractéristique du corps envisagé.
  • Effectivement le choix de $B={}^t\!A_2$ pour $A_1$ est valable quelle que soit la caractéristique du corps alors que le choix de $B=A_2$ ne marche que si la caractéristique du corps ne divise pas $m-1$.
  • @dSP. Rassure nous, pour les "petits" corps finis, on peut se passer d'une tour d'extensions quadratiques ?
  • Oui, il y a une démonstration universelle pour tous les corps.
  • @dsp est-ce ton élève et toi pouvez-vous écrire un article sur cette exo passant
    en revue le cas K=R,K=C,K corps commutatif quelconque
    Merci
  • Bonjour !
    @etanche : c'est une question qui m'intéresse aussi.
    Le problème est résolu (sauf corps de caractéristique non nulle : le cas corps fini n'est pas le seul en cause) lorsque $A$ est scindé sur un corps de caractéristique nulle. Tout ce qui précède fournit une solution.

    Si le corps est celui des réels et $A$ non scindé, on peut remarquer, par utilisation du complexifié, que pour tout endomorphisme réel non scindé il existe un plan stable où la restriction a pour matrice $A_2=\begin{pmatrix}\alpha&-\beta\\\beta&\alpha\end{pmatrix},\;\beta\neq0$ et il suffit d'étudier ces matrices en taille 2.
    On peut se ramener à $B=\dfrac1{\beta}(A_2-\alpha I_2)=\begin{pmatrix}0&-1\\1&0\end{pmatrix}$ et la considération de $U=\begin{pmatrix}1&1\\-1&-1\end{pmatrix}$ conduit à une contradiction pour $B+U$.

    Il reste la question concernant un corps autre que $\R$, de caractéristique nulle et $A$ non scindé ?
  • Pour K autre que R ou C faut-il utiliser le théorème de Frobénius
    et les matrices compagnons ?
  • Rakam, si tu regardes bien mes arguments tu constateras que la caractéristique ne pose pas de problème.

    Un point que j'ai omis de signaler : si le corps $\mathbb{K}$ possède au moins $m+1$ éléments alors
    la formule se prolonge à toute matrice $B$ de $\mathcal{M}_n(\mathbb{L})$ pour n'importe quelle extension
    $\mathbb{L}$ de $\mathbb{K}$, et en particulier on peut considérer une telle extension sur laquelle $A$ est trigonalisable.
  • @ etanche : on n'a pas besoin de toute la puissance du théorème de réduction de Frobenius mais il est certain que travailler avec des matrices compagnons est une bonne idée.
  • @dsp Avec l'exo de ton élève y de quoi faire un joli problème
    de concours.
  • Je pense que c'est trop court, à moins de faire comme à Centrale et de tourner 3 heures autour du pot
    avant de donner la méthode efficace...
  • Bel exercice et belle solution ! (tu)
  • Quelques indications pour le cas d'un corps quelconque :
    considérer le cas particulier où $A$ est une matrice compagnon de taille au moins $2$, choisir $B$ telle que $B^2=0$, ce qui simplifie la formule.

    Si $A$ est singulière, s'arranger pour que $A+B$ soit inversible.
    si $A$ est inversible, s'arranger si possible pour que $A+B$ ait $0$ pour valeur propre multiple.
    Il y a une difficulté particulière liée aux blocs de taille 2, mais je n'en dis pas plus pour le moment.
Connectez-vous ou Inscrivez-vous pour répondre.