Formule du binôme matricielle
Un de mes élèves a inventé l'exercice suivant. Il est assez amusant donc je vous le soumets.
Soit $m \geq 2$ et $n \geq 2$ entiers. Soit $A \in \mathcal{M}_n(\mathbb{K})$ (où $\mathbb{K}$ est un corps quelconque) telle que
Soit $m \geq 2$ et $n \geq 2$ entiers. Soit $A \in \mathcal{M}_n(\mathbb{K})$ (où $\mathbb{K}$ est un corps quelconque) telle que
$\forall B \in \mathcal{M}_n(\mathbb{K}), \; (A+B)^m=\sum_{k=0}^m \binom{m}{k} A^k B^{m-k}.$
Montrer que $A$ est scalaire. Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
je pense que prendre $B=\delta_{ij}$, matrice dont seul le coefficient d'indices $i$ et $j$ est non nul doit alors pouvoir permettre de conclure.
Cordialement.
Mais je n'ai pas réussi à en déduire la démonstration quand $A$ est quelconque.
Un peu longuet mais s'il n'y a rien d'autre...
En se plaçant dans une clôture algébrique de $\K$ on peut supposer $A$ trigonale.
En écrivant $A=\begin{pmatrix}a&L\\0&A_1\end{pmatrix}, \; L$ matrice ligne on peut montrer que $A_1$ vérifie aussi la propriété du binôme pour le même $m$.
En effet, si $B=\begin{pmatrix}0&-L\\0&B_1\end{pmatrix},\;B_1$ arbitraire en taille $n-1$, on calcule facilement les blocs de $A^k,B^k,A^kB^{m-k},(A+B)^m$.
Il en résulte, par récurrence sur la taille $n$ de $A$, la propriété demandée.
Comme @jandri, on montre que si une matrice de taille 2 est diagonalisable, les valeurs propres sont égales.
Ensuite pour $A=\begin{pmatrix}a&b\\0&a\end{pmatrix},\;B=\begin{pmatrix}0&1\\0&0\end{pmatrix}$ les matrices $A,A+B$ ont même polynôme caractéristique donc il y a des constantes $\lambda_m,\mu_m$ telles que $(A+B)^m=\lambda_m(A+B)+\mu_mI_2,\;A^m=\lambda_mA+\mu_mI_2$.
On en déduit que nécessairement $a=0$.
Edit, 21:09 : Une erreur ici. Le choix de $B$ ne donne pas de contradiction avec $a\neq0$, je m'y remets...
Enfin pour $A=\begin{pmatrix}0&b\\0&0\end{pmatrix},\;B=\begin{pmatrix}1&0\\0&2\end{pmatrix}$ on arrive à une contradiction si $b\neq0$ toujours par comparaison des polynômes caractéristiques de $B,A+B$.
La récurrence n'est pas tout à fait en place : il faudrait expliquer comment passer du caractère scalaire de $A_1$ à celui de $A$.
En peut se passer de récurrence, si $A$ est trigonalisable et non scalaire il est facile de voir qu'elle est semblable à une matrice de la forme
$\begin{pmatrix}
B & ? \\
0 & ?
\end{pmatrix}$ avec $B \in \mathcal{M}_2(K)$ non scalaire mais triangulaire supérieure.
On est alors directement ramené au cas de matrices de taille $2$.
Une remarque, incidemment : si $A$ vérifie la propriété alors $A+\lambda I_n$ la vérifie pour tout scalaire $\lambda$. Cela permet par exemple de réduire l'étude dans le cas $n=2$.
Cependant, si $K$ est fini de petit cardinal par rapport à $m$ alors on ne peut pas étendre le corps des scalaires aussi facilement que cela et une autre démarche de démonstration semble nécessaire.
En reprenant pour mon erreur et, en tenant compte de ta remarque judicieuse concernant ma récurrence pas finie, je me suis rendu compte qu'on pouvait faire une démonstration pour les deux.
Donc pour l'initialisation de récurrence ($n=2$) il suffit d'enlever les blocs de taille $n-2$ de ma démonstration.
Le calcul par blocs a montré que, sous hypothèse de récurrence, le bloc $A_1$ est une matrice scalaire.
Par conséquent, $A=\begin{pmatrix}a& L \\0 & bI_{n-1} \end{pmatrix}$.
Supposons $a\neq b$. Il existe un vecteur propre associé à $b$ et, par similitude, on peut prendre
$A=\begin{pmatrix}a & 0 & L \\ 0 & b & L' \\0 & 0 & bI_{n-2} \end{pmatrix}$.
Soit $U=\begin{pmatrix}a& 0 \\0 & b \end{pmatrix},\;V=\begin{pmatrix}0& 1 \\0 & 0 \end{pmatrix},\;W=\begin{pmatrix}0& 0 \\1 & 0 \end{pmatrix}$.
On note $\lambda_kX+\mu_k$ le reste de la division de $X^k$ par $(X-a)(X-b)$.
Les polynômes caractéristiques de $U,U+V,U+W$ étant les mêmes on a $U^k=\lambda_kU+\mu_kI_2,\;(U+V)^k=\lambda_k(U+V)+\mu_kI_2,\;(U+W)^k=\lambda_k(U+W)+\mu_kI_2 $ donc, si $B=\begin{pmatrix}V & 0 \\ 0 & 0_{n-2}\end{pmatrix}$ on a $A+B=\begin{pmatrix}U+V & * \\ 0 & bI_{n-2}\end{pmatrix}$ et $$(A+B)^m=\begin{pmatrix}U+V & * \\ 0 & bI_{n-2}\end{pmatrix}^m=\begin{pmatrix}\lambda_m(U+V)+\mu_mI_2 & * \\ 0 & b^mI_{n-2}\end{pmatrix}$$ et, puisque $B^2=0$,
$$\sum_{0\leqslant k\leqslant m}\binom mkA^{m-k}B^k=\begin{pmatrix}\lambda_{m}U+\mu_mI_2 & * \\ 0 & b^mI_{n-2}\end{pmatrix}+m\begin{pmatrix}\lambda_{m-1}U+\mu_{m-1}I_2 & * \\ 0 & b^{m-1}I_{n-2}\end{pmatrix}B$$
On a $UV=bV$ et $UW=aW$ d'où la relation: $\lambda_mV=m(b\lambda_{m-1}+\mu_{m-1})V $
De même, avec $A+B^T$ on aurait $\lambda_mW=m(a\lambda_{m-1}+\mu_{m-1})W$.
Il en résulte $a=b$.
Il me manque la démonstration de $A$ diagonale : j'ai une solution quand la première ligne de $A$ ne contient qu'un terme non nul, à part $a$ évidemment...
Peux-tu donner des détails pour ta méthode sans récurrence ?
.....................................
Pour $n=2$ il reste à montrer que si $A=\begin{pmatrix} a & b \\0 & a \end{pmatrix}=aI_2+bD$ le coefficient $b$ est nul.
Soit $B=\begin{pmatrix} -a & 0 \\b & -a \end{pmatrix}=-aI_2+bD^T$.
Alors, $(A+B)^m=b^m(D+D^T)^m$ et
$(D+D^T)^m=\begin{cases}I_2, & \text{si $m\equiv0\pmod2$;} \\D+D^T, & \text{si $m\equiv1\pmod2$.}\end{cases}$.
$D,D^T$ sont de carré nul donc $A^k=a^kI_2+kbD,\;B^k=(-a)^kI_2+kbD^T$. Alors,
\begin{align*}
\sum_{0\leqslant k\leqslant m}\binom mkA^{m-k}B^k= &
\sum_{0\leqslant k\leqslant m}\binom mk(-1)^k(a^{m-k}I_2+(m-k)bD)(a^kI_2-kbD^T) \\
&a^m\sum_{0\leqslant k\leqslant m}(-1)^k\binom mk\,I_2+a^{m-1}b\sum_{0\leqslant k\leqslant m}(-1)^k(m-k)\binom mk\,D \\
&-a^{m-1}b\sum_{0\leqslant k\leqslant m}(-1)^k\binom mk\,D^T+a^{m-2}\sum_{0\leqslant k\leqslant m}(-1)^kk(m-k)\binom mk\,D^T
\end{align*}
Tous les coefficients de la formule précédente sont nuls car, pour des réels $x,y$,
\begin{align*}
f(x,y)&=(x-y)^m=\sum_{0\leqslant k\leqslant m}(-1)^k\binom mk\,x^{m-k}y^k\\
\dfrac{\partial f}{\partial x}(x,y)&=m(x-y)^{m-1}=\sum_{0\leqslant k\leqslant m}(-1)^k(m-k)\binom mk\,x^{m-k-1}y^k\\
\dfrac{\partial f}{\partial y}(x,y)&=-m(x-y)^{m-1}=\sum_{0\leqslant k\leqslant m}(-1)^kk\binom mk\,x^{m-k}y^{k-1}\\
\dfrac{\partial^2 f}{\partial y\partial x}f(x,y)&=-m(m-1)(x-y)^{m-2}=\sum_{0\leqslant k\leqslant m}(-1)^km(m-k)\binom mk\,x^{m-k-1}y^{k-1}
\end{align*}
(inutile de changer les bornes des sommations car les "apparents" exposants négatifs de $x,y$ ont des coefficients nuls).
On a donc bien $b=0$ puisque $(D+D^T)^m\neq 0$.
(1) Si $A$ vérifie la propriété alors $\alpha A+\beta I_n$ aussi pour tout $(\alpha,\beta)\in \C^2$ (calcul facile que je ne détaille pas).
(2) Si $A$ vérifie la propriété alors toute matrice semblable à $A$ la vérifie également.
(3) Si $A$ vérifie la propriété et s'écrit $A=\begin{pmatrix}
A_1 & ? \\
0 & ?
\end{pmatrix}$ (triangulaire supérieure par blocs) alors $A_1$ vérifie la propriété (pour les matrices carrées de même format que $A_1$, et le même entier $m$).
(4) Si $A$ est non scalaire elle est semblable à une matrice de la forme précédente avec $A_1 \in \mathcal{M}_2(K)$ triangulaire supérieure non scalaire : en effet, soit $A$ admet deux valeurs propres distinctes, auquel cas il suffit de consider le plan vectoriel engendré par deux vecteurs propres associés, soit $A$ ne possède qu'une seule valeur propre $\lambda$ auquel cas il suffit de considérer un vecteur $x$ de $\mathrm{Ker}(A-\lambda I_n)^2 \setminus \mathrm{Ker} (A-\lambda I_n)$ puis de prendre le plan $\mathrm{Vect}(A(x),x)$.
(5) Pour conclure, la combinaison des points précédents montre qu'il suffit d'invalider la propriété pour deux matrices particulières de taille $2$, à savoir $A_1=\begin{pmatrix}
1 & 0 \\
0 & 0
\end{pmatrix}$ et $A_2=\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}$. Pour la première, on remarque que $B={}^tA_2$ fournit un contre-exemple, pour la deuxième que $B=A_1$ en fournit un.
Il reste à traiter le cas des corps finis, mais là il faut changer de méthode...
Une coquille au (3) pour pouvoir l'utiliser au (4): le bloc en bas à droite est quelconque et pas forcément nul.
Au (5), $(A_1+A_2)^m$ et $(A_2+A_1)^m$ montrent que ni $A_1$ ni $A_2$ ne vérifie la propriété.
en revue le cas K=R,K=C,K corps commutatif quelconque
Merci
@etanche : c'est une question qui m'intéresse aussi.
Le problème est résolu (sauf corps de caractéristique non nulle : le cas corps fini n'est pas le seul en cause) lorsque $A$ est scindé sur un corps de caractéristique nulle. Tout ce qui précède fournit une solution.
Si le corps est celui des réels et $A$ non scindé, on peut remarquer, par utilisation du complexifié, que pour tout endomorphisme réel non scindé il existe un plan stable où la restriction a pour matrice $A_2=\begin{pmatrix}\alpha&-\beta\\\beta&\alpha\end{pmatrix},\;\beta\neq0$ et il suffit d'étudier ces matrices en taille 2.
On peut se ramener à $B=\dfrac1{\beta}(A_2-\alpha I_2)=\begin{pmatrix}0&-1\\1&0\end{pmatrix}$ et la considération de $U=\begin{pmatrix}1&1\\-1&-1\end{pmatrix}$ conduit à une contradiction pour $B+U$.
Il reste la question concernant un corps autre que $\R$, de caractéristique nulle et $A$ non scindé ?
et les matrices compagnons ?
Un point que j'ai omis de signaler : si le corps $\mathbb{K}$ possède au moins $m+1$ éléments alors
la formule se prolonge à toute matrice $B$ de $\mathcal{M}_n(\mathbb{L})$ pour n'importe quelle extension
$\mathbb{L}$ de $\mathbb{K}$, et en particulier on peut considérer une telle extension sur laquelle $A$ est trigonalisable.
de concours.
avant de donner la méthode efficace...
considérer le cas particulier où $A$ est une matrice compagnon de taille au moins $2$, choisir $B$ telle que $B^2=0$, ce qui simplifie la formule.
Si $A$ est singulière, s'arranger pour que $A+B$ soit inversible.
si $A$ est inversible, s'arranger si possible pour que $A+B$ ait $0$ pour valeur propre multiple.
Il y a une difficulté particulière liée aux blocs de taille 2, mais je n'en dis pas plus pour le moment.