Le Théorème de Cayley-Hamilton

Original: http://www.efgh.com/math/cayleyhamilton.htm

LOGO
Philip J. Erdelsky
8 juin 2006
Reformaté 7 Juin, 2012


Se il vous plaît e-mail des commentaires, des corrections et des ajouts au webmaster à pje@efgh.com.

1. Le Théorème

Certains théorèmes mathématiques sont particulièrement beaux. Il est difficile de dire ce qui fait un théorème beau, mais deux propriétés viennent à l’esprit:

  1.      Il est simple à énoncer.
  2.      Il est difficile à prouver.


À mon avis, un très beau théorème est le théorème de Cayley-Hamilton de l’algèbre matricielle. Il indique que, si p(z) est le polynôme caractéristique d’un n n complexe matrice A, alors p (A) est la matrice zéro, l’addition et la multiplication dans l’évaluation sont les opérations matricielles usuelles, et le p0 constante de durée de p (z) est remplacée par la matrice p0I.

Rappelons que le polynôme caractéristique de A est donnée par

p(z) = det(A-zI).

2. La preuve Simple Mais non valide

À ce stade, les élèves parfois naïvement substituer un pour z dans la définition du polynôme caractéristique et faussement concluent que la CayleyHamilton théorème est trivial:

Pourquoi est pas p(A) = det(AAI) = det(AA) = det(O) = 0?

Il ya deux erreurs évidentes. Tout d’abord, zI dans la définition du polynôme caractéristique représente la multiplication d’une matrice par un scalaire, mais AI est la multiplication de deux matrices. En outre, l’argument ci-dessus semble prouver que la matrice est égal à un scalaire.

En fait, cet argument est valable dans le cas particulier où A est une matrice 1 1, et il n’y a pratiquement pas de différence entre les opérations de matrice et scalaires; mais dans ce cas, le théorème de Cayley-Hamilton est vraiment insignifiant.

3. Une preuve analytique

Il existe de nombreuses preuves de l’CayleyHamilton Théorème. Je dois admettre que je suis mal à suivre plupart d’entre eux, car ils impliquent algèbre combinatoire ou plutôt avancé. Un argument plus analytique, comme celle présentée ici, est plus adapté à ma propre formation et des talents.

Il permet de travailler sur le grand cas 2 2:

    | a b |
A = |     |
    | c d |


Le polynôme caractéristique de A est

   | a-z b   |
p(z) =  |         | = (a-z)(d-z) - bc = z2 - (a+d)z + ad - bc.
        | c   d-z |

La substitution de A z donne:

p(A) = A2 - (a+d)*A + (ad-bc)*I =

       | a b |   | a b |           | a b |             | 1 0 |
       |     | * |     | - (a+d) * |     | + (ad-bc) * |     | =
       | c d |   | c d |           | c d |             | 0 1 |

       | a2+bc  ab+bd |     | a2+ad  ab+bd |   | ad-bc 0     |
       |              |  -  |              | + |             | =
       | ac+cd  bc+d2 |     | ac+cd  ad+d2 |   | 0     ad-bc |

       | a2+bc-a2-ad+ad-bc  ab+bd-ab-bd       |    | 0 0 |
       |                                      | =  |     |.
       | ac+cd-ac-cd        bc+d2-ad-d2+ad-bc |    | 0 0 |


Pour prouver le théorème dans le cas général, nous λ une valeur propre de A, et soit x le vecteur propre correspondant (exprimé en tant que vecteur de la colonne). puis

Ax = λx.

Utilisation des propriétés élémentaires des opérations scalaires et matrice donne

A2x = (AA) x = A (Ax) = A (λx) = λ (Ax) = λ (λx) = λ2x.

Il peut être montré de manière générale que

[1] Akx = λkx, for k = 0, 1, 2, … n,

A0 = I.

Laissez le polynôme caractéristique de A soit

p(z) = pnzn + pn-1zn-1 + pn-2zn-2 + … + p0.

Puis, multiplier chaque équation [1] ci-dessus par pk et les ajouter à obtenir

p(A)x = p(λ)x.

Maintenant, p (λ), λ est égal à zéro parce que est une valeur propre de A. Ainsi p (A) x = 0 pour tout x vecteur propre de A.

Si A a n vecteurs propres linéairement indépendants, ce qui implique que p (A) doit être la matrice nulle.

Si A ne possède pas de vecteurs propres linéairement indépendants n, on construit une séquence A1, A2, … de matrices dont la limite est A, dont chacune a n vecteurs propres linéairement indépendants. Alors si pj(z) est le polynôme caractéristique de Aj, pj(Aj) = O. Comme tous les coefficients de pj(Aj) sont des fonctions continues des entrées de la matrice, la même chose est vraie de la limite p (A).

Pour créer une telle séquence, il suffit de construire des matrices arbitrairement proche de A, dont chacune a n vecteurs propres linéairement indépendants.

Tout d’abord, nous avons besoin d’un lemme simple. La matrice A, comme toutes les matrices complexes, est semblable à une matrice triangulaire supérieure, à savoir, il existe une matrice non singulière de Q où Q-1AQ est triangulaire supérieure. Ce résultat est bien connu, mais une preuve simple est donnée à l’annexe A.

Les valeurs propres d’une matrice triangulaire supérieure apparaissent le long de sa diagonale principale. Il est une matrice triangulaire supérieure T arbitrairement proche de Q-1AQ avec n valeurs propres distinctes. Puis QTQ-1 est arbitrairement proche de A et a les mêmes valeurs propres distinctes n que T.

Une matrice à n valeurs propres distinctes a vecteurs propres n distincts. Si ces vecteurs propres sont linéairement dépendantes, elles couvrent un espace de dimension inférieure à n. La cartographie définie par la matrice, limité à cet espace, aurait toujours les mêmes valeurs propres distinctes n, ce qui est impossible. Par conséquent, les vecteurs propres sont linéairement indépendants.

4. Preuve de commutative Anneaux

Cela prouve le théorème de Cayley-Hamilton pour des matrices complexes, mais il est également vrai pour les matrices plus de plusieurs anneaux commutatifs générales.

La preuve en est en fait assez simple. Notre expérience à prouver le cas 2 2 montre le chemin. L’expression de chaque entrée de p(A) est un polynôme en les variables n2, qui sont les entrées de A. Il n’y a pas que tout polynôme, mais qui prend la valeur zéro pour toutes les valeurs des variables. Cela peut se produire que si tous les coefficients sont nuls lorsque les termes semblables sont combinés. (Cela semble être une suite logique, mais il exige la preuve, si une figure à l’Annexe B.) où le polynôme évalue à zéro dans toute autre entité algébrique qui a toutes les opérations nécessaires.

Il pourrait sembler que la bague doit avoir une unité. Cependant, si nous nous abstenons de combiner des termes semblables, nous aurons une somme de monômes, chaque préfixé par un signe plus ou un signe moins. Même dans le domaine complexe, l’annulation est possible que si chaque monôme positif a un monôme négatif correspondant. Ils annuler dans un anneau, aussi, même si la bague n’a pas d’unité.

Annexe A. Chaque matrice complexe est semblable à une matrice triangulaire supérieure.

Soit A une matrice n n complexe. On montre, par récurrence sur n, ce qui est similaire à une matrice triangulaire supérieure.

Pour n = 1 l’assertion est triviale car A est déjà triangulaire supérieure.

Dans d’autres cas, nous λ une valeur propre de A et Soit x1 un vecteur propre correspondant. L’étendre à un ensemble x1, x2, …, xn, xn des vecteurs linéairement indépendants, et soit Q la matrice dont les colonnes sont x1, x2, …, xn.

Ensuite, si e1 est le vecteur colonne avec 1 dans sa première ligne et des zéros ailleurs, Me1 est la première colonne de M pour tout n n matrice M. conséquent

Q-1AQe1 = Q-1Ax1 = Q-1λx1 = λQ-1x1 = λe1, ,

et la première colonne de Q-1AQ est λe1. Par conséquent, il peut être divisé de la manière suivante:

| λ  v |
|      |
| 0  B |,


v est un (n1) vecteur ligne -Element, B est un (n-1) (n1) matrice, et 0 est tous les zéros. Par hypothèse de récurrence, R-1BR est triangulaire supérieure pour une matrice inversible R, de sorte que la matrice suivante est la matrice triangulaire supérieure requis analogues à A:

| 1  0  |           | 1  0 |
|       | * Q-1AQ *  |      | .
| 0  R-1 |           | 0  R |


ANNEXE B. un polynôme complexe est identiquement nulle seulement si tous les coefficients sont nuls

Si un polynôme est identiquement nulle, tous ses coefficients sont nuls, lorsque les termes similaires sont combinés, bien sûr.

La preuve se fait par induction sur le nombre de variables indépendantes.

Pour un polynôme p(z) dans une variable, nous notons simplement que p(k)(0) est k! fois le coefficient de zk. Si le polynôme est identiquement nulle, l’ensemble de ses dérivés sont également identiquement nul, et tous ses coefficients doit être égale à zéro.

Un polynôme en n variables peuvent être réorganisées de sorte qu’il est un polynôme à une variable, et chacun de ses coefficients est un polynôme en les n-1 autres variables.

Par la suite pour une variable, chacune de ces coefficients est nul pour toutes les valeurs de ses variables indépendantes. Ainsi par hypothèse de récurrence tous ses coefficients sont nuls.

Bien que les coefficients d’un polynôme identiquement nulle complexe sont tous nuls, cela ne vaut pas sur les corps finis. Si N est le nombre d’éléments d’un corps fini, puis zN – z = 0 pour tout élément z du champ. (La preuve ci-dessus se décompose dans ce cas. Bien que dérivés officiels peuvent être définis, N! Est égal à zéro, tel qu’il apparaît dans le dérivé officiel.)

Comments are closed.