Rambler's Top100 Service
Поиск   
 
Обратите внимание!   Посмотрите новые поступления ... Обратите внимание!
 
  Наука >> Математика >> Алгебра, математическая логика и теория чисел | Курсы лекций
 Посмотреть комментарии[2]  Добавить новое сообщение
next up previous contents index
Next: Понятие о тензорах Previous: 21 инвариантные множители

Subsections


22 -матрицы

1

$ \lambda $-матрицей (полиномиальной матрицей) называется матрица, элементами которой являются многочлены относительно некоторой буквы $ \lambda $. Степенью $ \lambda $-матрицы называется наивысшая из степеней многочленов, входящих в состав матрицы. Ясно, что $ \lambda $-матрица степени $ n$ может быть представлена в виде

$\displaystyle A_0\lambda^n+A_1\lambda^{n-1}+\ldots+A_n,
$

где $ A_k$ -- матрицы, уже не зависящие от $ \lambda $ 4.12. Частный случай $ \lambda $-матриц нам уже встречался неоднократно, а именно матрицы вида $ A-\lambda E$. Результаты, которые мы получим в этом параграфе, для случая $ \lambda $-матриц вида $ A-\lambda E$ содержат как частный случай многие из результатов, полученных в предыдущих параграфах этой главы.


$ \lambda $-матрицы встречаются во всех вопросах математики. Так, например, решение системы однородных линейных дифференциальных уравнений первого порядка с постоянными коэффициентами

$\displaystyle \frac{dy_i}{dx}=\sum_{k=1}^na_{ik}y_k \quad(i=1,2,\dots,n)$ (1)

ищется обычно в виде

$\displaystyle y_k=c_ke^{\lambda x},$ (2)

где $ \lambda $ и $ c_k$ -- некоторые постоянные. Для их определения подставим функции (2) в систему и сократим уравнение на $ e^{\lambda x}$. Мы получим систему линейных уравнений

$\displaystyle \lambda c_i=\sum_{k=1}^na_{ik}c_k,
$

матрица которой есть $ A-\lambda E$, где $ A$ -- матрица из коэффициентов системы (1). Таким образом, изучение системы дифференциальных уравнений (1) тесно связано с $ \lambda $-матрицей первой степени относительно $ \lambda $: $ A-\lambda E$.

Аналогично, исследование системы уравнений порядка выше первого приводит к исследованию $ \lambda $-матриц высших степеней. Например, исследование системы уравнений

$\displaystyle \sum_{k=1}^na_{ik}\frac{d^2y_k}{dx^2}+
\sum_{k=1}^nb_{ik}\frac{dy_k}{dx}+
\sum_{k=1}^nc_{ik}y_k=0
$

приводит к исследованию $ \lambda $-матрицы $ A\lambda^2+B\lambda+C$, где $ A=\Vert a_{ik}\Vert$, $ B=\Vert b_{ik}\Vert$, $ C=\Vert c_{ik}\Vert$.


Мы рассмотрим сейчас вопрос о каноническом виде $ \lambda $-матриц относительно так называемых элементарных преобразований.

Элементарными преобразованиями $ \lambda $-матриц называются преобразования следующих типов.

1$ ^\circ$ Перестановка между собой двух каких-либо строк или столбцов матрицы.

2$ ^\circ$ Прибавление к строке какой-либо другой строки, умноженной на некоторый многочлен $ \phi(\lambda)$, и, аналогично, прибавление к столбцу другого столбца, умноженного на некоторый многочлен.

3$ ^\circ$ Умножение строки или столбца на некоторое число, отличное от нуля.

Определение   Две $ \lambda $-матрицы называются эквивалентными, если одна может быть получена из другой некоторой последовательностью элементарных преобразований.

Обратное к каждому элементарному преобразованию есть снова элементарное преобразование. Это легко проверяется для каждого из трех типов элементарных преобразований. Так, если $ \lambda $-матрица $ B(\lambda)$ получается из $ \lambda $-матрицы $ A(\lambda)$ перестановкой строк, то обратной перестановкой строк мы можем из $ B(\lambda)$ получить $ A(\lambda)$. Если $ B(\lambda)$ получается из $ A(\lambda)$ прибавлением к $ k$-й строке $ i$-й, умноженной на $ \phi(\lambda)$, то, обратно, $ A(\lambda)$ можно получить из $ B(\lambda)$ прибавлением к $ k$-й строке $ i$-й, умноженной на $ -\phi(\lambda)$.

Из сделанного замечания следует, что если $ \lambda $-матрица $ K(\lambda)$ эквивалентна $ L(\lambda)$, то и обратно, $ L(\lambda)$ эквивалентна $ K(\lambda)$. В самом деле, пусть из $ K(\lambda)$ применением некоторой последовательности элементарных преобразований получается $ L(\lambda)$. Тогда, применяя к $ L(\lambda)$ в обратном порядке обратные преобразования, мы придем к $ K(\lambda)$.

Если две $ \lambda $-матрицы $ K_1(\lambda)$ и $ K_2(\lambda)$ эквивалентны некоторой матрице $ K(\lambda)$, то они эквивалентны между собой. Действительно, если сначала провести последовательность элементарных преобразований, переводящих $ K_1(\lambda)$ в $ K(\lambda)$, а затем элементарные преобразования, переводящие $ K(\lambda)$ в $ K_2(\lambda)$, то мы переведем $ K_1(\lambda)$ в $ K_2(\lambda)$, т.е. $ K_1(\lambda)$ эквивалентна $ K_2(\lambda)$.

Основной результат п.1 этого параграфа состоит в доказательстве теоремы о том, что всякую $ \lambda $-матрицу можно элементарными преобразованиями привести к диагональному виду. Доказательству этого предложения предпошлем лемму:

Лемма 22.1   Если элемент $ a_{11}(\lambda)$ в $ \lambda $-матрице $ A(\lambda)$ не равен нулю и если не все элементы $ a_{ik}(\lambda)$ матрицы $ A(\lambda)$ делятся на многочлен $ a_{11}(\lambda)$, то можно подобрать эквивалентную $ A(\lambda)$ $ \lambda $-матрицу $ B(\lambda)$, для которой элемент $ b_{11}(\lambda)$ также не равен нулю и имеет степень более низкую, чем $ a_{11}(\lambda)$.

Доказательство. Предположим сначала, что не делящийся на $ a_{11}(\lambda)$ элемент матрицы $ A(\lambda)$ находится в первой строке. Пусть, например, $ a_{1k}(\lambda)$ не делится на $ a_{11}(\lambda)$. Тогда $ a_{1k}(\lambda)$ можно представить в виде

$\displaystyle a_{1k}(\lambda)=a_{11}(\lambda)\phi(\lambda)+b(\lambda),
$

где $ \phi(\lambda)$ -- частное, $ b(\lambda)\ne0$ -- остаток от деления $ a_{1k}(\lambda)$ на $ a_{11}(\lambda)$ и, следовательно, степень $ b(\lambda)$ ниже, чем степень $ a_{11}(\lambda)$. Вычтем из $ k$-го столбца первый, умноженный на $ \phi(\lambda)$. Получим матрицу, где вместо $ a_{1k}(\lambda)$ стоит теперь многочлен $ b(\lambda)$, имеющий более низкую степень, чем $ a_{11}(\lambda)$. Переставляя теперь $ k$-й столбец с первым, мы переведем $ b(\lambda)$ в левый верхний угол.

Рассмотрим теперь случай, когда все элементы первой строки и первого столбца делятся на $ a_{11}(\lambda)$, а некоторый элемент $ a_{ik}(\lambda)$ не делится на $ a_{11}(\lambda)$. Этот случай мы сведем к предыдущему следующим образом: $ a_{i1}(\lambda)$ делится на $ a_{11}(\lambda)$, т.е. имеет вид $ a_{i1}(\lambda)=
\phi(\lambda)a_{11}(\lambda)$. Вычтем из $ i$-й строки первую, умноженную на $ \phi(\lambda)$. Тогда $ a_{i1}(\lambda)$ заменится нулем, элемент $ a_{ik}(\lambda)$ заменится элементом $ a'_{ik}(\lambda)=a_{ik}(\lambda)-\phi(\lambda)a_{1k}(\lambda)$, который по-прежнему не делится на $ a_{11}(\lambda)$ (так как $ a_{1k}(\lambda)$ по предположению делится на $ a_{11}(\lambda)$). Прибавим теперь $ i$-ю строку к первой. Так как на первом месте в $ i$-й строке теперь стоит нуль, то $ a_{11}(\lambda)$ не изменится, а на $ k$-м месте в первой строке теперь будет стоять $ a_{1k}(\lambda)+a'_{ik}(\lambda)= a_{1k}(\lambda)(1-\phi(\lambda))+
a_{ik}(\lambda)$ и, следовательно, в первой строке имеется элемент, не делящийся на $ a_{11}(\lambda)$. Мы свели этот случай к рассмотренному выше и, следовательно, лемма доказана.\qedsymbol

В дальнейшем мы будем пользоваться также следующим замечанием: если все элементы $ \lambda $-матрицы $ B(\lambda)$ делятся на некоторый многочлен $ E(\lambda)$, то после элементарных преобразований над матрицей $ B(\lambda)$ мы снова получим матрицу, элементы которой делятся на $ E(\lambda)$.

Перейдем теперь к приведению $ \lambda $-матрицы к диагональному виду.

Мы можем считать, что $ a_{11}(\lambda)\ne0$, так как, если в матрице есть хоть один элемент, отличный от нуля, то перестановками строк и столбцов его можно перевести на это место. Если не все элементы матрицы делятся на $ a_{11}(\lambda)$, то мы можем способом, указанном в лемме, заменить матрицу эквивалентной, в которой элемент, стоящий в левом верхнем углу, имеет более низкую степень и по-прежнему отличен от нуля. Если не все элементы делятся на него, то мы можем опять понизить степень этого элемента и т.д. Процесс закончится, когда мы придем к матрице $ B(\lambda)$, в которой все элементы делятся на $ b_{11}(\lambda)$.

Так как элементы $ b_{12}(\lambda),\dots,b_{1n}(\lambda)$ первой строки делятся на $ b_{11}(\lambda)$, то, вычитая из второго, третьего и т.д. столбца первый, умноженный на соответственно подобранные многочлены от $ \lambda $, мы можем обратить в нуль 2-й, 3-й, $ \dots$, $ n$-й элементы первой строки. Аналогично обратим в нуль все элементы, начиная со второго, в первом столбце. Так как в матрице $ B(\lambda)$ все элементы делились на $ b_{11}(\lambda)$, то в полученной матрице все элементы также делятся на $ b_{11}(\lambda)$. Разделим все элементы первой строки на старший коэффициент многочлена $ b_{11}(\lambda)$. На первом месте получится многочлен со старшим коэффициентом 1, который мы обозначим через $ E_1(\lambda)$, а на остальных местах будут по-прежнему нули.

Мы пришли, таким образом, к матрице следующего вида:

$\displaystyle \begin{pmatrix}E_1(\lambda)&0&0&\dots&0  0&c_{22}(\lambda)&c_{2...
...5]{5}  0&c_{n2}(\lambda)&c_{n3}(\lambda)&\dots&c_{nn}(\lambda) \end{pmatrix},$ (3)

все элементы которой делятся на $ E_1(\lambda)$.

Мы можем теперь повторить с матрицей $ (n-1)$-го порядка $ \Vert c_{ik}(\lambda)\Vert$ те же операции, что с матрицей $ n$-го порядка. Заметим, что всякое элементарное преобразование матрицы $ \Vert c_{ik}\Vert$ есть в то же время элементарное преобразование матрицы (3), так как в первой строке и столбце все элементы, кроме $ E_1(\lambda)$, равны нулю.

Таким образом, мы обратим в нуль все элементы второй строки и второго столбца, кроме диагонального. Полученный диагональный элемент (старший коэффициент которого также считаем равным единице) обозначим $ E_2(\lambda)$. Все элементы $ c_{ik}(\lambda)$ делятся на $ E_1(\lambda)$. Поэтому все дальнейшие элементарные преобразования всегда приводят нас к элементам, делящимся на $ E_1(\lambda)$. В частности, $ E_2(\lambda)$ делится на $ E_1(\lambda)$.

Мы пришли, таким образом, к матрице, у которой в первых двух строках и столбцах все элементы, кроме диагональных, равны нулю, а по диагонали стоят $ E_1(\lambda)$ и $ E_2(\lambda)$, причем $ E_2(\lambda)$ делится на $ E_1(\lambda)$. Мы сможем продолжать этот процесс далее, пока не приведем всю матрицу к диагональному виду. Может, конечно, оказаться, что мы закончим процесс раньше, придя к матрице, состоящей сплошь из нулей.

Итак, доказана следующая

Теорема 22.1   Всякая $ \lambda $-матрица может быть элементарными преобразованиями приведена к виду

$\displaystyle \begin{pmatrix}E_1(\lambda)&0&0&\dots&0  0&E_2(\lambda)&0&\dots...
...lambda)&\dots&0  \hdotsfor[1.5]{5}  0&0&0&\dots&E_n(\lambda) \end{pmatrix},$ (4)

где многочлены $ E_k(\lambda)$, стоящие по диагонали, имеют старшие коэффициенты, равные единице, многочлен $ E_2(\lambda)$ делится на $ E_1(\lambda)$, $ E_3(\lambda)$ делится на $ E_2(\lambda)$, $ E_4(\lambda)$ на $ E_3(\lambda)$ и т.д. Этот вид называется нормальной диагональной формой $ \lambda $-матрицы.

Конечно, некоторое число последних многочленов $ E_k(\lambda)$ в матрице (4) может оказаться равным нулю:

$\displaystyle E_{r+1}(\lambda)=E_{r+2}(\lambda)=\ldots=0.
$

Замечание   Мы привели матрицу $ A(\lambda)$ к нормальному диагональному виду, в котором каждый диагональный элемент делится на предшествующий. Если поставить себе целью приведение матрицы к какому-нибудь диагональному виду, отбросив требование делимости, то задача решается проще.

Действительно, для того чтобы обратить в нуль все элементы первой строки и первого столбца кроме $ a_{11}(\lambda)$, достаточно, чтобы эти элементы (а не все элементы матрицы) делились на $ a_{11}(\lambda)$. Как видно из доказательства леммы, для того чтобы этого достигнуть, требуется гораздо меньшее число элементарных преобразований, чем для приведения к нормальной диагональной форме. Обратив в нуль все элементы первой строки и первого столбца, кроме диагонального, мы можем проделать то же самое с оставшейся матрицей $ (n-1)$-го порядка и т.д., пока матрица не будет приведена к диагональному виду. Этим путем можно привести матрицу к различным диагональным формам, т.е. диагональная форма не определена однозначно. В следующем пункте этого параграфа мы покажем, что нормальная диагональная форма данной $ \lambda $-матрицы определяется уже однозначно.


Упражнение   Привести $ \lambda $-матрицу

$\displaystyle \begin{pmatrix}
\lambda-\lambda_1&0\\
0&\lambda-\lambda_2
\end{pmatrix},\quad\lambda_1\ne\lambda_2,
$

к нормальной диагональной форме.

Ответ.

$\displaystyle \begin{pmatrix}
1&0\\
0&(\lambda-\lambda_1)(\lambda-\lambda_2)
\end{pmatrix}.
$


2

В этом пункте мы докажем, что нормальная диагональная форма данной матрицы определена однозначно. Для этого мы построим систему многочленов, связанных с данной $ \lambda $-матрицей, которые не меняются при элементарных преобразованиях и которыми, как мы увидим, нормальная диагональная форма $ \lambda $-матрицы вполне определяется.

Пусть дана произвольная $ \lambda $-матрица. Наибольший общий делитель всех миноров $ k$-го порядка данной $ \lambda $-матрицы обозначим через $ D_k(\lambda)$. Так как наибольший общий делитель определен с точностью до постоянного множителя, то будем считать, что старший коэффициент у $ D_k(\lambda)$ равен единице. В частности, если общий наибольший делитель миноров $ k$-го порядка равен постоянной, то мы полагаем $ D_k(\lambda)=1$.

Докажем, что элементарные преобразования не меняют многочленов $ D_k(\lambda)$, т.е. что у эквивалентных $ \lambda $-матриц многочлены $ D_k(\lambda)$ совпадают.

Для элементарных преобразований вида 1$ ^\circ$, переставляющих строки или столбцы, это очевидно, так как при них каждый минор $ k$-го порядка либо вовсе не меняется, либо меняет знак, либо заменяется другим минором $ k$-го порядка, что, конечно, не меняет общего наибольшего делителя всех таких миноров. Аналогично, не меняют $ D_k(\lambda)$ элементарные преобразования вида 3$ ^\circ$, так как при этих преобразованиях миноры самое большее умножаются на постоянное. Рассмотрим теперь элементарное преобразование вида 2$ ^\circ$, например, прибавим к $ i$-му столбцу $ j$-й, умноженный на $ \phi(\lambda)$. При этом минор $ k$-го порядка вовсе не изменится, если он содержит и $ i$-й и $ j$-й столбцы либо если он не содержит ни одного из них.

В случае же, если минор содержит $ i$-й столбец и не содержит $ j$-го столбца, то его можно представить как комбинацию двух миноров, которые имелись у исходной матрицы. Таким образом, наибольший общий делитель миноров $ k$-го порядка и в этом случае не изменится.

Если все миноры порядка $ k$, а следовательно, и более высоких порядков, матрицы $ A(\lambda)$ равны нулю, то мы будем считать $ D_k(\lambda)\equiv D_{k+1}(\lambda)\equiv\ldots\equiv
D_n(\lambda)=0$. Заметим, что из совпадения у всех эквивалентных матриц многочленов $ D_k(\lambda)$ следует, что эквивалентные матрицы имеют один и тот же ранг.

Найдем многочлены $ D_k(\lambda)$ для матрицы, приведенной к нормальной диагональной форме:

$\displaystyle \begin{pmatrix}E_1(\lambda)&0&\dots&0  0&E_2(\lambda)&\dots&0  \hdotsfor[1.5]{4}  0&0&\dots&E_n(\lambda) \end{pmatrix}.$ (5)

Заметим, что у диагональной матрицы отличны от нуля только главные миноры, т.е. миноры, в которые входят строки и столбцы с одинаковыми номерами. Эти миноры имеют вид $ E_{i_1}(\lambda)E_{i_2}(\lambda)\dots
E_{i_k}(\lambda)$.

Так как $ E_2(\lambda)$ делится на $ E_1(\lambda)$, $ E_3(\lambda)$ делится на $ E_2(\lambda)$ и т.д., то наибольший общий делитель миноров первого порядка $ D_1(\lambda)$ равен $ E_1(\lambda)$. Так как все многочлены $ E_k(\lambda)$ делятся на $ E_1(\lambda)$, а все многочлены, кроме $ E_1(\lambda)$, делятся на $ E_2(\lambda)$, то произведение $ E_i(\lambda)E_j(\lambda)$ $ (i<j)$ всегда делится на минор $ E_1(\lambda)E_2(\lambda)$. Таким образом, $ D_2(\lambda)=E_1(\lambda)E_2(\lambda)$. Так как, кроме того, все $ E_k(\lambda)$, кроме $ E_1(\lambda)$ и $ E_2(\lambda)$, делятся на $ E_3(\lambda)$, то $ E_i(\lambda)E_j(\lambda)E_k(\lambda)$ $ (i<j<k)$ делится на минор $ E_1(\lambda)E_2(\lambda)E_3(\lambda)$ и, следовательно, $ D_3(\lambda)=E_1(\lambda)E_2(\lambda)E_3(\lambda)$.

Таким же образом для матрицы (4)

$\displaystyle D_k(\lambda)=E_1(\lambda)E_2(\lambda)\dots E_k(\lambda) \quad(k=1,2,\dots,n).$ (6)

Очевидно, что если, начиная с некоторого $ r$, $ E_{r+1}(\lambda)=E_{r+2}(\lambda)=\ldots=E_n(\lambda)=0$, то $ D_{r+1}(\lambda)=D_{r+2}(\lambda)= \ldots=D_n(\lambda)=0$.

Отсюда получается, что для $ \lambda $-матрицы, имеющей нормальную диагональную форму (5), диагональные элементы $ E_k(\lambda)$ вычисляются по формулам

$\displaystyle E_k(\lambda)=\frac{D_k(\lambda)}{D_{k-1}(\lambda)}.
$

При этом, если $ D_{r+1}(\lambda)=\ldots=D_n(\lambda)=0$, то надо положить $ E_{r+1}(\lambda)=\ldots=E_n(\lambda)=0$.

Многочлены $ E_k(\lambda)$ называются инвариантными множителями. В §20 мы уже определили их для матриц вида $ A-\lambda E$.

Теорема 22.2   Нормальная диагональная форма данной $ \lambda $-матрицы $ A(\lambda)$ определяется по ней однозначно. Если $ D_k(\lambda)$ ( $ k=2,3,\dots,r$) -- наибольший общий делитель миноров $ k$-го порядка матрицы $ A(\lambda)$, а $ D_{r+1}(\lambda)=\ldots=D_n(\lambda)=0$, то элементы нормальной диагональной формы (5) определяются по формулам

$\displaystyle E_k(\lambda)=\frac{D_k(\lambda)}{D_{k-1}(\lambda)}
\quad(k=1,2,\dots,r),
$

а

$\displaystyle E_{r+1}(\lambda)=E_{r+2}(\lambda)=\ldots=E_n(\lambda)=0.
$

Доказательство. Мы показали, что при элементарных преобразованиях многочлены $ D_k(\lambda)$ не меняются. Поэтому, если матрица $ A(\lambda)$ эквивалентна диагональной нормальной матрице (5), то $ D_k(\lambda)$ у них совпадают. Так как для матрицы (5) мы получили, что

$\displaystyle D_k(\lambda)=E_1(\lambda)\dots E_k(\lambda)
\quad(k=1,2,\dots,r; r\leqslant n)
$

и что $ D_{r+1}(\lambda)=D_{r+2}(\lambda)= \ldots=D_n(\lambda)=0$, то теорема доказана.\qedsymbol

Следствие   Для того чтобы две $ \lambda $-матрицы $ A(\lambda)$ и $ B(\lambda)$ были эквивалентны, необходимо и достаточно, чтобы для них совпадали многочлены $ D_1(\lambda), D_2(\lambda), \dots, D_n(\lambda)$.

Действительно, если многочлены $ D_k(\lambda)$ у $ A(\lambda)$ и $ B(\lambda)$ совпадают, то эти матрицы эквивалентны одной и той же нормальной диагональной $ \lambda $-матрице и, следовательно, эквивалентны между собой.

3

Назовем $ \lambda $-матрицу $ P(\lambda)$ обратимой, если матрица $ [P(\lambda)]^{-1}$ также есть $ \lambda $-матрица. Если $ \operatorname{Det}{P(\lambda)}$ равен постоянной, отличной от нуля, то $ P(\lambda)$ обратима. Действительно, элементы обратной матрицы равны минорам $ (n-1)$-го порядка, деленным на $ \operatorname{Det}{P(\lambda)}$, т.е. в нашем случае они будут многочленами от $ \lambda $ и, значит $ [P(\lambda)]^{-1}$, будет $ \lambda $-матрицей.

Обратно, если $ P(\lambda)$ обратима, то $ \operatorname{Det}{P(\lambda)}=\mathrm{const}\ne
\ne0$. В самом деле, пусть $ [P(\lambda)]^{-1}=P_1(\lambda)$. Тогда $ \operatorname{Det}{P(\lambda)}\operatorname{Det}{P_1(\lambda)}=1$, а произведение двух многочленов может быть тождественно равно единице лишь в том случае, если многочлены суть отличные от нуля постоянные. Таким образом, мы показали, что $ \lambda $-матрица обратима тогда и только тогда, когда ее определитель есть постоянная, отличная от нуля.

Все обратимые матрицы эквивалентны единичной матрице. В самом деле, определитель обратимой матрицы равен постоянной, отличной от нуля, и значит, $ D_n(\lambda)=1$. Так как $ D_n(\lambda)$ делится на $ D_k(\lambda)$, то и $ D_k(\lambda)=1$ $ (k=1,2,\dots,n)$. Поэтому все инвариантные множители $ E_k(\lambda)$ обратимой матрицы равны 1, и нормальная диагональная форма для них будет совпадать с единичной матрицей.

Теорема 22.3   Для того чтобы $ \lambda $-матрицы $ A(\lambda)$ и $ B(\lambda)$ были эквивалентны между собой, необходимо и достаточно, чтобы существовали обратимые $ \lambda $-матрицы $ P(\lambda)$ и $ Q(\lambda)$ такие, что

$\displaystyle A(\lambda)=P(\lambda)B(\lambda)Q(\lambda).$ (7)

Доказательство. Докажем сначала, что если матрицы $ A(\lambda)$ и $ B(\lambda)$ эквивалентны, то можно подобрать обратимые матрицы $ P(\lambda)$ и $ Q(\lambda)$ так, чтобы выполнялось равенство (7). Для этого заметим, что каждое элементарное преобразование $ \lambda $-матрицы $ A(\lambda)$ можно осуществить, умножая $ A(\lambda)$ слева или справа на некоторую обратимую $ \lambda $-матрицу -- матрицу этого элементарного преобразования.

Покажем это для всех трех типов элементарных преобразований. Пусть дана $ \lambda $-матрица

$\displaystyle A(\lambda)=
\begin{pmatrix}
a_{11}(\lambda)&a_{12}(\lambda)&\dots...
...5]{4}\\
a_{n1}(\lambda)&a_{n2}(\lambda)&\dots&a_{nn}(\lambda)
\end{pmatrix}.
$

Чтобы поменять местами, например, первый и второй столбцы (соответственно строки) этой матрицы, надо умножить $ A(\lambda)$ справа (соответственно слева) на матрицу

$\displaystyle \begin{pmatrix}0&1&0&\dots&0  1&0&0&\dots&0  0&0&1&\dots&0  \hdotsfor[1.5]{5}  0&0&0&\dots&1 \end{pmatrix},$ (8)

полученную из единичной перестановкой тех же столбцов (или, что все равно, строк).

Чтобы умножить второй столбец (соответственно строку) матрицы $ A(\lambda)$ на число $ \alpha$, нужно умножить $ A(\lambda)$ справа (соответственно слева) на матрицу

$\displaystyle \begin{pmatrix}1&0&0&\dots&0  0&\alpha&0&\dots&0  0&0&1&\dots&0  \hdotsfor[1.5]{5}  0&0&0&\dots&1 \end{pmatrix},$ (9)

полученную из единичной также умножением на $ \alpha$ второго столбца (или, что все равно, второй строки).

Наконец, чтобы прибавить к первому столбцу $ A(\lambda)$ второй, умноженный на $ \phi(\lambda)$, надо умножить $ A(\lambda)$ справа на матрицу

$\displaystyle \begin{pmatrix}1&0&0&\dots&0  \phi(\lambda)&1&0&\dots&0  0&0&1&\dots&0  \hdotsfor[1.5]{5}  0&0&0&\dots&1 \end{pmatrix},$ (10)

полученную с помощью той же операции из единичной, а чтобы прибавить к первой строке вторую, умноженную на $ \phi(\lambda)$, нужно умножить $ A(\lambda)$ слева на матрицу

$\displaystyle \begin{pmatrix}1&\phi(\lambda)&0&\dots&0  0&1&0&\dots&0  0&0&1&\dots&0  \hdotsfor[1.5]{5}  0&0&0&\dots&1 \end{pmatrix},$ (11)

которая также получается из единичной с помощью соответствующего элементарного преобразования.


Мы видим, таким образом, что матрицы элементарных преобразований -- это матрицы, полученные одним элементарным преобразованием из E, причем, чтобы произвести элементарное преобразование над столбцами, $ A(\lambda)$ надо умножать на матрицу преобразования справа, а чтобы преобразовать строки, $ A(\lambda)$ надо умножать на соответствующую матрицу слева.


Можно сосчитать определитель каждой из приведенных матриц (8)-(11) и, таким образом, проверить, что он равен отличной от нуля постоянной; следовательно, все эти матрицы обратимы. Так как определитель произведения матриц равен произведению определителей, то и произведение матриц элементарных преобразований есть обратимая матрица.

Так как мы предположили, что $ A(\lambda)$ и $ B(\lambda)$ эквивалентны, то $ A(\lambda)$ можно получить, применяя к $ B(\lambda)$ некоторую цепочку элементарных преобразований. Каждое элементарное преобразование можно осуществить, умножая $ B(\lambda)$ на обратимую $ \lambda $-матрицу; следовательно, весь переход от $ B(\lambda)$ к $ A(\lambda)$ можно получить, умножая $ B(\lambda)$ последовательно на некоторую совокупность обратимых $ \lambda $-матриц слева и аналогично на некоторую совокупность справа. Так как произведение обратимых матриц также есть обратимая матрица, то первая часть теоремы тем самым доказана.

Отсюда следует, что всякая обратимая матрица есть произведение матриц элементарных преобразований. Действительно, всякая обратимая матрица $ Q(\lambda)$ эквивалентна единичной матрице и поэтому может быть представлена в виде

$\displaystyle Q(\lambda)=P_1(\lambda)EP_2(\lambda),
$

где $ P_1(\lambda)$ и $ P_2(\lambda)$ -- произведения матриц элементарных преобразований. Но это значит, что и сама $ Q(\lambda)=P_1(\lambda)P_2(\lambda)$ есть произведение матриц элементарных преобразований.

Этим замечанием можно воспользоваться для доказательства второй половины теоремы. Действительно, пусть дано, что

$\displaystyle A(\lambda)=P(\lambda)B(\lambda)Q(\lambda),
$

где $ P(\lambda)$ и $ Q(\lambda)$ обратимы. Но, согласно только что сделанному замечанию, умножение слева на $ P(\lambda)$ и справа на $ Q(\lambda)$ эквивалентно некоторой совокупности элементарных преобразований, произведенных над $ B(\lambda)$. Таким образом, $ A(\lambda)$ эквивалентна $ B(\lambda)$, что и требовалось доказать.\qedsymbol


4

4.13

В этом пункте мы будем заниматься $ \lambda $-матрицами вида $ A-\lambda E$, где $ A$ -- постоянная матрица. Основной вопрос, который будет решен, это вопрос об эквивалентности $ \lambda $-матриц первой степени $ A-\lambda E$ и $ B-\lambda E$ 4.14.

Легко видеть, что если матрицы $ A$ и $ B$ подобны, т.е. существует такая невырожденная постоянная матрица $ C$, что $ B=C^{-1}\!AC$, то $ \lambda $-матрицы $ A-\lambda E$ и $ B-\lambda E$ эквивалентны. Действительно, если

$\displaystyle B=C^{-1}\!AC,$

то

$\displaystyle B-\lambda E=C^{-1}(A-\lambda E)C.$

Так как постоянная невырожденная матрица есть частный случай обратимой $ \lambda $-матрицы, то, по теореме 3, из этого равенства следует эквивалентность $ A-\lambda E$ и $ B-\lambda E$.

Мы покажем позднее и обратное, что из эквивалентности $ \lambda $-матриц $ A-\lambda E$ и $ B-\lambda E$ следует подобие матриц $ A$ и $ B$. Отсюда мы получим, в частности, новое доказательство того, что всякая матрица подобна матрице, имеющей нормальную жорданову форму.

Доказательству предпошлем лемму:

Лемма 22.2   Произвольную $ \lambda $-матрицу

$\displaystyle P(\lambda)=P_0\lambda^n+P_1\lambda^{n-1}+\ldots+P_n
$

можно разделить слева на матрицу вида $ A-\lambda E$ (где $ A$ -- любая постоянная матрица), т.е. можно найти такие матрицы $ S(\lambda)$ и $ R$ ($ R$ постоянна), что,

$\displaystyle P(\lambda)=(A-\lambda E)S(\lambda)+R.
$

Процесс деления, с помощью которого доказывается лемма, отличается от обычного деления многочленов только тем, что при умножении нельзя изменять порядок сомножителей.

Пусть

$\displaystyle P(\lambda)=P_0\lambda^n+P_1\lambda^{n-1}+\ldots+P_n,
$

где $ P_k$ -- постоянные матрицы.

Легко видеть, что $ \lambda $-матрица

$\displaystyle P(\lambda)+(A-\lambda E)P_0\lambda^{n-1}
$

будет иметь степень не выше $ n-1$.

Если

$\displaystyle P(\lambda)+(A-\lambda E)P_0\lambda^{n-1}=
P'_0\lambda^{n-1}+P'_1\lambda^{n-2}+\ldots+P'_{n-1},
$

то аналогично многочлен

$\displaystyle P(\lambda)+(A-\lambda E)P_0\lambda^{n-1}+
(A-\lambda E)P'_0\lambda^{n-2}
$

есть многочлен степени не выше $ n-2$. Продолжая этот процесс, мы придем к многочлену

$\displaystyle P(\lambda)+(A-\lambda E)
(P_0\lambda^{n-1}+P'_0\lambda^{n-2}+\dots)
$

степени не выше нулевой, т.е. не зависящему от $ \lambda $. Обозначив полученную постоянную матрицу через $ R$, мы получим

$\displaystyle P(\lambda)=(A-\lambda E)
[-P_0\lambda^{n-1}-P'_0\lambda^{n-2}-\dots]+R.
$

Если теперь обозначить многочлен в квадратных скобках через $ S(\lambda)$, то мы будем иметь

$\displaystyle P(\lambda)=(A-\lambda E)S(\lambda)+R,
$

т.е. лемма доказана.

Аналогично доказывается возможность деления справа, т.е. существование матриц $ S_1(\lambda)$ и $ R_1$ таких, что

$\displaystyle P(\lambda)=S_1(\lambda)(A-\lambda E)+R_1.
$


Заметим кстати, что здесь, как и в обычной теореме Безу, можно утверждать, что

$\displaystyle R=R_1=P(A).$


Теорема 22.4   Для того чтобы $ \lambda $-матрицы $ A-\lambda E$ и $ B-\lambda E$ были эквивалентны, необходимо и достаточно, чтобы матрицы $ A$ и $ B$ были подобны.

Доказательство. Достаточность была доказана в начале этого пункта. Докажем необходимость. Нам надо доказать, что если $ \lambda $-матрицы $ A-\lambda E$ и $ B-\lambda E$ эквивалентны, то матрицы $ A$ и $ B$ подобны. По теореме 3 существуют такие обратимые $ \lambda $-матрицы $ P(\lambda)$ и $ Q(\lambda)$, что

$\displaystyle B-\lambda E=P(\lambda)(A-\lambda E)Q(\lambda).$ (12)

Покажем сначала, что в равенстве (12) $ P(\lambda)$ и $ Q(\lambda)$ можно заменить постоянными матрицами.

С этой целью разделим $ P(\lambda)$ на $ B-\lambda E$ слева, $ Q(\lambda)$ -- справа. Мы получим равенства

\begin{displaymath}\begin{aligned}P(\lambda)&=(B-\lambda E)P_1(\lambda)+P_0,  Q(\lambda)&=Q_1(\lambda)(B-\lambda E)+Q_0, \end{aligned}\end{displaymath}

где $ P_0$ и $ Q_0$ -- постоянные матрицы.

Подставим в формулу (12) выражение для $ P(\lambda)$ и произведем умножение. Мы получим:

$\displaystyle B-\lambda E=(B-\lambda E)P_1(\lambda)(A-\lambda E)Q(\lambda)+
P_0(A-\lambda E)Q(\lambda).
$

Во второе слагаемое подставим выражение для $ Q(\lambda)$, произведем умножение и перенесем слагаемое $ P_0(A-\lambda E)Q_0$ в левую часть равенства. Мы получим:

$\displaystyle B-\lambda E-P_0(A-\lambda E)Q_0=K(\lambda),$ (14)

где

$\displaystyle K(\lambda)=(B-\lambda E)P_1(\lambda)(A-\lambda E)Q(\lambda) +P_0(A-\lambda E)Q(\lambda)(B-\lambda E).$ (15)

Из равенства (13) следует, что $ P_0=P(\lambda)-(B-\lambda E)P_1(\lambda)$. Заменив этим выражением $ P_0$ во втором слагаемом, получим:

$\displaystyle K(\lambda)=(B-\lambda E)P_1(\lambda)(A-\lambda E)Q(\lambda) +P(\l...
...(B-\lambda E) -(B-\lambda E)P_1(\lambda)(A-\lambda E)Q_1(\lambda)(B-\lambda E).$ (16)

Но из равенства (12) мы имеем

\begin{displaymath}
\begin{gathered}
(A-\lambda E)Q(\lambda)=P^{-1}(\lambda)(B-\...
...da)(A-\lambda E)=(B-\lambda E)Q^{-1}(\lambda){.}
\end{gathered}\end{displaymath}

Пользуясь этими равенствами, мы можем ввести множитель $ B-\lambda E$ в конец первого и начало второго слагаемого в выражении для $ K(\lambda)$, после чего получим окончательно

$\displaystyle K(\lambda)=(B-\lambda E)[P_1(\lambda)P^{-1}(\lambda)+
Q^{-1}(\lambda)Q_1(\lambda) -P_1(\lambda)(A-\lambda
E)Q_1(\lambda)](B-\lambda E).
$

Докажем теперь, что $ K(\lambda)=0$. Выражение в квадратных скобках, в силу обратимости $ P(\lambda)$ и $ Q(\lambda)$, есть многочлен относительно $ \lambda $. Докажем, что он равен нулю. Предположим, что этот многочлен отличен от нуля и имеет степень $ m$. Нетрудно убедиться тогда, что $ K(\lambda)$ имеет степень $ m+2$ и так как $ m\geqslant0$, является многочленом не ниже второй степени. Но из равенства (14) следует, что $ K(\lambda)$ не выше первой степени. Следовательно, выражение в квадратных скобках, а значит, и $ K(\lambda)=0$.

Мы получили таким образом, что

$\displaystyle B-\lambda E=P_0(A-\lambda E)Q_0,$ (17)

где $ P_0$ и $ Q_0$ -- постоянные матрицы, т.е. в равенстве (12) можно матрицы $ P(\lambda), Q(\lambda)$ заменить постоянными матрицами.

Сравнивая коэффициенты при первой степени $ \lambda $ в обеих частях равенства (17), мы получаем

$\displaystyle P_0Q_0=E,$

откуда следует невырожденность каждой из матриц $ P_0$ и $ Q_0$ и равенство

$\displaystyle P_0=Q_0^{-1}.$

Сравнение свободных членов дает

$\displaystyle B=P_0AQ_0=Q_0^{-1}AQ_0,$

т.е. $ B$ и $ A$ подобны. Теорема доказана.\qedsymbol

Так как условием эквивалентности $ A-\lambda E$ и $ B-\lambda E$ служит совпадение их инвариантных множителей, то из доказанной теоремы следует, что, для того чтобы матрицы $ A$ и $ B$ были подобны, необходимо и достаточно, чтобы инвариантные множители у $ A-\lambda E$ и $ B-\lambda E$ совпадали между собой. Покажем теперь, что всякая матрица $ A$ подобна матрице, имеющей жорданову нормальную форму.

Для этого рассмотрим матрицу $ A-\lambda E$ и найдем ее инвариантные множители. По этим инвариантным множителям построим, как было указано в §21, матрицу $ B$, имеющую жорданову нормальную форму. Тогда $ B-\lambda E$ имеет те же инвариантные множители, что и $ A-\lambda E$, и, значит, $ B$ подобна $ A$.

Как было указано на стр.[*] (сноска), изложенное в п.4 является другим, заменяющим §§19 и 20, доказательством того, что всякая матрица подобна матрице, имеющей жорданову нормальную форму. С другой стороны, конечно, содержание п.4 может быть непосредственно выведено из содержания §§19 или 20 и 21.


next up previous contents index
Next: Понятие о тензорах Previous: 21 инвариантные множители Vadim Yu. Radionov
2000-08-30


Посмотреть комментарии[2]
 Copyright © 2000-2015, РОО "Мир Науки и Культуры". ISSN 1684-9876 Rambler's Top100 Яндекс цитирования