Матрицы


1. Определение и первое применение

Пусть m,n∈ℕ. Матрицей размера m× n называется совокупность mn чисел, записанных в виде прямоугольной таблицы из m строк и n столбцов. — Г. Д. Ким, Л. В. Крицков. Алгебра и аналитическая геометрия: Теоремы и задачи. Том I; глава I, страница 9.

В общем, матрица — это просто прямоугольная таблица чисел с заданным числом строк и столбцов. Она называется квадратной, если количество строк и столбцов совпадает. Таблицы чисел сами по себе, в быту, возникают очень часто, поэтому определение это выглядит естественным и простым; но если бы неискушенный читатель на миг смог осознать всю глубину современного матричного анализа, он, наверное, удивился бы, почему вокруг матриц такой сыр-бор.

Именно поэтому мы, не углубляясь в формальности, определения, теоремы, начнём рассмотрение матриц с возможных способов их применения, так сказать, «в быту».

Сперва рассмотрим обычную систему линейных алгебраических уравнений (СЛАУ)
≤ft{\begin{matrix}a_{11}x_1+a_{12}x_2+…+a_{1n}x_n&=&b_1\\a_{21}x_1+a_{22}x_2+…+a_{2n}x_n&=&b_2\\…&&\\a_{m1}x_1+a_{m2}x_2
+…+a_{mn}x_n&=&b_m\end{matrix}\right.
Системы линейных уравнений возникают в огромном количестве задач в самых разных областях науки и исследованы очень глубоко, потому не будем тратить время на примеры задач, в которых они появляются. Давайте лучше для удобства запишем коэффициенты системы в прямоугольную таблицу A, которую мы теперь гордо можем назвать матрицей коэффициентов системы линейных уравнений:
A=\begin{bmatrix}a_{11}&a_{12}&…&a_{1n}\\a_{21}&a_{22}&…&a_{2n}\\
\vdots&\vdots&\ddots&\vdots\\a_{m1}&a_{m2}&…&a_{mn}\end{bmatrix}
Теперь мы можем попытаться провести наши преобразования в терминах матриц. Давайте для этого допишем в конце каждой строчки матрицы коэффициент из правой части соответствующего уравнения:
≤ft[\begin{array}{cccc|c}a_{11}&a_{12}&…&a_{1n}&b_1\\a_{21}&a_{22}&…&a_{2n}&b_2\\
\vdots&\vdots&\ddots&\vdots&\vdots\\a_{m1}&a_{m2}&…&a_{mn}&b_n\end{array}\right]
Такая матрица называется расширенной матрицей исходной системы уравнений.

Теперь давайте вспомним, как мы решаем системы уравнений. Одна из основных операций при этом — вычитание одного уравнения, умноженного на какое-то число, из другого. Эта операция никак не влияет на решение, но зато такими вычитаниями при желании можно исключить любую из переменных из всех уравнений, кроме какого-то одного и таким образом, потихоньку исключая переменные, получить уравнение с одной переменной, которое можно решить. Теперь остаётся заметить, что в терминах матрицы коэффициентов это будет означать вычитание одной строки из другой! Значит, мы можем решать системы, оперируя только матрицами и правыми частями. Вот и первое бесценное применение матриц.

Вот яркий пример того, как можно упростить систему, забыв о переменных:
≤ft[\begin{array}{ccc|c}1&−1&0&2\\0&1&−1&2\\−1&0&2&2\end{array}\right]∼
≤ft[\begin{array}{ccc|c}1&−1&0&2\\0&1&−1&2\\0&−1&2&4\end{array}\right]∼
≤ft[\begin{array}{ccc|c}1&−1&0&2\\0&1&−1&2\\0&0&1&6\end{array}\right]
(Здесь значок ∼ означает переход к эквивалентной системе уравнений.)

То есть мы сперва прибавили первую строчку к третьей, а затем прибавили вторую к третьей и в итоге получили систему очень простого вида, в которой можно сразу найти, чему равны неизвестные:
x_3=6,   x_2=2+x_3=8,   x_1=2+x_2=10.
Такой метод решения систем достаточно универсален и называется методом Гаусса.

2. Метод Гаусса

Метод Гаусса — классический метод решения систем линейных уравнений. Также его иногда называют методом исключения неизвестных. Общая схема метода очень проста:

  1. Находим строку матрицы, в которой первый элемент не равен нулю. Такая строка точно есть, в противном случае переменная x_1 не фигурирует в системе и система имеет бесконечное число решений.
  2. Меняем найденную строку местами с первой. (Или оставляем всё как есть, если в первой строке первый коэффициент не равен нулю.)
  3. Вычитаем новую первую строку из всех остальных строк с такими множителями, чтобы первые коэффициенты всех остальных строк обнулились.
  4. Проделываем всё то же самое со второй строкой и вторыми коэффициентами, и так далее.

В результате работы такого алгоритма должна получиться так называемая диагональная матрица — матрица, в которой не равны нулю только элементы главной диагонали, то есть такие, у которых номер строки равен номеру столбца:
D=\begin{bmatrix}d_1&0&…&0\\0&d_2&…&0\\\vdots&\vdots&\ddots&\vdots\\0&0&…&d_n\end{bmatrix}
(Мы говорим сейчас только о системах, в которых число уравнений m равно числу неизвестных n. Прочие случаи будут рассмотрены отдельно.)

Диагональная же матрица соответствует совершенно элементарной системе уравнений:
≤ft{\begin{matrix}d_1x_1&=&b_1\\d_2x_2&=&b_2\\\vdots&&\\d_nx_n&=&b_n\\\end{matrix}\right.

Собственно, суть метода и состоит в том, чтобы свести произвольную линейную систему к достаточно простой для решения.

Следующая интерактивная демонстрация поможет получить представление о решении систем методом Гаусса. Введите матрицу и правую часть или сгенерируйте случайную и нажмите кнопку «Решить!», чтобы проследить ход решения системы. (Допускаются целые числа и дроби, например -10/7. Пустые места в матрицах означают нули, как принято в линейной алгебре. )

 \LARGE = 

3. Умножение матриц

Матрицы оказались полезны нам при решении систем, но это лишь вершина айсберга.

Представьте, например, что при решении системы
≤ft{\begin{matrix}a_{11}x_1+a_{12}x_2+…+a_{1n}x_n&=&b_1\\a_{21}x_1+a_{22}x_2+…+a_{2n}x_n&=&b_2\\…&&\\a_{n1}x_1+a_{n2}x_2
+…+a_{nn}x_n&=&b_n\end{matrix}\right.
мы решили провести линейную замену переменных, вот такую:
≤ft{\begin{matrix}x_1&=&b_{11}y_1+b_{12}y_2+…+b_{1n}y_n,\\x_2&=&b_{21}y_1+b_{22}y_2+…+b_{2n}y_n,\\\vdots&&\\x_n&=&b_{n1}y_1+b
_{n2}y_2+…+b_{nn}y_n,\end{matrix}\right.
где b_{ij} — какие-то константы (не перепутайте их с константами в правой части, которые обозначены как b_i), составляющие матрицу B. И теперь мы хотим узнать, какую же систему нам нужно решать относительно новых переменных y_{i}. Давайте для этого возьмём какое-либо i-е уравнение исходной системы и подставим в него нашу замену:
\begin{matrix}&a_{i1}(b_{11}y_1+b_{12}y_2+…+b_{1n}y_n)&+&\\
+&a_{i2}(b_{21}y_1+b_{22}y_2+…+b_{2n}y_n)&+&\&⋅s&&\\
+&a_{in}(b_{n1}y_1+b_{n2}y_2+…+b_{nn}y_n)&=&b_i\end{matrix}
Аккуратно раскрыв скобки, получим, что в новой системе уравнений относительно y_{i}, которая имеет вид
≤ft{\begin{matrix}c_{11}y_1+c_{12}y_2+…+c_{1n}y_n&=&b_1\\
c_{21}y_1+c_{22}y_2+…+c_{2n}y_n&=&b_2\\
…&&\\c_{n1}y_1+c_{n2}y_2+…+c_{nn}y_n&=&b_n,\end{matrix}\right.
«новые» коэффициенты c_{ij} будут равны
c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+…+a_{in}b_{nj}=∑_{k=0}^na_{ik}b_{kj} .
То есть из двух матриц A и B мы получили новую матрицу C с указанной выше формулой для коэффициентов. Эта матрица и называется произведением матриц A и B и обозначается C=AB.
Произведением матриц A=(a_{ij})∈ℝ^{m× {}n} и B=(b_{ij})∈ℝ^{n× k} называется матрица C=(c_{ij})∈ℝ^{m× k}, элементы которой определены равенством
c_{ij}=∑_{s=1}^na_{is}b_{sj},   i=\overline{1,m}, j=\overline{1,k}.
 — Г. Д. Ким, Л. В. Крицков. Алгебра и аналитическая геометрия: Теоремы и задачи. Том I; глава I, §1, страница 10.

Как видно из формального определения, произведение матриц определено для не только для квадратных, но и прямоугольных матриц, но с некоторыми ограничениями:

Правило перемножения матриц легко запомнить фразой «строка на столбец»: чтобы получить очередной элемент матрицы-произведения, нужно «умножить» строку первой матрицы на столбец второй (кстати, такое «умножение» называется скалярным произведением), как схематически изображено на картинке: брать поочерёдно элементы строки и столбца, перемножать их и всё это суммировать. Из этого правила и вытекает единственное ограничение — для перемножения двух матриц необходимо, чтобы длины строк в первой были равны длинам столбцов во второй.

Кстати, для прямоугольных матриц тоже можно проследить аналогию с заменой переменных в системе уравнений, только теперь в изначальной системе либо не хватает, либо слишком много уравнений, а после замены число переменных может измениться.

Из этого определения можно извлечь много полезного. Например, если у нас есть n чисел, то мы всегда можем представить их в виде матрицы размера n× 1, то есть так называемого вектор-столбца. И тогда получится, что если мы запишем неизвестные нашей старой доброй системы уравнений в вектор-столбец
x=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix},
то произведение матрицы коэффициентов системы и этого вектор-столбца будет равно
Ax=\begin{bmatrix}a_{11}x_1+a_{12}x_2+…+a_{1n}x_n\\
a_{21}x_1+a_{22}x_2+…+a_{2n}x_n\\
\vdots\\a_{n1}x_1+a_{n2}x_2+…+a_{nn}x_n\end{bmatrix} .
То есть когда мы запишем правую часть в вектор-столбец b, то вся наша система сможет быть записана в виде
Ax=b.
Этот замечательный, лаконичный и красивый способ записи систем уравнений называется операторной формой записи, и у неё огромное количество преимуществ. Например, в операторной форме записи наша замена переменных имеет вид x=By, и, подставляя эту формулу в операторное уравнение, соответствующее исходной системе, мы получим уравнение относительно вектор-столбца y вида
A(By)=b .
Ну а используя определение матричного умножения, несложно доказать, что A(By)=(AB)y, то есть показать свойство ассоциативности матричного умножения. И тогда мы сразу получаем результат, который выводили вручную в начале этого пункта — что система относительно y имеет вид
(AB)y=b .

 

«Попробуйте на ощупь» перемножение матриц, воспользовавшись нашим мини-калькулятором. (Допускаются целые числа и дроби, например -12/5. Пустые места в матрицах означают нули, как принято в линейной алгебре. )

 \LARGE × 
 \LARGE = 

4. Другие операции с матрицами

В дальнейшем нам понадобятся некоторые простейшие операции с матрицами, о которых здесь будет вкратце рассказано.

Умножение матрицы на число — элементарная операция, заключающаяся в умножении каждого элемента матрицы на это самое число: