Матрицы
1. Определение и первое применение
Пусть . Матрицей размера называется совокупность чисел, записанных в виде прямоугольной таблицы из строк и столбцов. — Г. Д. Ким, Л. В. Крицков. Алгебра и аналитическая геометрия: Теоремы и задачи. Том I; глава I, страница 9.В общем, матрица — это просто прямоугольная таблица чисел с заданным числом строк и столбцов. Она называется квадратной, если количество строк и столбцов совпадает. Таблицы чисел сами по себе, в быту, возникают очень часто, поэтому определение это выглядит естественным и простым; но если бы неискушенный читатель на миг смог осознать всю глубину современного матричного анализа, он, наверное, удивился бы, почему вокруг матриц такой сыр-бор.Именно поэтому мы, не углубляясь в формальности, определения, теоремы, начнём рассмотрение матриц с возможных способов их применения, так сказать, «в быту».Сперва рассмотрим обычную систему линейных алгебраических уравнений (СЛАУ)
Системы линейных уравнений возникают в огромном количестве задач в самых разных областях науки и исследованы очень глубоко, потому не будем тратить время на примеры задач, в которых они появляются. Давайте лучше для удобства запишем коэффициенты системы в прямоугольную таблицу , которую мы теперь гордо можем назвать матрицей коэффициентов системы линейных уравнений:
Теперь мы можем попытаться провести наши преобразования в терминах матриц. Давайте для этого допишем в конце каждой строчки матрицы коэффициент из правой части соответствующего уравнения:
Такая матрица называется расширенной матрицей исходной системы уравнений.Теперь давайте вспомним, как мы решаем системы уравнений. Одна из основных операций при этом — вычитание одного уравнения, умноженного на какое-то число, из другого. Эта операция никак не влияет на решение, но зато такими вычитаниями при желании можно исключить любую из переменных из всех уравнений, кроме какого-то одного и таким образом, потихоньку исключая переменные, получить уравнение с одной переменной, которое можно решить. Теперь остаётся заметить, что в терминах матрицы коэффициентов это будет означать вычитание одной строки из другой! Значит, мы можем решать системы, оперируя только матрицами и правыми частями. Вот и первое бесценное применение матриц.Вот яркий пример того, как можно упростить систему, забыв о переменных:
(Здесь значок означает переход к эквивалентной системе уравнений.)То есть мы сперва прибавили первую строчку к третьей, а затем прибавили вторую к третьей и в итоге получили систему очень простого вида, в которой можно сразу найти, чему равны неизвестные:
Такой метод решения систем достаточно универсален и называется методом Гаусса.
2. Метод Гаусса
Метод Гаусса — классический метод решения систем линейных уравнений. Также его иногда называют методом исключения неизвестных. Общая схема метода очень проста:- Находим строку матрицы, в которой первый элемент не равен нулю. Такая строка точно есть, в противном случае переменная не фигурирует в системе и система имеет бесконечное число решений.
- Меняем найденную строку местами с первой. (Или оставляем всё как есть, если в первой строке первый коэффициент не равен нулю.)
- Вычитаем новую первую строку из всех остальных строк с такими множителями, чтобы первые коэффициенты всех остальных строк обнулились.
- Проделываем всё то же самое со второй строкой и вторыми коэффициентами, и так далее.
(Мы говорим сейчас только о системах, в которых число уравнений равно числу неизвестных . Прочие случаи будут рассмотрены отдельно.)Диагональная же матрица соответствует совершенно элементарной системе уравнений:
Собственно, суть метода и состоит в том, чтобы свести произвольную линейную систему к достаточно простой для решения.Следующая интерактивная демонстрация поможет получить представление о решении систем методом Гаусса. Введите матрицу и правую часть или сгенерируйте случайную и нажмите кнопку «Решить!», чтобы проследить ход решения системы. (Допускаются целые числа и дроби, например -10/7. Пустые места в матрицах означают нули, как принято в линейной алгебре. )
3. Умножение матриц
Матрицы оказались полезны нам при решении систем, но это лишь вершина айсберга.Представьте, например, что при решении системымы решили провести линейную замену переменных, вот такую:
где — какие-то константы (не перепутайте их с константами в правой части, которые обозначены как ), составляющие матрицу . И теперь мы хотим узнать, какую же систему нам нужно решать относительно новых переменных . Давайте для этого возьмём какое-либо -е уравнение исходной системы и подставим в него нашу замену:
Аккуратно раскрыв скобки, получим, что в новой системе уравнений относительно , которая имеет вид
«новые» коэффициенты будут равны
То есть из двух матриц и мы получили новую матрицу с указанной выше формулой для коэффициентов. Эта матрица и называется произведением матриц и и обозначается .
Произведением матриц и называется матрица , элементы которой определены равенствомКак видно из формального определения, произведение матриц определено для не только для квадратных, но и прямоугольных матриц, но с некоторыми ограничениями: Правило перемножения матриц легко запомнить фразой «строка на столбец»: чтобы получить очередной элемент матрицы-произведения, нужно «умножить» строку первой матрицы на столбец второй (кстати, такое «умножение» называется скалярным произведением), как схематически изображено на картинке: брать поочерёдно элементы строки и столбца, перемножать их и всё это суммировать. Из этого правила и вытекает единственное ограничение — для перемножения двух матриц необходимо, чтобы длины строк в первой были равны длинам столбцов во второй. Кстати, для прямоугольных матриц тоже можно проследить аналогию с заменой переменных в системе уравнений, только теперь в изначальной системе либо не хватает, либо слишком много уравнений, а после замены число переменных может измениться.Из этого определения можно извлечь много полезного. Например, если у нас есть чисел, то мы всегда можем представить их в виде матрицы размера , то есть так называемого вектор-столбца. И тогда получится, что если мы запишем неизвестные нашей старой доброй системы уравнений в вектор-столбец— Г. Д. Ким, Л. В. Крицков. Алгебра и аналитическая геометрия: Теоремы и задачи. Том I; глава I, §1, страница 10.
то произведение матрицы коэффициентов системы и этого вектор-столбца будет равно
То есть когда мы запишем правую часть в вектор-столбец , то вся наша система сможет быть записана в виде
Этот замечательный, лаконичный и красивый способ записи систем уравнений называется операторной формой записи, и у неё огромное количество преимуществ. Например, в операторной форме записи наша замена переменных имеет вид , и, подставляя эту формулу в операторное уравнение, соответствующее исходной системе, мы получим уравнение относительно вектор-столбца вида
Ну а используя определение матричного умножения, несложно доказать, что , то есть показать свойство ассоциативности матричного умножения. И тогда мы сразу получаем результат, который выводили вручную в начале этого пункта — что система относительно имеет вид
«Попробуйте на ощупь» перемножение матриц, воспользовавшись нашим мини-калькулятором. (Допускаются целые числа и дроби, например -12/5. Пустые места в матрицах означают нули, как принято в линейной алгебре. )
4. Другие операции с матрицами
В дальнейшем нам понадобятся некоторые простейшие операции с матрицами, о которых здесь будет вкратце рассказано.Умножение матрицы на число — элементарная операция, заключающаяся в умножении каждого элемента матрицы на это самое число:Сложение матриц — тоже элементарная операция. Складывать можно только матрицы одинакового размера, и результатом сложения будет матрица, элементы которой являются суммами соответствующих элементов первого и второго слагаемого:
После введения операции сложения матриц легко представить себе и разность матриц.Транспонирование матрицы — несколько менее тривиальная операция. Матрицей, транспонированной к матрице , называется матрица , обозначаемая через , определяющаяся следующим образом:
То есть мы как бы переворачиваем матрицу вокруг её главной диагонали, тем самым меняя у элементов строчный и столбцовый индексы местами:
При этом если мы применим эту операцию два раза, то непременно получим исходную матрицу:
Сразу обратим внимание (на будущее), что в силу определения операции транспонирования всегда существуют произведения и — так уж согласованы размеры матриц и .В завершение обсуждения операций над матрицами приведём несколько их основных свойств, которые несложно доказать, аккуратно выписав поэлементно получающиеся матрицы:
- Коммутативность сложения: .
- Ассоциативность сложения: .
- Ассоциативность при умножении на числа: . (Здесь и далее и — любые вещественные числа.)
- Дистрибутивность умножения на число относительно сложения матриц: .
- Дистрибутивность умножения на число относительно сложения чисел: .
- Некоммутативность умножения: не для любых матриц и справедливо равенство . (Даже если они квадратные и их можно перемножать в любом порядке.)
- Ассоциативность умножения: . (Здесь и далее , и — любые матрицы, которые можно перемножить в указанном порядке.)
- Ассоциативность перемножений матриц и чисел: .
- Дистрибутивность умножения относительно сложения матриц: и .
- Аддитивность транспонирования: .
- Однородность транспонирования: .
- Транспонирование произведения: .
- Двойное транспонирование: .
5. Треугольные матрицы
В матричном анализе важное место занимают так называемые матрицы специального вида. Как несложно догадаться, это матрицы, элементы которых имеют какой-либо специальный вид, например, заданы фиксированной формулой с параметрами или связаны между собой каким-нибудь соотношением (например, матрица, в которой выполнено соотношение , называется симметричной). Упомянутые выше диагональные матрицы — яркий пример матриц специального вида. Треугольные матрицы, которые будут рассмотрены здесь — ещё один не менее важный пример. Матрица называется нижнетреугольной, если все элементы над её главной диагональю равны нулю, и верхнетреугольной, если все элементы под её главной диагональю равны нулю. Соответственно, треугольной матрицей называется любая нижне- или верхнетреугольная матрица. Вот общий вид верхнетреугольной матрицы:В верхнетреугольной матрице выполнено соотношение (соответственно, в нижнетреугольной ). Кстати, нередко матрицы специального вида определяются именно расположением нулей (вспомнить те же диагональные матрицы).Но зачем пришлось выделять треугольные матрицы из общей массы, чем они так хороши? В первую очередь простотой решения линейных систем с такими матрицами коэффициентов. (Не забывайте, что решение линейных систем — главная, хоть и не единственная, область применения матриц и связанных с ними результатов.) Действительно, если есть система с описанной выше верхнетреугольной матрицей , то мы сразу можем её решить:
(5.1)
имеет бесконечное количество решений. В этом несложно убедиться: подставьте вместо любое число — и полученная система относительно и будет иметь решение. С другой стороны, гораздо более простая на вид система
не имеет решений вообще. (Попробуйте, найдите хоть одно!)Есть простое правило: если уравнений в системе меньше, чем неизвестных, то система всегда имеет бесконечное число решений. Если же уравнений больше, чем неизвестных, то такого простого правила уже нет — тут всё будет зависеть от самих уравнений и правой части. Но и если число неизвестных в точности равно числу уравнений, то нельзя сразу сказать, будет ли существовать решение и будет ли оно единственно.Так что вопрос это непростой, а в его важности сомневаться не приходится. К счастью, на сегодняшний день он решён полностью, и далее мы будем постепенно идти к его решению.Начнём же мы наш путь с самого простого случая — системы с квадратной треугольной матрицей коэффициентов.Как видно из формул выше, единственная проблема, которая может возникнуть при решении системы с треугольной матрицей — это деление на ноль. То есть мы можем решить систему уравнений с треугольной матрицей коэффициентов, если все элементы на её главной диагонали не равны нулю. Действительно, в этом случае мы можем просто вычислить решение, воспользовавшись этой формулой. Притом видно, что оно единственно — потому что путей получить другое решение просто нет. Если же где-то на главной диагонали затаился ноль, то это значит, что на очередном шаге мы просто не сможем определить значение очередной переменной, и всё пойдёт крахом. Таким образом, можно сформулировать критерий разрешимости системы уравнений с треугольной матрицей коэффициентов: такая система разрешима (то есть у неё есть решение, и притом единственное, для любой правой части) тогда и только тогда, когда ни один из элементов на главной диагонали соответствующей треугольной матрицы не равен нулю.
6. Обратная матрица
Вернёмся к нашей системе линейных уравнений с произвольной квадратной матрицей коэффициентов:Давайте теперь представим, что у нас есть одна матрица коэффициентов и много разных правых частей, с которыми нужно решить систему. Притом мы сразу отметаем вариант с обычным методом Гаусса — он достаточно трудоёмок (требует порядка операций умножения, деления и вычитания чисел), и если правых частей действительно много, то вычислительный процесс может затянуться. В поисках альтернативы изучим вот какой вопрос. Что нам даёт линейность наших уравнений? А то, что если мы решили систему с правыми частями и , и получили решения, соответственно, и , то для правой части решение будет в точности равно . Чего из этого можно извлечь толкового? А вот что. Если мы решим систему для векторов
в которых все элементы равны нулю, кроме одной единицы, стоящей в -й позиции, и получим решения , то решение системы с произвольной правой частью будет равно линейной комбинации векторов с коэффициентами , то есть вектору вида
Если теперь записать векторы в матрицу (эта запись означает, что векторы стали столбцами матрицы ), то мы получим, что
И это великолепно!Что же мы получили? Что если мы решим систему с определёнными векторами, то решение её с любой правой частью сведётся к обычному умножению вектора на матрицу! А это уже заметный прогресс по сравнению с методом Гаусса, ибо умножение вектора на матрицу требует лишь порядка операций умножения и сложения чисел. (Сложность алгоритмов — это отдельная, большая и сложная тема, поэтому на такие замечания можете впредь не обращать внимания. Скажу лишь, что стало быстрее. Гораздо.)Именно такая вот матрица , позволяющая умножением на правую часть решать системы с матрицей коэффициентов (при условии, что у них заведомо существует единственное решение при любых правых частях), и называется матрицей, обратной к матрице и обозначается .
Матрица называется обратной к матрице , еслиВ этом определении фигурирует до сих пор не введённая нами единичная матрица— Г. Д. Ким, Л. В. Крицков. Алгебра и аналитическая геометрия: Теоремы и задачи. Том I; глава II, §9, страница 87.
— квадратная диагональная матрица с единицами на главной диагонали. В указанной в определении формуле подразумевается, что матрица квадратная и что — единичная матрица того же размера, что и .Главное свойство единичной матрицы заключается в том, что при домножении какой-либо матрицы на единичную (слева или справа, неважно) результат равен исходной матрице. То есть для любой матрицы и . (Учтите, что во всех формулах, где фигурирует , обычно считается, что она такого размера, при которым все произведения имеют смысл. В данных формулах матрица может быть прямоугольной; тогда эти две формулы по-прежнему будут справедливы, только матрицы в них будут разных размеров.) В частности, это касается и векторов. Вектор при умножении на единичную матрицу не изменяется.Но вернёмся к определению обратной матрицы. Если приглядеться внимательно, то можно увидеть, что снова определение из учебника полностью совпадает с нашим, хоть и выглядит совсем по-другому. Ведь что значит, что произведение равно единичной матрице? А то, что если сперва умножить вектор на матрицу , а потом умножить результат на , то получится исходный вектор. То есть вектор является решением системы ! Значит, матрица действительно решает систему с матрицей . Ну а другое условие даёт нам единственность этого решения. (Предположим, что существует два решения и . Тогда и . Тогда . Ну а тогда , но в то же время , и, следовательно, и . Значит, решение единственно.) Матрица , для которой существует обратная, называется обратимой. Как мы только что показали, обратимость эквивалентна существованию и единственности решения системы уравнений с матрицей коэффициентов для любой правой части. Для краткости впредь мы будем вместо этого трудновыговариваемого свойства сразу говорить, что матрица коэффициентов обратима.Ну и из наших рассуждений видно, как можно найти обратную матрицу — нужно просто решить систему с векторами . Причём для удобства решать её можно со всеми векторами одновременно, то есть расширенная матрица будет расширена теперь не одним вектором, а сразу штуками.Следующая интерактивная демонстрация призвана продемонстрировать нахождение обратной матрицы методом Гаусса.