В сообщении делается попытка дать ответ на вопрос, поставленный в заголовке, а также показать, что линейное преобразование имеет две матрицы.
1.
У Беклемишева в
http://ef.donnu-support.ru/emk/Data/BM/ ... BEKLEM.PDF стр.136
читаем:
Цитата:
"Рассмотрим два множества целых чисел:

и

. Через

обозначим множество всех пар вида

, где

— число из

, а

— из

. Матрицей называется функция на множестве

, т.е. закон, сопоставляющий каждой паре

некоторое число

."
Мы не будем называть эту функцию матрицей, будем называть ее просто функцией.
Матрицу же будем считать двухмерной - в пределах этого сообщения - таблицей элементов, причем ограничимся квадратными матрицами.
Пусть функция

сопоставляет на множестве

каждой паре

некоторое число

.
Назовем элементом

функции

функцию

от пары

.
Элементы функции

можно обозначить

, но по традиции их обозначают

.
Элементы

функции

можно расположить в виде двухмерной таблицы, которая называется матрицей:
Назовем матрицей функции совокупность всех элементов этой функции, расположенную в виде матрицы.Матрица (1) обозначается

.
Обратно, если представить каждый элемент матрицы

как функцию

от пары

, то

будет матрицей функции

.
Назовем

общим выражением элемента функции

.
(У Беклемишева сказано: "... некоторое число

", - но это неопределенное число, то есть неопределенное значение функции

от неопределенного аргумента, так что

это общее выражение элемента функции

.)
Назовем, например,

полуобщим (или полуконкретным) выражением элемента функции

от аргумента

, поскольку выражение аргумента в нем конкретное, а выражение функции общее.
Назовем, например,

конкретным выражением элемента функции

от аргумента

.
Последнее выражение соответствует записи

где вместо крестиков можно подставить конкретные выражения остальных элементов функции

Из нее видно, что функция, значение которой равно

, взята от аргумента

, хотя в этой записи не присутствует ни знак

, ни знак

. Мы видим это из положения

в таблице, взятой в скобки.
Таким образом, при конкретном выражении элемента функции его положение в матрице показывает, какому аргументу он соответствует (при совпадении аргументов элементов функции с номерами их мест в матрице.)
То есть при конкретных выражениях элементов функции

ее матрица сама является функцией

(при совпадении аргументов элементов функции

с номерами их мест в матрице.)
Если же матрица состоит из элементов функции

в полуобщем выражении - как, например, матрица (1), - то это не так (в этом случае матрица представляет собой функцию, каждое значение которой само является функцией).
Если попытаться посмотреть на выражение

как на функцию

, то возникает вопрос: зачем писать индексы при

, если из положения элемента

в матрице и так ясно, что для этого элемента аргументом функции

является

?
А если написать

то можно подумать, что

стоит не на своем месте.
Но что значит "не на своем месте"? В отношении чего? Если речь идет о функции

, то, где бы ни стоял элемент

, значение функции

от пары

одно и то же.
Что касается функции

самой по себе, то расположение ее элементов не имеет к ней никакого отношения, оно является для нее чисто внешним и может быть совершенно произвольным, то есть даже хаотичным.
Назовем транспонированием функции

замену ее на функцию

.
Если расположить полуобщие выражения элементов функции

в виде матрицы:

и затем транспонировать эту матрицу:

будет ли транспонирована функция

? Нет, потому что, чтобы транспонировать функцию, а не расположение ее элементов, надо изменить саму функцию, то есть взять транспонированную к ней. При этом следует изменить также обозначение функции, взять не

, а, например,

.
[В матрицах (2), (3) элементы могли бы быть обозначены не

, а

.]
Итак, при транспонировании матрицы функции сама функция не меняется.
Транспонирование ее матрицы это, так сказать, ее
внешнее транспонирование, а транспонирование изменением самой функции это
внутреннее транспонирование.
Когда мы видим элемент

, для нас это должно означать не то, что в матрице он стоит в строке

и столбце

, а то, что это функция от пары

натуральных чисел.
Если в записи матрицы

воспринимать индексы элементов как номера строк и столбцов, то после ее транспонирования при взгляде на полученную запись

может возникнуть недоумение, потому что, например, элемент

стоит на месте под номером

- как это понять?
Но если в

под индексами при

понимать аргумент функции

, все встает на место: любой элемент функции может стоять на любом месте в матрице, его сущность - то есть значение функции

от пары

- не зависит от места, которое он занимает.
Другое дело, что расположение элементов

функции

в матрице может быть задано упорядоченным, например, таким, чтобы аргументы всех элементов одновременно совпадали с номерами мест в матрице (как в матрице (1)), либо все одновременно были по отношению к ним симметричны (как в матрице (4)).
В этом случае из всех возможных изменений расположения элементов матрицы может допускаться только ее транспонирование, и функция может иметь только две матрицы.
2.
Обозначим через

матрицу (1) и, соответственно, через

матрицу (4).
Чтобы в выбранном базисе определить линейное преобразование вектора

в матричной форме, расположим элементы функции

в виде матриц

и

.
При умножении матрицы

на вектор-столбец

справа получим вектор-столбец, который обозначим

, это будет матричное выражение некоторого вектора, который естественно обозначить

и который будет являться вектором-образом произведенного преобразования, при том что

будет его вектором-прообразом.
Обозначим произведенное преобразование

.
При умножении матрицы

на вектор-строку

слева получим вектор-строку

, который также является матричным выражением вектора-образа

.
Таким образом, мы снова произведем линейное преобразование

вектора

, но не умножением матрицы

на вектор-столбец

справа, а умножением матрицы

на вектор-строку

слева.
При умножении матрицы

на вектор-столбец

справа или при умножении матрицы

на вектор-строку

слева получается в общем случае другое преобразование вектора

.
Обозначим его

.
(Впрочем, мы могли бы обозначить преобразования наоборот: первое как

, а второе как

, имея в виду, что предпочитаем второе преобразование считать исходным, а первое - производным от него.)
Таким образом, одна и та же функция

может быть использована для двух разных (в общем случае) преобразований.
Назовем функцию
функцией линейных преобразований
,
.3.
Каждое из преобразований

могло бы быть произведено при помощи другой матрицы, а именно, матрицы

, транспонированной к матрице

.
Для этого надо было бы расположить элементы функции

в виде двух матриц:

и

и умножить их на матричное выражение вектора

так же, как это было сделано по отношению к матрицам

и

.
Поскольку

, то

и

, и, умножая матрицы

и

на матричные выражения вектора

(то есть на

и

), мы не получим новых преобразований.
(То есть, несмотря на то, что функция линейного преобразования имеет две матрицы, а линейное преобразование имеет две функции, линейное преобразование имеет только две матрицы.)
Если транспонировать матрицу

, не транспонируя функцию

, то это все равно, как если, не транспонируя матрицу

, транспонировать функцию

, то есть заменить ее функцией

:
Поэтому, вместо того чтобы транспонировать функцию

, можно транспонировать ее матрицу

.
Таким образом, применяя вместо внутреннего транспонирования функции

ее внешнее транспонирование, то есть используя вместо матрицы

матрицу

и вместо матрицы

матрицу

, можно, вместо употребления обеих функций

, ограничиться употреблением одной только функции

.
4.
Вернемся к определению Беклемишева, а именно, к тому, что в нем он функцию, которую мы обозначили

, называет матрицей.
Почему он это делает?
Наверное, потому, что, поскольку раз навсегда было решено при линейном преобразовании вектора в матричной форме умножать на него матрицу преобразования справа, а не слева, функция преобразования стала отождествляться с одним из двух своих возможных расположений в виде матрицы.
Если же принять, что матрицу функции линейного преобразования можно умножать на преобразуемый вектор в матричной форме не только справа, но и слева - предварительно транспонировав и матрицу, и вектор, - то придется признать, что, как было показано, у линейного преобразования имеется не одна, а две матрицы.
Тем не менее, для того, чтобы не уточнять каждый раз, какая из этих двух матриц имеется в виду, можно называть матрицей линейного преобразования ту матрицу, которая умножается на вектор-столбец справа, как это и делалось до сих пор.
При этом есть смысл функцию, которую мы обозначили

, - и которая у линейного преобразования, конечно же, одна (если не считать транспонированной к ней функции

), - называть не матрицей преобразования, а функцией преобразования.
Что касается обозначений, то преобразование

вектора

, вместо

или

, можно было бы обозначать как

или

, чтобы не выказывать предпочтения умножению справа или умножению слева, которые имеют равные права, но можно этого и не делать, потому что что угодно можно обозначить как угодно.
5.
Ответ на вопрос: матрица линейного преобразования это матрица его функции, причем функция линейного преобразования имеет две матрицы, а линейное преобразование имеет две функции, тем не менее, линейное преобразование имеет не четыре, а только две матрицы.