Часто концепция умножения матриц является таким небольшим камнем преткновения для студентов. Тема плохо усваивается, забываются определения, путаются строки со столбцами и т.п. Ну, по крайней мере, со мной так было, я несколько вальяжно относился к предметам на 1 курсе, ой да что там может быть сложного? Проблема невелика, конечно, последующие курсы заставят освоить эту тему or die. И всё-таки, нет причин не облегчать усвоение любой темы.
Вот этот рисунок (взял из Википедии) был для меня некоторым откровением:
Мне кажется, это первое, что должен видеть студент по этой теме, да и в дальнейшем эта схема должна более активно эксплуатироваться (в случае со мной это было не так, я увидел этот рисунок гораздо позже). Такой подход, как мне представляется, имеет ряд преимуществ:
1) Оказывается, мы с детства знакомы с перемножением матриц. Таблица умножения — не что иное, как произведение матрицы-вектора-столбца на матрицу-вектор-строку. Только "вектора" могут быть толще, или, другими словами, произведение матриц — это просто сумма нескольких таблиц умножения.
2) Мгновенно запоминается, что умножается "строка на столбец" и что "число столбцов в левой матрице равняется числу строк в правой". Если усвоить картинку, потом уже ничего нельзя перепутать.
3) А что будет, если поменять местами
и
? Для случая таблицы умножения получается (опять со школы знакомое) скалярное произведение векторов, вау, это тоже частный случай перемножения матриц. Сразу видно, что умножение некоммутативно. Хотя для квадратных матриц, всё-таки, не сразу.
4) Ассоциативность, к сожалению, тоже не очевидна, нужно писать формулы. Но, хотя бы по размерностям видно: если
можно умножить на
, а
— на
, то
умножаемо на
, а
— на
.
5) Ранг можно сразу давать через decomposition rank: минимальная "толщина" сомножителей, на которые можно разложить матрицу. А уже потом показывать, что он равен "рангу по строкам" и "рангу по столбцам". Придётся, правда, сплясать вокруг нулевого ранга, но выгод, имхо, больше.
Может, мне просто не повезло, а эта схема и так уже достаточно активно используется?
Или у неё есть неочевидные изъяны, из-за которых предпочтителен более "формульный" подход?