YYSS
К тому же здесь речь шла лишь об умножении матриц.
Дело в том, что умножении матриц играет важную вспомогательную роль во многих ключевых алгоритмах линейной алгебры, например, в диагонализации, интернетные примеры для которой я и привел. Т.е. нет скорости умножения матриц - нет скорости и соответствующего алгоритма. Хотя в моих ссылках можно еще много чего интересного найти, касающегося проколов Intel MKL в их, как они рекламируют, самых быстрых алгоритмах.
PaviaЕсть такая программа: PC GAMESS. В ней есть ссылка на ассемблерный код, который содержит и быстрое перемножение матриц, не уступающее по скорости dgemm Intel MKL.