В методе опорных векторов (SVM) как примере линейных дискриминантных функций приводится уравнение разделяющей гиперплоскости.
Если записать уравнение гиперплоскости в общем виде, то получается для n-мерного случая что-то типа:
Обычно вместо буквы
используют
, чтобы намекнуть на то, что множитель перед
- это весовой коэффициент.
Далее, для сокращения записи представляют выражение
как выраженное в координатах скалярное произведение некоторых векторов
и
Таким образом, получается
Это всё понятно.
Также встречается другая запись, которая меня и смущает.
Запись это такая:
Судя по записи, тут речь о матричном представлении векторов:
- вектор-строка,
- вектор-столбец,
- вектор-строка, а транспонирование необходимо чисто формально для возможности перемножения матриц.
Что тут неясно:
1. В названиях матриц обычно прописные буквы, а тут строчные, разве это допустимо?
2. Названия матриц обычно напечатаны обычным шрифтом, а тут жирным, как у обозначений векторов, да и пояснениях указывают, что это векторы, то есть получается что тут как бы транспонируют вектор, хотя транспонирование векторов вне контекста матриц для меня непонятная операция... В общем, как понимать транспонированный вектор - всегда как матрицу?
3. По идее, изначально оба вектора были обозначены как векторы-строки, первый вектор после транспонирования стал вектором-столбцом, но тогда после умножения вектора-столбца на вектор-строку получается квадратная матрица
, а не то выражение, которое должно получиться (матрица
c единственным элементом
)... Как это тогда понимать?
4. Почему транспонировали именно матрицу
, а не
, ведь при любом из транспонирований результат одинаковый?