В методе опорных векторов (SVM) как примере линейных дискриминантных функций приводится уравнение разделяющей гиперплоскости.
Если записать уравнение гиперплоскости в общем виде, то получается для n-мерного случая что-то типа:
![$a_1x_1 + a_2x_2 + ... + a_nx_n + b = 0$ $a_1x_1 + a_2x_2 + ... + a_nx_n + b = 0$](https://dxdy-02.korotkov.co.uk/f/d/3/2/d32aad3c90cfd03b61155f77eeb7c77e82.png)
Обычно вместо буквы
![$a$ $a$](https://dxdy-01.korotkov.co.uk/f/4/4/b/44bc9d542a92714cac84e01cbbb7fd6182.png)
используют
![$w$ $w$](https://dxdy-04.korotkov.co.uk/f/3/1/f/31fae8b8b78ebe01cbfbe2fe5383262482.png)
, чтобы намекнуть на то, что множитель перед
![$x$ $x$](https://dxdy-04.korotkov.co.uk/f/3/3/2/332cc365a4987aacce0ead01b8bdcc0b82.png)
- это весовой коэффициент.
Далее, для сокращения записи представляют выражение
![$w_1x_1 + w_2x_2 + ... + w_nx_n$ $w_1x_1 + w_2x_2 + ... + w_nx_n$](https://dxdy-02.korotkov.co.uk/f/5/8/c/58cfeb36d46538bcac55f9292c246a7082.png)
как выраженное в координатах скалярное произведение некоторых векторов
![$\mathbf{w} = (w_1, w_2, ..., w_n)$ $\mathbf{w} = (w_1, w_2, ..., w_n)$](https://dxdy-04.korotkov.co.uk/f/b/8/b/b8bb03733a9836f543879a156e79cbb882.png)
и
![$\mathbf{x} = (x_1, x_2, ..., x_n)$ $\mathbf{x} = (x_1, x_2, ..., x_n)$](https://dxdy-01.korotkov.co.uk/f/8/f/a/8fa05ad00f211c6c2c6b628a1b49a57782.png)
Таким образом, получается
![$(\mathbf{w},\mathbf{x}) + b = 0$ $(\mathbf{w},\mathbf{x}) + b = 0$](https://dxdy-03.korotkov.co.uk/f/e/6/b/e6b4410bc17a63dd38e8c5b97a7d110b82.png)
Это всё понятно.
Также встречается другая запись, которая меня и смущает.
Запись это такая:
![$\mathbf{w}^\mathbf{T}\mathbf{x}+b=0$ $\mathbf{w}^\mathbf{T}\mathbf{x}+b=0$](https://dxdy-01.korotkov.co.uk/f/4/b/1/4b12edeccaa3d617672ac6d902bc024782.png)
Судя по записи, тут речь о матричном представлении векторов:
![$\mathbf{w}$ $\mathbf{w}$](https://dxdy-02.korotkov.co.uk/f/5/d/d/5ddc1b22140b2658931d8962d8c90c3382.png)
- вектор-строка,
![$\mathbf{w}^\mathbf{T}$ $\mathbf{w}^\mathbf{T}$](https://dxdy-04.korotkov.co.uk/f/3/d/5/3d57db02b95f0db285959073cf93ed3982.png)
- вектор-столбец,
![$\mathbf{x}$ $\mathbf{x}$](https://dxdy-04.korotkov.co.uk/f/b/0/e/b0ea07dc5c00127344a1cad40467b8de82.png)
- вектор-строка, а транспонирование необходимо чисто формально для возможности перемножения матриц.
Что тут неясно:
1. В названиях матриц обычно прописные буквы, а тут строчные, разве это допустимо?
2. Названия матриц обычно напечатаны обычным шрифтом, а тут жирным, как у обозначений векторов, да и пояснениях указывают, что это векторы, то есть получается что тут как бы транспонируют вектор, хотя транспонирование векторов вне контекста матриц для меня непонятная операция... В общем, как понимать транспонированный вектор - всегда как матрицу?
3. По идее, изначально оба вектора были обозначены как векторы-строки, первый вектор после транспонирования стал вектором-столбцом, но тогда после умножения вектора-столбца на вектор-строку получается квадратная матрица
![$n \times n$ $n \times n$](https://dxdy-04.korotkov.co.uk/f/3/a/d/3add1221abfa79cb14021bc2dacd572582.png)
, а не то выражение, которое должно получиться (матрица
![$1 \times 1$ $1 \times 1$](https://dxdy-02.korotkov.co.uk/f/d/1/2/d12ef2fd91d2a991710509cae722913482.png)
c единственным элементом
![$w_1x_1 + w_2x_2 + ... + w_nx_n$ $w_1x_1 + w_2x_2 + ... + w_nx_n$](https://dxdy-02.korotkov.co.uk/f/5/8/c/58cfeb36d46538bcac55f9292c246a7082.png)
)... Как это тогда понимать?
4. Почему транспонировали именно матрицу
![$\mathbf{w}$ $\mathbf{w}$](https://dxdy-02.korotkov.co.uk/f/5/d/d/5ddc1b22140b2658931d8962d8c90c3382.png)
, а не
![$\mathbf{x}$ $\mathbf{x}$](https://dxdy-04.korotkov.co.uk/f/b/0/e/b0ea07dc5c00127344a1cad40467b8de82.png)
, ведь при любом из транспонирований результат одинаковый?