2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2, 3  След.
 
 Распределение коэффициентов дискриминантной функции
Сообщение25.10.2019, 08:00 


27/10/09
602
Дамы и Господа!

Вопрос о законе распределения коэффициентов дискриминантной функции. В предположении о равенстве ковариационных матриц двух выборок $X$ и $Y$линейная дискриминантная функция может быть построена как $V=\left(\bar Y-\bar X\right)S^{-1}$, $v_0=\left(\bar Y+\bar X\right)V'/2$, где $S$ - оценка ковариационной матрицы по обеим выборкам. Есть подозрение, что компоненты вектора связаны с распределением Стьюдента (по аналогии с регрессионным анализом), точнее $\frac{V_i-A_i}{\sigma_i}$ подчиняется распределению Стьюдента, здесь $A_i$ - истинный коэффициент дискриминантной функции.
Если это верно, то стает вопрос: как определить $\sigma_i$ и сколько степеней свободы распределения Стьюдента?

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение12.11.2019, 23:32 


07/10/15

2400
$\sigma^2=\frac{N}{N-k}[1-(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})] $
число степеней свободы $N-k$, где $N$ - объём выборки, k - число независимых переменных.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение13.11.2019, 05:11 


27/10/09
602
Не совсем понял. $\sigma^2=\frac{N}{N-k}[1-(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})] $ - это скаляр. Тогда получается, что у всех компонентов вектора $V$ одинаковая дисперсия, что вряд ли соответствует действительности. По аналогии с регрессионным анализом должна получиться ковариационная матрица коэффициентов.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение13.11.2019, 17:49 


07/10/15

2400
AndreyL в сообщении #1425645 писал(а):
Не совсем понял. $\sigma^2=\frac{N}{N-k}[1-(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})] $ - это скаляр


Да, это несмещённая оценка дисперсии эквивалентных остатков, разумеется скаляр,
к стати в той формуле ошибка, сейчас перепроверил, правильно будет так
$$\sigma^2=\frac{4N-(N-1)(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})}{4(N-k-1)} $$.
Она верна, только если классы сбалансированы, а признаки центрированы.
Из неё, ковариационная матрица коэффициентов находятся так
$cov(b)=\sigma^2\cdot \frac{S^{-1}}{N-1}$
это классические оценки Вальда, думал будет и так понятно.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 15:58 


27/10/09
602
Извиняюсь, был в отъезде.

Попробовал посчитать дисперсию $$\sigma^2=\frac{4N-(N-1)(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})}{4(N-k-1)} $$ Парадокс в том, что в подавляющем большинстве случаев она отрицательна. На самом деле ни из чего не следует, что она обязана быть положительной, поскольку при хорошей дискриминации величина $(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})$ может быть сколь угодно большой. Не могли бы Вы дать ссылку, где эта дисперсия и ковариационная матрица опубликованы?

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 16:48 


07/10/15

2400
AndreyL в сообщении #1427062 писал(а):
Парадокс в том, что в подавляющем большинстве случаев она отрицательна.

приведите хотя бы 1 пример в числах, подтверждающий ваше утверждение

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 20:20 


27/10/09
602
Привожу два, в обоих $N=22$
первый
$\bar{X}=(-1.78636, 0.327078, 1.35463)$
$\bar{Y}=(1.90767, 1.71493, 0.396559)$
$S=\left(
\begin{array}{ccc}
 0.0406341 & 0.324432 & -0.0550334 \\
 0.324432 & 2.92064 & -0.858945 \\
 -0.0550334 & -0.858945 & 0.676882 \\
\end{array}
\right)$
$\sigma^2=-5003.07$

второй
$\bar{X}=(1.15848, -1.37285, -0.527274)$
$\bar{Y}=(1.75171, 0.80198, 1.76463)$
$S=\left(
\begin{array}{ccc}
 0.851032 & -0.177051 & -0.802064 \\
 -0.177051 & 0.278668 & 0.268149 \\
 -0.802064 & 0.268149 & 1.36385 \\
\end{array}
\right)$
$\sigma^2=-7.10802$

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 21:08 


07/10/15

2400
Посмотрел только первый пример. Сама по себе, матрица $S $ похожа на реальную. Однако, произведение
$(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})$ получается равным ~17 тыс. Это действительно парадоксально.
На всякий случай, для проверки, сгенерировал 2 нормальные выборки с $n=100$ и $k=10$. К одной из них прибавил единицу, из другой единицу вычел. Результаты вычислений получились ожидаемыми. Никаких ошибок нет. Возникают подозрения, что ошибка на вашей стороне, возможно в вычислении $S$.

Чтобы развеять все сомнения, пришлите сами данные по одному из примеров, тем более, что их не так уж и много (2 таблицы 20х3).

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 21:13 


27/10/09
602
Извиняюсь, возможно я не совсем понял Вашу формулу для $\sigma^2$ - что такое $N$? Это суммарный объем двух выборок (речь идет о дискриминантном анализе) или что-то другое?
А квадратичная форма $(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})$ действительно может изменяться от 0 до бесконечности, чем она больше, тем лучше дискриминация.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 21:25 


07/10/15

2400
AndreyL в сообщении #1427083 писал(а):
А квадратичная форма $(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})$ действительно может изменяться от 0 до бесконечности


$N$ это общий объём выборки, судя по всему, у вас он 46, но это число никак не влияет на знак, всё дело в $S$ и средних. Поэтому, предлагаю вам всё же предоставить данные, по которым получится вычислить приведенные выше статистики $S, \bar{Y}, \bar{X}$. Лично у меня есть веские основания полагать, что таких данных просто не существует.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 21:32 


27/10/09
602
Вот, к примеру, две выборки, для них $\sigma^2=-1628.31$

$$X=\begin{array}{ccc}
 -0.328622 & -0.87017 & -2.17363 \\
 1.9345 & -0.986489 & -0.898776 \\
 -0.421032 & -1.23808 & -1.86044 \\
 0.379683 & -0.644588 & -2.2625 \\
 -1.16996 & -3.49466 & 0.66839 \\
 0.456648 & -0.537651 & -2.1577 \\
 0.282273 & -1.0096 & -1.63835 \\
 -1.51017 & 0.228499 & -4.02526 \\
 0.260191 & -1.39899 & -1.19776 \\
 -0.58455 & 0.348837 & -3.76483 \\
\end{array}$$

$$Y=\begin{array}{ccc}
 -0.91257 & 1.36325 & -0.630705 \\
 0.684393 & 0.688076 & 0.907156 \\
 1.34309 & 1.99672 & -0.345454 \\
 -2.89959 & 0.310577 & -0.302742 \\
 -0.106302 & 1.05992 & 0.176537 \\
 -1.58508 & 0.276857 & 0.304146 \\
 -0.560415 & 1.43938 & -0.464039 \\
 -1.19281 & 1.41599 & -0.795362 \\
 -2.55391 & -0.250654 & 0.514022 \\
 -1.39749 & -0.0923164 & 0.880748 \\
 -2.24582 & -0.841647 & 1.45851 \\
 -1.41262 & -1.74733 & 2.86862 \\
\end{array}$$

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 21:46 


07/10/15

2400
Посчитал
$(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})=0.6877$,
соответственно, ни о каких минусах речи не идёт.
Ищите ошибки у себя.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 21:55 


27/10/09
602
Странно. У меня
$(\bar{Y}-\bar{X})^T S^{-1}(\bar{Y}-\bar{X})=5586.98$,
Подскажите, пожалуйста, как Вы считаете обобщенную ковариационную матрицу и какой получился определитель.
У меня $S=\frac{S_x(n_x-1)+S_y(n_y-1)}{n_x+n_y-2}$, определитель получился 0.0046064.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 22:32 


07/10/15

2400
Определитель 2,875. Считаю в Matlab, там есть функция cov(), определитель этой матрицы можно посчитать с помощью функции det()

AndreyL в сообщении #1427094 писал(а):
У меня $S=\frac{S_x(n_x-1)+S_y(n_y-1)}{n_x+n_y-2}$,


Считайте по обычной формуле, с общим матожиданием, так проще. Ну, и не забывайте нормировать сумму квадратов, возможно всё дело в этом.

 Профиль  
                  
 
 Re: Распределение коэффициентов дискриминантной функции
Сообщение21.11.2019, 23:44 


07/10/15

2400
AndreyL, я кажется понял в чём у вас ошибка. По формуле
AndreyL в сообщении #1427094 писал(а):
$S=\frac{S_x(n_x-1)+S_y(n_y-1)}{n_x+n_y-2}$

вы находите не общую, а среднюю внутригрупповую дисперсию.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 32 ]  На страницу 1, 2, 3  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group