2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Доказать хи-квадратность
Сообщение02.03.2018, 19:50 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Задача про метод наименьших квадратов:
$$
y_i = a + b x_i + \varepsilon_i, \quad \varepsilon_i \sim \mathcal N(0, \sigma^2), \quad i = 1, \ldots, n.
$$

Оценки коэффициентов $\hat b = \dfrac{\langle x y \rangle - \langle x \rangle \langle y \rangle}{S^2_x}$, $\hat a = \langle y \rangle - \hat b \langle x \rangle$, $S^2_x = \langle x^2 \rangle - \langle x \rangle^2$, $\langle \cdot \rangle$ --- среднее по выборке.

Проблема: доказать, что $(n - 2) S^2/\sigma^2 \sim \chi^2_{n - 2}$, $S^2 = \frac{1}{n - 2} \sum_n (y_i - \hat a - \hat b x_i)^2$.

Пока удалось лишь привести к виду $(n - 2) S^2 = \langle y^2 \rangle - \langle y \rangle^2 - \hat b^2 n S^2_x$. В случае просто нормальной выборки доказательство опирается на лемму Фишера: если компоненты вектора $\mathbf x \in \mathbb R^n$ независимы и распределены стандартно и $C$ --- ортогональная матрица, то компоненты вектора $\mathbf y = C \mathbf x$ распределены стандартно и независимы. В этих условиях величина $||\mathbf x||^2 - y^2_1 - \ldots - y^2_k \sim \chi^2_{n - k}$.

Напрямую это сюда не применить, так как мешает слагаемое
$$
\hat b^2 n S^2_x = \frac{n^2}{nS^2_x} \left( \sum \limits_{i, j} y_i y_j (x_i x_j + \langle x \rangle^2 - 2 \langle x \rangle x_j )\right),
$$
это некоторая квадратичная форма, и в какое место в теореме её засунуть не очень понятно. Подскажите, пожалуйста, что всё-таки нужно делать?

 Профиль  
                  
 
 Re: Доказать хи-квадратность
Сообщение03.03.2018, 12:44 
Заслуженный участник
Аватара пользователя


11/03/08
10043
Москва
Я бы пошёл от геометрии. Полагал бы, что эпсилоны - в n-мерном пространстве. В котором регрессоры задают к-мерное подпространство. И наблюдаемые части эпсилонов лежат в ортогональном к нему подпространстве размерности (n-k). Поворот, после которого две координаты совпадают с регрессорами, а остальные к ним ортогональны, задаётся ортогональной матрицей, так что после поворота у нас k преобразованных эпсилонов коллинеарны регрессорам и мы их не видим, а (n-k) видны. Ну, а распределение суммы квадратов (n-k) нормальных величин известно...

 Профиль  
                  
 
 Re: Доказать хи-квадратность
Сообщение03.03.2018, 18:37 
Заслуженный участник
Аватара пользователя


23/11/06
4171

(Оффтоп)

А ещё можно взять готовое доказательство для общего случая, и переписать для $k=2$. Типа этого.

 Профиль  
                  
 
 Re: Доказать хи-квадратность
Сообщение10.03.2018, 02:01 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Евгений Машеров в сообщении #1295301 писал(а):
Я бы пошёл от геометрии. Полагал бы, что эпсилоны - в n-мерном пространстве. В котором регрессоры задают к-мерное подпространство. И наблюдаемые части эпсилонов лежат в ортогональном к нему подпространстве размерности (n-k). Поворот, после которого две координаты совпадают с регрессорами, а остальные к ним ортогональны, задаётся ортогональной матрицей, так что после поворота у нас k преобразованных эпсилонов коллинеарны регрессорам и мы их не видим, а (n-k) видны. Ну, а распределение суммы квадратов (n-k) нормальных величин известно...

Да, такое доказательство я разобрал. Тем не менее, всё же интересует вопрос, можно ли в лоб получить то, что нужно. Я напишу здесь дальше то, что я смог пока выяснить.

Итак, можно без потери общности (что легко показать) исследовать выражение $E^2 = \sum_i (y_i - \hat a - \hat b x_i)^2$ при том условии, что $\langle x \rangle = 0$. После преобразований найдём
$$
E^2 = \sum_i y^2_i - \frac{1}{n} \left( \sum_i y_i \right)^2 - n \hat b^2 S^2_x.
$$
Подставляем сюда
$$
\hat b = \frac{\langle xy \rangle}{ S^2_x} =\frac{\sum_i {x_i y_i}}{ n S^2_x}, \qquad \hat b^2 = \frac{1}{n^2 S^4_x} \sum_{i, j} x_i x_j y_i y_j
$$
и приводим $\sum_i y^2_i = \frac{1}{n} \sum_{i, j} y_i y_j n \delta_{ij}$ получаем в итоге квадратичную форму
$$
E^2 = \frac{1}{n} \sum_{i, j} y_i y_j \left(n \delta_{ij} - 1 - \frac{x_i x_j}{S^2_x} \right) = \frac{1}{n} \sum_{i, j} c_{ij} y_i y_j.
$$
Отбросим пока множитель $1/n$ и будем исследовать матрицу формы $c_{ij}$. Заметим, что можно представить $c_{ij} = a_{ij} + b_{ij}$, где $a_{ij} = n \delta_{ij} - 1$, $b_{ij} = - x_i x_j/S^2_x$. Матрица $B$ характерна тем, что сумма всех элементов в строках или в столбцах равна нулю; она допускает следующее разложение:
$$
B = - \frac{1}{S^2_x} \begin{pmatrix} 
x_1 & x_1 & \ldots & x_1 \\
x_2 & x_2 & \ldots & x_2\\
\vdots & \vdots & \ddots & \vdots \\
x_n & x_n & \ldots & x_n \end{pmatrix} \operatorname{diag}(x_1, \ldots, x_n) = X \operatorname{diag}(x_1, \ldots, x_n).
$$
Легко понять, что $\operatorname{rang} X = 1$, а по теореме
$$\operatorname{\rang} B \leqslant \min(\operatorname{rang} X, \operatorname{rang} \operatorname{diag}(x_1, \ldots, x_n)) = 1$$
(мы имеем ввиду, что хотя бы одно $x_i$ отлично от нуля, в силу чего $\operatorname{rang} B > 0$, стало быть, $\operatorname{rang} B = 1$).

Мы знаем, что $\operatorname{rang} A = n - 1$. Нам хочется, чтобы два собственных числа матрицы $C$ формы были нули (а остальные - не нули) и матрица $C$ была диагонализуема. Я не могу пока сообразить, будет ли это тогда и только тогда, когда $\operatorname{rang} C = n - 2$. Пока даже не получается доказать, что ранг $C$ ровно $n - 2$; удаётся лишь сказать, что он не больше $n - 1$. Явно вычислить собственные значения, как для матрицы $A$, очевидно, нельзя, так как $C$ общего вида.

После безуспешных попыток найти доказательство из общих соображений, закрались подозрения: а не сведётся ли весь вопрос в конечном счёте опять к геометрическому методу, упомянутому выше...

 Профиль  
                  
 
 Re: Доказать хи-квадратность
Сообщение13.03.2018, 01:01 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Я нашёл всё же прямое доказательство через квадратичные формы. В некотором смысле оно использует свойства ортогональных проекторов. По всей видимости, оно неплохо обобщается на большее количество регрессоров, но я ещё не пробовал.

Спасибо за внимание.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group