2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 дисперсионный анализ
Сообщение14.01.2015, 23:25 


27/10/09
602
Дамы и Господа!

Возник вопрос с законом распределения межгрупповой дисперсии в однофакторном дисперсионном анализе с повторными измерениями.

Есть несколько ($K$ штук) выборок, каждая объемом $n_k$. Для простоты возьмем, что элементы этих выборок берутся из нормального распределения с некоторым центром (для всех одинаковым) и дисперсией 1. Тогда величина $SS_1=\sum \limits_{k=1}^K \sum\limits_{i=1}^{n_k} (x_{ki}-\bar x_k)^2=\sum\limits_{k=1}^K (n_k-1) s^2_k$ подчиняется распределению $\chi^2$ с $N-K$ степенями свободы. Здесь оценки средних по выборкам $\bar x_k=\frac{1}{n_k}\sum\limits_{i=1}^{n_k} x_{ki}$, оценки дисперсий по выборкам $s^2_k=\frac{1}{n_k-1}\sum\limits_{i=1}^{n_k} (x_{ki}-\bar x_k)^2$, объем обобщенной выборки $N=\sum\limits_{k=1}^K n_k$. Это понятно. То, что величина $SS_0=\sum \limits_{k=1}^K \sum\limits_{i=1}^{n_k} (x_{ki}-\bar x)^2$ подчиняется распределению $\chi^2$ с $N-1$ степенями свободы, тоже понятно. Здесь обобщенное среднее $\bar x=\frac{1}{K}\sum \limits_{k=1}^K \sum\limits_{i=1}^{n_k} x_{ki}=\frac{1}{K}\sum\limits_{k=1}^{K} n_k \bar x_k$

А вот почему величина $SS_2=\sum\limits_{k=1}^K n_k(\bar x_k-\bar x)^2$ подчиняется распределению $\chi^2$ с $K-1$ степенями свободы - не понятно. При этом ясно, что $SS_0=SS_1+SS_2$. Но по идее нормальному распределению (с центром 0 и дисперсией 1) должны подчиняться величины $U_k=\sqrt {\frac{n_k N}{N-n_k}} (\bar x_k-\bar x)$, а не $V_k=\sqrt {n_k}(\bar x_k-\bar x)$. Если это так, то распределению $\chi^2$ должна подчиняться величина $\sum\limits_{k=1}^K U_k^2$. Но $\sum\limits_{k=1}^K U_k^2 \neq \sum\limits_{k=1}^K V_k^2$. Как правильно показать, что именно $SS_2=\sum\limits_{k=1}^K V_k^2$ подчиняется распределению $\chi^2$?

 Профиль  
                  
 
 Re: дисперсионный анализ
Сообщение15.01.2015, 08:16 
Заслуженный участник
Аватара пользователя


23/11/06
4171
AndreyL в сообщении #962287 писал(а):
А вот почему величина $SS_2=\sum\limits_{k=1}^K n_k(\bar x_k-\bar x)^2$ подчиняется распределению $\chi^2$ с $K-1$ степенями свободы - не понятно. При этом ясно, что $SS_0=SS_1+SS_2$.

Потому что слагаемые в правой части независимы, левая часть имеет распределение $\chi^2(N-1)$, первое слагаемое - распределение $\chi^2(N-K)$.

Характеристическая функция распределения $\chi^2(m)$ есть $\varphi(t)=(1-2it)^{-m/2}$. Характеристическая функция суммы двух независимых слагаемых есть произведение их х.ф. Поэтому
$$\varphi_{SS_0}(t)=(1-2it)^{-(N-1)/2} = (1-2it)^{-(N-K)/2} \cdot \varphi_{SS_2}(t),$$
откуда $\varphi_{SS_2}(t)=(1-2it)^{-(K-1)/2}$, т.е. $SS_2\sim \chi^2(K-1)$.

 Профиль  
                  
 
 Re: дисперсионный анализ
Сообщение15.01.2015, 08:46 


27/10/09
602
Правильно ли я понимаю, что здесь закон распределения $SS_2$ выводится из равенства $SS_0=SS_1+SS_2$? Т.е. если известно (а это известно), что $SS_0 \in \chi^2(N-1)$ и $SS_1 \in \chi^2(N-K)$, то с учетом того, что $\chi^2(m_1)+\chi^2(m_2) \in \chi^2(m_1+m_2)$ получается, что $SS_2 \in \chi^2(K-1)$. Здесь символ $\in$ используется как "подчиняется распределению" - не знаю, какой значок тут правильно поставить. Можно ли вывести закон распределения $SS_2$ в лоб, не задействуя равенство $SS_0=SS_1+SS_2$?

 Профиль  
                  
 
 Re: дисперсионный анализ
Сообщение15.01.2015, 08:59 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Вы принципиально не произносите в нужных местах слово "независимы"? Эта болезнь продолжается уже давно.

Напрямую вывести наверняка можно с помощью леммы Фишера.

 Профиль  
                  
 
 Re: дисперсионный анализ
Сообщение15.01.2015, 18:47 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Достаточно того, что величины $z_i=\sqrt{n_k}(\overline x_k-a)$, $k=1,\ldots,K$ при верной основной гипотезе о совпадении средних можно считать выборкой из $N(0,\,1)$. Поэтому
$$SS_2=\sum n_k (\overline x_k - \overline x)^2 = \sum n_k (\overline x_k-a - (\overline x-a))^2 = \sum n_k z_k^2 - N(\overline x-a)^2.$$
При этом
$$ N(\overline x-a)^2 = \left(\dfrac{\sqrt{n_1}z_1+\ldots+\sqrt{n_K}z_k}{\sqrt{N}}\right)^2 = y_1^2,$$
где $y_1$ можно считать первой координатой вектора $\vec y=C\vec z$, полученного из стандартного нормального вектора $\vec z=(z_1,\ldots,z_K)^T$ умножением на ортогональную матрицу $C$ с первой строкой $\left(\frac{\sqrt{n_1}}{\sqrt{N}}, \ldots, \frac{\sqrt{n_K}}{\sqrt{N}}\right)$. По лемме Фишера разность $SS_2=\sum_{k=1}^K n_k z_k^2-y_1^2$ имеет распределение $\chi^2(K-1)$.

См. лемму Фишера тут, например: http://www.nsu.ru/mmf/tvims/chernova/ms/ms_nsu07.pdf

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group