2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Однофакторный дисперсионный анализ
Сообщение18.01.2013, 14:37 
Доброго время суток, Уважаемые Форумчане.

Пожалуйста, помогите разобраться.
Понадобилась применить однофакторный дисперсионный анализ, решил вспомнить теорию, но кое-что не могу понять.
Задача следующая:
Есть две случайные величины - зависимая ($X$) и независимая ($Y$). Необходимо определить зависит ли мат. ожидание $X$ от значения $Y$.

Ограничения модели:
Дисперсия $X$ не зависит от $Y$.
$X$ распределена нормально.

Нулевая гипотеза ($H_0$) - мат. ожидание $X$ не зависит от значения $Y$

Проверка проводится с помощью критерия Фишера.

Обозначения:
Есть статистика.
$Y$ принимает значения от $1$ до $k$.
$x^j$ наблюдения признака $X$, при $Y$ принимающего значение $j$
${x^j}_i$ i-тый элемент наблюдений, при $Y$ принимающего значение $j$. $i$ принимает значения от 1 до $p_j$.
$D$ дисперсия $X$.
$n$ объем всей выборки т.е. $n=\sum^{k}_{j=1}{p_j}$

По теории, случайная величина $F$ имеет распределение Фишера, если нулевая гипотеза истина.
$F=\frac{\frac{\sum^{k}_{j=1}{{p_j}(\overline{x^j}-\overline{x})^2}}{k-1}}{\frac{\sum^{k}_{j=1}{\sum^{p_j}_{i=1}{(x^j_i-\overline{x^j})^2}}}{n-k}}$

Вопрос - это действительно так или все же $F$ имеет распределение близкое к Фишеру.
Если $p_1=p_2=...=p_k$, то $F$ действительно имеет распределение Фишера, а вот если объемы выборок не равны, то получается распределение несколько отличное, хоть и близкое.

Если необходимо, могу предоставить свои выкладки в подтверждение сомнений.

 
 
 
 Re: Однофакторный дисперсионный анализ
Сообщение18.01.2013, 19:32 
Аватара пользователя
Не надо предоставлять выкладки. Распределение у этой дроби действительно есть распределение Фишера, если выборки, как им и полагается, независимы и нормально распределены. Если нет - нет. Даже при одинаковых объёмах выборок.

Почитайте теорию, тут всё доказано: http://www.nsu.ru/mmf/tvims/chernova/ms/ms_nsu07.pdf, стр. 104.

(Оффтоп)

Не знаю, что такое "независимая случайная величина". И что такое "зависимая случайная величина", тоже не знаю. И другим не советую употреблять занятую под стандартные вещи терминологию в нестандартных смыслах.

 
 
 
 Re: Однофакторный дисперсионный анализ
Сообщение18.01.2013, 20:18 
Спасибо за информацию.
К сожалению у нас уже много времени, поэтому с информацией ознакомился бегло. Возникло ощущение, что все мои непонимания кроются в утверждении "Распределение хи-квадрат устойчиво относительно суммирования".
Возникает вопрос:
Случайная величина: ${p_1}{N^2}+{p_2}{N^2}+{p_3}{N^2}$, где $p_1+p_2+p_3=1$
и
$N^2+N^2+N^2$

Распределены одинаково?

$N$ нормальное стандартное распределение.

-- Сб янв 19, 2013 04:22:33 --

(Оффтоп)

--mS-- в сообщении #673342 писал(а):
Не знаю, что такое "независимая случайная величина". И что такое "зависимая случайная величина", тоже не знаю. И другим не советую употреблять занятую под стандартные вещи терминологию в нестандартных смыслах.

Прошу прощения, здесь я описался. Обычно говорят зависимые, не зависимые факторы, признаки

 
 
 
 Re: Однофакторный дисперсионный анализ
Сообщение18.01.2013, 21:11 
Аватара пользователя
Разумеется, нет, не одинаково. Если только одним и тем же набором символов $N^2$ Вы обозначили три раза разные объекты. Если же один и тот же - то, разумеется, одинаково. Только не с $3N^2$, а просто с $N^2$. По распределительному закону: $$p_1N^2+p_2N^2+p_3N^2=N^2(p_1+p_2+p_3)=N^2.$$
:facepalm:

 
 
 
 Re: Однофакторный дисперсионный анализ
Сообщение20.01.2013, 07:50 
Так, опять описался. Имел ввиду следующие:
$N_i$ имеет нормальное стандартное распределение
$F(A)$ функция распределения случайной величины $A$.
$0<p_i<1$, $p_1+p_2+p_3=1$.
Верно ли равенство $F(\frac{{N_1}^2+{N_2}^2+{N_3}^2}{3})=F({p_1}{N_1}^2+{p_2}{N_2}^2+{p_3}{N_3}^2)$?

Вопрос вот почему возник:
$N^j_i$ имеет нормальное стандартное распределение
$D(A)$ – Дисперсия случайной величины $A$
$M(A)$ – мат. ожидание случайной величины $A$
Тогда,
$(\overline{x^j}- \overline{x})$ – нормально распределенная случайная величина
$M(\overline{x^j}- \overline{x})=0$
$D(\overline{x^j}- \overline{x})=\frac{n-p_j}{np_j}D(X)$
$(\overline{x^j}- \overline{x})^2=\frac{n-p_j}{np_j}{D(X){N_j}^2}$
$\sum^k_{j=1}{p_j}(\overline{x^j}- \overline{x})^2={D(X)}\sum^k_{j=1}\frac{n-p_j}{n}{{N_j}^2}$

$(x^j_i - \overline{x^j})$ – нормально распределенная случайная величина
$M(x^j_i - \overline{x^j})=0$
$D(x^j_i - \overline{x^j})=\frac{p_j-1}{p_j}D(X)$
$D(x^j_i - \overline{x^j})^2=\frac{p_j-1}{p_j}D(X){{N^i_j}^2}$
$\sum^k_{j=1}{\sum^{p_j}_{i=1}{(x^j_i - \overline{x^j})^2}}={D(X)}\sum^k_{j=1}{\frac{p_j-1}{p_j}\sum^{p_j}_{i=1}{{N^i_j}^2}}$

А вот дальше у меня возникает ступор.
Если $p_1=p_2=...=p_k=p$, то дальше все понятно:
$\sum^k_{j=1}{p_j}(\overline{x^j}- \overline{x})^2={D(X)}\sum^k_{j=1}\frac{n-p_j}{n}{{N_j}^2}={D(X)}\sum^k_{j=1}\frac{kp-p}{kp}{{N_j}^2}=\frac{k-1}{k}{D(X)}\sum^k_{j=1}{{N_j}^2}$
$\sum^k_{j=1}{\sum^{p_j}_{i=1}{(x^j_i - \overline{x^j})^2}}={D(X)}\sum^k_{j=1}{\frac{p_j-1}{p_j}\sum^{p_j}_{i=1}{{N^i_j}^2}}=\frac{p-1}{p}{D(X)}\sum^k_{j=1}{\sum^{p}_{i=1}{{N^i_j}^2}}$

Если теперь подставить полученный результат в формулу $F$, то получиться распределение Фишера.

А вот если условие $p_1=p_2=...=p_k=p$ не выполняется, то как прийти к распределению Фишера понять пока не могу.

 
 
 
 Re: Однофакторный дисперсионный анализ
Сообщение20.01.2013, 08:36 
Аватара пользователя
Shtirlic в сообщении #673997 писал(а):
Верно ли равенство $F(\frac{{N_1}^2+{N_2}^2+{N_3}^2}{3})=F({p_1}{N_1}^2+{p_2}{N_2}^2+{p_3}{N_3}^2)$?

Вообще говоря, нет.

Shtirlic в сообщении #673997 писал(а):
$(\overline{x^j}- \overline{x})^2=\frac{n-p_j}{np_j}{D(X){N_j}^2}$
$\sum^k_{j=1}{p_j}(\overline{x^j}- \overline{x})^2={D(X)}\sum^k_{j=1}\frac{n-p_j}{n}{{N_j}^2}$

Величины $N_j$ зависимы, что толку в таком представлении?

Вам дана ссылка на учебник, где всё доказано, и практически в Ваших обозначениях. Обойтись без леммы Фишера и основного дисперсионного соотношения не получится.

 
 
 
 Re: Однофакторный дисперсионный анализ
Сообщение20.01.2013, 08:48 
--mS-- в сообщении #674008 писал(а):
Shtirlic в сообщении #673997 писал(а):
$(\overline{x^j}- \overline{x})^2=\frac{n-p_j}{np_j}{D(X){N_j}^2}$
$\sum^k_{j=1}{p_j}(\overline{x^j}- \overline{x})^2={D(X)}\sum^k_{j=1}\frac{n-p_j}{n}{{N_j}^2}$

Величины $N_j$ зависимы, что толку в таком представлении?


А вот это я зевнул.
Получается доказательство при условии $p_1=p_2=...=p_k$ строго говоря некорректно.

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group