2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Проверка гипотезы об однородности наблюдений с помощью хи^2
Сообщение07.01.2012, 11:03 
Нужно проверить гипотезу, одинаково ли распределены 2 выборки (как именно – неизвестно). В книге Кибзуна утверждается, что статистика

$S=n(\sum_{i=1}^r \frac1{n_{i*}}(\frac{n_{ja}^2}{n_{*a}}+\frac{n_{jb}^2}{n_{*b}})-1)$

распределена как хи-квадрат (приводится там без доказательства) с числом степеней свободы r-1 (я здесь написал ту формулу, переписанную для частного случая 2-х выборок).
$n_{*a}$, $n_{*b}$ – объемы сравниваемых выборок;
$n_{ia}$, $n_{ib}$ – число i-го исхода (из r возможных) в каждой из выборок;
$ n_{i*}=n_{ia}+n_{ib}$.

В моем случае СВ непрерывная, поэтому диапазон наблюдаемых значений разбиваю на r интервалов. Есть масса информации о разбиении в случае проверки гипотезы о принадлежности к к.-л. заданному распределению, а как делать это правильно в моем случае – не нашел. Разбил на равные по длине. Результат повергает в ужас: в зависимости от r гипотеза может приниматься или отвергаться, причем и то и то – «со свистом».

При равных по длине интервалах часто получаются ситуации, что почти все числа толпятся в одном интервале (причем в крайнем), а в остальных – по 1-2.

Подскажите, пожалуйста, где найти информацию, на сколько интервалов следует разбивать и каким образом?

 
 
 
 Re: Проверка гипотезы об однородности наблюдений с помощью хи^2
Сообщение07.01.2012, 16:13 
Я приводил к равновероятным интервалам, и чтобы количество наблюдений в интервале было разумное - больше 5 иногда берут. Таким образом добиваемся стабилизации. Пришли мне этого Кибзуна, если есть в электронке или общую формулу. С Новым Годом!

 
 
 
 Re: Проверка гипотезы об однородности наблюдений с помощью хи^2
Сообщение07.01.2012, 16:36 
Если я правильно понимаю, к равновероятным интервалам приводят, когда сравнивают с заведомо известным распределением, а я сравниваю между собой 2 выбырки с неизвестным(и) распределением(-ями).
Не будет ли лажа, если я подгоню интервалы так, чтобы они примерно одинаково были "заселены"?
Вот ссылка на Кибзуна, стр. 189:
http://www.uchites.ru/files/tvims-book.pdf
С Новым Годом!

 
 
 
 Re: Проверка гипотезы об однородности наблюдений с помощью хи^2
Сообщение07.01.2012, 17:00 
Спасибо за Кибзуна. Ранее сказанное нарушает условия применения
статистики, в интервале мало наблюдений. Надо поискать ограничения
когда Хи-квадрат плохо работает. "Малая заселённость" очевидное нарушение.
Равновероятные интервалы обеспечивают повышение стабильности критерия.
В личку кинул тебе ссылку на тему. Удачи.

 
 
 
 Re: Проверка гипотезы об однородности наблюдений с помощью хи^2
Сообщение08.01.2012, 10:01 
Cпасибо за ссылку, но там ответа не нашел. В упомянутой там литературе пороюсь, может что откопаю.

P.S. Зачем ссылку кидать в личку, если там ничего личного? Лучше бы прямо здесь, может еще кому-то поможет

 
 
 [ Сообщений: 5 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group