2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Двухвыборочный тест Смирнова
Сообщение31.01.2013, 13:53 
Аватара пользователя
Требуется проверить гипотезу о принадлежности двух выборок к одной ГС. Предлагается построить эмпирическую функцию распределения для каждой выборки и найти максимальное отклонение между ними. А вот как строить эмпирическую функцию? По скольким точкам?

 
 
 
 Re: Двухвыборочный тест Смирнова
Сообщение31.01.2013, 14:30 
Аватара пользователя
По $N$ — числу точек в выборке.
Эмпирическая (выборочная) Ф.Р. — кусочно-постоянная функция, имеющая в каждой точке выборки скачок, равный $1/N$ (ну, это в простейшем случае, когда никакие 2 точки не совпадают). Сравнение, правда, усложняется тем, что у двух разных выборок точки разрыва (вообще говоря) не совпадают, но, я думаю, Вы справитесь.

 
 
 
 Re: Двухвыборочный тест Смирнова
Сообщение31.01.2013, 15:07 
Аватара пользователя
worm2 в сообщении #678290 писал(а):
По $N$ — числу точек в выборке.
Сравнение, правда, усложняется тем, что у двух разных выборок точки разрыва (вообще говоря) не совпадают, но, я думаю, Вы справитесь.

У меня выборки по 288 точек. Объединил, ранжировал, построил каждую экспериментальную функцию по 576 точкам, но нигде не написано что так нужно делать. В каждой выборке есть совпадающие значения.
Задача решена. Не могу найти, где было бы сказано про количество точек. У Закса есть пример где две выборки по 10 объединили и общую область разделили на 8 равновеликих интервалов. На их границах находили накопленную частоту. Почему так сделано?

Определение эмпирической функции распределения: $F_n(x)=\frac{n_x}{n}$, $n_x-$число вариант меньших $x$, $n-$ объём выборки. Вопрос такой: какие берутся $x$?

 
 
 
 Posted automatically
Сообщение31.01.2013, 16:34 
Аватара пользователя
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
Причина переноса: стандартная задача, не приведены попытки решения

В учебниках подробно изложен алгоритм применения критерия однородности Смирнова (двухвыборочного критерия Колмогорова — Смирнова). Откройте учебник и прочитайте определение эмпирической функции распределения. Алгоритм применения критерия подробно описан, например, в Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с. Попробуйте решить им, если есть какие-то затруднения - опишите их здесь.

 
 
 
 Posted automatically
Сообщение01.02.2013, 18:11 
Аватара пользователя
 i  Тема перемещена из форума «Карантин» в форум «Помогите решить / разобраться (М)»

 
 
 
 Re: Двухвыборочный тест Смирнова
Сообщение02.02.2013, 11:56 
Аватара пользователя
Александрович писал(а):
какие берутся $x$?
Любые. Функция определена на всей оси. Правда, между точками выборки она будет кусочно-постоянная
Александрович писал(а):
У Закса есть пример где две выборки по 10 объединили и общую область разделили на 8 равновеликих интервалов. На их границах находили накопленную частоту. Почему так сделано?
Затрудняюсь сказать. Так же сложнее. Как-то вручную нужно выбирать эти интервалы, на глазок, видимо.

 
 
 
 Re: Двухвыборочный тест Смирнова
Сообщение02.02.2013, 12:41 
Аватара пользователя
Александрович в сообщении #678279 писал(а):
построить эмпирическую функцию распределения

Упорядочить набор, дальше - бухгалтерское, "с нарастающим итогом".
Критерий Колмогорова? http://biometrica.tomsk.ru/k_s.htm

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group