2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение15.06.2013, 08:55 
Аватара пользователя


21/01/09
3929
Дивногорск
В зависимости от выбранного количества интервалов гипотеза может быть или принята или отвергнута. И это с одними и теми же данными. Как всё таки корректно поступать?

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение15.06.2013, 17:28 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Ну и вопросик! Думаете, есть общий алгоритм?

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение15.06.2013, 18:38 
Заслуженный участник
Аватара пользователя


23/07/08
10910
Crna Gora
(ничего не знаю о критерии Пирсона)
Выбор количества интервалов остается за пользователем, тем самым и ответственность за результат переносится с Пирсона на пользователя. Считаете, что критерий врёт? -- ну а кто вас заставлял брать именно столько интервалов? Вот если бы вы взяли столько-то...

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение15.06.2013, 18:41 
Аватара пользователя


24/05/13
49
Я как-то ради интереса смоделировал процесс проверки гипотезы .
Брал 150 выборок объемом 100, сгенерированных Random ( равномерные ), и 150 по 100 - сгенерированных RandG ( нормальное ). И разбивал или на 7, или на 8 интервалов.
Итог, при уровне значимости 0,05:
а) по равномерным. в 10,7% случаев при 7 принято, при 8 -нет, в 4% случаев - наоборот, в остальных случаях - совпало,
б) по нормальным. в 12,7% случаев при 7 принято, при 8 -нет, в 5,3% случаев - наоборот, в остальных случаях - совпало.
То есть, при 7 интервалах - более "согласный" критерий.
Правда, малочисленные интервалы ( частоты менее 5) не объединял.
Число степеней свободы, конечно учитывал.

Конечно, разбивка на интервалы - это неизбежный произвол. Кроме того, можно еще по разному разбивать - например, не равной длины, а равной частоты.
PS А если сравнить Пирсона и Колмогорова, то Колмогоров почти всегда - " согласнее".

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение15.06.2013, 18:44 
Заслуженный участник
Аватара пользователя


18/01/13
12065
Казань
Критерий Пирсона вообще довольно сомнительный.

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение17.06.2013, 01:21 


23/12/07
1763
ИМХО, критерий Пирсона - для дискретных распределений. Для непрерывных процедура фактически сводится к предварительной "дискретизации" (за счет выбора интервалов), а потому, по сути, осуществляется на классах эквивалентности (критерий не различает непрерывные распределения, имеющие одинаковые "дискретизации"). С этой точки зрения, выбор интервалов должен ложиться на исследователя. (Который к тому же при малых объемах выборки должен еще учитывать тот факт, что критерий Пирсона асимптотически непараметрический, а потому интервалы нужно подбирать так, чтобы обеспечить приемлемую точность аппроксимации предельным распределением).

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение17.06.2013, 22:48 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
В собственно критерии Пирсона никаких интервалов, вообще-то, нет. Есть вероятности некоторых событий и наблюдаемые частости. Интервалы появляются, когда мы сводим непрерывное распределение к дискретному, вводя группировку. Это вносит произвол. И приходится пользоваться голимой эмпирикой. Скажем, можно взять формулу Стёрджесса
$n=1+\log_2N=1+3.333\lg N$
При том, что она выводилась для совершенно иной задачи (рисования гистограмм), да и там не слишком обоснована, она может внести единообразие

(Оффтоп)

Хоть и безобразно, но однообразно! (майор Шматов, командуя взводу расстегнуть воротники в жару)


-- 17 июн 2013, 22:55 --

Предлагались и иные формулы для группировки. Скажем, формула Скотта для ширины интервала
$h=3.5\sigma N^{1/3}$, сигма - выборочное стандартное отклонение
или формула Фридмана и Диакониса
$h=2I_QN^{1/3}$, где $I_Q$ - интерквартильное расстояние.
Оснований для предпочтения одной из них другой мало, и скорее надо пользоваться пусть не лучшей, но одинаковой формулой.
Неопределённость вносится также выбором границ интервалов (скажем, простое их округление может давать неожиданно большой эффект), а также объединением интервалов, чтобы получить достаточно большое количество наблюдений в ячейке.

 Профиль  
                  
 
 Re: Критерий Пирсона. Произвол в выборе количества интервалов...
Сообщение17.06.2013, 23:04 
Аватара пользователя


24/05/13
49
Новосибирский ГТУ, похоже плотно этой проблемой занимался.
Вот http://www.ami.nstu.ru/~headrd/seminar/publik_html/Z_lab_8.htm

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group