2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Большая вероятность в критерии "хи-квадрат"
Сообщение24.08.2012, 00:17 
Пусть проводится проверка гипотезы о законе распределения выборочных данных. И используется критерий хи-квадрат. На основе выборочных данных рассчитываем значение хи-квадрат $ (\chi^{2} = x)$ по соответствующей формуле. На основе объёма выборки и количества связей рассчитываем количество степеней свободы DF. Берём соответствующую таблицу - и получаем некоторую вероятность Р. Если Р достаточно мала ("достаточно" в контексте решаемой задачи), выборка противоречит гипотезе.

У меня следующий вопрос. Р - это вероятность того, что при условии истинности гипотезы Н, значение хи-квадрат будет не меньше текущего $P = Pr \left(\chi^{2} \geqslant x \right)$. Но что если Р будет очень большой. Скажем, 0.99 или даже больше. Если Р маленькое, то вероятность "достигнуть" х или значения больше х очень мала - и гипотезу Н стоит отбросить. Но если оно велико, выходит, что очень малой будет вероятность $Pr \left(\chi^{2} < x \right) = 1 - Pr \left(\chi^{2} \geqslant x \right) = 0.01$. Означает ли это, что гипотезу Н стоит отбросить и при $P=0.99$?

Заранее спасибо.

 
 
 
 Posted automatically
Сообщение24.08.2012, 07:48 
Аватара пользователя
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
по следующим причинам: запись формул.


Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.


-- 24 авг 2012, 08:51 --

Если это случайно $\chi$-квадрат, то хи = \chi. И проч.

 
 
 
 Posted automatically
Сообщение27.08.2012, 16:07 
Аватара пользователя
 i  Тема перемещена из форума «Карантин» в форум «Помогите решить / разобраться (М)»
Причина переноса: не указана.

 
 
 
 Re: Большая вероятность в критерии "хи-квадрат"
Сообщение28.08.2012, 01:09 
Аватара пользователя
Если есть сомнения в природе выборочных данных - например, есть подозрение, что они неслучайны, то "слишком хорошее согласие" тоже может быть поводом для отрицания основной гипотезы. Если же таковых сомнений нет, то нет никакого смысла брать двустороннюю критическую область: при верной альтернативе статистика критерия хи-квадрат стремится к бесконечности, а не к нулю, вот это стремление к бесконечности (или его отсутствие) и должен уловить критерий.

 
 
 
 Re: Большая вероятность в критерии "хи-квадрат"
Сообщение28.08.2012, 18:07 
Аватара пользователя
Я бы ответил на Ваш вопрос так - если Вы уверены в достоверности данных, то, значит, 99% это"просто повезло". При справедливости гипотезы такая ситуация возникнет в 1% случаев.
Но если данные не Ваши и не от абсолютно надёжного источника, то возникает подозрение, что их в той или иной степени фальсифицировали (подкорректировали под теорию, отбросили несогласующиеся, или вообще целиком выдумали) - и перестарались. Статистически распознать это нельзя, максимум получить "информацию к размышлению" и далее действовать методами не сколько математическими, сколько полицейскими.
То есть зависит от ответа на (статистически неразрешимый) вопрос - отклонения от теоретической модели обусловлены воздействием бездушной природы или хитрого фальсификатора?
Если все наблюдения принимают наивероятнейшие значения - то этот критерий равен нулю. Так что если нет оснований думать, что данные фальсифицированы - то P=0.99 не свидетельствует ни о чём плохом. Но если данные прошли через неизвестные руки - стоит проверить, нет ли подгонки.

 
 
 
 Re: Большая вероятность в критерии "хи-квадрат"
Сообщение01.09.2012, 19:16 
Спасибо.

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group