2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 О критерии Стьюдента
Сообщение22.12.2019, 01:32 


20/07/16
24
Москва
Коллеги, прошу помощи разобраться.

Как известно, что бы гипотеза об однородности двух выборок была принята, при проверке ее $t$-критерием Стьюдента должно соблюдаться следующее неравенство:

$\left\lvert\hat{t}(n_1+n_2-2)\right\rvert \leqslant t_\frac{\alpha}{2}(n_1+n_2-2)$

В "Таблицах математической статистики" Большева и Смирнова (1983) приведена таблица процентных точек распределения Стьюдента (Табл. 3.2, с. 178).

Если я их правильно понимаю, то в них с уменьшением значения процентной точки $\math{Q}=\frac{\alpha}{2}$ (т.е. с повышением вероятности события, в нашем случае - однородности двух выборок) растет значение $\math{t}$.

Но тогда получается противоречие с формулой, в которой расчетное значение должно быть меньше табличного.

 Профиль  
                  
 
 Posted automatically
Сообщение22.12.2019, 01:41 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
по следующим причинам:

- неправильно набраны формулы (краткие инструкции: «Краткий FAQ по тегу [math]» и видеоролик Как записывать формулы) - в частности, не надо вставлять лишние доллары внутрь формулы;
- в нынешнем виде из вопроса крайне сложно понять, в чем вы хотите разобраться.

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

 Профиль  
                  
 
 Posted automatically
Сообщение22.12.2019, 02:16 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Карантин» в форум «Помогите решить / разобраться (М)»

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 03:02 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
Gandzak в сообщении #1431414 писал(а):
Но тогда получается противоречие с формулой, в которой расчетное значение должно быть меньше табличного.

Непонятно, что чему противоречит? Чтобы уменьшить вероятность ошибки первого рода нужно расширить коридор тех значений, при которых принимается нулевая гипотеза.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 08:14 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Gandzak, вы неправильно понимаете смысл числа $\alpha$. Это совсем не есть "вероятность события, в нашем случае - однородности двух выборок". А есть вероятность ошибки первого рода, т.е. вероятность критерию отвергнуть нулевую гипотезу об однородности, если на самом деле выборки однородны.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 15:10 


20/07/16
24
Москва
Спасибо за ответы!

Уточню с цифрами расчетf $\hat{t}$ между парами выборок:

1) У двух выборок $n = 246$, $\hat{t} = 0,1946$.
По таблицам при $n = 200$ и $Q = 40\%$ (это максимальное табличное значение $Q$), $t = 0,2537$.
Т. е. в данном случае раз $\hat{t}<t$, то $Q >40\%$.

Правильно ли это интерпретировать так, что с вероятностью >80% наступит ошибка первого рода и с вероятностью >80% должна быть отвергнута гипотеза об однородности двух выборок?

2) У двух выборок $n = 123$, $\hat{t} = 1,1492$.
По таблицам при $n = 120$: $Q = 25\%$, $t_{\textit25} = 0,6765$ ; $Q = 10\%$, $t_{\textit10} = 1,2886$.
Т. е. в данном случае $t_{\textit10}<\hat{t}<t_{\textit25}.

Правильно ли это интерпретировать так, что с вероятностью 20-50% наступит ошибка первого рода и с вероятностью 20-50% должна быть отвергнута гипотеза об однородности двух выборок? Является ли промежуток от 20% до 50% достаточным, что б гипотеза была принята?

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 17:39 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Нет, неправильно. Во-первых, что за прошлый век, почему надо искать какие-то таблицы? Откройте хотя бы Excel и найдите точные значения двусторонних вероятностей для распределения Стьюдента с нужным числом степеней свободы. Если я правильно понимаю, что такое у Вас $n$, то в первом случае для 244 степеней свободы $\mathsf P(|T_{244}|>0{,}1946)=0{,}845868031348741$. Во втором $\mathsf P(|T_{121}|>1{,}492)=0{,}13830181022029$.

Во-вторых, то, что Вы вычисляете, называется реально достигнутым уровнем значимости ($p$-value). Это не есть вероятность отвергнуть гипотезу однородности! О какой вообще вероятности отвергнуть гипотезу идёт речь, если критерий - мероприятие ни разу не рандомизированное? Вы либо принимаете гипотезу, либо отвергаете её, а не монетку бросать собрались, чтобы решить, какое из этих действий предпринять. $p$-value - вероятность для двух однородных выборок получить значение $\hat t$ дальше от нуля, чем Ваше $0{,}1946$ или $1{,}492$. Т.е. получить для двух однородных выборок худшее согласие с проверяемой гипотезой, чем получено для проверяемых выборок. То, что это значение столь велико в первом случае, и сравнительно велико во втором, говорит о том, что гипотезу однородности следует принять.

Можно на это смотреть иначе. Если (в первом случае) Вы будете пользоваться критерием с любой вероятностью ошибки первого рода меньшей, чем $0{,}845868031348741$, этот критерий будет принимать гипотезу однородности! Т.е. даже критерий, отвергающий верную гипотезу однородности в 80% случаев (а это крайне строгий критерий!), всё равно не найдёт криминала в Ваших проверяемых выборках и примет гипотезу однородности.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 23:40 


20/07/16
24
Москва
--mS-- в сообщении #1431502 писал(а):
Нет, неправильно. Во-первых, что за прошлый век, почему надо искать какие-то таблицы? Откройте хотя бы Excel и найдите точные значения двусторонних вероятностей для распределения Стьюдента с нужным числом степеней свободы. Если я правильно понимаю, что такое у Вас $n$, то в первом случае для 244 степеней свободы $\mathsf P(|T_{244}|>0{,}1946)=0{,}845868031348741$. Во втором $\mathsf P(|T_{121}|>1{,}492)=0{,}13830181022029$.


Благодарю вас за дискуссию. Да, все верно, $n$ это число степеней свободы. Буду очень признателен, если объясните, как Вы в Excel считаете значение $\mathsf P$.

Дальше, поскольку все сформулировано в новых для меня терминах, мне надо обдумать ваш ответ. Пока что мне сложно понять, что с чем сравнивать для того что бы показать, что две выборки однородны: $\mathsf P$ с $\hat{t}$?

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение23.12.2019, 08:40 
Заслуженный участник
Аватара пользователя


23/11/06
4171
=T.DIST.2T(0,1946; 244)

Сравнивать $P$ с $0{,}05$. Или с тем уровнем критерия $\alpha$, которым Вы хотите воспользоваться.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение26.12.2019, 03:55 


20/07/16
24
Москва
--mS--
Большое спасибо! Все понял.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group