2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 О критерии Стьюдента
Сообщение22.12.2019, 01:32 


20/07/16
24
Москва
Коллеги, прошу помощи разобраться.

Как известно, что бы гипотеза об однородности двух выборок была принята, при проверке ее $t$-критерием Стьюдента должно соблюдаться следующее неравенство:

$\left\lvert\hat{t}(n_1+n_2-2)\right\rvert \leqslant t_\frac{\alpha}{2}(n_1+n_2-2)$

В "Таблицах математической статистики" Большева и Смирнова (1983) приведена таблица процентных точек распределения Стьюдента (Табл. 3.2, с. 178).

Если я их правильно понимаю, то в них с уменьшением значения процентной точки $\math{Q}=\frac{\alpha}{2}$ (т.е. с повышением вероятности события, в нашем случае - однородности двух выборок) растет значение $\math{t}$.

Но тогда получается противоречие с формулой, в которой расчетное значение должно быть меньше табличного.

 Профиль  
                  
 
 Posted automatically
Сообщение22.12.2019, 01:41 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
по следующим причинам:

- неправильно набраны формулы (краткие инструкции: «Краткий FAQ по тегу [math]» и видеоролик Как записывать формулы) - в частности, не надо вставлять лишние доллары внутрь формулы;
- в нынешнем виде из вопроса крайне сложно понять, в чем вы хотите разобраться.

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

 Профиль  
                  
 
 Posted automatically
Сообщение22.12.2019, 02:16 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Карантин» в форум «Помогите решить / разобраться (М)»

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 03:02 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
Gandzak в сообщении #1431414 писал(а):
Но тогда получается противоречие с формулой, в которой расчетное значение должно быть меньше табличного.

Непонятно, что чему противоречит? Чтобы уменьшить вероятность ошибки первого рода нужно расширить коридор тех значений, при которых принимается нулевая гипотеза.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 08:14 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Gandzak, вы неправильно понимаете смысл числа $\alpha$. Это совсем не есть "вероятность события, в нашем случае - однородности двух выборок". А есть вероятность ошибки первого рода, т.е. вероятность критерию отвергнуть нулевую гипотезу об однородности, если на самом деле выборки однородны.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 15:10 


20/07/16
24
Москва
Спасибо за ответы!

Уточню с цифрами расчетf $\hat{t}$ между парами выборок:

1) У двух выборок $n = 246$, $\hat{t} = 0,1946$.
По таблицам при $n = 200$ и $Q = 40\%$ (это максимальное табличное значение $Q$), $t = 0,2537$.
Т. е. в данном случае раз $\hat{t}<t$, то $Q >40\%$.

Правильно ли это интерпретировать так, что с вероятностью >80% наступит ошибка первого рода и с вероятностью >80% должна быть отвергнута гипотеза об однородности двух выборок?

2) У двух выборок $n = 123$, $\hat{t} = 1,1492$.
По таблицам при $n = 120$: $Q = 25\%$, $t_{\textit25} = 0,6765$ ; $Q = 10\%$, $t_{\textit10} = 1,2886$.
Т. е. в данном случае $t_{\textit10}<\hat{t}<t_{\textit25}.

Правильно ли это интерпретировать так, что с вероятностью 20-50% наступит ошибка первого рода и с вероятностью 20-50% должна быть отвергнута гипотеза об однородности двух выборок? Является ли промежуток от 20% до 50% достаточным, что б гипотеза была принята?

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 17:39 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Нет, неправильно. Во-первых, что за прошлый век, почему надо искать какие-то таблицы? Откройте хотя бы Excel и найдите точные значения двусторонних вероятностей для распределения Стьюдента с нужным числом степеней свободы. Если я правильно понимаю, что такое у Вас $n$, то в первом случае для 244 степеней свободы $\mathsf P(|T_{244}|>0{,}1946)=0{,}845868031348741$. Во втором $\mathsf P(|T_{121}|>1{,}492)=0{,}13830181022029$.

Во-вторых, то, что Вы вычисляете, называется реально достигнутым уровнем значимости ($p$-value). Это не есть вероятность отвергнуть гипотезу однородности! О какой вообще вероятности отвергнуть гипотезу идёт речь, если критерий - мероприятие ни разу не рандомизированное? Вы либо принимаете гипотезу, либо отвергаете её, а не монетку бросать собрались, чтобы решить, какое из этих действий предпринять. $p$-value - вероятность для двух однородных выборок получить значение $\hat t$ дальше от нуля, чем Ваше $0{,}1946$ или $1{,}492$. Т.е. получить для двух однородных выборок худшее согласие с проверяемой гипотезой, чем получено для проверяемых выборок. То, что это значение столь велико в первом случае, и сравнительно велико во втором, говорит о том, что гипотезу однородности следует принять.

Можно на это смотреть иначе. Если (в первом случае) Вы будете пользоваться критерием с любой вероятностью ошибки первого рода меньшей, чем $0{,}845868031348741$, этот критерий будет принимать гипотезу однородности! Т.е. даже критерий, отвергающий верную гипотезу однородности в 80% случаев (а это крайне строгий критерий!), всё равно не найдёт криминала в Ваших проверяемых выборках и примет гипотезу однородности.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение22.12.2019, 23:40 


20/07/16
24
Москва
--mS-- в сообщении #1431502 писал(а):
Нет, неправильно. Во-первых, что за прошлый век, почему надо искать какие-то таблицы? Откройте хотя бы Excel и найдите точные значения двусторонних вероятностей для распределения Стьюдента с нужным числом степеней свободы. Если я правильно понимаю, что такое у Вас $n$, то в первом случае для 244 степеней свободы $\mathsf P(|T_{244}|>0{,}1946)=0{,}845868031348741$. Во втором $\mathsf P(|T_{121}|>1{,}492)=0{,}13830181022029$.


Благодарю вас за дискуссию. Да, все верно, $n$ это число степеней свободы. Буду очень признателен, если объясните, как Вы в Excel считаете значение $\mathsf P$.

Дальше, поскольку все сформулировано в новых для меня терминах, мне надо обдумать ваш ответ. Пока что мне сложно понять, что с чем сравнивать для того что бы показать, что две выборки однородны: $\mathsf P$ с $\hat{t}$?

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение23.12.2019, 08:40 
Заслуженный участник
Аватара пользователя


23/11/06
4171
=T.DIST.2T(0,1946; 244)

Сравнивать $P$ с $0{,}05$. Или с тем уровнем критерия $\alpha$, которым Вы хотите воспользоваться.

 Профиль  
                  
 
 Re: О критерии Стьюдента
Сообщение26.12.2019, 03:55 


20/07/16
24
Москва
--mS--
Большое спасибо! Все понял.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: denny


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group