2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Определение статистического критерия
Сообщение18.06.2021, 14:33 


21/03/11
200
В учебнике Боровкова по математической статистике (издательство Лань 2010, с.302) дано следующее определение статистического критерия:
Цитата:
Статистическим критерием для проверки $r$ гипотез $H_1,\ldots,H_r$ называется любое измеримое отображение $\delta: \mathcal{X}^n \to \{H_1, \ldots, H_r\}$.
Другими словами, $\delta(X)$ есть случайная "величина", принимающая значения $H_1, H_2, \ldots, H_r$: если $\delta(X)=H_k$, то принимаем гипотезу $H_k$ (т.е. считаем, что $\theta = \theta_k$ в параметрическом случае).

Правильно ли я понял, что здесь слово "величина" взято в кавычки по той причине, что у обычной случайной величины $\xi$ индуцированное вероятностное пространство имеет вид $(\mathbb{R},\mathcal{B}(\mathbb{R}), P_\xi)$, а для $\delta(X)$ оно имеет вид $(\{H_1, \ldots, H_r\}, \mathcal{F}, P_\delta)$, где $\{H_1, \ldots, H_r\}$ - некоторое абстрактное пространство гипотез (которые, вообще говоря, не являются числами), $\mathcal{F}$ - какая-то сигма-алгебра на этом пространстве, $P_\delta$ - индуцированная вероятностная мера на измеримом пространстве $(\{H_1, \ldots, H_r\}, \mathcal{F})$?

Если это так, то получается, что вероятностная мера $P_\delta$ вообще не является распределением, раз она определена не на борелевских множествах, и поэтому с ней неудобно работать. И тогда возникает еще один вопрос - можно ли сопоставить гипотезам $H_1, H_2, \ldots, H_r$ набор чисел, например, $0,1,\ldots,r-1$, и считать, что в случае $r=2$ величина $\delta(X)$ имеет бернуллиевское распределение?

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение18.06.2021, 15:47 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
give_up в сообщении #1523234 писал(а):
И тогда возникает еще один вопрос - можно ли сопоставить гипотезам $H_1, H_2, \ldots, H_r$ набор чисел, например, $0,1,\ldots,r-1$, и считать, что в случае $r=2$ величина $\delta(X)$ имеет бернуллиевское распределение?

Да.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение19.06.2021, 16:48 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Но это плохое определение, потому что не включает рандомизированные критерии.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение20.06.2021, 17:54 


21/03/11
200
alisa-lebovski в сообщении #1523253 писал(а):
Да.

Понял, спасибо.

Тогда такой связанный вопрос - пусть $r=2$, и статистический критерий определен как бернуллиевская случайная величина $\delta: \mathcal{X}^n \to \{0,1\}$, где значение $0$ соответствует принятию гипотезы $H_0$, а значение $1$ соответствует принятию гипотезы $H_1$. В этом случае критическая область определяется как множество $U = \{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x}) = 1\}$. То есть здесь сначала определяется критерий, а затем его критическая область.

Но я в нескольких учебниках заметил, что делают наоборот - сначала определяют критическую область $U$ как множество таких точек из $\mathcal{X}^n$, для которых гипотеза $H_0$ отвергается. А затем вводят формально статистический критерий как индикаторную случайную величину $\delta(\mathbf{X}) = I(\mathbf{X} \in U)$, которая, очевидно, имеет распределение $\mathrm{Bern}(p) = \mathrm{Bern}(P(\mathbf{X} \in U))$. Таким образом, они сначала определяют критическую область критерия, а затем само понятие критерия (что как-то "некрасиво", на мой взгляд).

Так как все же делать более корректно - сначала определить критерий, а затем его критическую область, или наоборот - сначала ввести понятие критической области, а затем через него вводить понятие критерия? Насколько я понял, в обоих случаях выполняется ключевое равенство $P(\mathbf{X} \in U) = P(\delta(\mathbf{X})=1)$, то есть по сути оба способа вроде как эквивалентны. Но может есть какие-то неочевидные мне нюансы, которые делают выбор одного из этих двух способов (введения понятий критерий и критическая область) более корректным с математической точки зрения?

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение20.06.2021, 18:11 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
give_up в сообщении #1523568 писал(а):
сначала определить критерий, а затем его критическую область
Да, так логичнее.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 00:22 
Заслуженный участник
Аватара пользователя


11/04/08
2748
Физтех
give_up в сообщении #1523568 писал(а):
Тогда такой связанный вопрос - пусть $r=2$, и статистический критерий определен как бернуллиевская случайная величина $\delta: \mathcal{X}^n \to \{0,1\}$, где значение $0$ соответствует принятию гипотезы $H_0$, а значение $1$ соответствует принятию гипотезы $H_1$. В этом случае критическая область определяется как множество $U = \{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x}) = 1\}$. То есть здесь сначала определяется критерий, а затем его критическая область.
Нет, я думаю это неверный подход. Если Вы считаете, что критерий -- это случайная величина, то как эта случайная величина соотносится с выборкой и ее распределением? Зависима, независима? Как-то функционально связана? Как именно?

На самом деле критерий -- это детерминированое отображение. Оно становится случайным, когда на вход подается выборка. Наиболее общее определение критерия (см. Боровкова) -- это отображение из $\mathcal{X}^n$ в пространство векторов $(\pi_1,\dots,\pi_r)$ таких, что $\pi_i \ge 0$, $\sum\pi_i=1$. Если какие-то из $\pi_i$ не равны нулю или единице, то проводится независимый от выборки эксперимент, реализация $r$-мерного вектора из соответствующего распределения.

Именно при подаче выборки в критерий $\delta:\mathcal{X}^n \to \{0,1\}$ мы получаем случайную величину $\delta(X)$, которая оказывается бернуллиевской, а не то чтобы она изначально была почему-то бернуллиевской. Параметр этого бернуллиевского распределения зависит от распределения выборки. И вообще распределение $\delta(X)$ зависит как от отображения, так и от распределения выборки.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 11:06 


21/03/11
200
ShMaxG в сообщении #1523643 писал(а):
На самом деле критерий -- это детерминированое отображение. Оно становится случайным, когда на вход подается выборка.

Ну то есть (нерандомизированный) критерий - это по сути борелевская функция вида $\delta: \mathcal{X}^n \to \{0,1\}$, это Вы имеете в виду?

А определение критической области через критерий по формуле $U=\{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x})=1 \}$ Вы тоже считаете неправильным? (просто оно вошло в Вашу цитату моего сообщения)

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 14:02 
Заслуженный участник
Аватара пользователя


11/04/08
2748
Физтех
give_up в сообщении #1523654 писал(а):
Ну то есть (нерандомизированный) критерий - это по сути борелевская функция вида $\delta: \mathcal{X}^n \to \{0,1\}$, это Вы имеете в виду?
Да, для двух гипотез можно так определить. Либо (более общо) борелевское отображение в векторы $(\pi_1,\pi_2)$, где (для нерандомизированного критерия) компоненты равны либо 0, либо 1 и в сумме дают 1.

give_up в сообщении #1523654 писал(а):
А определение критической области через критерий по формуле $U=\{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x})=1 \}$ Вы тоже считаете неправильным? (просто оно вошло в Вашу цитату моего сообщения)
В этой формуле $\delta$ -- это измеримое отображение, оно не случайное, что противоречит тому, что Вы написали в том абзаце, что $\delta$ это случайная величина. Сначала нужно определить отображение (и критическую область), а потом подставлять в него выборку. Обращаю еще внимание на то, что критическая область -- это тоже неслучайное подмножество множества значений выборки.

А вообще, распределения выборки из разных гипотез разные, а критерий один. Соответственно, при подстановке выборки в критерий мы будем получать разные случайные величины. Так что никакого изначального определения критерия как какой-то одной случайной величины быть не может.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 16:30 


21/03/11
200
ShMaxG
Хорошо все объяснили, спасибо!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 9 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group