2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Определение статистического критерия
Сообщение18.06.2021, 14:33 


21/03/11
200
В учебнике Боровкова по математической статистике (издательство Лань 2010, с.302) дано следующее определение статистического критерия:
Цитата:
Статистическим критерием для проверки $r$ гипотез $H_1,\ldots,H_r$ называется любое измеримое отображение $\delta: \mathcal{X}^n \to \{H_1, \ldots, H_r\}$.
Другими словами, $\delta(X)$ есть случайная "величина", принимающая значения $H_1, H_2, \ldots, H_r$: если $\delta(X)=H_k$, то принимаем гипотезу $H_k$ (т.е. считаем, что $\theta = \theta_k$ в параметрическом случае).

Правильно ли я понял, что здесь слово "величина" взято в кавычки по той причине, что у обычной случайной величины $\xi$ индуцированное вероятностное пространство имеет вид $(\mathbb{R},\mathcal{B}(\mathbb{R}), P_\xi)$, а для $\delta(X)$ оно имеет вид $(\{H_1, \ldots, H_r\}, \mathcal{F}, P_\delta)$, где $\{H_1, \ldots, H_r\}$ - некоторое абстрактное пространство гипотез (которые, вообще говоря, не являются числами), $\mathcal{F}$ - какая-то сигма-алгебра на этом пространстве, $P_\delta$ - индуцированная вероятностная мера на измеримом пространстве $(\{H_1, \ldots, H_r\}, \mathcal{F})$?

Если это так, то получается, что вероятностная мера $P_\delta$ вообще не является распределением, раз она определена не на борелевских множествах, и поэтому с ней неудобно работать. И тогда возникает еще один вопрос - можно ли сопоставить гипотезам $H_1, H_2, \ldots, H_r$ набор чисел, например, $0,1,\ldots,r-1$, и считать, что в случае $r=2$ величина $\delta(X)$ имеет бернуллиевское распределение?

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение18.06.2021, 15:47 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
give_up в сообщении #1523234 писал(а):
И тогда возникает еще один вопрос - можно ли сопоставить гипотезам $H_1, H_2, \ldots, H_r$ набор чисел, например, $0,1,\ldots,r-1$, и считать, что в случае $r=2$ величина $\delta(X)$ имеет бернуллиевское распределение?

Да.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение19.06.2021, 16:48 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Но это плохое определение, потому что не включает рандомизированные критерии.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение20.06.2021, 17:54 


21/03/11
200
alisa-lebovski в сообщении #1523253 писал(а):
Да.

Понял, спасибо.

Тогда такой связанный вопрос - пусть $r=2$, и статистический критерий определен как бернуллиевская случайная величина $\delta: \mathcal{X}^n \to \{0,1\}$, где значение $0$ соответствует принятию гипотезы $H_0$, а значение $1$ соответствует принятию гипотезы $H_1$. В этом случае критическая область определяется как множество $U = \{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x}) = 1\}$. То есть здесь сначала определяется критерий, а затем его критическая область.

Но я в нескольких учебниках заметил, что делают наоборот - сначала определяют критическую область $U$ как множество таких точек из $\mathcal{X}^n$, для которых гипотеза $H_0$ отвергается. А затем вводят формально статистический критерий как индикаторную случайную величину $\delta(\mathbf{X}) = I(\mathbf{X} \in U)$, которая, очевидно, имеет распределение $\mathrm{Bern}(p) = \mathrm{Bern}(P(\mathbf{X} \in U))$. Таким образом, они сначала определяют критическую область критерия, а затем само понятие критерия (что как-то "некрасиво", на мой взгляд).

Так как все же делать более корректно - сначала определить критерий, а затем его критическую область, или наоборот - сначала ввести понятие критической области, а затем через него вводить понятие критерия? Насколько я понял, в обоих случаях выполняется ключевое равенство $P(\mathbf{X} \in U) = P(\delta(\mathbf{X})=1)$, то есть по сути оба способа вроде как эквивалентны. Но может есть какие-то неочевидные мне нюансы, которые делают выбор одного из этих двух способов (введения понятий критерий и критическая область) более корректным с математической точки зрения?

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение20.06.2021, 18:11 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
give_up в сообщении #1523568 писал(а):
сначала определить критерий, а затем его критическую область
Да, так логичнее.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 00:22 
Заслуженный участник
Аватара пользователя


11/04/08
2737
Физтех
give_up в сообщении #1523568 писал(а):
Тогда такой связанный вопрос - пусть $r=2$, и статистический критерий определен как бернуллиевская случайная величина $\delta: \mathcal{X}^n \to \{0,1\}$, где значение $0$ соответствует принятию гипотезы $H_0$, а значение $1$ соответствует принятию гипотезы $H_1$. В этом случае критическая область определяется как множество $U = \{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x}) = 1\}$. То есть здесь сначала определяется критерий, а затем его критическая область.
Нет, я думаю это неверный подход. Если Вы считаете, что критерий -- это случайная величина, то как эта случайная величина соотносится с выборкой и ее распределением? Зависима, независима? Как-то функционально связана? Как именно?

На самом деле критерий -- это детерминированое отображение. Оно становится случайным, когда на вход подается выборка. Наиболее общее определение критерия (см. Боровкова) -- это отображение из $\mathcal{X}^n$ в пространство векторов $(\pi_1,\dots,\pi_r)$ таких, что $\pi_i \ge 0$, $\sum\pi_i=1$. Если какие-то из $\pi_i$ не равны нулю или единице, то проводится независимый от выборки эксперимент, реализация $r$-мерного вектора из соответствующего распределения.

Именно при подаче выборки в критерий $\delta:\mathcal{X}^n \to \{0,1\}$ мы получаем случайную величину $\delta(X)$, которая оказывается бернуллиевской, а не то чтобы она изначально была почему-то бернуллиевской. Параметр этого бернуллиевского распределения зависит от распределения выборки. И вообще распределение $\delta(X)$ зависит как от отображения, так и от распределения выборки.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 11:06 


21/03/11
200
ShMaxG в сообщении #1523643 писал(а):
На самом деле критерий -- это детерминированое отображение. Оно становится случайным, когда на вход подается выборка.

Ну то есть (нерандомизированный) критерий - это по сути борелевская функция вида $\delta: \mathcal{X}^n \to \{0,1\}$, это Вы имеете в виду?

А определение критической области через критерий по формуле $U=\{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x})=1 \}$ Вы тоже считаете неправильным? (просто оно вошло в Вашу цитату моего сообщения)

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 14:02 
Заслуженный участник
Аватара пользователя


11/04/08
2737
Физтех
give_up в сообщении #1523654 писал(а):
Ну то есть (нерандомизированный) критерий - это по сути борелевская функция вида $\delta: \mathcal{X}^n \to \{0,1\}$, это Вы имеете в виду?
Да, для двух гипотез можно так определить. Либо (более общо) борелевское отображение в векторы $(\pi_1,\pi_2)$, где (для нерандомизированного критерия) компоненты равны либо 0, либо 1 и в сумме дают 1.

give_up в сообщении #1523654 писал(а):
А определение критической области через критерий по формуле $U=\{\mathbf{x} \in \mathcal{X}^n: \delta(\mathbf{x})=1 \}$ Вы тоже считаете неправильным? (просто оно вошло в Вашу цитату моего сообщения)
В этой формуле $\delta$ -- это измеримое отображение, оно не случайное, что противоречит тому, что Вы написали в том абзаце, что $\delta$ это случайная величина. Сначала нужно определить отображение (и критическую область), а потом подставлять в него выборку. Обращаю еще внимание на то, что критическая область -- это тоже неслучайное подмножество множества значений выборки.

А вообще, распределения выборки из разных гипотез разные, а критерий один. Соответственно, при подстановке выборки в критерий мы будем получать разные случайные величины. Так что никакого изначального определения критерия как какой-то одной случайной величины быть не может.

 Профиль  
                  
 
 Re: Определение статистического критерия
Сообщение21.06.2021, 16:30 


21/03/11
200
ShMaxG
Хорошо все объяснили, спасибо!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 9 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: mihaild


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group