У меня возник вопрос по так называемому "простому" критерию согласия хи-квадрат Пирсона (под простотой здесь подразумевается, что вероятности попадания в интервалы не зависят от параметра, то есть асимптотическое распределение тестовой статистики при справедливости нулевой гипотезы имеет вид
). Как я понял, этот критерий может быть применен для трех разных постановок задач, отличающихся друг от друга входными данными. Ниже я выписал три этих постановки (далее символом
обозначена i.i.d. выборка,
- ее релизация).
Случай 1. Заданы числа
и
, где
.
Пусть носитель
случайной величины
разбит на
непересекающихся интервалов
, границы которых фиксированы, но не известны, сам носитель
и
тоже неизвестны. По результатам
независимых наблюдений
случайной величины
были кем-то посчитаны частоты ее попаданий в эти интервалы, они оказались равны
соответственно. Здесь семейство допустимых распределений
(оно содержит все одномерные непрерывные распределения и все одномерные дискретные распределения, у которых
). Формально гипотезы выглядит следующим образом:
, где семейство
таково, что
.
, где семейство
таково, что
где
(часто пишут "
")
. (
)
Для случайного вектора
допустимым семейством распределений является семейство всевозможных
-мерных мультиномиальных распределений:
.
Тестовая статистика критерия имеет вид
, а ее реализация есть
. При верности гипотезы
и
выполняется
.
Случай 2. Задан вектор
– реализация i.i.d. выборки
из неизвестного распределения
, а также некоторое известное распределение
. Предполагается, что носитель
случайной величины
известен априори.
Разобъем
на
непересекающихся интервалов (так, чтобы в каждый из них попал хотя бы один элемент из
):
, и посчитаем вероятности
. Если окажется, что
, или хотя бы одна из вероятностей
окажется равной 0 или 1, то считаем, что критерий хи-квадрат неприменим для
. Вычислим числа
– частоты попаданий элементов вектора
в интервалы
соответственно. Дальше выписывается семейство допустимых распределений
, гипотезы и тестовая статистика
.
Случай 3. То же самое, что в случае 2, только носитель
неизвестен. В этом случае нужно положить
и дальше действовать так же, как в 2.
Мой вопрос.В случае 2 предполагается, что носитель
случайной величины
известен априори, тогда как в случаях 1 и 3 мы вообще ничего не знаем про его структуру.
Правильно ли я понимаю, что несмотря на это, в случае 2 семейство допустимых допустимых распределений и гипотезы выглядят точно так же, как в случае 1?Положительный ответ на этот вопрос означает, что критерий согласия хи-квадрат в принципе не способен как-то учесть априорную информацию о носителе истинного распределения для того, чтобы специфицировать
- то есть, независимо от наличия этой информации,
всегда выглядят так, как описано в случае 1. Если же они выглядят как-то по другому, то как именно?