Продолжаю рекомендовать
, как наиболее удобный. Но в качестве альтернатив - функцию правдоподобия посчитать
для каждой из гипотез, и выбрать "самую правдоподобную" (
- плотность распределения для k-той гипотезы,
- i-тое наблюдение в выборке)
(Оффтоп)
"В светском уложении правдоподобие равняется правде!" (А.С.Пушкин)
Можно выбирать графически. Для этого надо знать обратные к функции распределения
, посчитать
, где элементы выборки предполагаются упорядоченными по возрастанию, и нанести их на график. Где ближе к прямой получится, то и распределение верное.
Но вот
мне больше нравится. И я бы разбивал на интервалы не слепо нарубив на равные, а, если уж нам даны теоретические функции распределения, сперва построил бы их графики и посмотрел бы, на каких интервалах какая больше. Соответственно, за границы интервалов принимал бы точки пересечения графиков (разумеется, слишком сильно дробить тоже не стоит, лучше следовать рекомендациям выбирать интервалы так, чтобы в них было не менее 5, или даже 10 наблюдений). Конечно, даже с этим разбиением, максимально контрастирующим распределения, вовсе не гарантировано, что одна гипотеза будет принята, а другая отброшена. Могут быть принимаемы обе, или обе отброшены. Второй случай - это неприятная, но важная информация, что наша теория никуда не годится. Надо менять модель. Первый случай может случиться попросту из-за малости выборки, недостаточно данных для однозначного ответа. Тогда просто принять лучшее приближение, помня, что и второе не отвергнуто, и есть смысл повторить, набрав поболее данных.
Что до учёта "цены ошибки" - если её можно определить (иногда трудно из-за нехватки данных, иногда из-за неопределённости критерия, а иногда несравнимо в принципе - ошибка первого рода, ложноположительная диагностика это перерасход на лечение в рублях, ошибка второго рода, ложноотрицательная диагностика это повышение смертности в жизнях), то такой учёт желателен. Но без Байеса он малополезен. Надо изыскать априорные вероятности, затем, сравнив с выборкой, найти апостериорные (например, используя тот же критерий
для оценки вероятности события при данной гипотезе, или через правдоподобие), умножить вероятности ошибок на цены ошибок и минимизировать ожидаемые потери.