Давно интересовал вопрос о выборе наиболее близкой к реальным данным функции распределения если подходят несколько (в смысле не отвергается гипотеза о принадлежности опытной функции распределения к гипотетической). Сформировалось следующая методика:
0. Имеется выборка
большого объёма, например 1000, и по ней сделано предположение, что ГС может быть распределена как по
, так и по
. Какую из гипотез следует принять? В литературе по матстатистике ответа не нашёл, поэтому предлагаю следующий способ:
1. Из
случайным образом извлекается безповторная выборка меньшего объёма
, пусть 100, и по ней находятся параметры для
и
. Эта выборка затем возвращается в
.
2. Из
случайным образом извлекается следующая безповторная выборка объёма
и для неё находится величина суммы квадратов невязок (
) для
и
. Эта выборка затем также возвращается в
.
3. Пункт 2). повторяем
раз.
4. Использование полученных результатов. Пусть в
случаях из
, тогда с вероятностью
выбирается функция
.
Я понятно изложил? Что вы на это скажете?