Никакие критерии согласия не дают вероятностей того, что проверяемая гипотеза верна. Вы хотите использовать реально достигнутые уровни значимости в роли таких вероятностей? Они совсем иное показывают:
- вероятность для выборки из распределения
получить худшее согласие с гипотезой
, чем по тестируемой выборке.
Чтобы вообще можно было говорить о вероятностях, с которыми гипотеза верна, слова "верна такая-то гипотеза" должны стать событиями, т.е. им следует приписать некие априорные вероятности
в отдельном эксперименте. Допустим, приписали. Но дробь
составлена из одних условных вероятностей: если, скажем, критерий непараметрический, значение статистики критерия на данной числовой выборке для распределения
есть
и с.в.
имеет такое же распределение, как статистика критерия при верной основной гипотезе (одно и то же для всех трёх гипотез), то
где
есть гипотетическая "усреднённая статистика критерия", которая с вероятностью
равна
.
Т.е. дробь
вычисляет что-то по формуле Байеса только в случае
, т.е. когда априори гипотезы равновозможны. Но и в этом случае она вычисляет не вероятность того, что выборка взята из
-го распределения, а вероятность, взяв выборку равновозможно из любого из трёх распределений, получить по ней худшее согласие с проверяемыми тремя гипотезами, чем по тестируемой числовой выборке.