Никакие критерии согласия не дают вероятностей того, что проверяемая гипотеза верна. Вы хотите использовать реально достигнутые уровни значимости в роли таких вероятностей? Они совсем иное показывают:

- вероятность для выборки из распределения

получить худшее согласие с гипотезой

, чем по тестируемой выборке.
Чтобы вообще можно было говорить о вероятностях, с которыми гипотеза верна, слова "верна такая-то гипотеза" должны стать событиями, т.е. им следует приписать некие априорные вероятности

в отдельном эксперименте. Допустим, приписали. Но дробь

составлена из одних условных вероятностей: если, скажем, критерий непараметрический, значение статистики критерия на данной числовой выборке для распределения

есть

и с.в.

имеет такое же распределение, как статистика критерия при верной основной гипотезе (одно и то же для всех трёх гипотез), то

где

есть гипотетическая "усреднённая статистика критерия", которая с вероятностью

равна

.
Т.е. дробь
вычисляет что-то по формуле Байеса только в случае

, т.е. когда априори гипотезы равновозможны. Но и в этом случае она вычисляет не вероятность того, что выборка взята из

-го распределения, а вероятность, взяв выборку равновозможно из любого из трёх распределений, получить по ней худшее согласие с проверяемыми тремя гипотезами, чем по тестируемой числовой выборке.