Сравнение реальных уровней значимости различных модификаций критерия Колмогорова — Смирнова для сложной гипотезы В сообщении методом статистических испытаний находятся оценки уровней значимости трех модификаций: Лиллиефорса, Тюрина, Лемешко Б.Ю., и Лемешко С.Б. [1].
В отличие от работ Лиллиефорса и Тюрина, в работе [1] в качестве статистики критерия используется

.
В таблице приведены критические значения статистик, используемые ниже при тестировании. В первой строке указаны номинальные уровни значимости.
Распределение статистики

стремится к асимптотической формуле Тюрина при

,

.
Для получения оценок выполнялось

испытаний. В каждом испытании генерировалась выборка из нормального распределения с нулевым ожиданием и единичной дисперсией, вычислялись статистики модификаций критерия и сравнивались с соответствующим критическим значением. По результатам

испытаний, находились оценки вероятностей:

, где

— количество случает отвергнуть верную гипотезу.
Для вычисления функции распределения использовалась функция erf в реализации [2]. В качестве генератора равномерного распределения использован стандартный генератор Delphi 5.0.
Для выборок объема 30, 100 число повторений составляло 1 000 000, для выборок объема 200 и 500 — 5 000 000.
Оценки вероятностей отвергнуть гипотезу, когда она верна

Из таблицы видно, что асимптотическое распределение Тюрина, при использовании статистики

, как и ожидалось, хоть как-то применимо только при очень малых уровнях значимости (0.01 и менее) и больших объемах выборки (больше 500). Сравнение критических значений статистик, показывает, что при применении асимптотического распределения Тюрина следует использовать статистику

. Критические значения, предложенные в работе [1], в широком диапазоне объемов выборок приводят к очень хорошим результатам.
В строках "Тюрин Ю.Н., 1984" приведены оценки ошибок первого рода, полученные методом Монте-Карло, при использовании критических значений найденных по асимптотическому распределению Тюрина и

в качестве статистики критерия. Для каждого объема выборки число повторений равно 5 000 000.
Т.к. для конечных объемов выборок таблицы критических значений рассчитываются методом Монте-Карло, то опубликованные таблицы быстро устаревают и имеют скорее историческое значение. Было опубликовано множество таблиц и аппроксимаций. Часть указана в работе Лемешко Б.Ю., Лемешко С.Б., 2009. Вот еще ссылки. В [3] воспроизведены таблицы [4] для проверки нормальности и экспоненциальности, содержащие критические значения для объемов выборок 4–100. В [5] приводится таблица, полученная в результате генерации 100 000 реализаций (повторений) для каждого объема выборки, объемы выборок 4–50. В [6] табулированы критические значения статистики

для уровней значимости 0.5, 0.25, 0.1, 0.05, 0.025, 0.01, 0.001, 0.0001 для n = 3–30 с шагом 1, для n = 30–100 c шагом 10 и для n = 200, 400. Для каждого объема выборки было сгенерировано 50 миллионов реализаций. Предельное распределение получено гармонической экстраполяцией (детали в статье не описаны).
Некоторые критические значения

для «бесконечно большого» объема выборки [6]:
Авторы утверждают, что на основании многочисленных примеров они уверовали, что критерий Крамера — фон Мизеса мощнее Лиллиефорса. Для выборок объемом 30, 500, 100 и уровне значимости 0.05 приводится пример, когда в соответствии с альтернативой предполагается, что данные получены из распределения Стьюдента с двумя степенями свободы. В этом примере с увеличением объема выборки выигрыш в мощности критерия Крамера — фон Мизеса уменьшается.
Судя по документации, mathlab использует таблицу критических значений, охватывающую выборки объемом до 1000.
Я благодарен
headrd за указание на форуме работы [1].
[1] Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч. I // Измерительная техника, 2009, N 6, c. 6. (
pdf)
[2]
http://alglib.sources.ru/specialfunctio ... normal.php.
[3] J.D. Gibbons, S. Chakraborti “Nonparametric Ststistical inference”, Marcel Dekker, Inc, New York, 2003 (
pdf).
[4] R.L. Edgeman, R.C. Scott (1987) “Lilliefors’s test for transformed variables” // Brazilian Journal of Probability and Statistics, 1, 101–112.
[5] P. Molin, H. Abdi “New table and numerical approximations for Kolmogorov—Smirnov / Lilliefors / van Soest normality test”, Technical Report, University of Bourgogne (France) / University of Texas at Dallas (USA), 1998 (
pdf).
[6] W. F. Scott, B. Stewart
“Tables for the Lilliefors and Modified Cramer–von Mises tests of normality” // Communications in Statistics — Theory and Methods, Vol. 40, Issue 4 (2011).