Тестирование критических значений статистики критерия Андерсона — Дарлинга для гипотезы «нормальности»[В серии работ Стефенса используется договорённость о нумерации случаев проверки гипотезы о «нормальности». 0 — случай, когда параметры известны (проверка простой гипотезы); 1 — неизвестно ожидание, но известна дисперсия, 2 — известно ожидание, но не известна дисперсия; 3 — оба параметра неизвестны. Эта договорённость принята и в этом сообщении.]
На сегодняшний день на странице
Anderson–Darling test английской вики выложен вариант критических значений «асимптотического» распределения статистики
для всех четырёх случаев и модификация статистики для применения критерия в случае 3 для выборок малого объёма (
); работа [7]. [В вики, в отличие от Стефенса, нумерация случаев начинается не с 0, а с 1.] К сожалению, в работе [9] отмечается, что при нахождении асимптотических распределений статистики в [7] были допущены просчёты и приводятся исправленные критические значения статистики. Выражение модифицированной статистики для случая 3 не приводится.
Также на вики выложен более поздний вариант критических значений асимптотического распределения
и модификация статистики для случая 3 для выборок малого объема:
; [8]. (Книгу [8] я не читал, но такие критические значения и модификация статистики приводятся в других источниках со ссылкой на [8].)
В [7] указывается: в случае 2, как и в случае 0, уже для выборок объемом большим 5 можно пользоваться асимптотическим распределением.
Для удобства критические значения статистики (для случая, когда и дисперсия и ожидание оцениваются по выборке) приведены в табл. 1. Видно: критические значения D’Agostino практически совпадают с критическими значениями Stephens-76, а также близки к значениям [1].
Табл 1. Процентные точки статистики при проверке «нормальности».
Предварительное моделирование показало: как и ожидается, критические значения Стефенса 74 никуда не годятся.
Для того чтобы получить представление насколько хороши критические значения и модификация статистики D’Agostino для случая 3, а также насколько хороши для случаев 1 и 2 критические значения Стефенса 76 и при каких объемах выборки ими уже можно пользоваться было выполнено незамысловатое моделирование, в котором оценивалась вероятность отвергнуть истинную гипотезу (оценивался «реальный» уровень значимости). Данные приведены в табл. 2. Для получения оценок для каждого объёма выборки генерировалось 500 тыс. реализаций выборки. Для вычисления функции распределения, как и в предыдущем сообщении, использовалась функция библиотеки alglib [2].
Табл. 2 — Оценки вероятности отклонить гипотезу, когда она верна
Ref. (ссылки [1] и [2] приведены в предыдущем сообщении)
[7] Stephens M.A. EDF Statistics for Goodness of Fit and Some Comparisons. //
Journal of the American Statistical Association, 69, 730–737 (1974) (
pdf)
[8] D'Agostino R.B., Stephens M.A. Goodness-of-Fit Techniques. – N.Y.: Marcel Dekker, 1986.
[9] Stephens M.A. Asymptotic results for goodness-of-fit statistics with unknown parameters //
The Annals of Statistics, Vol. 4, No. 2, 357–369 (1976).