А какова тогда "внутренняя логика" отклонения гипотезы сдвига при
? Мой ход мыслей: 1) если сдвига нет, значит, доля значений U, принадлежащих указанному интервалу, равна
; 2) если сдвиг есть, значит, доля значений U, принадлежащих указанному интервалу, меньше
; 3) если априорные вероятности гипотез о наличии и отсутствии сдвига равны и значение U конкретной выборки принадлежит указанному интервалу, значит, более вероятна гипотеза об отсутствии сдвига.
Простая. Даже если распределения совершенно одинаковы, в силу случайности элементы одной выборки могут оказаться в общей совокупности не равномерно перемешаны с элементами другой, а кучковаться в начале или конце выборки. Что оценивает предложенный критерий. Но можно рассчитать вероятность такой ситуации. Вероятность того, что случайно при одинаковости распределений в выборках значение критерия окажется равным наблюдаемому или "хуже". Если эта вероятность p достаточно мала - говорим, что "на 5% уровне" или "1% уровне значимости", соответственно
или
нулевая гипотеза не опровергается. О "вероятностях гипотез" не говорим. Чтобы имел смысл говорить о вероятностях - надо перейти к байесовскому оцениванию, а для этого гипотезы сформулировать не в терминах "нулевой сдвиг"/"ненулевой сдвиг", а рассмотреть разные варианты сдвига (возможно, континуум) и для каждого привести априорную вероятность, оценить вероятность наблюдаемой статистики для каждой гипотезы, перейти к апостериорным и указать апостериорную вероятность для выбранной.
-- 08 мар 2023, 16:12 --Этот подобен случаю выше с двумя нормальными распределениями с одинаковым матожиданием и очень разной дисперсией. Распределение критерия искажено даже на больших выборках и нулевая гипотеза отвергается почти в два раза чаще, чем положено. Но да, работает из рук вон плохо.
В Вашем примере "работает из рук вон плохо", в моём не работает принципиально. А почему - потому, что статистика в критерии Манна-Уитни подогнана под задачу проверки наличия сдвига. Она выражается через сумму рангов элементов данной выборки в объединённой совокупности. Если одна выборка сдвинута, в смысле её параметр сдвига отличен от другой, то её элементы, упорядоченные по возрастанию, будут на столько же сдвинуты по сравнению с упорядоченными по возрастанию элементами другой, а значит, в объединённой выборке их ранги будут систематически сдвинуты в соответствующую сторону. И хотя для отдельных элементов выборки их ранги будут сдвинуты не в соответствии с общим сдвигом распределений, сумма будет сдвинута в нужную сторону и покажет наличие сдвига.
Если задача именно проверить, одинаковы ли распределения - двухвыборочный Колмогоров-Смирнов,
-тест,
-тест.
-- 08 мар 2023, 16:34 --Вопросы:
1. В чём проблема одностороннего теста?
2. Есть ли смысл использовать тест на основе «оси значимости»?
1. Односторонний тест - когда нас интересует только одно возможное направление сдвига. Двусторонний - когда любое отклонение.
Если мы проверяем гипотезу, что препарат Х как-то влияет на давление - двусторонний тест, поскольку мы напишем статью и в том случае, если увидели гипотензивное, и если гипертензивное действие. Если мы требует уровня значимости в 5%, то есть в 1 публикации из 20 согласны быть обмануты игрой случайностей, то, значит, надо допускать такой афронт в 2.5% случаях для повышения и 2.5% для понижения давления (обычно поровну, но в принципе можно делить и 2%+3% или 1% и 4%). Это "двусторонний критерий"
Если мы проверяем гипотезу, что препарат Х понижает давление, сдвиг в сторону повышения давления нас не интересует, то берём уровень значимости 5% и для него считаем критическое значение статистики. Это "односторонний критерий".
Выбор подчинён прикладной задаче.
2. Насколько я понял идею "оси значимости" - автор предлагает не выбирать волевым решением между "общепринятыми" уровнями 5% и 1% (а некоторые авторы даже предлагают использовать 10%, но указывать не на значимость, а на "тенденцию", имея в виду, что при увеличении объёма выборки либо получим значимость, либо окончательно убедимся в отсутствии, и есть смысл продолжать эксперименты), а при 1% значимости объявлять о значимом различии, при отсутствии хотя бы 5% - говорить об отсутствии значимости, а в промежутке 1...5% "оставлять в подозрении". Особого смысла не усматриваю, но, может, где-то и оправдано.