Ну, вот помонтекарлил. Две выборки по 400 точек, нормально распределённые, вычисляется среднее, максимум и минимум. Затем оценивается СКО (через максимум-минимум и предложенным Гуру способом, второй даёт примерно втрое большие значения). Первая выборка имеет исходно нулевое матожидание и единичную дисперсию, у второй матожидание сдвинуто на h при той же дисперсии. Расчёт сделан при разных h, от 0 (где нахождение различий есть ошибка, при заданном уровне с вероятностью 5%) до 0.5 с шагом 0.1 (где метод должен замечать различия).
Код:
h P1 P2
0 3.1% 0%
0.1 28.9% 0%
0.2 74.6% 0%
0.3 98.4% 6.6%
0.4 100% 51.6%
0.5 100% 93.0%
То есть предложенный мной вариант ведёт разумно, а "от Гуру" подслеповат, начинает замечать различия, когда они втрое выше, чем замечаемые обычным способом. Можно, конечно, высказать претензию, что сильно используется презумпция нормальности - но предложенные Гуру критерии тоже на неё опираются. При том, что наиболее опасный вид ненормальности - "тяжёлые хвосты", а при них минимум и максимум статистики крайне неинформативные.