Для проверки гипотезы гомоскедастичности остатков регрессионной модели предложено множество разных способов,
все формальные процедуры так или иначе основаны на выявлении корреляций квадратов остатков модели с независимыми переменными, но каждая из них специфична, так как постулирует определённую модель гетероскедастичности, и только её она способно надёжно выявить. Среди прочих, наиболее привлекательным и универсальных мне представляется тест Спирмена, так как в нём предполагается лишь монотонный характер произвольной нелинейной зависимости.
Вроде бы всё понятно, но после практического применения метода я пришел в некоторое замешательство. Уж слишком много было значимых корреляций. Чтобы проверить свои результаты я сгенерировал случайный гаусовый процесс и посчитал корреляции для него. Оказалось, что количество значимых корреляций то же достаточно велико.
Привожу гистограмму распределения полученных z-уровней корреляций
есть подозрение, что здесь имеет место проблема множественных сравнений, т.к. число факторов велико (N=200).
Вместо того чтобы вводить соответствующие поправки, я сравнивал доверительные интервалы:
для P=76%, z=1.32 и в этот интервал попадает 4 столбика гистограммы, в которых 76% всех наблюдений. На этом основании я делаю вывод, что гипотеза гомоскедастичности остатков может быть принята с вероятностью 76%.
для P=86,5%, z=1.15 и в этот интервал уже не попадает 5 столбиков, в которых содержится 86,5% всех наблюдений. На этом основании я делаю вывод, что гипотеза гомоскедастичности остатков на уровне 86,5% должна быть отвергнута.
Для моих остатков получаются следующие результаты:
т.е. они мало чем отличаются от предыдущих, хотя сами остатки по виду неоднородные
можно ли в данном случае принять гипотезу гомоскедастичности остатков, или я просто неверно интерпретирую результаты теста Спирмена? или же данный тест в моём случае не подходит?
Самое непонятное для меня - почему такие результаты получаются для случайного гауссова шума?