Спасибо
Евгений Машеров , примерно так у меня и происходит на реальных данных. Значит причина - это наличие сложной нелинейной взаимосвязи переменных. Почему ранговые корреляции не решают проблемы - мне стало понятно: они способны выявить только монотонные зависимости, а если зависимость более сложная - то могут её и не обнаружить.
В Вашем примере наверное так и будет.
По этому поводу у меня возникла идея: делим выборку на 2 равные части, наблюдения распределяем таким образом, чтобы в первой подвыборке корреляция переменных была минимальной, а во второй, соответственно - максимальной. Это будут границы доверительного интервала для доверительной вероятности
(это исходя из максимального числа возможных неодинаковых подвыборок). Затем вычисляем доверительный интервал для
вычисленного по общей выборке для такой же доверительной вероятности
. И смотрим, насколько сильно вылетают полученные на подвыборках значения
за его пределы. Если они существенно выходят за границы, то очевидно, что выборка неоднородна. В частности, в случае корреляции Пирсона - совместное распределение не является нормальным. В общем похоже на ресамплинг, но в вычислительном отношении эта процедура намного проще.
Что Вы думаете по этому поводу?