Делаю функцию, которая:
1) генерирует выборку объема
n из двумерного нормального распределения с центрами 0 и единичной ковариационной матрицей. Генератор случайной величины использую стандартный, который есть в Вольфрамовской Математике
Код:
dist = MultinormalDistribution[{0, 0}, {{1, 0}, {0, 1}}];
data=RandomReal[dist, n];
2) считает сумму квадратов отклонений от центра

для каждого компонента сгенерированной выборки. В зависимости от того, известен или неизвестен центр по этому компоненту, она может быть или

, или

;
3) считает выборочный коэффициент корреляции

, где

- оценка или известное значение (0) центра по данному компоненту.
4) считает статистику с учетом изменения числителя.
Далее запускаю эту функцию 10 000 раз, получаю выборку статистики, которая, по идее, должна подчинятся распределению Стьюдента со степенями свободы как в числителе статистики. Считаю по этой выборке тесты, это стандартная процедура в Математике, строю график.
Если оба центра оцениваются, все тесты проходят, если только один (понятно, любой), то тесты проходят еще лучше, а вот если ни один центр не оценивается, то распределение статистики не Стьюдентовское. Но тогда вопрос - а какое? Или статистика в данном случае не так должна считаться? Или вообще оценка коэффициента корреляции должна быть другая?