Интересным представляется вариант «оценивать отклонение не от общей оценки, а от оценки, полученной по всем прочим». Тогда
![$\chi^2=\sum _{i=1}^n \frac{(X_i-a_i)^2}{\sigma_i ^2}$ $\chi^2=\sum _{i=1}^n \frac{(X_i-a_i)^2}{\sigma_i ^2}$](https://dxdy-01.korotkov.co.uk/f/0/0/4/00406159c9e1f6783e48e24bd12f748f82.png)
, где
![$a_i$ $a_i$](https://dxdy-03.korotkov.co.uk/f/6/5/e/65ed4b231dcf18a70bae40e50d48c9c082.png)
- такая же взвешенная оценка среднего, но по выборке без
![$X_i$ $X_i$](https://dxdy-02.korotkov.co.uk/f/1/3/3/1338d1e5163ba5bc872f1411dd30b36a82.png)
. По идее должна подчиняться
![$\chi_{n}^2$ $\chi_{n}^2$](https://dxdy-04.korotkov.co.uk/f/7/5/d/75d0e8155f0225522227cbacddd5cf2f82.png)
. Монте-Карло показывает, что такая величина вообще не подчиняется
![$\chi^2$ $\chi^2$](https://dxdy-03.korotkov.co.uk/f/a/6/7/a67d576e7d59b991dd010277c7351ae082.png)
а что эта статистика должна по Вашему характеризовать? Вам не кажется, что Вы пытаетесь найти различия там, где их нет?
-- 01.10.2023, 21:08 --но по выборке без
![$X_i$ $X_i$](https://dxdy-02.korotkov.co.uk/f/1/3/3/1338d1e5163ba5bc872f1411dd30b36a82.png)
. По идее должна подчиняться
![$\chi_{n}^2$ $\chi_{n}^2$](https://dxdy-04.korotkov.co.uk/f/7/5/d/75d0e8155f0225522227cbacddd5cf2f82.png)
с какой стати, Вы оцениваете средние по уменьшенной выборке, а число степеней свободы от этого только увеличивается?
На самом деле всё наоборот, оно уменьшается и будет не n, а n-2. Это в идеале, но вы берёте подвыборки неслучайно, а согласованно с
![$X_i$ $X_i$](https://dxdy-02.korotkov.co.uk/f/1/3/3/1338d1e5163ba5bc872f1411dd30b36a82.png)
. Путём искусственной декорреляции Вы не сделаете малую выборку независимой, а любая манипуляция с данными приводит к потере степеней свободы.
-- 01.10.2023, 21:18 --Можно просто посчитать хи-квадрат на всех подвыборках, и сделать поправку на множественные сравнения, так по крайней мере будет корректно, и никакого шаманства. Так Вы найдёте главный выброс, и оцените его значимость, а выбором поправки сможете подогнать результаты под свои ожидания. Такое в статистике считается нормальным.