Нужно проверить гипотезу, одинаково ли распределены 2 выборки (как именно – неизвестно). В книге Кибзуна утверждается, что статистика

распределена как хи-квадрат (приводится там без доказательства) с числом степеней свободы r-1 (я здесь написал ту формулу, переписанную для частного случая 2-х выборок).

,

– объемы сравниваемых выборок;

,

– число i-го исхода (из r возможных) в каждой из выборок;

.
В моем случае СВ непрерывная, поэтому диапазон наблюдаемых значений разбиваю на r интервалов. Есть масса информации о разбиении в случае проверки гипотезы о принадлежности к к.-л. заданному распределению, а как делать это правильно в моем случае – не нашел. Разбил на равные по длине. Результат повергает в ужас: в зависимости от r гипотеза может приниматься или отвергаться, причем и то и то – «со свистом».
При равных по длине интервалах часто получаются ситуации, что почти все числа толпятся в одном интервале (причем в крайнем), а в остальных – по 1-2.
Подскажите, пожалуйста, где найти информацию, на сколько интервалов следует разбивать и каким образом?