Предыстория:
Я наблюдаю за действием, которое повторяется через какое-то время. Собственно задача, уметь сравнить два таких наблюдения.
При наблюдении получаем последовательность интервалом между действиями ( длинна последовательности меняется).
Построив гистограмму такой последовательности, стало видно что плотность распределения примерно одна и таже ( для наблюдений которые должны быть одинаковыми). Похоже на то, что можно сравнивать именно функции распределения.
Чтобы сравнить непараметрические(не стандартные) функции распределения вроде должны подходить Хи-квадрат критерий и Критерий согласия Колмогорова. Если бы у меня все было непрерывно, то было бы очень просто и понятно как их применять.
Но вот проблема в том что у меня то все данные дискретные, и вот тут то я и недоумеваю что делать.
Вот например при подсчете
Хи-квадрат статистики.
Вот что я должен сделать, если у меня у одной функции распределения в интервале 0 наблюдений, а у второй одно?
. Данных довольно мало чтобы точно сказать что там будет. А заменять на какое-то малое число тоже как-то не очень хорошо.
А ведь применяют же это критерий для дискретных данных
http://psystat.at.ua/publ/1-1-0-29. Но вот нулей у них нету в таблице.
Может кто-то растолковать, что делать с этим нулем в знаменателе? Или может посоветуете что другое?