В собственно критерии Пирсона никаких интервалов, вообще-то, нет. Есть вероятности некоторых событий и наблюдаемые частости. Интервалы появляются, когда мы сводим непрерывное распределение к дискретному, вводя группировку. Это вносит произвол. И приходится пользоваться голимой эмпирикой. Скажем, можно взять формулу Стёрджесса

При том, что она выводилась для совершенно иной задачи (рисования гистограмм), да и там не слишком обоснована, она может внести единообразие
(Оффтоп)
Хоть и безобразно, но однообразно! (майор Шматов, командуя взводу расстегнуть воротники в жару)
-- 17 июн 2013, 22:55 --Предлагались и иные формулы для группировки. Скажем, формула Скотта для ширины интервала

, сигма - выборочное стандартное отклонение
или формула Фридмана и Диакониса

, где

- интерквартильное расстояние.
Оснований для предпочтения одной из них другой мало, и скорее надо пользоваться пусть не лучшей, но одинаковой формулой.
Неопределённость вносится также выбором границ интервалов (скажем, простое их округление может давать неожиданно большой эффект), а также объединением интервалов, чтобы получить достаточно большое количество наблюдений в ячейке.