Ладно, ссылки никто не дает. Видимо действительно придется решать самим.
Я благодарю всех за помощь, но текущее решение меня не удовлетворяет: соотношения используют условия и недостаточно точны. Поэтому буду пилить дальше.
Я нашел следующее.
Обозначим
- вероятность получить ровно
уникальных значений в выборке из
элементов.
Тогда
, где
- числа Стирлинга 2-го рода.
Теперь, по идее, мы должны оценить
методом максимального правдоподобия. Чтобы заюзать ММП нужна какая-то статистика, но у меня всего 2 числа:
, ну или максимум гистограмма, но чего-то другого. Можно выборку нарезать на куски, но так мы не учтем часть информации о дублях между кусками выборки. Можно найти
, но это будет только точечная оценка, а желательна интервальная с какой-то точностью.
Если кто знает, пните в нужном направлении, пожалуйста.