Ладно, ссылки никто не дает. Видимо действительно придется решать самим.
Я благодарю всех за помощь, но текущее решение меня не удовлетворяет: соотношения используют условия и недостаточно точны. Поэтому буду пилить дальше.
Я нашел следующее.
Обозначим

- вероятность получить ровно

уникальных значений в выборке из

элементов.

Тогда

, где

- числа Стирлинга 2-го рода.
Теперь, по идее, мы должны оценить

методом максимального правдоподобия. Чтобы заюзать ММП нужна какая-то статистика, но у меня всего 2 числа:

, ну или максимум гистограмма, но чего-то другого. Можно выборку нарезать на куски, но так мы не учтем часть информации о дублях между кусками выборки. Можно найти

, но это будет только точечная оценка, а желательна интервальная с какой-то точностью.
Если кто знает, пните в нужном направлении, пожалуйста.