Ладно, ссылки никто не дает. Видимо действительно придется решать самим.
Я благодарю всех за помощь, но текущее решение меня не удовлетворяет: соотношения используют условия и недостаточно точны. Поэтому буду пилить дальше.
Я нашел следующее.
Обозначим
![$p(s,n)$ $p(s,n)$](https://dxdy-04.korotkov.co.uk/f/b/f/a/bfac84c7cd6124a2f8dd596e682f057282.png)
- вероятность получить ровно
![$s$ $s$](https://dxdy-03.korotkov.co.uk/f/6/f/9/6f9bad7347b91ceebebd3ad7e6f6f2d182.png)
уникальных значений в выборке из
![$n$ $n$](https://dxdy-02.korotkov.co.uk/f/5/5/a/55a049b8f161ae7cfeb0197d75aff96782.png)
элементов.
![$a^{\underline{b}}:=a(a-1)...(a-b+1)$ $a^{\underline{b}}:=a(a-1)...(a-b+1)$](https://dxdy-03.korotkov.co.uk/f/2/a/6/2a664e24acda93630608430af357d1a582.png)
Тогда
![$p(s,n)=\dfrac{N^{\underline{s}}}{N^n}\left\{n\atop k\right\}$ $p(s,n)=\dfrac{N^{\underline{s}}}{N^n}\left\{n\atop k\right\}$](https://dxdy-04.korotkov.co.uk/f/f/f/9/ff920c0b63aeb1be83a4b1c0975abc5e82.png)
, где
![$\left\{n\atop s\right\}$ $\left\{n\atop s\right\}$](https://dxdy-04.korotkov.co.uk/f/b/a/c/bacb24debe02d96869cfe710a2f7bbd982.png)
- числа Стирлинга 2-го рода.
Теперь, по идее, мы должны оценить
![$N$ $N$](https://dxdy-04.korotkov.co.uk/f/f/9/c/f9c4988898e7f532b9f826a75014ed3c82.png)
методом максимального правдоподобия. Чтобы заюзать ММП нужна какая-то статистика, но у меня всего 2 числа:
![$n, s$ $n, s$](https://dxdy-04.korotkov.co.uk/f/3/9/d/39d9587895cface00df1a2bc7414906f82.png)
, ну или максимум гистограмма, но чего-то другого. Можно выборку нарезать на куски, но так мы не учтем часть информации о дублях между кусками выборки. Можно найти
![$\arg\max\limits_{N} p(s,n,N)$ $\arg\max\limits_{N} p(s,n,N)$](https://dxdy-03.korotkov.co.uk/f/e/e/3/ee3ab666dfd6845e9889b670a4d0549882.png)
, но это будет только точечная оценка, а желательна интервальная с какой-то точностью.
Если кто знает, пните в нужном направлении, пожалуйста.