Забывая о выпуклости
![$f(x)$ $f(x)$](https://dxdy-04.korotkov.co.uk/f/7/9/9/7997339883ac20f551e7f35efff0a2b982.png)
(не могу сообразить, как это может быть),
если
![$\mathcal D(x, \theta)$ $\mathcal D(x, \theta)$](https://dxdy-03.korotkov.co.uk/f/e/a/d/ead8d58eae63fbd6d2d74df706a6359d82.png)
это функция распределения, то мысль идёт в направлении того, чтобы сделать
![$f(x, \theta) = \mathcal{D}^{-1}(x, \theta)$ $f(x, \theta) = \mathcal{D}^{-1}(x, \theta)$](https://dxdy-03.korotkov.co.uk/f/2/d/8/2d8f47718cf62e0278ee0f6b01a4476782.png)
. Тогда p в Бернулли будут соответствовать её квантилям, поэтому мы смогли бы "взвесить" для Z функцию плотности вероятности от X
![$\mathcal D'(x, \theta)$ $\mathcal D'(x, \theta)$](https://dxdy-02.korotkov.co.uk/f/1/7/f/17f2aaa60f85a13411d4d819c696d24b82.png)
его же функцией распределения
![$\mathcal D(x, \theta)$ $\mathcal D(x, \theta)$](https://dxdy-03.korotkov.co.uk/f/e/a/d/ead8d58eae63fbd6d2d74df706a6359d82.png)
.
Если для
![$\mathcal D(x, \theta)$ $\mathcal D(x, \theta)$](https://dxdy-03.korotkov.co.uk/f/e/a/d/ead8d58eae63fbd6d2d74df706a6359d82.png)
взять самую удобную функцию распределения (стандартное логистическое распредление с
![$\mu=0$ $\mu=0$](https://dxdy-04.korotkov.co.uk/f/b/0/d/b0def8c925f9ac65f543dd0dc2696f6f82.png)
и
![$s=1$ $s=1$](https://dxdy-04.korotkov.co.uk/f/7/7/6/776f93672423b6ad1b8808ea2f12445282.png)
), то получаем:
![$\frac{e^{-x}}{(1 + e^{-x})^3}$ $\frac{e^{-x}}{(1 + e^{-x})^3}$](https://dxdy-01.korotkov.co.uk/f/4/e/a/4eab7631c5bf3f35339936c296ca4ad382.png)
и, нормализуя её интегралом
![$\int\limits_{-\infty}^{+\infty} \frac{e^{-x}}{(1 + e^{-x})^3} dx = 0.5$ $\int\limits_{-\infty}^{+\infty} \frac{e^{-x}}{(1 + e^{-x})^3} dx = 0.5$](https://dxdy-01.korotkov.co.uk/f/8/9/4/894557c1b5466040780eca85800920ff82.png)
, получаем функцию плотности вероятности
![$\frac{2 \cdot e^{-x}}{(1 + e^{-x})^3}$ $\frac{2 \cdot e^{-x}}{(1 + e^{-x})^3}$](https://dxdy-04.korotkov.co.uk/f/b/3/f/b3f3533045eeb28b57d9ab170b4895c982.png)
и функцию распределения соответственно
![$-\frac{2}{(1 + e^{x})} + \frac{1}{((1 + e^{x})^2) + 1}$ $-\frac{2}{(1 + e^{x})} + \frac{1}{((1 + e^{x})^2) + 1}$](https://dxdy-01.korotkov.co.uk/f/0/f/4/0f4c64035457feac03c63b286907219182.png)
. Это как частный случай.
Ничего не напутал?
Симуляция в Питоне подтверждает, что аналитически для данного частного случая оно так:
import numpy as np
from scipy.stats import logistic, ks_1samp
размер_выборки_MC = 100000
rv = logistic(loc=0, scale=1)
X = rv.rvs(size=размер_выборки_MC)
p = rv.cdf(X)
Y = np.random.binomial(1, p=p)
Z = X[Y.astype(bool)]
target_pdf = lambda x: 2.0 * np.exp(-x) / np.power(1 + np.exp(-x), 3)
target_cdf = lambda x: -2.0 / (np.exp(x) + 1) + 1.0 / np.power(np.exp(x) + 1, 2) + 1
ks_1samp(Z, target_cdf)
Просветите, пожалуйста, что это значит.
Просто подчеркивание зависимости события
![$Y = 1$ $Y = 1$](https://dxdy-02.korotkov.co.uk/f/9/1/b/91b934388898617349ea45c71c5dcea882.png)
от значения
![$X$ $X$](https://dxdy-01.korotkov.co.uk/f/c/b/f/cbfb1b2a33b28eab8a3e59464768e81082.png)
.