2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Доказательство ЦПТ через предел бесконечных сверток
Сообщение08.10.2023, 17:13 


08/10/23
1
Я пытаюсь показать (не доказать, потому что я хочу сначала хотя бы эвристически получить нужный результат) ЦПТ как предел бесконечных сверток, и вроде такой способ дает нужный результат. Но когда я пытаюсь его обобщить на то, чтобы получить еще и скорость сходимости к гауссиане (теорему Берри-Эссеена), то результат не совпадает с ожидаемым. Буду очень благодарен, если поможете мне найти ошибку в рассуждениях.

В общем, предположим $X_1, X_2, ..., X_n$ это i.i.d случайные величины с $\mathbb{E}X=0$ и $ \text{Var}X=1$.

Мы хотим найти предел распределения $p_{S_n}(t)$ где $S_n=\frac{X_1+X_2+...+X_n}{\sqrt{n}}$ при $n\to\infty$.
Если прибавить еще $X_i$ то получится новая случайная величина $S_{n+1}$ такая, что

$$S_{n+1} = \frac{\sqrt{n}}{\sqrt{n+1}}S_n+\frac{X_{n+1}}{\sqrt{n}}$$

Обозначая $\frac{X_{n+1}}{\sqrt{n}}=\xi$ имеющую pdf $p_{\xi}(x)$, получаем

$$p_{S_{n+1}}(t) = \int p_{\xi}(x) \frac{\sqrt{n+1}}{\sqrt{n}}p_{S_n}\left(\frac{\sqrt{n+1}}{\sqrt{n}}(t-x)\right)dx$$

Это можно упростить. Во первых, $n \gg 1$, так что $\frac{\sqrt{n+1}}{\sqrt{n}} \approx 1+\frac{1}{2n}$. Во вторых, $\xi$ имеет очень маленькую дисперсию $\frac{1}{n+1}$, поэтому вся почти масса ее распределения находится в окрестности 0. Так что интеграл будет ненулевым только для достаточно малых значений x. Поэтому можно разложить $p_{S_n}$.
$$p_{S_n}\left(\frac{\sqrt{n+1}}{\sqrt{n}}(t-x)\right) \approx p_{S_n}\left((1+\frac{1}{2n})t\right)-xp'_{S_n}\left((1+\frac{1}{2n})t\right)+$$
$$+\frac{x^2}{2}p''_{S_n}\left((1+\frac{1}{2n})t\right)-\frac{x^3}{6}p'''_{S_n}\left((1+\frac{1}{2n})t\right)+...$$

$\mathbb{E}\xi=0$ и $ \text{Var}\xi\approx\frac{1}{n}$, поэтому слагаемое с первой производной занулится после интегрирования, а слагаемое со второй производной будет порядка $\frac{1}{n}$. Также, нет смысла раскладывать внутри $p''_{S_n}$ и$p'''_{S_n}$ если нужны только слагаемые больше, чем $\frac{1}{n^2}$. В общем, после интегрирования имеем
$$p_{S_{n+1}}(t)=\left(1+\frac{1}{2n}\right)\Bigg(p_{S_n}\left((1+\frac{1}{2n})t\right)+0+\frac{1}{2(n+1)}p''_{S_n}(t)-\frac{\mu_3}{6(n+1)^{\frac{3}{2}}}p'''_{S_n}(t)\Bigg)\approx$$
$$\approx p_{S_n}(t)+\frac{p_{S_n}(t)}{2n}+\frac{tp'_{S_n}(t)}{2n}+\frac{p''_{S_n}(t)}{2n}-\frac{\mu_3p'''_{S_n}(t)}{6n^{\frac{3}{2}}} \tag{1}
$$

При $n\to\infty$, $p_{S_{n}}\to p_{S_{n+1}}$, поэтому умножив на $2n$ получаем диффур:
$$p(t)+tp'(t)+p''(t)-\frac{\mu_3p'''(t)}{3\sqrt{n}}=0$$
Если принять, что последнее слагаемое тоже зануляется, а также, что $p(-\infty)=0$, получим:

$$(tp(t)+p'(t))'=0$$
$$tp(t)+p'(t)=0$$
$$p(t)=ce^{-\frac{t^2}{2}}$$

И это по сути ЦПТ. Пока все хорошо.

Но если обозначить $\varepsilon=\frac{\mu_3}{3\sqrt{n}}$ и рассмотреть ДУ со всеми слагаемыми, получим:

$$p(t)+tp'(t)+p''(t)-\varepsilon p'''(t)=0$$
$$tp(t)+p'(t)-\varepsilon p''(t)=0$$
Можно попробовать искать решения в виде
$$p=p_0+\varepsilon p_1+...$$
Тогда имеем для разных порядков $\varepsilon$:
$$\varepsilon^0:tp_0+p'_0=0\Rightarrow p_0=c_0e^{-\frac{t^2}{2}}$$
$$\varepsilon^1:tp_1+p'_1=p''_0\Rightarrow p_1=c_1e^{-\frac{t^2}{2}}+c_0e^{-\frac{t^2}{2}}\left(\frac{t^3}{3}-t\right)$$
И окончательно:
$$p(t)=(c_0+\varepsilon c_1)e^{-\frac{t^2}{2}}+\varepsilon c_0 e^{-\frac{t^2}{2}}\left(\frac{t^3}{3}-t\right)$$
И тут возникает проблема. Если я вычислю $c_0$ из уравнения порядка $\varepsilon^0$ (так как $\int p dt=1$), то $c_0=\frac{1}{\sqrt{2\pi}}$ и $c_1=0$.
Но с другой стороны $\int t^3pdt=\frac{\mu_3}{\sqrt{n}}=3\varepsilon$ и тогда
$$3\varepsilon=\int t^3pdt=\int\frac{t^3}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}+\frac{\varepsilon t^3}{\sqrt{2\pi}} e^{-\frac{t^2}{2}}\left(\frac{t^3}{3}-t\right)dt=0+\frac{\varepsilon}{\sqrt{2\pi}}2\sqrt{2\pi}=2\varepsilon\neq3\varepsilon$$
Если же я вычислю $c_0$ и $c_1$ из полного решения, я получаю
$$c_0=\frac{3}{2}, c_1=\frac{1}{\varepsilon}\big(\frac{1}{\sqrt{2\pi}}-\frac{3}{2}\big)$$
И тот факт, что $c_1\to\infty$ при $\varepsilon\to0$ кажется совершенно неправильным.

Насколько я вижу, причина этих противоречий может быть в том, что множитель при $\frac{1}{\sqrt{n}}$ который я получил равен $\frac{\mu_3}{3}$, а не $\frac{\mu_3}{2}$. У меня есть несколько мыслей, как это можно поправить, но они какие-то неубедительные.

Например, один из способов получить "правильный" ответ это рассматривать не изначальный диффур, а
$$p_{S_{n+2}}-p_{S_{n+1}}\approx p_{S_{n+2}} - p_{S_n}-\frac{p_{S_n}}{2n}-\frac{tp'_{S_n}}{2n}-\frac{p''_{S_n}}{2n}+\frac{\mu_3p'''_{S_n}}{6n^{\frac{3}{2}}}\approx$$
$$\approx p_{S_{n+1}} + \frac{p_{S_{n+1}}}{2(n+1)}+\frac{tp'_{S_{n+1}}}{2(n+1)}+\frac{p''_{S_{n+1}}}{2(n+1)}-\frac{\mu_3p'''_{S_{n+1}}}{6(n+1)^{\frac{3}{2}}} - p_{S_n}-\frac{p_{S_n}}{2n}-\frac{tp'_{S_n}}{2n}-\frac{p''_{S_n}}{2n}+\frac{\mu_3p'''_{S_n}}{6n^{\frac{3}{2}}}\approx$$
$$\approx p_{S_{n+1}} - p_{S_{n}} -\frac{p_{S_n}}{2n^2}-\frac{tp'_{S_n}}{2n^2}-\frac{p''_{S_n}}{2n^2}+\frac{\mu_3p'''_{S_n}}{4n^{\frac{5}{2}}}$$
Тогда при $(p_{S_{n+2}}-p_{S_{n+1}}) - (p_{S_{n+1}}-p_{S_{n}})\to0$ получаем уравнение
$$\frac{\mu_3}{2\sqrt{n}} p''' - p''-p'-tp=0$$
Его решение (при непрерывной p) с $c_0=\frac{1}{\sqrt{2\pi}}$ после интегрирования от $-\infty$ до x соответствует неравенству Берри-Эссеена, а именно
$$F_n(x) \approx \Phi(x) + \frac{1}{\sqrt{n}}\frac{\mu_3}{6\sqrt{2\pi}}e^{-\frac{x^2}{2}}\big(1-x^2\big)$$
где $F_n$ это CDF $p_{S_n}$, а $\Phi$ это CDF нормального распределения.

Но я не знаю, почему я бы стал рассматривать вторые разности, не зная заранее ответа. И кажется, что третьи разности снова ведут к чему-то странному, так что это может быть просто совпадение.

В общем, вопрос в том, какие правильные шаги на этом пути и как их найти?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Mikhail_K


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group