2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Доказательство ЦПТ через предел бесконечных сверток
Сообщение08.10.2023, 17:13 


08/10/23
1
Я пытаюсь показать (не доказать, потому что я хочу сначала хотя бы эвристически получить нужный результат) ЦПТ как предел бесконечных сверток, и вроде такой способ дает нужный результат. Но когда я пытаюсь его обобщить на то, чтобы получить еще и скорость сходимости к гауссиане (теорему Берри-Эссеена), то результат не совпадает с ожидаемым. Буду очень благодарен, если поможете мне найти ошибку в рассуждениях.

В общем, предположим $X_1, X_2, ..., X_n$ это i.i.d случайные величины с $\mathbb{E}X=0$ и $ \text{Var}X=1$.

Мы хотим найти предел распределения $p_{S_n}(t)$ где $S_n=\frac{X_1+X_2+...+X_n}{\sqrt{n}}$ при $n\to\infty$.
Если прибавить еще $X_i$ то получится новая случайная величина $S_{n+1}$ такая, что

$$S_{n+1} = \frac{\sqrt{n}}{\sqrt{n+1}}S_n+\frac{X_{n+1}}{\sqrt{n}}$$

Обозначая $\frac{X_{n+1}}{\sqrt{n}}=\xi$ имеющую pdf $p_{\xi}(x)$, получаем

$$p_{S_{n+1}}(t) = \int p_{\xi}(x) \frac{\sqrt{n+1}}{\sqrt{n}}p_{S_n}\left(\frac{\sqrt{n+1}}{\sqrt{n}}(t-x)\right)dx$$

Это можно упростить. Во первых, $n \gg 1$, так что $\frac{\sqrt{n+1}}{\sqrt{n}} \approx 1+\frac{1}{2n}$. Во вторых, $\xi$ имеет очень маленькую дисперсию $\frac{1}{n+1}$, поэтому вся почти масса ее распределения находится в окрестности 0. Так что интеграл будет ненулевым только для достаточно малых значений x. Поэтому можно разложить $p_{S_n}$.
$$p_{S_n}\left(\frac{\sqrt{n+1}}{\sqrt{n}}(t-x)\right) \approx p_{S_n}\left((1+\frac{1}{2n})t\right)-xp'_{S_n}\left((1+\frac{1}{2n})t\right)+$$
$$+\frac{x^2}{2}p''_{S_n}\left((1+\frac{1}{2n})t\right)-\frac{x^3}{6}p'''_{S_n}\left((1+\frac{1}{2n})t\right)+...$$

$\mathbb{E}\xi=0$ и $ \text{Var}\xi\approx\frac{1}{n}$, поэтому слагаемое с первой производной занулится после интегрирования, а слагаемое со второй производной будет порядка $\frac{1}{n}$. Также, нет смысла раскладывать внутри $p''_{S_n}$ и$p'''_{S_n}$ если нужны только слагаемые больше, чем $\frac{1}{n^2}$. В общем, после интегрирования имеем
$$p_{S_{n+1}}(t)=\left(1+\frac{1}{2n}\right)\Bigg(p_{S_n}\left((1+\frac{1}{2n})t\right)+0+\frac{1}{2(n+1)}p''_{S_n}(t)-\frac{\mu_3}{6(n+1)^{\frac{3}{2}}}p'''_{S_n}(t)\Bigg)\approx$$
$$\approx p_{S_n}(t)+\frac{p_{S_n}(t)}{2n}+\frac{tp'_{S_n}(t)}{2n}+\frac{p''_{S_n}(t)}{2n}-\frac{\mu_3p'''_{S_n}(t)}{6n^{\frac{3}{2}}} \tag{1}
$$

При $n\to\infty$, $p_{S_{n}}\to p_{S_{n+1}}$, поэтому умножив на $2n$ получаем диффур:
$$p(t)+tp'(t)+p''(t)-\frac{\mu_3p'''(t)}{3\sqrt{n}}=0$$
Если принять, что последнее слагаемое тоже зануляется, а также, что $p(-\infty)=0$, получим:

$$(tp(t)+p'(t))'=0$$
$$tp(t)+p'(t)=0$$
$$p(t)=ce^{-\frac{t^2}{2}}$$

И это по сути ЦПТ. Пока все хорошо.

Но если обозначить $\varepsilon=\frac{\mu_3}{3\sqrt{n}}$ и рассмотреть ДУ со всеми слагаемыми, получим:

$$p(t)+tp'(t)+p''(t)-\varepsilon p'''(t)=0$$
$$tp(t)+p'(t)-\varepsilon p''(t)=0$$
Можно попробовать искать решения в виде
$$p=p_0+\varepsilon p_1+...$$
Тогда имеем для разных порядков $\varepsilon$:
$$\varepsilon^0:tp_0+p'_0=0\Rightarrow p_0=c_0e^{-\frac{t^2}{2}}$$
$$\varepsilon^1:tp_1+p'_1=p''_0\Rightarrow p_1=c_1e^{-\frac{t^2}{2}}+c_0e^{-\frac{t^2}{2}}\left(\frac{t^3}{3}-t\right)$$
И окончательно:
$$p(t)=(c_0+\varepsilon c_1)e^{-\frac{t^2}{2}}+\varepsilon c_0 e^{-\frac{t^2}{2}}\left(\frac{t^3}{3}-t\right)$$
И тут возникает проблема. Если я вычислю $c_0$ из уравнения порядка $\varepsilon^0$ (так как $\int p dt=1$), то $c_0=\frac{1}{\sqrt{2\pi}}$ и $c_1=0$.
Но с другой стороны $\int t^3pdt=\frac{\mu_3}{\sqrt{n}}=3\varepsilon$ и тогда
$$3\varepsilon=\int t^3pdt=\int\frac{t^3}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}+\frac{\varepsilon t^3}{\sqrt{2\pi}} e^{-\frac{t^2}{2}}\left(\frac{t^3}{3}-t\right)dt=0+\frac{\varepsilon}{\sqrt{2\pi}}2\sqrt{2\pi}=2\varepsilon\neq3\varepsilon$$
Если же я вычислю $c_0$ и $c_1$ из полного решения, я получаю
$$c_0=\frac{3}{2}, c_1=\frac{1}{\varepsilon}\big(\frac{1}{\sqrt{2\pi}}-\frac{3}{2}\big)$$
И тот факт, что $c_1\to\infty$ при $\varepsilon\to0$ кажется совершенно неправильным.

Насколько я вижу, причина этих противоречий может быть в том, что множитель при $\frac{1}{\sqrt{n}}$ который я получил равен $\frac{\mu_3}{3}$, а не $\frac{\mu_3}{2}$. У меня есть несколько мыслей, как это можно поправить, но они какие-то неубедительные.

Например, один из способов получить "правильный" ответ это рассматривать не изначальный диффур, а
$$p_{S_{n+2}}-p_{S_{n+1}}\approx p_{S_{n+2}} - p_{S_n}-\frac{p_{S_n}}{2n}-\frac{tp'_{S_n}}{2n}-\frac{p''_{S_n}}{2n}+\frac{\mu_3p'''_{S_n}}{6n^{\frac{3}{2}}}\approx$$
$$\approx p_{S_{n+1}} + \frac{p_{S_{n+1}}}{2(n+1)}+\frac{tp'_{S_{n+1}}}{2(n+1)}+\frac{p''_{S_{n+1}}}{2(n+1)}-\frac{\mu_3p'''_{S_{n+1}}}{6(n+1)^{\frac{3}{2}}} - p_{S_n}-\frac{p_{S_n}}{2n}-\frac{tp'_{S_n}}{2n}-\frac{p''_{S_n}}{2n}+\frac{\mu_3p'''_{S_n}}{6n^{\frac{3}{2}}}\approx$$
$$\approx p_{S_{n+1}} - p_{S_{n}} -\frac{p_{S_n}}{2n^2}-\frac{tp'_{S_n}}{2n^2}-\frac{p''_{S_n}}{2n^2}+\frac{\mu_3p'''_{S_n}}{4n^{\frac{5}{2}}}$$
Тогда при $(p_{S_{n+2}}-p_{S_{n+1}}) - (p_{S_{n+1}}-p_{S_{n}})\to0$ получаем уравнение
$$\frac{\mu_3}{2\sqrt{n}} p''' - p''-p'-tp=0$$
Его решение (при непрерывной p) с $c_0=\frac{1}{\sqrt{2\pi}}$ после интегрирования от $-\infty$ до x соответствует неравенству Берри-Эссеена, а именно
$$F_n(x) \approx \Phi(x) + \frac{1}{\sqrt{n}}\frac{\mu_3}{6\sqrt{2\pi}}e^{-\frac{x^2}{2}}\big(1-x^2\big)$$
где $F_n$ это CDF $p_{S_n}$, а $\Phi$ это CDF нормального распределения.

Но я не знаю, почему я бы стал рассматривать вторые разности, не зная заранее ответа. И кажется, что третьи разности снова ведут к чему-то странному, так что это может быть просто совпадение.

В общем, вопрос в том, какие правильные шаги на этом пути и как их найти?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group