2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение30.01.2020, 17:33 


07/11/19
11
Добрый день.

На самом деле, вопрос лишь косвенно касается неравенства Чебышева.
Ширяев в гл.1 §6 п.7 приводится хитрая оценка вероятности $\left\lbrace\left\lvert \frac{S}{n} - p \right\rvert \leqslant \varepsilon \right\rbrace$ через экспоненциальную форму неравенства Чебышева. Но дело даже не в этом. В целом, все выкладки понятны, кроме двух:

1.
Приводится такая формула:
$H(a) = a\ln \frac{a}{p} + (1 - a)\ln\frac{1-a}{1-p}$

и утверждается, что
$H(p + x)\geqslant 2x^2, 0 \leqslant p + x \leqslant 1 $

Откуда следует это утверждение???
Я уже третий день этими логарифмами жонглирую и частичные суммы рядов оценить пытаюсь, но воз, увы, и ныне там.

2.
Этот вопрос для тех, у кого есть книжка Ширяева, т.к. чтобы полностью описать весь контекст, пришлось бы переписывать весь параграф с предельными теоремами, т.к. непонятны выкладки в самом конце главы.

Цитирую "Воспользовавшись без труда («правило Лопиталя») устанавливаемым соотношением...... --->
$\frac{1}{\sqrt{2\pi}}\int\limits_{x}^{\infty} e^{-y^2/2} dy  \sim \frac{1}{\sqrt{2\pi}x} e^{-x^2/2},  x \to \infty$

(С этим я, в целом, согласен. Хотя, дифференцирование несобственных интегралов по нижнему пределу я себе представляю не очень хорошо. Зорич, рассматривая эту тему, дифференцирует не по параметру интегрирования (у него интегральная ф-ция от двух параметров). Но интуиция (и правила дифференцирования собственных интегралов) подсказывает, что формула выше верна). Когда начал с этим разбираться, у меня все время лишний минус вылезал, но после расписывания приращений вроде сошлось.)

---> ... можно показать, что $k^2 (\alpha) \sim 2\ln\frac{2}{\alpha}, \alpha\downarrow 0$ "

При этом, выше он приводит следующее соотношение для $k$:

$\frac{1}{\sqrt{2\pi}}\int\limits_{-k(\alpha)}^{k(\alpha)} e^{-x^2/2} dx = 1 - \alpha$
и $2\xi\sqrt{n} \geqslant k(\alpha)$

Вот как он это получил? Куда вставил предыдущую оценку интеграла, чтобы это вывести?

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение30.01.2020, 18:40 


07/11/19
11
По поводу пункта 2:
Я предположил, что он вот это:
$\left\lbrace\left\lvert \frac{S}{n} - p \right\rvert \leqslant \varepsilon \right\rbrace \sim \frac{1}{\sqrt{2\pi}}\int\limits_{-\varepsilon\sqrt{n/pq}}^{\varepsilon\sqrt{n/pq}}e^{-x^2/2} dx, n \to \infty$
представил в виде:
$\left\lbrace\left\lvert \frac{S}{n} - p \right\rvert \leqslant \varepsilon \right\rbrace \sim 1 - ( \frac{1}{\sqrt{2\pi}}\int\limits_{-\infty}^{-x}e^{-x^2/2} dx + \frac{1}{\sqrt{2\pi}}\int\limits_{x}^{\infty}e^{-x^2/2} dx) $
и уже как-то от этого отталкивался.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение30.01.2020, 18:48 
Заслуженный участник
Аватара пользователя


11/04/08
2748
Физтех
Plague Doctor
По-моему неравенство из первого пункта следует из неравенства
$$\ln{(1+x)} \ge \frac{x}{1+x}, \ \ x > -1.$$

-- Чт янв 30, 2020 18:56:26 --

По поводу второго пункта, не понимаю, какие могут быть проблемы с дифференцированием несобственного интеграла с переменным нижним пределом. Вы же всегда его можете представить как сумму двух интегралов -- с конечными пределами и несобственный. Второй от икс не зависит, это число. А первый дифференцируйте как обычно. Как замечено в книге, по правилу Лопиталя действительно получается, что те функции в пределе эквивалентны.

-- Чт янв 30, 2020 19:31:16 --

Что касается $k^2(\alpha)$, то тоже все понятно. Из равенства
$$\frac{1}{\sqrt{2\pi}}\int\limits_{-k(\alpha)}^{k(\alpha)}e^{-x^2/2}\,dx=1-\alpha$$
следует
$$\frac{1}{\sqrt{2\pi}}\int\limits_{k(\alpha)}^{+\infty}e^{-x^2/2}\,dx=\alpha/2,$$
поэтому отсюда (по указанному в книге свойству) сразу получаем
$$\frac{1}{\sqrt{2\pi}k(\alpha)}e^{-k^2(\alpha)/2} \sim \alpha/2, \ \alpha \to 0.$$
С другой стороны можно взять равенство выше, продифференцировать его и получить
$$-\frac{1}{\sqrt{2\pi}}k'(\alpha)e^{-k^2(\alpha)/2}=1/2,$$
откуда выражаем эту экспоненту, подставляем в формулу выше и получаем $-kk' \sim \alpha$ и откуда следует требуемое $k^2(\alpha) \sim 2\ln{(2/\alpha)},\alpha\to0$.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение01.02.2020, 14:24 


07/11/19
11
ShMaxG

Цитата:
По поводу второго пункта, не понимаю, какие могут быть проблемы с дифференцированием несобственного интеграла с переменным нижним пределом. Вы же всегда его можете представить как сумму двух интегралов -- с конечными пределами и несобственный. Второй от икс не зависит, это число. А первый дифференцируйте как обычно. Как замечено в книге, по правилу Лопиталя действительно получается, что те функции в пределе эквивалентны.

И правда очевидно.
По поводу пункта 2 - благодарю за исчерпывающее объяснение! Все и правда сошлось.


А вот пункт 1 пока не поддался.

Цитата:
По-моему неравенство из первого пункта следует из неравенства...

С этим неравенством я тоже пробовал. Если подставить "в лоб" (и если я нигде не ошибся), оценка получается
$H(p+x) \geqslant \frac{x^2}{1-p}$
но она заходит только для $p \geqslant \frac{1}{2}$
Т.е.
$H(p+x) \geqslant 2x^2$ - более точна при $p < \frac{1}{2} $

На всякий случай попробовал перебросить правую часть влево и оценить производную через это неравенство, но ничего толкового не вышло (оценка-то по сути та же самая).

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение01.02.2020, 18:40 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Plague Doctor
Видимо, у меня более раннее издание Ширяева. Он это место там довольно подробно обосновывает, предварительно разложив $H(x)$ по формуле Тейлора по степеням $(x-p)$, до второго порядка.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение02.02.2020, 17:42 
Заслуженный участник
Аватара пользователя


11/04/08
2748
Физтех
Да там все гораздо проще. Там же вторая производная функции $H(p+x)$ по иксу равна $$H''(p+x)=\frac{1}{p+x} + \frac{1}{1-p-x} = \frac{1}{(p+x)(1-p-x)} \ge 4$$ для всех допустимых икс, т.е. $-p < x < 1-p$. Проинтегрируем это неравенство аккуратно два раза и получим $H(p+x) \ge 2x^2$ для всех $-p < x < 1-p$.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение05.02.2020, 11:10 


07/11/19
11
ShMaxG в сообщении #1437949 писал(а):
Да там все гораздо проще. Там же вторая производная функции $H(p+x)$ по иксу равна $$H''(p+x)=\frac{1}{p+x} + \frac{1}{1-p-x} = \frac{1}{(p+x)(1-p-x)} \ge 4$$ для всех допустимых икс, т.е. $-p < x < 1-p$. Проинтегрируем это неравенство аккуратно два раза и получим $H(p+x) \ge 2x^2$ для всех $-p < x < 1-p$.


Красиво. Спасибо.

Otta в сообщении #1437819 писал(а):
Видимо, у меня более раннее издание Ширяева. Он это место там довольно подробно обосновывает, предварительно разложив $H(x)$ по формуле Тейлора по степеням $(x-p)$, до второго порядка.


Да, этот момент я упустил. Но тут все-равно не до конца понятно.
Если разложить $H(\hat{p}), \hat{p} = p + x$ в точке $x = 0$, у меня получилось:
$H(\hat{p}) = H(p) + H'(p)x + \frac{1}{2}H''(p)x^2 + o(x^3) = \frac{1}{2}(\frac{1}{p} + \frac{1}{1-p}) + o(x^3) \geqslant 2x^2 + o(x^3)$

Но тут все портит $o(x^3)$

Если взять в форме Лагранжа:
$R_n(x) = \frac{x^3}{6}(\frac{1}{(1-p-\theta x)^2} - \frac{1}{(p+\theta x)^2})$

Чтобы его отбросить, надо, чтобы было $R_n(x) \geqslant 0$
Это может быть при $ p \geqslant \frac{1}{2} -  \theta x$ или опять же $ p \geqslant \frac{1}{2}$

Можно ли все-таки доказать это неравенство через разложение в ряд?

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение05.02.2020, 12:46 
Заслуженный участник
Аватара пользователя


23/07/05
17976
Москва
Plague Doctor в сообщении #1438374 писал(а):
$H(\hat{p}) = H(p) + H'(p)x + \frac{1}{2}H''(p)x^2 + o(x^3) = \frac{1}{2}(\frac{1}{p} + \frac{1}{1-p}) + o(x^3) \geqslant 2x^2 + o(x^3)$
Добавьте ещё один член к формуле и возьмите остаточный член в форме Лагранжа.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение05.02.2020, 13:09 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Plague Doctor в сообщении #1438374 писал(а):
$H(\hat{p}) = H(p) + H'(p)x + \frac{1}{2}H''(p)x^2 + o(x^3) = \frac{1}{2}(\frac{1}{p}x^2 + \frac{1}{1-p}) + o(x^3) \geqslant 2x^2 + o(x^3)$

Ну там или о маленькое от $x^2$ все же в конце или, по авторской версии о большое от $x^3$. И я совершенно не вижу, где, собственно, используется это неравенство. Вполне достаточно разложения.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение06.02.2020, 22:35 


07/11/19
11
Someone в сообщении #1438386 писал(а):
Добавьте ещё один член к формуле и возьмите остаточный член в форме Лагранжа.

В этом случае у меня вылезают иксы, которые все портят.
Распишу первые 4 производные для наглядности:
$H'(x) = \ln\frac{x}{p} - \ln\frac{1-x}{1-p}$
$H''(x) = \frac{1}{x} - \frac{1}{1-x}$
$H'''(x) = -\frac{1}{x^2} + \frac{1}{(1-x)^2}$
$H''''(x) = 2\frac{1}{x^3} + 2\frac{1}{(1-x)^3}$

Итого, раскладывая $H(\hat{p}), \hat{p} = p + x$ в точке $x = 0$:
$H(\hat{p}) = H(p) + H'(p)x + \frac{1}{2}H''(p)x^2 + \frac{1}{6}H'''(p)x^3 + R_n $
$R_n(x) = \frac{x^4}{4!}(2\frac{1}{(1-p-\theta x)^3} + 2\frac{1}{(p+\theta x)^3}) = \frac{x^4}{12}(\frac{1}{(1-p-\theta x)^3} + \frac{1}{(p+\theta x)^3})$

И вот, что получилось:
$H(\hat{p}) = \frac{1}{2}(\frac{1}{p} + \frac{1}{1-p})x^2 + \frac{1}{6}(\frac{1}{(1-p)^2} - \frac{1}{p^2})x^3 + \frac{1}{12}(\frac{1}{(1-p-\theta x)^3} + \frac{1}{(p+\theta x)^3})x^4 = \frac{1}{2}(\frac{1}{p} + \frac{1}{1-p})x^2 + \frac{x^3}{6}(\frac{1}{(1-p)^2} - \frac{1}{p^2} + \frac{x}{2(1-p-\theta x)^3} + \frac{x}{2(p+\theta x)^3})$

Из этого можно сказать, что:
$H(\hat{p}) \geqslant \frac{1}{2}(\frac{1}{p} + \frac{1}{1-p})x^2 + \frac{x^3}{6}(\frac{1}{(1-p)^2} - \frac{1}{p^2} + \frac{x}{2(1-p)^3} + \frac{x}{2(p+x)^3})$

Ну и дальше опять что-то застопорилось. Пытался прикинуть, что будет, если представить остаток в интегральной форме, но на глаз из этого тоже ничего хорошего не вышло, ибо на выходе получится огромное кол-во разномастных членов, включая логарифмы. Сразу оговорюсь, что я это не досчитал - просто посмотрел, как будет выглядеть подынтегральное выражение.


Otta в сообщении #1438389 писал(а):
Ну там или о маленькое от $x^2$ все же в конце или, по авторской версии о большое от $x^3$

Безусловно! Это я тут наврал.

Otta в сообщении #1438389 писал(а):
И я совершенно не вижу, где, собственно, используется это неравенство. Вполне достаточно разложения.

Он использует это ближе к концу параграфа. Параграф 6, пункт 7, формула (39). Там он применяет именно неравенство.

И коль скоро у вас под рукой Ширяев, помогите, пожалуйста, разобраться с еще одним вопросом.
В §7 (оценка вероятностей успеха в схеме Бернулли), когда он расписывает доверительные интервалы, он получил:

$P_\theta\left\lbrace\left\lvert\theta-T_n\right\rvert\leqslant\lambda\sqrt{\frac{\theta(1-\theta)}{n}}\right\rbrace = 0.9973$
где $T_n = \frac{S_n}{n} -$ эффективная оценка, $ S_n = \xi_1 +...+ \xi_n,  \theta -$ вероятность успеха одного исхода.

$E_\theta T_n = \theta$

Т.е. с вероятностью 0,9973 (формула 8):
$T_n - 3\sqrt{\frac{\theta(1-\theta)}{n}} \leqslant \theta \leqslant T_n + 3\sqrt{\frac{\theta(1-\theta)}{n}} $

С этим все понятно. И вот дальше он приводит, цитирую - "или после итерирования и отбрасывания членов порядка $O(n^\frac{-3}{4})$":
$T_n - 3\sqrt{\frac{T_n(1-T_n)}{n}} \leqslant \theta \leqslant T_n + 3\sqrt{\frac{T_n(1-T_n)}{n}} $

1. Это ($T_n \to \theta $) разве не следует из закона больших чисел?
2. Что он итерирует и откуда получил $O(n^\frac{-3}{4}) $. Быть может, он как-то выводит это через $E_\theta T_n = \theta$?
3. Зачем он вообще это написал, когда ниже он приводит "Отсюда следует, что доверительный интервал":
$[T_n - \frac{3}{2\sqrt{n}}, T_n + \frac{3}{2\sqrt{n}}]$
Разве это не следует из предыдущей формулы (формулы 8)??

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение07.02.2020, 00:54 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Plague Doctor в сообщении #1438611 писал(а):
Он использует это ближе к концу параграфа. Параграф 6, пункт 7, формула (39). Там он применяет именно неравенство.

Вы лучше скажите, при доказательстве какого результата. У нас решительно разные версии, и пункт 7 шестого параграфа в моем издании - это задачи.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение07.02.2020, 01:22 
Заслуженный участник
Аватара пользователя


23/07/05
17976
Москва
Plague Doctor в сообщении #1438611 писал(а):
$H(\hat{p}) = H(p) + H'(p)x + \frac{1}{2}H''(p)x^2 + \frac{1}{6}H'''(p)x^3 + R_n $
Нет, не получится. Прошу прощения, мне что-то померещилось.

Если все эти изыски отбросить и учесть, что $p(1-p)\leqslant\frac 14$ при $0<p<1$, то вторая производная от $H(p+x)-2x^2$ при $0<p+x<1$ тривиально оценивается снизу нулём, и если дважды это неравенство проинтегрировать (имеются в виду интегралы по $x$ с нижним пределом $0$), то получится как раз то, что нужно. Как Вам и советовали раньше.

 Профиль  
                  
 
 Re: Неравенство Чебышева и оценка вероятностей [Ширяев]
Сообщение07.02.2020, 11:34 


07/11/19
11
Someone в сообщении #1438645 писал(а):
Если все эти изыски отбросить и учесть, что $p(1-p)\leqslant\frac 14$ при $0<p<1$, то вторая производная от $H(p+x)-2x^2$ при $0<p+x<1$ тривиально оценивается снизу нулём, и если дважды это неравенство проинтегрировать (имеются в виду интегралы по $x$ с нижним пределом $0$), то получится как раз то, что нужно. Как Вам и советовали раньше.


Да, это простое и красивое решение.
Я просто ради интереса и практики хотел попробовать доказать это именно с помощью разложения.
Ну нет так нет). Все-равно спасибо.

Otta в сообщении #1438640 писал(а):
Вы лучше скажите, при доказательстве какого результата. У нас решительно разные версии, и пункт 7 шестого параграфа в моем издании - это задачи.


Там очередная попытка получить оценку точнее, чем Чебышев.
Ну и, соответственно, поиск минимально необходимого кол-ва экспериментов.

Там он пользуется, как он это называет, "экспоненциальной" формой неравенства Чебышева:
$\left\lbrace X \geqslant \varepsilon \right\rbrace = \left\lbrace X^{2k} \geqslant \varepsilon^{2k} \right\rbrace \leqslant \frac{X^{2k}}{\varepsilon^{2k}}$
или
$\left\lbrace X \geqslant \varepsilon \right\rbrace = \left\lbrace e^{\lambda X} \geqslant e^{\lambda \varepsilon} \right\rbrace \leqslant e^{\lambda (X - \varepsilon)}$

Дальше он приходит к выводу:
$\left\lbrace \frac{S_n}{n} \geqslant a\right\rbrace \leqslant e^{-nH(a)}$

И далее он применяет это неравенство:
$H(p + \varepsilon) \geqslant 2\varepsilon^2$
$\left\lbrace \frac{S_n}{n} - p \geqslant \varepsilon \right\rbrace \leqslant e^{-2n\varepsilon^2}$

И в конце он получает:
$\left\lbrace \left\lvert \frac{S_n}{n} - p \right\rvert \leqslant \varepsilon \right\rbrace \geqslant 1 - \alpha$
$n_3(\alpha) = [\frac{\ln(\frac{2}{\alpha})}{2\varepsilon^2}] $

В принципе, по сети ходит его четвертое издание. У меня шестое, но пока они, вроде, совпадают вплоть до нумерации формул. Если вас не коробит скачивание книг, можете посмотреть там.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: VanD


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group