2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Простая задача по статистике.
Сообщение01.07.2014, 23:30 
Надо мне было вспомнить статистику, взял я Лагутина и стал читать.

Есть в нём в частности следующая задача:

Цитата:
Пусть $X_0$ обозначает величину моей "неудачи", например сумму штрафа. Предположим, мои знакомые подвергли себя опыту того же типа. Обозначим размеры их "неудач" через $X_1,X_2 \hdots $. Сколько (в среднем) знакомых мне придётся опросить, пока не встретится человек, размер неудачи которого не меньше, чем у меня.

Формализуем задачу. Допустим $X_1,X_2 \hdots $ - независимые величины с одной и той же непрерывной функцией распределения. Введём случайную величину $N = \min\{n\geqslant 1 : X_n \geqslant X_0\}$. Чему равно математическое ожидание ${\mathbf{M}}N$


Как я её решал.

Обозначим через $X$ случайную величину, равную значению "неудачи".

Какова вероятность, что первый встречный будет иметь число больше моего или равное?

Ну, она будет зависеть от распределения, но в общем виде будет записываться формулой:

$\int_{X_0}^{+\infty} p(x)dx = c(X_0) > 0$

Вернее, больше нуля почти всюду, за исключением случая меры нуль, когда первое же значение получится максимальным, а распределение будет абсолютно непрерывным.

Как будет записано матожидание? Ну, вероятность, что i-тому встречному повезло меньше, чем мне, умножить на его номер:

получим ряд:

$\sum_{i=1}^{\infty} i\cdot c(X_0)^i,   c_j < 0$

Константа, обозначающая условную вероятность "неудачи" зависит от самой первой реализации случайной величины, поэтому возьмём по ней математическое ожидание и заменим почти всюду некой $c_2, 0 < c_2 < 1 $

(которая будет что-то вроде $c_2 = \int_{MX}^{+\infty} p(x)dx$)

$\sum_{i=1}^{\infty} i{c_2^i}$ = \theta( \frac{1}{1-c_2})

Ну, то есть, ряд не сходится в единственном случае - когда в первый раз выпало патологическое значение max распределения, имеющего непрерывный интервал в области максимального значения. Но у этого события мера нуль.

Ну а конкретные константы должны зависеть от распределения.


Я уж было обрадовался, но тут читаю Лагутина дальше:

Изображение

What the hell?

Ничего не понимаю.

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 00:51 
Аватара пользователя
Не опускаясь до придирок относительно того, что непрерывная функция распределения не всегда имеет плотность, сразу посмотрим на первую формулу

Lockywolf в сообщении #882960 писал(а):
Ну, какова вероятность, что первый встречный будет иметь число больше моего или равное?

Ну, она будет зависеть от распределения, но в общем виде будет записываться формулой:

$\int_{X_0}^{+\inf} p(x)dx = c(X_0) > 0$


И это что Вы нашли, вероятность? Тогда почему она зависит от случайной величины $X_0$? А верхний предел $\infty$ пишется так:
Код:
\infty


-- Ср июл 02, 2014 02:00:12 --

Вот ответьте на такой вопрос: Вы играете в какую-нибудь игру на деньги с игровым автоматом. Рядом другой такой же человек, на таком же автомате. Автоматы одинаковы, распределения выигрыша вы не знаете, но они одинаковы. Что вероятнее - Вы выиграете меньше, чем второй человек или больше? (в отличии от непрерывного случая здесь есть еще вариант ''одинаково'' с положительной вероятностью, но это сути и цели вопроса не меняет).

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 01:03 
Henrylee в сообщении #882991 писал(а):

И это что Вы нашли, вероятность? Тогда почему она зависит от случайной величины $X_0$?


Ну, вероятно, написано некорректно, а отредактировать я уже не могу, но кажется, это вполне можно назвать условной вероятностью.

 
 
 
 Posted automatically
Сообщение02.07.2014, 05:19 
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
Тема перемещена в Карантин по следующим причинам:

Наберите корректно все Ваши формулы. Уберите первую картинку и запишите условие здесь в соответствии с требованиями Правил форума, т.е. в $\TeX$.
Краткие инструкции можно найти здесь: topic8355.html и topic183.html.
Кроме этого, в теме Видео-пособия для начинающих форумчан можно посмотреть видео-ролик "Как записывать формулы".

Знак бесконечности пишется так: \infty.

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 15:24 
Цитата:
Вот ответьте на такой вопрос: Вы играете в какую-нибудь игру на деньги с игровым автоматом. Рядом другой такой же человек, на таком же автомате. Автоматы одинаковы, распределения выигрыша вы не знаете, но они одинаковы. Что вероятнее - Вы выиграете меньше, чем второй человек или больше? (в отличии от непрерывного случая здесь есть еще вариант ''одинаково'' с положительной вероятностью, но это сути и цели вопроса не меняет).


Я не очень понял вопрос, но на то, что как мне показалось, вы спросили, ответ следующий:

Задача симметрична. Вероятность, что автомат выдаст мне больше денег, чем соседу, равна вероятности обратной ситуации, когда автомат выдаст соседу больше чем мне. Значит $a = 1 - a = \frac{1}{2}$.
Это верно за исключением случая, когда автомат вообще никак не использует случайность, и просто по нажатии кнопки выдаёт фиксированную сумму. Тогда мы с вероятностью 1 получим равный выигрыш.

Если я правильно вас понял, то это даже значит, что константа $c_2 = \frac{1}{2}$, и подсчёт ещё более упрощается.

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 15:36 
Аватара пользователя
Правильнее сказать, вероятности равны. Но в случае, когда равенство сумм (это я про автоматы) имеет вер-ть ноль, то
$1/2$. И в книжке у Вас тоже столько же при $n=1$.
Тем не менее и с помощью условных вероятностей тоже можно. Только надо до конца доводить:
$$
\Prob\left\{X_1>X_0\,|\,X_0\right\}=1-F(X_0),
$$
где $F(x)$ та самая непрерывная функция распределения величин $X_i$.
Наконец,
$$
\Prob\left\{X_1>X_0\right\}=E\Prob\left\{X_1>X_0\,|\,X_0\right\}=1-EF(X_0)=\frac12,
$$
поскольку $F(X_0)$ имеет (для непрерывной $F(x)$) равномерное на $[0,1]$ распределение.

-- Ср июл 02, 2014 16:39:26 --

Lockywolf в сообщении #883173 писал(а):
Задача симметрична. Вероятность, что автомат выдаст мне больше денег, чем соседу, равна вероятности обратной ситуации, когда автомат выдаст соседу больше чем мне. Значит $a = 1 - a = \frac{1}{2}$.
Это верно за исключением случая, когда автомат вообще никак не использует случайность, и просто по нажатии кнопки выдаёт фиксированную сумму. Тогда мы с вероятностью 1 получим равный выигрыш.

Почему ''за исключением''? Также события равновероятны и в этом случае, просто обе вероятности нулевые.

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 16:46 
Цитата:
Только надо до конца доводить


Так почему ж у Лагутина-то бесконечное матожидание?

Казалось бы, с каждым следующим испытуемым вероятность должна уменьшаться вдвое, и ряд сходится, и причём очень быстро.

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 18:22 
Аватара пользователя
Lockywolf в сообщении #883203 писал(а):
Цитата:
Только надо до конца доводить


Так почему ж у Лагутина-то бесконечное матожидание?

Казалось бы, с каждым следующим испытуемым вероятность должна уменьшаться вдвое, и ряд сходится, и причём очень быстро.


А что Вам у него конкретно непонятно? Там все ясно написано.
Ряд гармонический.

 
 
 
 Re: Простая задача по статистике.
Сообщение02.07.2014, 19:15 
Цитата:
А что Вам у него конкретно непонятно? Там все ясно написано.


Вы издеваетесь что ли?

Откуда у него гармонический ряд берётся, когда мы с вами только что перепроверили два раза (первый раз в первом посте, второй в вашем предыдущем сообщении), что ряд там $\Theta(\sum\frac{1}{2^i})$.

И это ни разу не гармонический ряд.

 
 
 
 Re: Простая задача по статистике.
Сообщение03.07.2014, 08:05 
Аватара пользователя
Lockywolf в сообщении #883253 писал(а):
Цитата:
А что Вам у него конкретно непонятно? Там все ясно написано.


Откуда у него гармонический ряд берётся, когда мы с вами только что перепроверили два раза (первый раз в первом посте, второй в вашем предыдущем сообщении), что ряд там $\Theta(\sum\frac{1}{2^i})$.

И это ни разу не гармонический ряд.

Это Вы наверное шутите. Ничего такого мы с Вами не проверяли. Это Вы сами решили, что там геометрическая прогрессия. Все, что я показал, это то, что вероятность наткнуться с первого раза на человека с бОльшим значением случайной величины равна $1/2$. И все.
Для троих будет не $1/4$, а $1/3$, как и показано в этой книжке.

Я полагаю, Вы считаете независимыми события, которые таковыми не являются.

-- Чт июл 03, 2014 09:15:53 --

Ну давайте для убедительности.
Расмотрим такую вероятность
$$
\Prob\left\{X_0>X_1,\,X_0>X_2\right\}
$$
Вы полагаете, что события независимы, и эта вероятность равна $1/4$.
Ан нет:
$$
\Prob\left\{X_0>X_1,\,X_0>X_2\,|\,X_0\right\}=F^2(X_0)
$$
$$
\Prob\left\{X_0>X_1,\,X_0>X_2\right\}={\rm E}\Prob\left\{X_0>X_1\,X_0>X_2\,|\,X_0\right\}={\rm E}F^2(X_0)=\int\limits_0^1x^2\,dx=\frac13.
$$

 
 
 
 Re: Простая задача по статистике.
Сообщение03.07.2014, 09:15 
Аватара пользователя
Lockywolf, или так, что ли: обратите внимание, что ситуация с тремя соседями точно так же симметрична, как и с двумя. Вероятность, что один из них является максимально выигравшим - такая же, как у остальных.

 
 
 
 Re: Простая задача по статистике.
Сообщение03.07.2014, 09:34 
Аватара пользователя
ИСН в сообщении #883466 писал(а):
Lockywolf, или так, что ли: обратите внимание, что ситуация с тремя соседями точно так же симметрична, как и с двумя. Вероятность, что один из них является максимально выигравшим - такая же, как у остальных.

А почти ровно это в книжке (в первом посте) и написано, про симметрию. Но это почему-то ТС не удовлетворяет.

 
 
 
 Re: Простая задача по статистике.
Сообщение03.07.2014, 12:52 
Ээээ, что-то это выглядит странно. В формулы я ещё вчитаюсь, но у меня есть уточняющий вопрос:

Если первого броска нет, а я известным мне способом выбираю константу С, с которой всё сравниваю, изменится ли результат?

 
 
 
 Re: Простая задача по статистике.
Сообщение03.07.2014, 19:17 
Аватара пользователя
Если Вы сравниваете все результаты $X_1,X_2,\dots$ с некой константой, выбранной ранее, тогда события будут независимы. Вы об этом?

 
 
 
 Re: Простая задача по статистике.
Сообщение03.07.2014, 19:18 
Аватара пользователя
Смотря что понимать под "изменится". В этом случае
$$\mathsf P(N>n) = \mathsf P(X_1 < C, \ldots, X_n < C) = F^n(C),$$
$$\mathsf E N = \sum_{n=0}^{\infty} \mathsf P(N>n)= \sum_{n=0}^\infty F^n(C)=\dfrac{1}{1-F(C)},$$
и если Вы теперь захотите считать $C$ реализацией $X_0$ и проинтегрировать по ней, то нет, ничего измениться не может:
$$\mathsf E(\mathsf E(N | X_0)) = \mathsf E\dfrac{1}{1-F(X_0)} = \int_{\mathbb R} \dfrac{1}{1-F(x)}dF(x) = -\lim_{x\to+\infty}\ln (1-F(x)) = +\infty. $$

 
 
 [ Сообщений: 16 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group