2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 
Сообщение09.07.2006, 11:12 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Тут явно просто плохо сформулирован вопрос, поэтому он вызывает непонимание. Конечно же, имеется в виду стандартная статистическая задача проверки гипотезы $p=p_0$ против альтернативы $p>p_0$. Даны значения наблюдений, нужно определить уровни значимости, на которых при этих значениях гипотеза будет отвергнута. Так как число наблюдений велико, то можно пользоваться теоремой Муавра-Лапласа. Не совсем ясно сходу, как использовать три выборки. Подозреваю, что их можно просто объединить и пересчитать общую частоту. Но можно попытаться сделать что-то более хитрое, возможно действительно с помощью $\chi^2$.

Joker90 Сорри, что не ответил на ПМ, был в отъезде :wink:

 Профиль  
                  
 
 
Сообщение09.07.2006, 12:32 


01/06/06
107
На самом деле их действительно можно объединить: три значения частоты можно рассматривать как повторную выборку из "подпорченного" биномиального распределения и тогда построение равномерно наиболее мощного критерия с помощью леммы Неймана-Пирсона приведет к такой статистике (наверное :)).
А для $\chi^2$ трёх наблюдений более чем недостаточно.

 Профиль  
                  
 
 
Сообщение10.07.2006, 19:53 


22/06/06
29
Горьковчанин писал(а):
На самом деле их действительно можно объединить: три значения частоты можно рассматривать как повторную выборку из "подпорченного" биномиального распределения и тогда построение равномерно наиболее мощного критерия с помощью леммы Неймана-Пирсона приведет к такой статистике (наверное :)).
А для $\chi^2$ трёх наблюдений более чем недостаточно.

Нельзя ли подробнее? В этом месте туплю.
PAV писал(а):
Тут явно просто плохо сформулирован вопрос, поэтому он вызывает непонимание.

Не *тут*, а в задаче. Скопировал 1 к 1.
Кстати, не уверен, что *плохо сформулирован*.

 Профиль  
                  
 
 
Сообщение10.07.2006, 21:32 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Joker90 писал(а):
PAV писал(а):
Тут явно просто плохо сформулирован вопрос, поэтому он вызывает непонимание.

Не *тут*, а в задаче. Скопировал 1 к 1.
Кстати, не уверен, что *плохо сформулирован*.


Это я понял, и к Вам никаких претензий, только к задаче.

Сформулировано плохо, потому что понятие "случайная последовательность" не определено хорошо, когда речь идет о конкретных последовательностях. Эти вопросы обсуждаются, есть разные подходы к тому, какую последовательность следует считать случайной, и вообще это больше философский вопрос и неоднозначный. А разумная математическая задача все-таки должна быть сформулирована четко (если речь идет об учебной задаче).

 Профиль  
                  
 
 
Сообщение10.07.2006, 21:57 


22/06/06
29
PAV писал(а):
Эти вопросы обсуждаются, есть разные подходы к тому, какую последовательность следует считать случайной, и вообще это больше философский вопрос и неоднозначный.

Нельзя ли поподробней?
Всегда полагал, что в теории случайных процессов однозначно все сформулировано.

 Профиль  
                  
 
 
Сообщение10.07.2006, 22:15 
Заслуженный участник
Аватара пользователя


17/10/05
3709
:evil:
Горьковчанин писал(а):
А для $\chi^2$ трёх наблюдений более чем недостаточно.

Я имел в виду применять $\chi^2$ к сериям (так скаать, изнутри) -- каждая из них по 1000 наблюдений. А вот этого более чем достаточно. Можно, кстати, применить и к объединению.

 Профиль  
                  
 
 
Сообщение11.07.2006, 05:38 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Joker90 писал(а):
PAV писал(а):
Эти вопросы обсуждаются, есть разные подходы к тому, какую последовательность следует считать случайной, и вообще это больше философский вопрос и неоднозначный.

Нельзя ли поподробней?
Всегда полагал, что в теории случайных процессов однозначно все сформулировано.


Теория вероятностей изучает вероятности сами по себе, а не свойства отдельных реализаций.

Ну вот например, ответьте на вепрос: наблюдается две последовательности длины 10 из нулей и единиц: 0010100110 и 0000000000.

Какую из них следует считать более случайной? Более точно, какая из них больше похожа на реализацию 10 бросаний правильной монеты?


Тему переношу в основной раздел

 Профиль  
                  
 
 
Сообщение11.07.2006, 08:36 
Экс-модератор
Аватара пользователя


23/12/05
12065
PAV писал(а):
Ну вот например, ответьте на вепрос: наблюдается две последовательности длины 10 из нулей и единиц: 0010100110 и 0000000000.

Я не математик, но даже я знаю, что эти последовательности равнозначны. :D. Вероятность появления для каждой из них $2^{-10}$

 Профиль  
                  
 
 
Сообщение11.07.2006, 16:45 


22/06/06
29
PAV писал(а):
Ну вот например, ответьте на вепрос: наблюдается две последовательности длины 10 из нулей и единиц: 0010100110 и 0000000000.

Какую из них следует считать более случайной? Более точно, какая из них больше похожа на реализацию 10 бросаний правильной монеты?

0010100110, безусловно.
Есть же формулы для случайных блужданий.

 Профиль  
                  
 
 
Сообщение11.07.2006, 17:00 


01/06/06
107
Joker90 писал(а):
Горьковчанин писал(а):
На самом деле их действительно можно объединить: три значения частоты можно рассматривать как повторную выборку из "подпорченного" биномиального распределения и тогда построение равномерно наиболее мощного критерия с помощью леммы Неймана-Пирсона приведет к такой статистике (наверное :)).
А для $\chi^2$ трёх наблюдений более чем недостаточно.

Нельзя ли подробнее? В этом месте туплю.

Рассмотрим наиболее мощный критерий для проверки гипотезы $p=p_0$ против альтернативы $p=p_1$, ($p_1>p_0$) по наблюденным частотам $k_1,k_2,k_3$. Очевидно, велиниа $nk_i$ имеет биномиальное распределение с параметрами $n$ и $p$. Построим отношение правдоподобия $$
\frac{
 C^{nk_1}_{n}p_1^{nk_1}(1-p_1)^{n-nk_1}
 C^{nk_2}_{n}p_1^{nk_2}(1-p_1)^{n-nk_2}
 C^{nk_3}_{n}p_1^{nk_3}(1-p_1)^{n-nk_3}}%
{
 C^{nk_1}_{n}p_0^{nk_1}(1-p_0)^{n-nk_1}
 C^{nk_2}_{n}p_0^{nk_2}(1-p_0)^{n-nk_2}
 C^{nk_3}_{n}p_0^{nk_3}(1-p_0)^{n-nk_3}
}=$$ $$
\frac{
 p_1^{n(k_1+k_2+k_3)}(1-p_0)^{n(k_1+k_2+k_3)}
}%
{
 p_0^{n(k_1+k_2+k_3)}(1-p_1)^{n(k_1+k_2+k_3)}}
}\cdot\frac{(1-p_1)^{3n}}{(1-p_0)^{3n}}$$
Таким образом, в качестве статистики критерия удобно выбрать величину $T=k_1+k_2+k_3$, то есть фактически объединить выборки. Окажется, что вид критической области не зависит от конкретного альтернативного значения $p_1$, и посему найденная критическая область задает равномерно наиболее мощный критерий с заданным уровнем значимости для проверки нашей простой гипотезы против сложной альтернативы $p>p_0$.
Если бы выборки были не равных объемов, а, скажем, объемов $n_1,n_2, n_3$, то в качестве статистики критерия (проверьте!) выстпуло бы $T'=(n_1k_2+n_2k_2+n_3k_3)n^{-1}$, то есть все равно надо было бы пересчитывать частоту по объединенной выборке.

 Профиль  
                  
 
 
Сообщение11.07.2006, 17:36 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Joker90 писал(а):
PAV писал(а):
Ну вот например, ответьте на вепрос: наблюдается две последовательности длины 10 из нулей и единиц: 0010100110 и 0000000000.

Какую из них следует считать более случайной? Более точно, какая из них больше похожа на реализацию 10 бросаний правильной монеты?

0010100110, безусловно.
Есть же формулы для случайных блужданий.


Формулы для случайных блужданий тут не при чем. Правильно написал photon: при 10 бросаниях правильной монеты любая конкретная последовательность может появиться с одинаковой вероятностью $2^{-10}$. Так что указанные последовательности совершенно равноправны как случайные.

 Профиль  
                  
 
 
Сообщение11.07.2006, 17:46 


22/06/06
29
PAV писал(а):
Формулы для случайных блужданий тут не при чем. Правильно написал photon: при 10 бросаниях правильной монеты любая конкретная последовательность может появиться с одинаковой вероятностью $2^{-10}$. Так что указанные последовательности совершенно равноправны как случайные.

Феллер с Вами не согласен. Утверждает, что:
1. Бросание монеты - иллюстрация/разновидность случайного блуждания.
2. Приводит формулы для вероятности серий в случайном блуждании.

Из этих формул следует, что серия 0000000000 менее вероятна.

 Профиль  
                  
 
 
Сообщение11.07.2006, 17:50 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Joker90 писал(а):
Феллер с Вами не согласен. Утверждает, что:
1. Бросание монеты - иллюстрация/разновидность случайного блуждания.
2. Приводит формулы для вероятности серий в случайном блуждании.

Из этих формул следует, что серия 0000000000 менее вероятна.


И чему равна вероятность такой последовательности? И чему равна вероятность второй?

 Профиль  
                  
 
 
Сообщение11.07.2006, 17:51 
Экс-модератор
Аватара пользователя


23/12/05
12065
У меня другой вопрос (самому лень считать и проверять): какая из последовательностей с большей вероятностью может встретится в рамках более длинной случайной последовательности? Давайте посмотрим на вероятность появления тех же двух последовательностей из десяти бросаний, но в рамках, скажем, 20-ти бросаний.

 Профиль  
                  
 
 
Сообщение11.07.2006, 17:53 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
И напишите, пожалуйста, какое издание Феллера у Вас, и с какой страницы Вы взяли формулы, о которых говорите.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 48 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group