2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 оценивание математического ожидания
Сообщение10.05.2006, 13:11 


10/05/06
7
Требуется применить ЗБЧ на практике, причем речь идет о размере выборки.
Если упростить задачу, то звучит следующим образом: каков должен быть объем выборки данных, чтобы полученное из этой выборки среднее удовлетворяло условиям ЗБЧ и сходилось по вероятности к м.о.
:?:

подскажите, если не трудно :)

 Профиль  
                  
 
 
Сообщение10.05.2006, 22:20 
Экс-модератор


12/06/05
1595
MSU
По-моему, вопрос не очень корректно поставлен.
Полученное по какой-то выборке среднее не может удовлетворять ЗБЧ, потому что ЗБЧ формулируется как асимптотическое свойство для бесконечной последовательности случайных величин.

Можно поставить вопрос так: ЗБЧ говорит, что при большом размере выборки выборочное среднее должно быть близко к теоретическому мат. ожиданию, то есть, вероятность, что выборочное среднее сильно уклонится от теоретического мат. ожидания, мала. Вопрос: если мы имеем выборку из распределения F с мат. ожиданием a, и выполнены условия ЗБЧ, то при каком размере выборки выборочное среднее $\overline {x}$ отклонится от a не более, чем на $\varepsilon$, с вероятностью p.
Такого типа вопросы рассматриваются в мат. статистике. Это то, что вас интересует?

 Профиль  
                  
 
 про ЗБЧ
Сообщение10.05.2006, 22:28 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Вопрос поставлен не совсем корректно. При выполнении ЗБЧ среднее по выборке сходится (в том или ином смысле) к м.о. при стремлении объема выборки к бесконечности. Т.е. если Вы хотите объем выборки зафиксировать, то тем самым зафиксируется среднее и уже дальше никуда стремиться не будет.

Можно ставить вопрос о том, какой объем выборки нужно взять, чтобы среднее по ней отличалось от истинного м.о. не более чем на заданную величину. Но и это не очень корректный вопрос, так как среднее все равно может отклоняться от м.о. намного, только с очень малой вероятностью. Так что правильный вопрос - какой должен быть объем выборки, чтобы вероятность того, что среднее отклонится от м.о. за заданную величину $\varepsilon$, была бы меньше заданного числа $p_0$. Но для ответа на этот вопрос нужно знать закон распределения рассматриваемой величины или хотя бы что-то о нем (хоть дисперсию). Что вообще известно в задаче?


-------------------------
Dan_Te опередил :D

 Профиль  
                  
 
 
Сообщение10.05.2006, 23:43 


10/05/06
7
да, вопрос был не совсем корректен.

к вопросу о распределении: предполагается, что оно нормальное.

задача: имеется N человек, опрашивается n человек из N на тему их роста, затем берется среднее. Вопрос, каков должен быть объем выборки (n), чтобы вероятность оклонения среднего от м.о. была не более 5 процентов; распределение, как я уже говорил, - нормальное. :?:

 Профиль  
                  
 
 
Сообщение11.05.2006, 07:57 
Экс-модератор


12/06/05
1595
MSU
PAV: да, прикольно вышло =)))

van1ty
Ну вот, начинали с применения ЗБЧ на практике, а закончили обычной задачей по матстату =) Так что убираю тему из дискуссионных.

Чтобы начать решать задачу, вам надо все-таки дать нормальное условие. Во-первых, уточните, где тут нормальное распределение, и какие параметры оно имеет. Если, как вы говорите, у вас выборка небольшого размера из большой, но все же конечной генеральной совокупности, то здесь никаких нормальных распределений нет.

Во-вторых, вы пишете "вероятность оклонения среднего от м.о. была не более 5 процентов". Здесь ничего не сказано про величину отклонения, поэтому если переформулировать, то получается "вероятность того, что выборочное среднее окажется в точности равным м.о., равна 0,95". Это очень жесткое условие, которое в общем случае будет выполняться только при n=N.

 Профиль  
                  
 
 
Сообщение11.05.2006, 09:19 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Разумная постановка может быть такова. Имеется нормальное распределение с неизвестными параметрами. Берем выборку объема $n$ и оцениваем неизвестное м.о. частотой. Как верно отметил Dan_Te, величину $N$ нужно из постановки убрать (предполагаем, что генеральная совокупность потенциально бесконечна), а добавить нужно параметр $\varepsilon$ - величину собственно отклонения среднего от м.о. Это называется задачей оценки параметров нормального распределения. Описано во многих книгах по статистике, можно посмотреть он-лайн учебник Маниты, вот ссылка на нужный раздел http://teorver-online.narod.ru/teorver60.html

Нам нужен доверительный интервал для среднего при неизвестной дисперсии (если бы была известна, было бы проще). Размер доверительного интервала выражается через квантили распределения Стьюдента. Вам нужно взять уровень $\gamma$ равный 0.95 и подобрать такое $n$, при котором радиус интервала не превосходит требуемой величины $\varepsilon$. Сложность заключается в том, что величина $n$ входит в параметры распределения Стьюдента (именно этой сложности нет, если дисперсия известна). Вероятно, стоит воспрользоваться асимптотическими свойствами распределения Стьюдента при больших $n$ (оно стремится к стандартному нормальному).

 Профиль  
                  
 
 
Сообщение11.05.2006, 14:32 


10/05/06
7
я согласен с вами, просто не смог сформулировать все точно и математически грамотно.

хорошо, еще вопрос:
на самом деле задача выглядит немного по-другому:
имеется ценная бумага, которая обращается на бирже, соответственно за определенный промежуток времени накапливается выборка цен, по ней считается среднее, которое в дальнейшем используется как м.о., что по правде говоря, не совсем корректно, на мой взгляд.
Поскольку ценная бумага может торговаться достаточно редко, соответственно и размер выборки будет небольшим, а , значит, и ЗБЧ в таком случае не работает..
так вот задача состоит в том, чтобы оценить достаточный объем выборки, для того чтобы среднее объективно отражало уровень цен за определенный промежуток времени :?:
(цена имеет нормальное распределение)

и это не экономическая задача, а чисто матетатическая)

 Профиль  
                  
 
 
Сообщение11.05.2006, 20:53 


03/03/06
48
Обычно цена ценной бумаги имеет тенденцию расти во времени, т.е. имеет временную компоненту. Стоит сначала ее оценить и вычесть прежде чем предполагать независимую выборку с постоянным распределением (это если на практике).

А если в теории то у Вас должна быть четкая формулировка модели.

P.S. Могут еще быть и сезонные компоненты.

 Профиль  
                  
 
 
Сообщение11.05.2006, 21:11 


10/05/06
7
Елена К
это уже эконометрика, здесь же не регрессионная модель.
и, как правило, это учитывается в случае долгосрочного периода, а брать среднее за длительный промежуток времени не очень показательно, если даже не бессмысленно.

к тому же, если брать цену облигации, то она имеет тенденцию по мере приближению к сроку погашения приближаться к 100.

 Профиль  
                  
 
 
Сообщение11.05.2006, 23:49 


10/05/06
7
хм, потерли)

 Профиль  
                  
 
 
Сообщение12.05.2006, 06:27 


03/03/06
48
Цитата:
к тому же, если брать цену облигации, то она имеет тенденцию по мере приближению к сроку погашения приближаться к 100


Не вижу проблемы. Цена растет в таком примере. В каком-нибудь другом может падать. И приближается не к 100 а к номиналу для облигации.

Цитата:
а брать среднее за длительный промежуток времени не очень показательно, если даже не бессмысленно

Цитата:
ценная бумага может торговаться достаточно редко, соответственно и размер выборки будет небольшим


А как тогда увеличить число наблюдений ести не увеличивать промежуток времени?

Цитата:
это уже эконометрика, здесь же не регрессионная модель


Кто спорит? Броуновское движение и стох. процессы лучше подходят, скрывать не буду.

 Профиль  
                  
 
 
Сообщение12.05.2006, 09:12 


10/05/06
7
Елена К
я не прошу со мной спорить, я прошу мне помочь)

з.ы. насчет облигаций: цены на них всегда указаны в % от номинала, так что 100% это и есть номинал)

 Профиль  
                  
 
 
Сообщение12.05.2006, 10:05 


03/03/06
48
Ну смотрите: любая функция от данных является статистикой и может рассматриваться как оценка мат. ожидания, без всякого ЗБЧ.
Вопрос в том что хочется иметь хорошие оценки, т.е. такие для которых
1) мат. ожидание оценки совпадает со значением интересующего нас параметра (мат ожидания цены в Вашем случае)
2) желательно чтобы при $N\to\infty$ дисперсия стремилась к нулю, т.е. точность оценки увеличивалась.
3) и т.д.

Что касается Вашей задачи при условии одинакового распределения наблюдений -- для среднего 1) выполняется. (ЗБЧ не нужен)
Я к тому, что среднее можно легально использовать.

Вопрос в том какие еще свойства Вы хотите.

Что касается вопроса о количестве наблюдений то при настоящей формулировке недостаточно данных чтобы соорудить ответ. Да и вообще: чем больше -- тем лучше.
Классический подход -- у всех наблюдений одинаковая дисперсия, если $N$ известно то, пользуясь ЦПТ можно построить приблизительный $95\%$ доверительный интервал. Чем больше значение $N$ -- тем точнее интервал будет. ЦПТ дает асимптотический интервал со всеми вытекающими последствиями: в маленьких выборках распределение может от него сильно отличаться.
Обычно, если нужно, можно просимулировать на компьютере распределение в малой выборке и построить интервал на его основе.

Кстати, если Вы зададите длину такого интервала то можете найти $N$ при котором доверительный интервал именно такой. Если $N$ увеличивать интервал будет сужаться.

 Профиль  
                  
 
 
Сообщение12.05.2006, 10:28 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Суть в том, что величина доверительного интервала зависит от двух сущностей: от числа наблюдений и от их разброса (дисперсии). Фактически, увеличение числа наблюдений сужает исходный разброс, за счет чего и достигается сходимость к среднему. Отсюда следует, что не зная разброса отдельных наблюдений невозможно определить, сколько наблюдений потребуется, чтобы достичь нужной точности. Если определить число наблюдений, подходящее для некоторого значения дисперсии, то при увеличении дисперсии это число придется также увеличивать.

Доверительная оценка среднего при неизвестной дисперсии основана на том, что эта неизвестная дисперсия все равно определяется, только статистически, используя ту же самую выборку. Получить конкретный ответ абстрактно, не имея никаких данных, невозможно.

Если Вы готовы взять на себя ответственность за предположение о том, что наблюдаемые величины распределены по нормальному закону с фиксированными параметрами (не меняющиеся со временем), то разумный подход - брать имеющиеся данные, строить по ним доверительный интервал для среднего (ссылку на методы я приводил ранее) для заданного уровня ошибки и далее принимать решение - устраивает Вас такая точность определения среднего или нет. Если не устраивает и есть возможность получить дополнительные данные - присовокупливаете их к исходным и повторяете процесс. До тех пор, пока либо точность не получится такая, как надо, либо пока данные не закончатся.

Если от Вас требуют заранее сказать, сколько данных потребуется, то единственный способ - взять какие-нибудь имеющиеся данные, по ним определить дисперсию, и зафиксировав ее (можно взять побольше, для надежности) вычислить, сколько требуется данных для такого разброса. Зная дисперсию, это легко решается. Но тогда Вы опять-таки отвечаете за то, что дисперсия при даьнейшей работе будет такой, как Вы предсказали. Поэтому все равно разумно всегда вычислять точность определения среднего (размер доверительного интервала при неизвестной дисперсии) и предоставлять ее тому, кто использует систему, чтобы в случае неудовлетворительной точности можно было отказаться от прогноза или использовать дополнительные данные.

 Профиль  
                  
 
 
Сообщение12.05.2006, 13:01 


10/05/06
7
благодарю всех за помощь, если возникнут вопросы, я знаю к кому обратиться))

всем спасибо :)

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 15 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group