2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 МатСтат. Доверительный интервал
Сообщение28.06.2011, 18:58 


17/09/08
18
Итак, во всех учебниках, которых я видел, не объясняется почему при выборе $t_{-}, t_{+} $ мы выбираем $t_{-} = - t_{+} $. Почему???

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение28.06.2011, 21:27 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Почему не объясняется или почему мы так выбираем?

В процедуре построения доверительных интервалов как правило участвуют верхняя и нижняя квантиль заданного уровня (одного и того же) для некоторого распределения. Буква $t$ обычно используется для распределения Стьюдента. Если это распределение симметрично, то и квантили также симметричны, что облегчает их нахождение - достаточно вычислить одну, а вторая восстанавливается из симметрии. В частности, если распределение симметрично относительно нуля, то и квантили тоже, то есть они отличаются знаком. Для Стьюдента именно эта ситуация и имеет место.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 09:06 


17/09/08
18
Благодарю. Но в том-то и вопрос! Почему если функция симметричная мы выбираем симметричные квантили? Преподователь мне сказал, что при построении доверительного интервала нам необходимо, чтобы этот самый доверительный интервал был бы как можно меньше по длине.
Вот например при построении доверительного интервала для математического ожидания, при неизвестной дисперсии для выборки из нормального распраделения, мы получаем доверительный интервал вот такой:

$\beta_{-} < \sqrt{n} \frac { ( \overline{X} - a ) } { \sigma } < \beta_{+}$

$\beta_{-} { \sigma } < \sqrt{n} ( \overline{X} - a ) < \beta_{+} { \sigma }$

$\frac{\beta_{-} { \sigma }}{ \sqrt{n}} < ( \overline{X} - a ) < \frac{\beta_{+} \sigma }{\sqrt{n}}$

$\frac{\beta_{-} { \sigma }}{ \sqrt{n}} - \overline{X} < ( - a ) < \frac{\beta_{+} \sigma }{\sqrt{n}} - \overline{X}$

$-\frac{\beta_{+} { \sigma }}{ \sqrt{n}} + \overline{X} < a < - \frac{\beta_{-} \sigma }{\sqrt{n}} + \overline{X}$

Итого, доверительный интервал таков:

$(-\frac{\beta_{+} { \sigma }}{ \sqrt{n}} + \overline{X}, - \frac{\beta_{-} \sigma }{\sqrt{n}} + \overline{X})$


Ок, находим длину, получаем:

$\frac{ \sigma ( \beta_{+} - \beta_{-} ) } { \sqrt{n}} $

Обозначим эту длину за L.

Теперь нам нужно минимизировать L, то есть найти решение вот такой задачи:

$\min L$

$\int_{\beta_{-}}^{\beta_{+}} \varphi ( t ) dt = 1 - \varepsilon$

Всё правильно? Если да, то как такую задачу решить?

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 09:55 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Например, методом множителей Лагранжа.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:18 


17/09/08
18
эм... И как вы себе это представляете?

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:43 
Заслуженный участник


11/05/08
32166
FreeLifer в сообщении #463305 писал(а):
как такую задачу решить?

Если $\alpha$ -- уровень значимости, $q$ -- вероятность попадания в левый хвост и, соответственно, $\alpha-q$ -- в правый, то для функции распределения $F$ и квантили $t$ (т.е. функции, обратной к $F$) имеем:

$1-F(\beta_+)=\alpha-q,\qquad F(\beta_-)=q;$

$\beta_+=t(1+q-\alpha),\qquad \beta_-=t(q);$

$L=\beta_+-\beta_-=\min\quad\longleftrightarrow\quad t'(1+q-\alpha)-t'(q)=0.$

Если распределение симметрично, то последнее равенство гарантированно достигается на симметричном интервале $(\beta_-;\beta_+)$. Если (как обычно и бывает) оно ещё и выпукло, т.е. его плотность спадает от центра монотонно, то других точек экстремума и нет. Но, между прочим, если для симметричного распределения плотность, наоборот, растёт к краям (пусть это и не встречающаяся на практике экзотика) -- симметричный интервал даст, напротив, максимум длины.

FreeLifer в сообщении #463305 писал(а):
Преподователь мне сказал, что при построении доверительного интервала нам необходимо, чтобы этот самый доверительный интервал был бы как можно меньше по длине.

Это не совсем правда в том смысле, что это -- лишь один из употребительных критериев, и пользуются им вовсе не всегда. Если распределение симметрично, то симметричный интервал выбирают попросту потому, что такой выбор наиболее естественен (то, что он оказывается заодно ещё и минимальным, можно рассматривать как нечаянный бонус). А вот в несимметричном случае (скажем, при оценке доверительного интервала для дисперсии по хи-квадрат) ситуация уже неоднозначна. Там чаще всего выбирают интервал исходя не из минимальности его длины, а из равенства вероятностей попадания в правый и левый хвосты (тоже своего рода соображения симметрии).

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:50 


17/09/08
18
Если распределение симметрично, то симметричный интервал выбирают попросту потому, что такой выбор наиболее естественен (то, что он оказывается заодно ещё и минимальным, можно рассматривать как нечаянный бонус).

Преподователь на это заявил, что математика, это вам не место, где выбирают что-то исходя из естественных соображений.

Но спасибо вам! А всё таки почему в учебниках об этом не пишут. Даже в Боровкове нету...

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:55 
Заслуженный участник


11/05/08
32166
FreeLifer в сообщении #463332 писал(а):
Преподователь на это заявил, что математика, это вам не место, где выбирают что-то исходя из естественных соображений.

Он не прав. Не все критерии в математике имеют сугубо внутреннее происхождение, бывают и внешние (в конце концов, математика -- наука прикладная), и тут как раз такой случай. Но спорить с ним, конечно, смысла нет.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 11:38 
Заслуженный участник
Аватара пользователя


23/11/06
4171
FreeLifer в сообщении #463332 писал(а):
Но спасибо вам! А всё таки почему в учебниках об этом не пишут. Даже в Боровкове нету...

Цитирую: "При этом несомненно, что чем ýже этот интервал, тем лучше" (параграф 31 "Интервальное оценивание", п.1). Если имеется в виду разъяснение, почему для этого у симметричного распределения нужно брать симметричные квантили, то такого в Боровкове Вы, конечно, не найдёте за полной очевидностью. Воспользуйтесь учебниками попроще. Впрочем, отчасти и такое разъяснение там есть (касательно байесовского случая) - см. последний абзац п. 2 того же параграфа.
Цитата:
Нетрудно видеть, что в описанной процедуре существует некоторый произвол, связанный с выбором чисел $\varepsilon _1$ и $\varepsilon _2.$ Иногда этот произвол устраняется самой постановкой задачи - например, в случаях, когда нам важно установить лишь верхнюю или нижнюю доверительную границу. В этом случае одно из чисел $\varepsilon _1,$ $\varepsilon _2$ следует положить равным нулю, а соответствующую границу сделать бесконечной. Если же границы играют симметричную роль, то естественно следует выбирать $\varepsilon _i$ так, чтобы сделать интервал $(\theta ^-,\theta ^+)$ по возможности более коротким. Для распределений $q(t/X),$ близких к симметричным, это достигается при $\varepsilon _1=\varepsilon _2=\varepsilon /2.$

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 11:43 
Заслуженный участник


11/05/08
32166
--mS-- в сообщении #463346 писал(а):
Если имеется в виду разъяснение, почему для этого у симметричного распределения нужно брать симметричные квантили, то такого в Боровкове Вы, конечно, не найдёте за полной очевидностью.

Не так быстро. Допустим, симметричное распределение таково, что минимальную длину будет иметь асимметричный интервал. Тогда таких интервалов, разумеется, два; и какой брать?...

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 11:55 
Заслуженный участник
Аватара пользователя


23/11/06
4171
ewert в сообщении #463347 писал(а):
Не так быстро. Допустим, симметричное распределение таково, что минимальную длину будет иметь асимметричный интервал. Тогда таких интервалов, разумеется, два; и какой брать?...

Ну зачем доводить до абсурда? Унимодальные распределения, естественно, имеются в виду. Если хотите всерьёз обсуждать, какой интервал брать в ином случае, приведите пример задачи построения доверительного интервала, в которой возникла бы центральная статистика с симметричным бимодальным распределением. На нём и выберем.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 12:04 
Заслуженный участник


11/05/08
32166
Я лишь хочу сказать, что в симметричном случае приоритетным является именно симметричность интервала, а не его минимальность. В случае с дисперсией требование минимальности тоже как-то не модно: хотя здесь оно уже было бы содержательно, но неудобно для применений, а практической пользы -- пшик.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 12:59 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Наверное, лучше все-таки излагать, исходя из равновероятности левого и правого хвостов. Это работает и для среднего, и для дисперсии.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 13:19 
Заслуженный участник


11/05/08
32166
alisa-lebovski в сообщении #463395 писал(а):
Это работает и для среднего, и для дисперсии.

Что значит "работает"? Что назначим, то и будет работать. Дли среднего вариантов, кроме симметричного, просто нет; для дисперсии -- равновероятность хвостов существенно проще, чем минимизация длины интервала, потому её и выбирают.

 Профиль  
                  
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 13:41 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Положим, что плотность распределения f(t) непрерывна.
Очевидно, что значения плотности распределения на концах самого короткого интервала такого, что $F(t_+)-F(t_-)=p$, равны. В противном случае интервал можно сузить. Если распределение ещё и симметрично и унимодально, то, значит, точки $t_+ , t_-$ симметричны относительно моды. В частности, это выполняется для распределения Сьюдента при всех степенях свободы (как и для нормального). При этом вероятности "хвостов" также равны. Для несимметричных распределений вероятности "хвостов" при кратчайшем интервале могут быть различны, и получается два разных критерия "симметричности интервала" - по равенству плотностей и по равенству хвостов.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 15 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group