2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 МатСтат. Доверительный интервал
Сообщение28.06.2011, 18:58 
Итак, во всех учебниках, которых я видел, не объясняется почему при выборе $t_{-}, t_{+} $ мы выбираем $t_{-} = - t_{+} $. Почему???

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение28.06.2011, 21:27 
Аватара пользователя
Почему не объясняется или почему мы так выбираем?

В процедуре построения доверительных интервалов как правило участвуют верхняя и нижняя квантиль заданного уровня (одного и того же) для некоторого распределения. Буква $t$ обычно используется для распределения Стьюдента. Если это распределение симметрично, то и квантили также симметричны, что облегчает их нахождение - достаточно вычислить одну, а вторая восстанавливается из симметрии. В частности, если распределение симметрично относительно нуля, то и квантили тоже, то есть они отличаются знаком. Для Стьюдента именно эта ситуация и имеет место.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 09:06 
Благодарю. Но в том-то и вопрос! Почему если функция симметричная мы выбираем симметричные квантили? Преподователь мне сказал, что при построении доверительного интервала нам необходимо, чтобы этот самый доверительный интервал был бы как можно меньше по длине.
Вот например при построении доверительного интервала для математического ожидания, при неизвестной дисперсии для выборки из нормального распраделения, мы получаем доверительный интервал вот такой:

$\beta_{-} < \sqrt{n} \frac { ( \overline{X} - a ) } { \sigma } < \beta_{+}$

$\beta_{-} { \sigma } < \sqrt{n} ( \overline{X} - a ) < \beta_{+} { \sigma }$

$\frac{\beta_{-} { \sigma }}{ \sqrt{n}} < ( \overline{X} - a ) < \frac{\beta_{+} \sigma }{\sqrt{n}}$

$\frac{\beta_{-} { \sigma }}{ \sqrt{n}} - \overline{X} < ( - a ) < \frac{\beta_{+} \sigma }{\sqrt{n}} - \overline{X}$

$-\frac{\beta_{+} { \sigma }}{ \sqrt{n}} + \overline{X} < a < - \frac{\beta_{-} \sigma }{\sqrt{n}} + \overline{X}$

Итого, доверительный интервал таков:

$(-\frac{\beta_{+} { \sigma }}{ \sqrt{n}} + \overline{X}, - \frac{\beta_{-} \sigma }{\sqrt{n}} + \overline{X})$


Ок, находим длину, получаем:

$\frac{ \sigma ( \beta_{+} - \beta_{-} ) } { \sqrt{n}} $

Обозначим эту длину за L.

Теперь нам нужно минимизировать L, то есть найти решение вот такой задачи:

$\min L$

$\int_{\beta_{-}}^{\beta_{+}} \varphi ( t ) dt = 1 - \varepsilon$

Всё правильно? Если да, то как такую задачу решить?

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 09:55 
Аватара пользователя
Например, методом множителей Лагранжа.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:18 
эм... И как вы себе это представляете?

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:43 
FreeLifer в сообщении #463305 писал(а):
как такую задачу решить?

Если $\alpha$ -- уровень значимости, $q$ -- вероятность попадания в левый хвост и, соответственно, $\alpha-q$ -- в правый, то для функции распределения $F$ и квантили $t$ (т.е. функции, обратной к $F$) имеем:

$1-F(\beta_+)=\alpha-q,\qquad F(\beta_-)=q;$

$\beta_+=t(1+q-\alpha),\qquad \beta_-=t(q);$

$L=\beta_+-\beta_-=\min\quad\longleftrightarrow\quad t'(1+q-\alpha)-t'(q)=0.$

Если распределение симметрично, то последнее равенство гарантированно достигается на симметричном интервале $(\beta_-;\beta_+)$. Если (как обычно и бывает) оно ещё и выпукло, т.е. его плотность спадает от центра монотонно, то других точек экстремума и нет. Но, между прочим, если для симметричного распределения плотность, наоборот, растёт к краям (пусть это и не встречающаяся на практике экзотика) -- симметричный интервал даст, напротив, максимум длины.

FreeLifer в сообщении #463305 писал(а):
Преподователь мне сказал, что при построении доверительного интервала нам необходимо, чтобы этот самый доверительный интервал был бы как можно меньше по длине.

Это не совсем правда в том смысле, что это -- лишь один из употребительных критериев, и пользуются им вовсе не всегда. Если распределение симметрично, то симметричный интервал выбирают попросту потому, что такой выбор наиболее естественен (то, что он оказывается заодно ещё и минимальным, можно рассматривать как нечаянный бонус). А вот в несимметричном случае (скажем, при оценке доверительного интервала для дисперсии по хи-квадрат) ситуация уже неоднозначна. Там чаще всего выбирают интервал исходя не из минимальности его длины, а из равенства вероятностей попадания в правый и левый хвосты (тоже своего рода соображения симметрии).

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:50 
Если распределение симметрично, то симметричный интервал выбирают попросту потому, что такой выбор наиболее естественен (то, что он оказывается заодно ещё и минимальным, можно рассматривать как нечаянный бонус).

Преподователь на это заявил, что математика, это вам не место, где выбирают что-то исходя из естественных соображений.

Но спасибо вам! А всё таки почему в учебниках об этом не пишут. Даже в Боровкове нету...

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 10:55 
FreeLifer в сообщении #463332 писал(а):
Преподователь на это заявил, что математика, это вам не место, где выбирают что-то исходя из естественных соображений.

Он не прав. Не все критерии в математике имеют сугубо внутреннее происхождение, бывают и внешние (в конце концов, математика -- наука прикладная), и тут как раз такой случай. Но спорить с ним, конечно, смысла нет.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 11:38 
Аватара пользователя
FreeLifer в сообщении #463332 писал(а):
Но спасибо вам! А всё таки почему в учебниках об этом не пишут. Даже в Боровкове нету...

Цитирую: "При этом несомненно, что чем ýже этот интервал, тем лучше" (параграф 31 "Интервальное оценивание", п.1). Если имеется в виду разъяснение, почему для этого у симметричного распределения нужно брать симметричные квантили, то такого в Боровкове Вы, конечно, не найдёте за полной очевидностью. Воспользуйтесь учебниками попроще. Впрочем, отчасти и такое разъяснение там есть (касательно байесовского случая) - см. последний абзац п. 2 того же параграфа.
Цитата:
Нетрудно видеть, что в описанной процедуре существует некоторый произвол, связанный с выбором чисел $\varepsilon _1$ и $\varepsilon _2.$ Иногда этот произвол устраняется самой постановкой задачи - например, в случаях, когда нам важно установить лишь верхнюю или нижнюю доверительную границу. В этом случае одно из чисел $\varepsilon _1,$ $\varepsilon _2$ следует положить равным нулю, а соответствующую границу сделать бесконечной. Если же границы играют симметричную роль, то естественно следует выбирать $\varepsilon _i$ так, чтобы сделать интервал $(\theta ^-,\theta ^+)$ по возможности более коротким. Для распределений $q(t/X),$ близких к симметричным, это достигается при $\varepsilon _1=\varepsilon _2=\varepsilon /2.$

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 11:43 
--mS-- в сообщении #463346 писал(а):
Если имеется в виду разъяснение, почему для этого у симметричного распределения нужно брать симметричные квантили, то такого в Боровкове Вы, конечно, не найдёте за полной очевидностью.

Не так быстро. Допустим, симметричное распределение таково, что минимальную длину будет иметь асимметричный интервал. Тогда таких интервалов, разумеется, два; и какой брать?...

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 11:55 
Аватара пользователя
ewert в сообщении #463347 писал(а):
Не так быстро. Допустим, симметричное распределение таково, что минимальную длину будет иметь асимметричный интервал. Тогда таких интервалов, разумеется, два; и какой брать?...

Ну зачем доводить до абсурда? Унимодальные распределения, естественно, имеются в виду. Если хотите всерьёз обсуждать, какой интервал брать в ином случае, приведите пример задачи построения доверительного интервала, в которой возникла бы центральная статистика с симметричным бимодальным распределением. На нём и выберем.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 12:04 
Я лишь хочу сказать, что в симметричном случае приоритетным является именно симметричность интервала, а не его минимальность. В случае с дисперсией требование минимальности тоже как-то не модно: хотя здесь оно уже было бы содержательно, но неудобно для применений, а практической пользы -- пшик.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 12:59 
Аватара пользователя
Наверное, лучше все-таки излагать, исходя из равновероятности левого и правого хвостов. Это работает и для среднего, и для дисперсии.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 13:19 
alisa-lebovski в сообщении #463395 писал(а):
Это работает и для среднего, и для дисперсии.

Что значит "работает"? Что назначим, то и будет работать. Дли среднего вариантов, кроме симметричного, просто нет; для дисперсии -- равновероятность хвостов существенно проще, чем минимизация длины интервала, потому её и выбирают.

 
 
 
 Re: МатСтат. Доверительный интервал
Сообщение29.06.2011, 13:41 
Аватара пользователя
Положим, что плотность распределения f(t) непрерывна.
Очевидно, что значения плотности распределения на концах самого короткого интервала такого, что $F(t_+)-F(t_-)=p$, равны. В противном случае интервал можно сузить. Если распределение ещё и симметрично и унимодально, то, значит, точки $t_+ , t_-$ симметричны относительно моды. В частности, это выполняется для распределения Сьюдента при всех степенях свободы (как и для нормального). При этом вероятности "хвостов" также равны. Для несимметричных распределений вероятности "хвостов" при кратчайшем интервале могут быть различны, и получается два разных критерия "симметричности интервала" - по равенству плотностей и по равенству хвостов.

 
 
 [ Сообщений: 15 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group