2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Как считаются квартили сгруппированных данных?
Сообщение27.09.2012, 22:15 
Размышлял над квартилями и осознал, что не все понимаю.

Если у нас есть выборка некой дискретной случайной величины. Сгруппировали вариационный ряд.

Получилось

\begin{matrix}
\!\!\vline\!\!&  x_i  &\!\!\vline\!\!&  x_1  &\!\!\vline\!\!&  x_2  &\!\!\vline\!\!& ... &\!\!\vline\!\!&x_n  \\\hline 
\!\!\vline\!\!&  p_i  &\!\!\vline\!\!&  p_1  &\!\!\vline\!\!&  p_2  &\!\!\vline\!\!& ...  &\!\!\vline\!\!&p_n
\end{matrix}

Как теперь считать квартили? Можно ли без эмпирической функции распределения?

Я себе представляю несколько ситуаций:

1) $n$ - нечетное число. Тогда $x_k$ - медиана. $k=\dfrac{1+n}{2}$

Но как считать 1 и 3 квартили. Понимаю, что нужно разбить на 4 равные группы, но во вторую или третью группу включить медиану?

2) $n$ - четное число, которое делится на 4. Тогда $x_m=\dfrac{x_{{n/2}}+x_{(n+1)/2}}{2}$ - медиана.

А как тут считать квартили? 1 квартиль будет $x_m(1)=\dfrac{x_{{n/4}}+x_{(n+1)/4}}{2}$?

3) $n$ - четное число, которое не делится на 4. Тогда $x_m=\dfrac{x_{{n/2}}+x_{(n+1)/2}}{2}$ - медиана.

А как тут считать квартили?

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение27.09.2012, 23:51 
У вас и для медианы неверно. Начать с нее нужно...
Если $p_i=\frac{1}{2^i}$, то чему медиана равна?

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 00:00 
Cash в сообщении #624184 писал(а):
У вас и для медианы неверно. Начать с нее нужно...
Если $p_i=\frac{1}{2^i}$, то чему медиана равна?


$x_1$

Так как $F(x_1)=0,5$

То есть нужно считать отталкиваясь от $F(x_{me})=0,5$?

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 00:12 
Вообще, и $F(x_{me})=0,5$ - это тоже неверно.
Возьмите, например, $p_1=0.6$
Квантили находятся с помощью кумулятивной вероятности, если на практике. Или по графику функции распределения, если наглядно.
Определение квантиля можете выписать?

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 00:43 
Cash в сообщении #624197 писал(а):
Вообще, и $F(x_{me})=0,5$ - это тоже неверно.
Возьмите, например, $p_1=0.6$
Квантили находятся с помощью кумулятивной вероятности, если на практике. Или по графику функции распределения, если наглядно.
Определение квантиля можете выписать?


Пусть есть вероятностное пространство $(\Omega,\;\mathcal{F},\;\mathbb{P})$ и $\mathbb{P}^X$ — вероятностная мера, задающая распределение некоторой случайной величины$X$. Пусть фиксировано $\alpha\in(0,\;1)$. Тогда $\alpha$-квантилью (или квантилью уровня $\alpha$) распределения $\mathbb{P}^X$ называется число $x_\alpha\in R$, такое что $x_\alpha\colon\begin{cases}\mathbb{P}(X\leqslant x_\alpha)\geqslant\alpha; \\ \mathbb{P}(X<x_\alpha)\leqslant\alpha.\end{cases}$

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 01:24 
С вики выписано? Своими словами можете высказать? Пусть, может и не математически выверено, но смысл был понятен?
Если затрудняетесь, то чтобы прочувствовать определение - возьмите ряд примеров.
Начните, например, с $n=3$. $p_1=0.4, \;p_2=0.2, \;p_3=0.4$
Чему равны здесь медиана и квартили?
Возьмите потом чуть побольше значений, поиграйтесь с вероятностями.
И сумеете тогда легко сформулировать (доступным языком :-) ) правило, по которому можно найти любой квантиль для дискретного распределения. Подсказка - кумулятивная вероятность - у вас есть.

-- Пт сен 28, 2012 02:35:56 --

Или еще способ:
Дан график функции распределения непрерывной случайной величины? Как найти квантиль?
И затем перенести на случай дискретной. Там будет всего одна дополнительная тонкость.

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 01:43 
Цитата:
С вики выписано? Своими словами можете высказать? Пусть, может и не математически выверено, но смысл был понятен?

1) да
2)да (уже написал про медиану, вам не понравилось)
3)да

Цитата:
Начните, например, с $n=3$. $p_1=0.4, \;p_2=0.2, \;p_3=0.4$
Чему равны здесь медиана и квартили?


Для $x_1<x_2<x_3$

1-ый квартиль $x_1$

2-ый квартиль $x_2$

3-ый квартиль $x_3$


Цитата:
Дан график функции распределения непрерывной случайной величины? Как найти квантиль?


Это будет корень уравнения

1-ый квартиль $F(x)=0,25$

2-oй квартиль $F(x)=0,5$

3-ый квартиль $F(x)=0,75$

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 02:08 
Дан график функции распределения непрерывной случайной величины.
Как найти квантиль $\alpha$? С помощью карандаша и линейки.

-- Пт сен 28, 2012 03:11:17 --

Цитата:
уже написал про медиану, вам не понравилось

А что там могло понравиться, если вероятности вообще не при делах были?

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 02:36 
Cash в сообщении #624214 писал(а):
Дан график функции распределения непрерывной случайной величины.
Как найти квантиль $\alpha$? С помощью карандаша и линейки.


Это будет абсцисса точки пересечения горизонтальной прямой $y=\alpha$ с $F(x)$

Cash в сообщении #624214 писал(а):
А что там могло понравиться, если вероятности вообще не при делах были?


Вероятность подразумевалась неявно) $F_X(x)=P(X<x)$

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 08:52 
Все правильно.
Теперь случай дискретного распределения, где точки пересечения уже может не быть.
Вообще, по-моему, нахождение квантилей у вас уже не должно вызывать трудностей и вы в состоянии сами сформулировать правило их нахождения.
Цитата:
Вероятность подразумевалась неявно) $F_X(x)=P(X<x)$

А-а, вы про свой второй пост? Я думал про стартовый...
В записи $F(x_{me})=0,5$ - ошибка вовсе не критическая, просто такая точка, где $F(x)=0.5$ не всегда есть. Тут чуть-чуть поаккуратнее надо быть и всё. Это как раз и есть тонкость в различии нахождения квантиля непрерывного и дискретного распределения.

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 13:05 
Аватара пользователя
Только интерполяцией. Строится функция распределения и затем интерполируется. В своё время было сильно востребовано, потом как-то забылось. Обычно использовали линейную интерполяцию (а для нахождения по группированным данным моды - квадратичную).

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 13:11 
Аватара пользователя
Евгений Машеров в сообщении #624279 писал(а):
Только интерполяцией. Строится функция распределения и затем интерполируется.
Для дискретного распределения?

 
 
 
 Re: Как считаются квартили сгруппированных данных?
Сообщение28.09.2012, 20:01 
Аватара пользователя
Для сгруппированного. Вообще говоря, непрерывного.

 
 
 [ Сообщений: 13 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group