2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Распределение "ограниченного" максимального элемента выборки
Сообщение08.02.2015, 16:59 
Доброго времени суток.

Не мог бы кто-нибудь проверить мои рассуждения?

Задача следующая: есть кусочно-непрерывное распределение на $[0,1]$ с плотностью $p$ и функцией распределения $P$.

Из неё выбирается n сэмплов и сортируется по возрастанию. (Ряд порядковых статистик.)

Требуется найти распределение максимального элемента не превышающего некую $t$, параметра.

В результате требуется функция $\Psi(t,x)$.

Мои рассуждения следующие:

1. Сначала посмотрим, сколько элеменов выбрки $k$ будет "слева" а какие "справа" от $t$.
Кажется, что $Pr( \mbox{слева ровно } k) = P^k(t)(1 - P(t))^{n-k}$.

2. Известно, что распределение максимума выборки определяется формулой $kP(x)^{k-1}p(x)$.

3. Пробуем совместить 1 и 2.
"Взвесим" с весами равными вероятностям что "налево" попадёт к элементов выражение 2.
При этом поскольку $P$ и $p$ идут вообще-то до 1, "обрежем" их на уровне $t$.

$\Psi(t,x) = \sum_{k=0}^n  P(t)^k(1 - P(t))^{n-k} k P_1(\frac{x}{P(t)})^{k-1} p_1 (\frac{x}{P(t)}) $.

Нижний индекс 1 означает, что функции обрезаются в 1. (Ну, они же отмасштабированы.)

Насколько это вообще похоже на правду? Что-то как-то кривовато выглядит на мой взгляд конструкция.

 
 
 
 Re: Распределение "ограниченного" максимального элемента выборки
Сообщение08.02.2015, 21:39 
Аватара пользователя
Ни на сколько не похоже, начиная с (1), где Вы забыли биномиальный коэффициент и заканчивая отсутствием плотности у искомого распределения.

Давайте формально. Есть $X_{(1)}\leqslant \ldots \leqslant X_{(n)}$ - вариационный ряд. Не очень понятно, правда, что такое "максимальный элемент, не превосходящий $t$" в ситуации, когда все элементы выборки окажутся больше $t$. Ну будем считать, что это нуль.

Заведём поэтому $X_{(0)}=0$ и пусть $\nu=\max\{k=0,1,\ldots,n~|~X_{(k)}\leqslant t\}$. Нас интересует распределение величины $Y=X_{(\nu)}$.

Во-первых, $\mathsf P(Y=0)=\mathsf P(\nu=0)=\mathsf P(X_{(1)}\geqslant t)=(1-P(t))^n$. Т.е. если так определить "максимальный элемент, не превосходящий $t$" в ситуации, когда все элементы выборки окажутся больше $t$, то ни о какой плотности распределения речи нет - функция распределения имеет скачок в нуле.

Найдём функцию распределения $Y$ при $x>0$.

При $0<x<t$
$$\mathsf P(Y < x) =\sum_{k=0}^n \mathsf P(\nu=k,\,X_{(k)}<x) = \sum_{k=0}^n \mathsf P(X_{(k)}<x,\, X_{(k+1)}\geqslant t)=\sum_{k=0}^n C_n^k P^k(x) (1-P(t))^{n-k}.$$
При $x\geqslant t$ функция распределения равна, как и должно быть, единице.

Т.е. при произвольном фиксированном $t>0$ искомое распределение есть смесь вырожденного распределения в нуле (с весом $(1-P(t))^n$) и абсолютно непрерывного распределения (c весом $1-(1-P(t))^n$). У этой абсолютно непрерывной компоненты плотность на $(0,\,t)$ равна
$$p_Y(x)=\dfrac{1}{1-(1-P(t))^n}\sum_{k=1}^n C_n^k kP^{k-1}(x)p(x) (1-P(t))^{n-k}.$$

 
 
 
 Re: Распределение "ограниченного" максимального элемента выборки
Сообщение09.02.2015, 01:50 
Аватара пользователя
Можно еще так рассуждать. Для $x\in[0,t]$
$$
\Prob\left\{Y\leqslant x\right\}=\Prob\left(\bigcap_{k=1}^n\left\{X_k\notin(x,t]\right\}\right)=
\prod_{k=1}^n\Prob\left\{X_k\notin(x,t]\right\}
=\big(1-\left[P(t)-P(x)\right]\big)^n.
$$

PS Кстати, а что такое ''кусочно-непрерывное распределение с плотностью''?

 
 
 
 Re: Распределение "ограниченного" максимального элемента выборки
Сообщение09.02.2015, 02:01 
Спасибо огромное. Кажется, это то что надо.

 
 
 
 Re: Распределение "ограниченного" максимального элемента выборки
Сообщение09.02.2015, 07:33 
Аватара пользователя
Ну да, бином Ньютона :mrgreen:

(Оффтоп)

Тоже хотела спросить, да забыла. Наверное, ТС полагает, что если плотность кусочно-непрерывна, то и распределение таково же.

 
 
 
 Re: Распределение "ограниченного" максимального элемента выборки
Сообщение09.02.2015, 16:23 
Цитата:
Наверное, ТС полагает, что если плотность кусочно-непрерывна, то и распределение таково же.


А когда это неверно? Интегрирование же не ухудшает свойств функции.

Добавка: под "кусочно-непрерывным распределением" я имел в виду распределение с кусочно-непрерывной плотностью. Я потом заметил, что некорректно написано, но уже отредактировать было нельзя. Если есть кусочно-непрерывная плотность, то распределение не то что кусочно-непрерывное, оно просто непрерывное быть должно.

 
 
 
 Re: Распределение "ограниченного" максимального элемента выборки
Сообщение09.02.2015, 17:18 
Аватара пользователя
Если говорим о любой плотности, то распределение абсолютно-непрерывно. Это сильнее непрерывности.

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group