2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2, 3, 4  След.
 
 Большая задача по статистике!
Сообщение22.12.2009, 22:28 
Аватара пользователя


15/11/08
502
London, ON
Здравствуйте! Мне очень нужна ваша помощь, что бы понять как решать задачу:
Проводят эксперимент с радиоктивными частицами. У каждой есть свой заряд энергии. Известно, что энергия имеет гамма-распределение с неизвестными $\alpha$ и $\beta$. В ходе эксперимента при соприкасании частиц с тонким фосфорным покрытием, частицы выделяли какое-то колличество фотонов (чем был больше заряд у частицы, тем больше фотонов она выделяла).
Если частица имела энергию $U$, то колличество фотонов которое выделяет эта частица имеет распределение $Pois(U)$. Надо найти estimator (оценка) для $\alpha$ и $\beta$.

$f(x;\alpha,\beta)=x^{\alpha-1} \frac{\exp\left(-x/\beta\right)}{\Gamma(\alpha)\,\beta^{\alpha}}$

Так же мне дан присок 1500 выбросов фотонов (то есть число фотонов от каждой из 1500 частиц, но не известна энергия каждой частицы).

Как решать такую задачу?

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение22.12.2009, 23:48 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Во-первых, можно выписать функцию правдоподобия выборки и максимизировать ее по $\alpha$ и $\beta$.

Но поскольку в каждом наблюдении есть неизвестная величина (значение энергии частицы мы не наблюдаем непосредственно, а только косвенно, по числу фотонов), то решить эту задачу непосредственно может быть сложно. В этом случае можно воспользоваться алгоритмом EM (Expectation-Maximization), он как раз для подобных ситуаций подходит.

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 00:03 
Аватара пользователя


15/11/08
502
London, ON
функция правдоподобия?
$L(x;\alpha,\beta)=\prod\limits_{i=1}^n x_i^{\alpha-1} \frac{\exp\left(-x_i/\beta\right)}{\Gamma(\alpha)\,\beta^{\alpha}}$
но не лучше взять лог-функцию?

$l(x;\alpha,\beta)=Ln\prod\limits_{i=1}^n( x_i^{\alpha-1} \frac{\exp\left(-x_i/\beta\right)}{\Gamma(\alpha)\,\beta^{\alpha}})=\sum\limits_{i=1}^nx_i^{\alpha-1}-\frac{\sum\limits_{i=1}^nx_i}{\beta}-n(\ln\Gamma(\alpha)\beta^{\alpha})$
Это я сделал, но тут застрял(

-- Вт дек 22, 2009 23:07:02 --

Нас пустили в свободное плаванье (типо вот вам задание непосильное, пользуйтесь чем хотите, но в конце концов принесите решение...вот помучившись я пришёл сюда)

-- Вт дек 22, 2009 23:16:26 --

Как я понял $U$ в задании это та самая энергия имеющая гамма-распределение, да?

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 08:20 
Аватара пользователя


15/11/08
502
London, ON
Expectation-Maximization - я об этом впервые слышу( мы такое не проходили.

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 09:20 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Может быть, EM тут и не подойдет, надо подумать еще. Но вообще эта штука очень известная и Вы без труда найдете массу описаний.

Вы написали функцию правдоподобия выборки, порожденной гамма-распределением. Но это сейчас бесполезно, потому что значения энергии-то Вам неизвестны. Вам нужно написать правдоподобие для числа фотонов. Т.е. вероятность того, что число фотонов примет заданное значение. Подставив в эту функцию имеющиеся значения, получится функция, зависящая только от параметров гамма-распределения. Максимизируя ее, Вы получите требуемые оценки параметров.

(Оффтоп)

Интересно, где это такие задачи дают для самостоятельной работы?


 i  Поскольку задача скорее исследовательская, чем стандартная учебная, то я ее переношу в корневой раздел

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 12:06 
Аватара пользователя


15/11/08
502
London, ON
PAV в сообщении #274322 писал(а):
равдоподобие для числа фотонов

вот то, что у меня получилось
$l(x;\theta)=\ln \prod\limits_{i=1}^n\frac{\theta_i^{x_i} e^{-\theta_i}}{x_i!}=\ln \frac{\prod\limits_{i=1}^n\theta_i^{x_i} e^{-\sum\limits_{i=1}^n\theta_i}}{\prod\limits_{i=1}^nx_i!}=\sum\limits_{i=1}^nx_i \ln\theta_i -\sum\limits_{i=1}^n\theta_i-\sum\limits_{i=1}^n\ln x_i!$

Далее нужно максимализировать функцию по $\theta_i$.
Hе подскажите как это сделать?
Я попробывал и у меня вышло, что $\theta_i=x_i$, но это как-то слишком просто. Hе могли бы вы показать как это решается с помощью expectation-maximization?

-- Ср дек 23, 2009 11:07:16 --

(Оффтоп)

Израиль

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 13:00 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Это не та задача. То, что Вы делали сейчас - это попытка оценить параметр распределения Пуассона по единственному наблюдению. Но в Вашей постановке нет никакого параметра $\theta_i$. Функция правдоподобия должна зависеть только от имеющихся параметров $\alpha$ и $\beta$.

Не торопитесь с EM, может быть он и не понадобится. Сначала Вы должны все-таки правильно найти функцию правдоподобия.

Смотрите. Каждое наблюдение (частица) задается парой случайных величин: $(U,N)$, где $U$ - энергия, имеет гамма-распределение, а $N$ - число фотонов, имеет распределение Пуассона с параметром $\theta=U$. Особенность задачи в том, что величина $U$ является скрытой или ненаблюдаемой (hidden component).

Вы должны найти распределение вероятностей величины $N$, т.е. вычислить вероятность $P(N=x)$, зависящую от $\alpha$ и $\beta$. Вероятностная интуиция должна подсказать, что для этого нужно усреднить пуассоновскую вероятность по случайному параметру $\theta=U$. Строго же говоря, это выводится (совершенно несложно) с помощью техники условных математических ожиданий. Вас этому учили? Попробуйте написать что-то осмысленное, потом будем двигаться дальше.

(Оффтоп)

Что Израиль, это я понял. Меня скорее интересует специальность и уровень учебного заведения. Ваша специальность связана с математикой и, в частности, с теорией вероятностей и математической статистикой? Какой уровень владения этими предметами предполагается, чему Вас учили? С чего вообще Вам дают такое задание, явно исследовательского характера? Разумеется, Вы совершенно не обязаны отвечать, просто интересно и может помочь в дальнейшем обсуждении. Хотя бы - на каком уровне строгости требуется привести решение? Потому что я могу хоть сейчас сформулировать некоторый разумный алгоритм решения (итеративный) в духе EM, но без особых математических обоснований.


-- Ср дек 23, 2009 13:02:11 --

Возможно, Вам понадобится оценка параметра распределения Пуассона по одному наблюдению, которую Вы получили, но нужно понимать, что она "не работает" если $x=0$, так как параметр распределения Пуассона должен быть положительным (иначе распределение вырождается в точку).

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 18:29 
Аватара пользователя


15/11/08
502
London, ON
Как я могу выразить $N$ который имеет распределение Пуассона при помощи $\alpha$ и $\beta$ из Гамма-распределения?
Мы проходили условное мат.ожидание, но я не вижу как применить это здесь. И что значит усреднить пуассоновскую вероятность?

(Оффтоп)

Я учусь в Иерусалимском университете. Экономика и статистика. Этот курс относится к статистике. Курс называется "статистические выводы".
Учимся в основном по википедии и другим инет-ресурсам. Это задание дано как-бы "наперёд", то есть нам ещё не дали шужных инструментовдля его решения, но мы можем попытаться.

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение23.12.2009, 23:30 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Neytrall в сообщении #274457 писал(а):
Как я могу выразить $N$ который имеет распределение Пуассона при помощи $\alpha$ и $\beta$ из Гамма-распределения?


Параметр $\theta$, задающий распределение Пуассона, в Вашем случае сам является случайной величиной, имеющей гамма-распределение.

Это делается так. Нас интересует вероятность $P(N=x)$. Будем обозначать через $I(\cdot)$ случайную величину, равную индикатору события; тогда вероятность события - это математическое ожидание этой случайной величины:
$P(N=x)=E(I(N=x))$
Теперь стандартный прием: представим это (безусловное) математическое ожидание как мат. ожидание от условного:
$E(I)=E(E(I|U))$

А теперь сами сообразите, пользуясь знаниями о том, что такое условное математическое ожидание, что будет представлять из себя $E(I|U)$.
Короче, теперь Ваш ход.

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение24.12.2009, 10:19 
Аватара пользователя


15/11/08
502
London, ON
$E(I)=E(E(I|U))=E(\sum\limits_{i=0}^1iP[I=i|U=u])=E(\frac{P(I=1,U=u)}{P(U=u)})$
Так?

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение24.12.2009, 10:30 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Нет. Про внешнее математическое ожидание пока что забудьте.

$E(I|U)=P(N=x|U)$

Что вообще представляет из себя условное математическое ожидание $E(I|U)$? Исходите из содержательного смысла этого понятия. И не забывайте, что $U$ распределена непрерывно, поэтому любая вероятность $P(U=u)$ равна нулю, так что делить на нее бессмысленно. Здесь как раз та ситуация, когда условная вероятность берется при условии события нулевой вероятности, поэтому классическое определение условной вероятности неприменимо.

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение24.12.2009, 10:38 
Аватара пользователя


15/11/08
502
London, ON
так...гамма- непрерывное, а пуассон- дискретное.
условное математическое ожидание $E(I|U)$ должно быть функцией $u$. Теперь я вижу, что делить нельзя. Но как тогда, если определение не помогает??

-- Чт дек 24, 2009 09:46:31 --

$E(X|U=u_j)=\sum\limits_{i=1}^{\infty} x_i\, P_{X \mid U}(x_i \mid u_j)$

-- Чт дек 24, 2009 10:06:10 --

А что если попробывать решить задачу при помощи нескольких моментов?

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение24.12.2009, 19:09 
Аватара пользователя


15/11/08
502
London, ON
И всё же...я не понимаю, что вы от меня просите(

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение24.12.2009, 21:11 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Neytrall в сообщении #274711 писал(а):
условное математическое ожидание $E(I|U)$ должно быть функцией $u$


Говорите точнее: $E(I|U)$ является функцией не $u$, а $U$. Пожалуй, для наглядности все-таки вернемся к обозначениям вероятности:
$P(N=x|U)=g(U)$

Значение функции $g$ в конкретной точке $t$ можно (и нужно) понимать так: $g(t)=P(N=x|U=t)$

А теперь соберите воедино все, что дано в задаче, и догадайтесь, чему это равно: $P(N=x|U=t)$? Интуитивно это должно быть совершенно очевидно. По сути, это дано в задаче.

 Профиль  
                  
 
 Re: Большая задача по статистике!
Сообщение25.12.2009, 03:59 
Аватара пользователя


15/11/08
502
London, ON
по логике $P(N=x|U=t)=\frac{t^x}{x!}\ e^{-t}$

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 57 ]  На страницу 1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group