2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Распределение Пуассона и нормальный закон
Сообщение25.02.2018, 16:59 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Пусть есть радиоактивный элемент и наблюдается количество распадов, зарегистрированных за время $t$ идеальным счётчиком. Положим, что для наблюдаемого процесса распада описание распределением Пуассона точно: вероятность зарегистрировать $k$ распадов за указанное время равна
$$
\mathbb P \left(X = k \right) = \dfrac{\overline k^k}{k!} e^{-\overline k}, \qquad \overline k = \dot nt,
$$
где $\dot n$ — средняя скорость счёта. Если экспозиция такова, что $\overline k \gg 1$, то распределение Пуассона почти совпадает с нормальным распределением $\mathcal N(\overline k, \overline k)$.

Попробую суть проблемы пояснить на примере. Была выставлена экспозиция, при которой для данной толщины фильтра были зарегистрированы следующие значения импульсов счётчика: 4002, 3898. Для расчёта доверительного интервала используем такое утверждение:
$$
\sqrt{n - 1} \dfrac{\langle X \rangle - \overline k}{S} \sim t_{n-1}, \eqno{(^*)}
$$
где $\langle \cdot \rangle$ — выборочное среднее.

Несмещённое стандартное отклонение по выборке $S \approx 73{,}54$. На уровне доверия 95% доверительный интервал имеет вид $3950 \pm 661$. Такая погрешность неудовлетворительна. На уровне доверия 70% доверительный интервал имеет вид $3950 \pm 102$, что уже достаточно, но хочется побольше сделать уровень доверия.

Для этого хотим использовать знание о том, что радиоактивный распад с хорошей точностью пуассоновский таким образом: используем утверждение
$$
\sqrt n \dfrac{\langle X \rangle - \overline k}{\sigma} \sim \mathcal N(0, 1) \eqno {(^{**})}
$$
и прикинемся, что мы знаем дисперсию $\sigma$, оценив её корнем из среднего по выборке $\sqrt{ \langle X \rangle}$. В таком случае получаем уже картину более радостную: на уровне доверия 95% имеем интервал $3950 \pm 87$, на уровне доверия 70% он будет уже $3950 \pm 46$.

Однако, соотношения $(^*)$ и $(^{**})$ выполняются строго лишь для нормальных выборок, причём в первом соотношении нестрогость вносится лишь пуассоновским характером выборки, который при $\overline k \gg 1$ очень похож на нормальный (поэтому можно надеяться, что доверительный интервал обоснован). Во втором же соотношении нестрогость вносится два раза: один раз из-за выборки и второй раз из-за замены $\sigma$ на $\sqrt{ \langle X \rangle }$, относительно которой уже нет оснований (нельзя, например, опереться на закон больших чисел, ибо выборка мала) заявить, что она не вносит сильных искажений.

Как же всё-таки быть? Расчёт по первому варианту выглядит более обоснованным, но даёт слишком длинные доверительные интервалы, а расчёт по второму даёт хорошие интервалы и к тому же использует дополнительную информацию, которую мы имеем из природы эксперимента, но при этом кажется менее обоснованным. Есть ли способ узнать, сильно ли мы ошибаемся в доверительном интервале при замене $\sigma \to \sqrt{ \langle X \rangle }$?

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение25.02.2018, 18:58 
Заслуженный участник
Аватара пользователя


01/09/13
4319
StaticZero в сообщении #1294302 писал(а):
Такая погрешность неудовлетворительна.

А что же Вы хотите от двух измерений?

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение25.02.2018, 19:01 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Geen в сообщении #1294326 писал(а):
А что же Вы хотите от двух измерений?

Ну тут оказалось, что если посчитать чуть по-другому, то она становится ещё как удовлетворительной.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение25.02.2018, 19:10 
Заслуженный участник
Аватара пользователя


01/09/13
4319
StaticZero в сообщении #1294302 писал(а):
Есть ли способ узнать, сильно ли мы ошибаемся

Проведите численный эксперимент.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 09:10 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Geen в сообщении #1294330 писал(а):
Проведите численный эксперимент.

Пытаюсь сообразить, как его поставить.

Пока соображение такое: возьмём много выборок длины 2 из реализации величины, распределённой по Пуассону с параметром $\lambda$: $\mathbf X_n = (x_{n1}, x_{n2})$. Для каждой выборки определяем среднее $\langle \mathbf X_n \rangle = c_n$. Потом организуем величину, реализации которой получим по формуле $\sqrt n \dfrac{x_{ik} - c_n}{\sqrt{\lambda}} = a_{ik}$, перебрав все сгенерированные числа $1 \leqslant i \leqslant n$ и $k = 1, 2$. Организуем рядом другую величину $\sqrt n \dfrac{x_{ik} - c_n}{\sqrt{c_n}} = b_{ik}$, перебор такой же.

Потом обе величины $a$ и $b$ будем каким-то образом тестировать на разумность предположения о том, что они имеют закон распределения $\mathcal N(0, 1)$ через их реализации при уровне доверия, совпадающем с уровнем доверия, используемом для желаемого доверительного интервала. Я правильно понял ваше предложение?

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 09:59 
Заслуженный участник
Аватара пользователя


01/09/13
4319
StaticZero в сообщении #1294409 писал(а):
Потом обе величины $a$ и $b$ будем каким-то образом тестировать на разумность предположения

Зачем? Вы просто будете иметь распределение этих величин и из него найдёте интервалы.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 15:05 
Заслуженный участник
Аватара пользователя


11/03/08
9543
Москва
Ответ у Вас получился разный, потому, что Вы решали задачу на основе разного объёма информации. Помимо численных значений для двух измерений, во втором случае Вы привлекли очень основательную информацию о том, что величина распределена по закону Пуассона. Нормальное распределение имеет два параметра - матожидание и дисперсию, пуассоновское - один, лямбда, и Вы пытаетесь оценить по двум наблюдениям в первом случае два параметра или, во втором случае, один. Разумеется, эта дополнительная информация вдвое увеличивает количество информации в расчёте на один рассчитанный параметр и, соответственно, повышает точность его.
При этом расчёт на основании столь малой выборки даст очень широкие доверительные интервалы. В том числе потому, что распределение Стьюдента с одной степенью свободы (и вообще, с числом степеней свободы 4 и менее) имеет бесконечный эксцесс, то есть "очень тяжёлые хвосты".
Проверить по данной выборке, что это распределение Пуассона, возможным не представляется. В данном случае надо либо научиться регистрировать на коротких интервалах и воспользоваться критерием, скажем $\chi^2$ для числа попаданий в интервалы, взяв их с десяток и более, либо доказать принадлежность к Пуассону не из статистических наблюдений, а из физических соображений (ну, или постулировать - "Постулирование имеет явные преимущества перед любыми другими методами научного исследования, те же, что у воровства перед честным трудом" - Б.Рассел). Проверить можно, что параметры распределения одинаковы для обоих Ваших измерений. Поскольку число импульсов велико, нормальная аппроксимация должна быть работающей, и можно сравнивать, как средние двух независимых выборок с известной оценкой дисперсии. Гипотеза о равенстве не отвергается.
Если имеется уверенность в Пуассоне и в неизменности его лямбды, два изменения стоит объединить, и оценивать $4002+3898=7902$ импульсов, полученных за время $2\tau$

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 22:39 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Взял сто выборок длины 2 из реализации величины, распределённой по Пуассону с параметром $\lambda = 2000$: $\mathbf X_n = (x_{n1}, x_{n2})$. Для каждой выборки определил среднее $\langle \mathbf X_n \rangle = c_n$. Для каждого значения $c_n$ вычислил величину $\sqrt 2 \dfrac{x_{ik} - c_n}{\sqrt{c_n}}$ (здесь $x_{ik}$ пробегает все 200 сгенерированных чисел, $c_n$ пробегает все сто выборок).

В итоге получил 20 000 величин и прогнал их через хи-квадрат критерий с нулевой гипотезой, утверждающей, что вся выборка получена от стандартно распределённой случайной величины. Критерий был успешно провален (значение статистики на три порядка превосходит критическое на уровне значимости 0,1%). Среднее по этой большой выборке равно ~0,0047.

Гистограмма частот такая, как на рис.
Изображение

-- 26.02.2018, 22:58 --

Для $\lambda = 7000$ те же объёмы выборок дают гистограмму такую. Хи-квадрат по-прежнему проваливается с запасом в три порядка, стало быть, нормальным распределением тут точно не пахнет (что в принципе по гистограмме неплохо видно).

Изображение

-- 26.02.2018, 23:18 --

Ну и вдобавок к этому при увеличении объёма длины выборки до 3 хвосты испортились и потяжелели. Вообще, распределение какое-то приплюснутое.


Geen в сообщении #1294410 писал(а):
Зачем? Вы просто будете иметь распределение этих величин и из него найдёте интервалы.

Эмпирическое имеете ввиду?

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 23:22 
Заслуженный участник
Аватара пользователя


11/03/08
9543
Москва
Не понял смысла данной манипуляции.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 23:25 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Евгений Машеров в сообщении #1294586 писал(а):
Не понял смысла данной манипуляции.

Проверка соответствия распределения величины $\sqrt n \dfrac{X - \langle X \rangle}{\sqrt{\langle X \rangle}}$ распределению $\mathcal N(0, 1)$, как было предположено.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 23:28 
Заслуженный участник
Аватара пользователя


11/03/08
9543
Москва
Вы проверяете что-то иное, если проверяете вообще.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 23:34 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Евгений Машеров в сообщении #1294589 писал(а):
Вы проверяете что-то иное, если проверяете вообще.

Процедура получения выборки неправильная, имеете ввиду?

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 23:41 
Заслуженный участник
Аватара пользователя


11/03/08
9543
Москва
0. Вы всерьёз надеетесь получить осмысленный доверительный интервал по двум наблюдениям?
1. В проверке принадлежности к распределению предполагается независимость величин. У Вас исходные иксы, по всей видимости, независимы, но Ваше преобразование даёт набор дико коррелированных величин.

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение26.02.2018, 23:53 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Евгений Машеров в сообщении #1294593 писал(а):
Вы всерьёз надеетесь получить осмысленный доверительный интервал по двум наблюдениям?

Его всерьёз предлагают получать в учебной лаборатории, что удручает.

Евгений Машеров в сообщении #1294593 писал(а):
но Ваше преобразование даёт набор дико коррелированных величин.

Хорошо бы это проверить самостоятельно, но, может быть, потом. Поверю на слово. В таком случае какой численный эксперимент имеет ввиду Geen, мне вообще не понятно, и стартовый вопрос остаётся открытым:
StaticZero в сообщении #1294302 писал(а):
Есть ли способ узнать, сильно ли мы ошибаемся в доверительном интервале при замене $\sigma \to \sqrt{ \langle X \rangle }$?

 Профиль  
                  
 
 Re: Распределение Пуассона и нормальный закон
Сообщение27.02.2018, 00:27 
Заслуженный участник
Аватара пользователя


01/09/13
4319
StaticZero в сообщении #1294596 писал(а):
Хорошо бы это проверить самостоятельно, но

Вы из 200 с.в. делаете в сто раз больше "значений" - понятно без проверок, что они, мягко говоря, не будут независимыми....
StaticZero в сообщении #1294596 писал(а):
В таком случае какой численный эксперимент имеет ввиду Geen

Ну если хотите 20000 "значений" (боюсь употреблять слово статистика), то надо сгенерировать 40000 с.в., разбить их на пары и т.д. Главное, что каждая сгенерированная с.в. используется не более одного раза.

StaticZero в сообщении #1294587 писал(а):
Проверка соответствия распределения величины $\sqrt n \dfrac{X - \langle X \rangle}{\sqrt{\langle X \rangle}}$

Какой случайной величины??
Посмотрите, хотя бы, https://ru.wikipedia.org/wiki/Доверительный_интервал_для_математического_ожидания_нормальной_выборки

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 24 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group