2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Как вычислять информацию Фишера?
Сообщение21.05.2018, 14:03 


21/03/11
200
Пусть $\mathbf{X} = (X_1, \ldots, X_n)$ - выборка независимых одинаково распределенных величин из параметрического семейства распределений $\mathcal{P} = \{P_\theta: \theta \in \Theta \} ($X_i \sim P_{\theta_0}$ независимые одинаково распределенные с.в., $\theta_0 \in \Theta$ - фиксированный истинный параметр).

Я хочу узнать, как правильно обосновать вычисление информации Фишера

$$I(\theta) = \mathrm{E}_\theta\left[ \left(\frac{\partial \log f(X_1; \theta)}{\partial \theta} \right)^2 \right]$$

Пока я вижу следующий алгоритм для вычисления $I(\theta)$:

1. Используя тот факт, что $X_1 \sim P_{\theta_0}$, мы вычисляем случайную величину $g(X_1; \theta) = \left(\frac{\partial \log f(X_1; \theta)}{\partial \theta} \right)^2$. Так как параметр $\theta_0$ зафиксирован, мы здесь можем сказать, что с.в. $X_1$ не зависит от $\theta$, а значит производная $\frac{\partial}{\partial \theta}$ легко вычисляется (на этом этапе можно даже рассматривать $X_1$ как некоторую фиксированную константу).
2. На втором этапе мы делаем предположение, что $X_1 \sim P_{\theta}$ (где число $\theta \in \Theta$ уже не обязательно совпадает с $\theta_0$) и вычисляем матожидание $\mathrm{E}_\theta[g(X_1; \theta)]$.

Вопрос: будет ли этот алгоритм математически корректен?

Меня сильно смущает "изменение" распределения случайной величины $X_1$ с $P_{\theta_0}$ на $P_{\theta}$ в пункте 2. Так всегда делается при вычислении матожиданий вида $\mathrm{E}_\theta[X_1]$ ??

 Профиль  
                  
 
 Re: Как вычислять информацию Фишера?
Сообщение21.05.2018, 15:07 
Заслуженный участник
Аватара пользователя


11/04/08
2749
Физтех
give_up в сообщении #1313826 писал(а):
Так как параметр $\theta_0$ зафиксирован, мы здесь можем сказать, что с.в. $X_1$ не зависит от $\theta$, а значит производная $\frac{\partial}{\partial \theta}$ легко вычисляется (на этом этапе можно даже рассматривать $X_1$ как некоторую фиксированную константу).
Это же частная производная, вы берете производную по одному аргументу, считая другой постоянным. Кроме того, выборка (в том числе и $X_1$) является функцией исходов, но не параметра $\theta$. От параметра $\theta$ зависит распределение $X_1$, но не $X_1$ как функция. Так что производную от $X_1$ вы берете не потому, что там $\theta_0$ фиксирована, а потому что она от $\theta$ вообще не зависит.
give_up в сообщении #1313826 писал(а):
На втором этапе мы делаем предположение, что $X_1 \sim P_{\theta}$
Мы сделали это предположение, когда поставили задачу, ввели в рассмотрение модель. Мы не знаем истинного $\theta_0$, поэтому приходится рассматривать параметр $\theta$ в некотором множестве $\Theta$. По определению, информация Фишера, как и многие другие характеристики выборки, если не все, вычисляются при каждом $\theta\in\Theta$, для которых они определены.
give_up в сообщении #1313826 писал(а):
Меня сильно смущает "изменение" распределения случайной величины $X_1$ с $P_{\theta_0}$ на $P_{\theta}$ в пункте 2. Так всегда делается при вычислении матожиданий вида $\mathrm{E}_\theta[X_1]$ ??
Еще раз повторюсь, что так как мы не знаем истинного $\theta_0$, то мы изначально предполагаем, что $X_1 \sim P_{\theta}$ для $\theta\in\Theta$. Если мы хотим вычислисть мат. ожидание случайной величины $X_1$, то мы фиксируем какую-нибудь $\theta\in\Theta$ и затем вычисляем мат. ожидание $\mathbb{E}_{\theta}(X_1)$. Тот факт, что мы вычисляем мат. ожидание для этого $\theta$, и обозначается в виде индекса у $\mathbb{E}$. Получается, что математическое ожидание $X_1$ -- это функция от $\theta$, а не одно число. Поэтому, например, определение несмещенности статистики $T(\mathbf{X})$ выглядит так: $$\forall \theta\in \Theta \ \ \ \mathbb{E}_{\theta}T(\mathbf{X})=\theta$$ т.е. функции должны совпадать, а не числа.

 Профиль  
                  
 
 Re: Как вычислять информацию Фишера?
Сообщение21.05.2018, 16:15 


21/03/11
200
ShMaxG, спасибо большое, теперь разобрался!

Другими словами, случайная величина $X_1(\omega)$ по определению является измеримым отображением $(\Omega, \mathcal{F}) \to (\mathbb{R}, \mathcal{B})$. А меру $P_\theta$ на $(\Omega, \mathcal{F})$ можно задать какую угодно, она не будет влиять на поведение $X_1$ как функции. То есть $\frac{d X_1}{d \theta} = 0$.

Теперь я смог осознать и корректность формулы для оценки максимального правдоподобия $\hat\theta(\mathbf{X}) = \underset{\theta \in \Theta}{\mathrm{argmax}} \, L(\mathbf{X}; \theta)$. А то раньше все голову ломал, почему случайный вектор $\mathbf{X}$ в этом выражении не зависит от $\theta$ (хотя его компоненты $X_i \sim P_\theta$).
Все таки не зря теорию вероятностей заставляют изучать перед математической статистикой :-).

 Профиль  
                  
 
 Re: Как вычислять информацию Фишера?
Сообщение21.05.2018, 18:01 
Заслуженный участник
Аватара пользователя


11/04/08
2749
Физтех
give_up в сообщении #1313875 писал(а):
Другими словами, случайная величина $X_1(\omega)$ по определению является измеримым отображением $(\Omega, \mathcal{F}) \to (\mathbb{R}, \mathcal{B})$. А меру $P_\theta$ на $(\Omega, \mathcal{F})$ можно задать какую угодно, она не будет влиять на поведение $X_1$ как функции. То есть $\frac{d X_1}{d \theta} = 0$.
Ну да. В принципе, можно так (через одно место) задать случайные величины, что они и от $\theta$ зависеть будут. Но это совершенно необязательно.

Пусть, например, $\mathcal{X}$ -- множество значений исследуемой случайной величины $\xi$, а $\mathcal{B}_{\mathcal{X}}$ -- какая-нибудь сигма-алгебра над $\mathcal{X}$. Ясно, что если мы хотим ввести какое-то параметрическое семейство распределений, то давайте просто возьмем $\Omega=\mathcal{X}$, $\mathcal{F}=\mathcal{B}_{\mathcal{X}}$, $\xi(\omega)=\omega\in\Omega$ и введем как нам нужно семейство $\mathbb{P}_{\theta}$ на $(\Omega,\mathcal{F})$.

Что касается выборки $X=(X_1,\dots,X_n)$, то ее можно определить (и мне кажется, так и поступают всегда в мат. статистике) на вероятностном пространстве с пространством исходов $\Omega=\mathcal{X}\times\dots\times\mathcal{X}$ и с сигма-алгеброй, порожденной событиями вида $B=B_1\times\dots\times B_n$, $B_i\in\mathcal{B}_{\mathcal{X}}$. Тогда меру на $B\in\mathcal{B}_{\mathcal{X}}$ можно определить как $$\mathbb{P}_{\theta}(X\in B)=\prod\limits_{i=1}^n \mathbb{P}_{\theta}(X_i\in B_i)$$ (я использовал один и тот же символ для вероятности события на на "большом" пространстве, так и на "малом"). В таком случае просто $X_i(\omega)=\omega_i$, где $\omega=(\omega_1,\dots,\omega_n)\in\Omega$. Получается так, что мы можем варьировать $\theta$, пробегаясь вдоль семейства вероятностных пространств $(\Omega,\mathcal{B}_{\Omega},\mathbb{P}_{\theta})$, при этом функции $X_i(\cdot)$ будут одни и те же, не зависящие от $\theta$.

 Профиль  
                  
 
 Re: Как вычислять информацию Фишера?
Сообщение22.05.2018, 22:14 


21/03/11
200
ShMaxG в сообщении #1313906 писал(а):
если мы хотим ввести какое-то параметрическое семейство распределений, то давайте просто возьмем $\Omega=\mathcal{X}$, $\mathcal{F}=\mathcal{B}_{\mathcal{X}}$, $\xi(\omega)=\omega\in\Omega$ и введем как нам нужно семейство $\mathbb{P}_{\theta}$ на $(\Omega,\mathcal{F})$.


ShMaxG, подскажите пожалуйста, правильно ли я понял, что задание случайной величины $\xi(\omega)=\omega$ приведет к совпадению индуцированной этой случайной величиной меры (распределения) $P_\xi$ с исходной мерой $P_\theta$. То есть случайная величина $\xi(\omega) = \omega$ будет отображать вероятностное пространство $(\Omega, \mathcal{F}, P_\theta)$ в себя ($\xi: (\Omega, \mathcal{F}, P_\theta) \to (\Omega, \mathcal{F}, P_\theta)$).

Я пришел к такому выводу, потому что у меня вышло $P_\xi(B) = P_\theta(\xi \in B) = P_\theta\{\omega: \xi(\omega) \in B\} = P_\theta\{\omega: \omega \in B\} = P_\theta(B)$.

В случае с выборкой $X=(X_1, \ldots, X_n)$ вышло аналогично:
$\displaystyle P_X(B) = P_\theta(X \in B) = \prod_{i=1}^n P_\theta(X_i \in B_i) = \prod_{i=1}^n P_\theta\{\omega: X_i(\omega) \in B_i\} = \prod_{i=1}^n P_\theta\{\omega_i: \omega_i \in B_i\} = \prod_{i=1}^n P_\theta(B_i) = P_\theta(B)$

 Профиль  
                  
 
 Re: Как вычислять информацию Фишера?
Сообщение22.05.2018, 22:27 
Заслуженный участник
Аватара пользователя


11/04/08
2749
Физтех
give_up в сообщении #1314185 писал(а):
ShMaxG, подскажите пожалуйста, правильно ли я понял, что задание случайной величины $\xi(\omega)=\omega$ приведет к совпадению индуцированной этой случайной величиной меры (распределения) $P_\xi$ с исходной мерой $P_\theta$. То есть случайная величина $\xi(\omega) = \omega$ будет отображать вероятностное пространство $(\Omega, \mathcal{F}, P_\theta)$ в себя ($\xi: (\Omega, \mathcal{F}, P_\theta) \to (\Omega, \mathcal{F}, P_\theta)$).
Все верно, только случайная величина действует из $\Omega$ в $\Omega$, а не из вероятностного пространства в вероятностное пространство.

 Профиль  
                  
 
 Re: Как вычислять информацию Фишера?
Сообщение22.05.2018, 22:36 


21/03/11
200
ShMaxG в сообщении #1314187 писал(а):
give_up в сообщении #1314185 писал(а):
ShMaxG, подскажите пожалуйста, правильно ли я понял, что задание случайной величины $\xi(\omega)=\omega$ приведет к совпадению индуцированной этой случайной величиной меры (распределения) $P_\xi$ с исходной мерой $P_\theta$. То есть случайная величина $\xi(\omega) = \omega$ будет отображать вероятностное пространство $(\Omega, \mathcal{F}, P_\theta)$ в себя ($\xi: (\Omega, \mathcal{F}, P_\theta) \to (\Omega, \mathcal{F}, P_\theta)$).
Все верно, только случайная величина действует из $\Omega$ в $\Omega$, а не из вероятностного пространства в вероятностное пространство.


Да, Вы правы, тут я некорректно написал. Имелось в виду, что "старое" и "новое" вероятностное пространство совпадут.
Теперь все понял. Спасибо еще раз.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: mihaild


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group