2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Сравнение оценок на вероятности
Сообщение09.10.2007, 14:17 


16/05/07
172
Москва
Есть выборка из двух дискретных распределений (с одним максимумом; близкие к пуассоновскому):
\{\{g_1,g_2\}, \{f_1,f_2\}\} (N штук)

g_i \ge 0, f_i \ge 0

Стоит задача, как можно более точно, оценить P\{g_1+g_2 > f_1+f_2\} (а также P\{g_1+g_2 = f_1+f_2\} и P\{g_1+g_2 < f_1+f_2\}).

Это можно делать как минимум двумя способами:
1) Для каждого элемента выборки найти g_1+g_2 > f_1+f_2 и потом найти частоту этого события по всей выборке P_{1)}\{g_1+g_2 < f_1+f_2\}).
2) Найти P_g\{g=i\} и P_f\{f=i\} как частоты, по выборке и затем найти P\{g_1+g_2 > f_1+f_2\} через эти вероятности: P_{2)}\{g_1+g_2 > f_1+f_2\}=\sum_{i>j}{P_g\{g=i\} P_f\{f=i\}}.

Вопрос в том, какой способ - более точный (как вообще исследовать такие задачи)?
Конечно, первый способ выглядит более приемлемым, но всегда ли он будет более точным?...

Кроме того, сразу возникает идея 3) построить некие P*_g\{g=i\} и P*_f\{f=i\} такие, чтобы P_{1)}\{g_1+g_2 > f_1+f_2\}=\sum_{i>j}{P*_g\{g=i\} P*_f\{f=i\}}. И, соответственно, возникает вопрос можно ли это сделать?

 Профиль  
                  
 
 
Сообщение24.10.2007, 17:13 


16/05/07
172
Москва
Изучалась где-нибудь теория, из которой можно понять, какие преобразования для P_g\{g1+g2=g\} не разрушают его асимптотику?

Ключевые слова для задачи, видимо: непараметрическая теория и робастные оценки...

 Профиль  
                  
 
 Re: Сравнение оценок на вероятности
Сообщение25.10.2007, 12:50 
Заслуженный участник
Аватара пользователя


28/09/06
10441
Андрей1 писал(а):
1) Для каждого элемента выборки найти g_1+g_2 > f_1+f_2 и потом найти частоту этого события по всей выборке P_{1)}\{g_1+g_2 < f_1+f_2\}).
2) Найти P_g\{g=i\} и P_f\{f=i\} как частоты, по выборке и затем найти P\{g_1+g_2 > f_1+f_2\} через эти вероятности: P_{2)}\{g_1+g_2 > f_1+f_2\}=\sum_{i>j}{P_g\{g=i\} P_f\{f=i\}}.

Вопрос в том, какой способ - более точный (как вообще исследовать такие задачи)?
Конечно, первый способ выглядит более приемлемым, но всегда ли он будет более точным?...

Второй способ основан на гипотезе независимости величин, которой на практике у Вас может и не быть. Первый способ можно получить как результат Байесовского оценивания по максимуму вероятности при равномерном априорном распределении, поэтому для указанных условий задачи (самого общего случая) он является наиболее подходящим.

 Профиль  
                  
 
 Re: Сравнение оценок на вероятности
Сообщение25.10.2007, 13:30 


16/05/07
172
Москва
epros писал(а):
Второй способ основан на гипотезе независимости величин, которой на практике у Вас может и не быть.


Можно считать, что есть независимость есть.

epros писал(а):
Первый способ можно получить как результат Байесовского оценивания по максимуму вероятности при равномерном априорном распределении, поэтому для указанных условий задачи (самого общего случая) он является наиболее подходящим.


Какое равномерное априорное распределение Вы имели ввиду?

 Профиль  
                  
 
 Re: Сравнение оценок на вероятности
Сообщение25.10.2007, 15:21 
Заслуженный участник
Аватара пользователя


28/09/06
10441
Андрей1 писал(а):
Можно считать, что есть независимость есть.

Тогда эту априорную информацию можно использовать при выводе формулы для оценивания. Только, как я понимаю, в данном случае это нам ничего нового не даст.

Андрей1 писал(а):
Какое равномерное априорное распределение Вы имели ввиду?

Распределение оцениваемой величины. В данном случае оцениваемая величина - это вероятность того, что одно сл. число меньше другого. Если положите априорное распределение этой вероятности равномерным по отрезку [0,1], а потом примените формулу Байеса для нахождения апостеориорного распределения этой величины, то максимум этого распределения как раз будет соответствовать формуле для первого случая.

 Профиль  
                  
 
 Re: Сравнение оценок на вероятности
Сообщение25.10.2007, 15:43 


16/05/07
172
Москва
epros писал(а):
Распределение оцениваемой величины. В данном случае оцениваемая величина - это вероятность того, что одно сл. число меньше другого. Если положите априорное распределение этой вероятности равномерным по отрезку [0,1], а потом примените формулу Байеса для нахождения апостеориорного распределения этой величины, то максимум этого распределения как раз будет соответствовать формуле для первого случая.


А разве формула для P_{2)}\{g1>g2\} не опредлеление? По моим представлениям - да и никакие дополнительные предположения не нужны :).

 Профиль  
                  
 
 Re: Сравнение оценок на вероятности
Сообщение25.10.2007, 16:46 
Заслуженный участник
Аватара пользователя


28/09/06
10441
Андрей1 писал(а):
А разве формула для P_{2)}\{g1>g2\} не опредлеление? По моим представлениям - да и никакие дополнительные предположения не нужны :).

Определение чего? Оценки определённого вида - да. Самой вероятности - нет.

Представьте, что Вы бросили монетку 5 раз, из которых 2 она выпала орлом. Какова вероятность выпадения орла? 2/5 - это оценка этой вероятности, но вовсе не обязательно данная оценка должна совпадать с самой вероятностью.

 Профиль  
                  
 
 
Сообщение26.10.2007, 09:45 


10/01/07
285
Санкт-Петербург
Поясните, пожалуйста, условие задачи. Выборка берется одновременно из двух двумерных распределений (из первого - $(g_1,g_2)$, из второго - $(f_1,f_2)$)? Если это так, то почему бы сразу не ввести случайные величины $g=g_1+g_2$, $f=f_1+f_2$ и не оценивать вероятность $P \left\{ g<f \right\}$?

В любом случае задача сводится к оценке вероятностной меры на множестве элементарных исходов $P \left\{ g<f \right\}$, $P \left\{ g=f \right\}$, $P \left\{ g>f \right\}$ по выборке. Например, если вероятностью $P\left\{ g=f \right\} $ можно пренебречь, то задача сводится к оценке вероятности успеха в схеме Бернулли по $N$ независимым испытаниям. Во многих смыслах "хорошей" оценкой для этих вероятностей (несмещенной, состоятельной, эффективной) является частотная оценка, то есть ваш пункт 1.

 Профиль  
                  
 
 
Сообщение26.10.2007, 10:48 


16/05/07
172
Москва
Mikhail Sokolov писал(а):
Если это так, то почему бы сразу не ввести случайные величины $g=g_1+g_2$, $f=f_1+f_2$ и не оценивать вероятность $P \left\{ g<f \right\}$?


Да, верно :).

Величины g_i, f_i будут нужны для следующего этапа задачи.

Mikhail Sokolov писал(а):
... Например, если вероятностью $P\left\{ g=f \right\} $ можно пренебречь, то задача сводится к оценке вероятности успеха в схеме Бернулли по $N$ независимым испытаниям.


Вероятностью $P\left\{ g=f \right\} $ пренебречь нельзя.

Mikhail Sokolov писал(а):
Во многих смыслах "хорошей" оценкой для этих вероятностей (несмещенной, состоятельной, эффективной) является частотная оценка, то есть ваш пункт 1.


Да, это понятно. Только второй способ тоже дает хорошую оценку. И для задачи нужны именно $P\left\{ g=i \right\} $, $P\left\{ f=j \right\} $.

Добавлено спустя 8 минут 59 секунд:

Re: Сравнение оценок на вероятности

epros писал(а):
Андрей1 писал(а):
А разве формула для P_{2)}\{g1>g2\} не опредлеление? По моим представлениям - да и никакие дополнительные предположения не нужны :).

Определение чего? Оценки определённого вида - да. Самой вероятности - нет.


Ну как нет? Если есть две дискретные неотрицательные случайные величины с плотностями P1{q1=i} и P2{q2=i}, то плотность вероятности их суммы P\{q1+q2=i\}=\sum_{j=0,...,i}{P1\{q1=j\} P2\{q2=i-j\}} следует из определения вероятности суммы множеств.

 Профиль  
                  
 
 
Сообщение26.10.2007, 11:31 


10/01/07
285
Санкт-Петербург
По-моему, ваш пункт 2 - это пример бутстреп оценки для $P\left\{ g>f \right\}$.

 Профиль  
                  
 
 
Сообщение26.10.2007, 14:17 
Заслуженный участник
Аватара пользователя


28/09/06
10441
Андрей1 писал(а):
epros писал(а):
Определение чего? Оценки определённого вида - да. Самой вероятности - нет.

Ну как нет? Если есть две дискретные неотрицательные случайные величины с плотностями P1{q1=i} и P2{q2=i}, то плотность вероятности их суммы P\{q1+q2=i\}=\sum_{j=0,...,i}{P1\{q1=j\} P2\{q2=i-j\}} следует из определения вероятности суммы множеств.

Только у Вас нет плотностей P1 и P2, а есть только их оценки.

 Профиль  
                  
 
 
Сообщение26.10.2007, 14:35 


16/05/07
172
Москва
epros писал(а):
Только у Вас нет плотностей P1 и P2, а есть только их оценки.

Да, в этом тонкость есть. Однако, как только у нас есть оценки, что мешает строить от них функции?

Добавлено спустя 6 минут 36 секунд:

Mikhail Sokolov писал(а):
По-моему, ваш пункт 2 - это пример бутстреп оценки для $P\left\{ g>f \right\}$.


К сожелению, я не знаком с теорией бутстрепа (только вижу, что мой пример на "размножение выборок" никак не походит...).
По этому случаю можете мне посоветовать лучшую книжку на эту тему :) (которую можно было бы заказать с amazon.com).

 Профиль  
                  
 
 
Сообщение26.10.2007, 14:51 
Заслуженный участник
Аватара пользователя


28/09/06
10441
Андрей1 писал(а):
Однако, как только у нас есть оценки, что мешает строить от них функции?

Ничего не мешает. Но при большом количестве возможных значений и при не очень большой выборке качество оценок вероятностей может быть весьма низким.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group