2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Многомерная дискретная плотность вероятностей
Сообщение01.11.2009, 16:42 


16/05/07
172
Москва
Посоветуйте литературу (которую можно найти в библиотеках или купить) по задачам аппроксимации многомерной дискретной плотности вероятностей или методам оценки асимпотической плотности для сумм двумерных случайных величин (с возможностью разложения по N, если членов в сумме конечно и не слишком много).

Интересует задача оценки двумерной дискретной плотности $P\{a, b\}, a=0,1,2,...; b=0,1,2,...$
Известно, что a и b нельзя считать независимыми, но зависимость эта слабая.

Есть ли для нарастающих двумерных сумм (двумерной) случайной величины (типа $(p_1,q_1) + (p_2,q_2)+...=(P, Q)$), описывающей редкое событие, какие-нибудь предельные (асимпотические) универсальные плотности (возможно, в зависимости от типа связи между p и q)?

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение02.12.2009, 17:37 


16/05/07
172
Москва
Жаль, что никто ничего не смог пока подсказать... :)

Хочется вообще понять, насколько развита теория в этом направлении и стоит ли надеяться, что где-то уже ответили на основные вопросы, которые возникают всвязи с этой задачей...

Например, есть такой вопрос, если связь между дискретными переменными слабая, то можно ли плотность $P\{i,j\}$ аппоксимировать независимой плотностью $P\{i,j\}=P_1\{i\}P_2\{j\}$ (такая аппроксимация имеет явное преимущество - частотные оценки для $P_1\{i\}$ и $P_2\{i\}$ будут более точными на тех же данных, потому что каждая переменная может принимать намного меньше значений, чем двумерная переменная).
А если и нельзя - то возникает идея все равно представить независимую плотность как разложение в ряд от зависимых. И теория копулы http://ru.wikipedia.org/wiki/%D0%9A%D0% ... 0%BB%D0%B0 тут явно должна как-то помочь (вопрос только - как :)).

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение03.12.2009, 10:05 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
За ссылку - спасибо, очень интересный объект, не знал про такой.

Я рекомендую не употреблять в данном контексте термин "дискретная плотность", потому что он не является употребительным и сбивает с толку. Речь идет просто о многомерном дискретном распределении.

По сути дела ничего, к сожалению, особо содержательного сказать не могу.

-- Чт дек 03, 2009 10:06:52 --

(Оффтоп)

В энциклопедическом словаре по теории вероятностей статьи про "копулу" нет.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение04.12.2009, 13:13 


16/05/07
172
Москва
PAV в сообщении #267658 писал(а):
Я рекомендую не употреблять в данном контексте термин "дискретная плотность", потому что он не является употребительным и сбивает с толку. Речь идет просто о многомерном дискретном распределении.

Да, Вы не первый, кто критикует меня за это :).
Ну я, честно говоря, не понимаю, почему нельзя называть ее плотностью. Дискретный случай можно понимать, как частный случай непрерывного (нужно только дельта функцию использовать). А там - как известно - плотность.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение04.12.2009, 14:27 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Просто терминологически не принято, поэтому сбивает с толку.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение07.12.2009, 14:06 


16/05/07
172
Москва
Да, посмотрел литературу, народ действительно разделяет "density estimation" и "estimation of probabilities in
categorical data". Надо будет мне подправить...

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение07.12.2009, 20:30 
Аватара пользователя


31/10/08
1244
Андрей1 в сообщении #267522 писал(а):
Жаль, что никто ничего не смог пока подсказать... :)

Хочется вообще понять, насколько развита теория в этом направлении и стоит ли надеяться, что где-то уже ответили на основные вопросы, которые возникают всвязи с этой задачей...

Например, есть такой вопрос, если связь между дискретными переменными слабая, то можно ли плотность $P\{i,j\}$ аппоксимировать независимой плотностью $P\{i,j\}=P_1\{i\}P_2\{j\}$ (такая аппроксимация имеет явное преимущество - частотные оценки для $P_1\{i\}$ и $P_2\{i\}$ будут более точными на тех же данных, потому что каждая переменная может принимать намного меньше значений, чем двумерная переменная).
А если и нельзя - то возникает идея все равно представить независимую плотность как разложение в ряд от зависимых. И теория копулы http://ru.wikipedia.org/wiki/%D0%9A%D0% ... 0%BB%D0%B0 тут явно должна как-то помочь (вопрос только - как :)).


$P\{i,j\}=P_1\{i\}P_2\{j\}$ Если это выполнимо то $P_1\{i\},P_2\{j\}$ называются мажоритарными. Я тебе даже более скажу при сильной связи в определенных случаях можно ввести преобразование которое позволит разделить переменные. Хотя бы тот-же PCA применить или. Но про критерии я не слышал. Хотя вру вроде что-то попадалось. Правда с поиском не заморачивался сильно, тоже хотел базовые вещи найти. Если что найдешь дай знать.

Цитата:
(будут более точными на тех же данных, потому что каждая переменная может принимать намного меньше значений, чем двумерная переменная).
Палка о двух конах мы можем внести большую ошибку если они связанны не таким образом.

Похоже в математике полно черных дыр.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение08.12.2009, 15:18 


16/05/07
172
Москва
Pavia в сообщении #268859 писал(а):
Цитата:
(будут более точными на тех же данных, потому что каждая переменная может принимать намного меньше значений, чем двумерная переменная).
Палка о двух конах мы можем внести большую ошибку если они связанны не таким образом.

В моем случае зависимость слабая и независимая оценка (пока) побеждает.

-- Вт дек 08, 2009 17:17:20 --

Pavia в сообщении #268859 писал(а):
Похоже в математике полно черных дыр.

Ага.
Задачу можно еще уточнить. Можно вспомнить, что каждый исход $(i,j)=(a_1,b_1)+(a_2,b_2)+...(a_t,b_t)+...+(a_N,b_N)$ (нарастающая сумма), где случайные величины $a_t и b_t$ могут принимать только два значения 0 или 1.
Эту информацию тоже можно как-то использовать, поскольку каждая частичнична сумма - тоже дает какую-то информацию (но только не очевидно как).

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение09.12.2009, 21:00 


16/05/07
172
Москва
Pavia в сообщении #268859 писал(а):
Похоже в математике полно черных дыр.

И еще пару "черных пятен":
1) допустим известно некоторое свойство неизвестного дискретного распределения (допустим известны значения сумм вероятностей некоторых исходов).
Вопрос, как в таком случае оценивать неизвестное распределение (в зависимости от того, являются ли известные суммы случайными или неслучайными величинами)?
2) допустим, имеется несколько выборок и известно, что некоторая характеристика в одной выборки (например, среднее значение) строго больше/меньше, чем в другой выборке. Вопрос, как в таком случае оценивать неизвестные распределения.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение09.12.2009, 22:14 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Не совсем четкая постановка (конкретнее было бы яснее), но в принципе разумный общий подход такой: рассматривается функция правдоподобия, описывающая все, что мы наблюдаем. В нее подставляются результаты наблюдений и полученное выражение максимизируется по всем параметрам распределения. Если про распределение априори известны какие-то соотношения, то они участвуют в этой задаче в виде ограничений.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение10.12.2009, 11:48 


16/05/07
172
Москва
PAV в сообщении #269596 писал(а):
... в принципе разумный общий подход такой: рассматривается функция правдоподобия, описывающая все, что мы наблюдаем...

Понятно. Но для этого (1) данные должны быть из одной выборки, (2) они должны быть независимы и (3) значения связей должны быть статистически независимы от данных.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение10.12.2009, 12:19 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
(1) и (3) непонятны. Можете примеры привести?

Что же касается (2), то тоже необязательно. Никто не запрещает рассмотреть какую-нибудь модель зависимых данных, просто тогда параметров может быть значительно больше. Однако тоже пример какой-нибудь был бы нелишним для конкретики.

 Профиль  
                  
 
 Re: Многомерная дискретная плотность вероятностей
Сообщение10.12.2009, 12:27 


16/05/07
172
Москва
PAV в сообщении #269596 писал(а):
Не совсем четкая постановка (конкретнее было бы яснее)...

1) Допустим известно, что заданных $Q_1, Q_2, T \in Z, V$ : $\sum_{i>j}{P\{i,j\}}=Q_1$, $\sum_{i<j}{P\{i,j\}}=Q_2$, $\sum_{i+j \le T}{P\{i,j\}}=V$.
Текущий лучший подход таков (он пока побеждает): сначала, используя независимую оценку, строим оценку $P'\{i,j\}$ распределения, затем методом $\chi^2$, считая все $P''\{i,j\}$ как независимые параметры, и рассматривая значения $P'\{i,j\}$ как частотные оценки, находим значения $P''\{i,j\}$, которые удовлетвоят связям (и минимизируют $\chi^2$).
2) Допустим известно, что для двух выборок 1 и 2: матожидание значений $M_1(i)>M_2(i)$ и $M_1(j)<M_2(j)$ (то есть, при бесконечном росте числа элементов выборок, среднее от первой дискретной величены (в рассматриваемом двумерном дискретном случае) больше среднего у второй выборки, а среднее от второй дискретной величены меньше среднего у второй выборки).
Задача - произвести оценку распределений, учитывая это условие.
Да, правдопобие тут должно помочь, правда, в книжке "Constrained Statistical Inference: Order, Inequality, and Shape Constraints" http://eu.wiley.com/WileyCDA/WileyTitle ... 08272.html обходятся как-то без этого :).

-- Чт дек 10, 2009 13:37:51 --

PAV в сообщении #269819 писал(а):
(1) и (3) непонятны. Можете примеры привести?

Попробую:
(1). Можно рассмотреть результаты бросания большого числа асиметричных костей. Понятно, что для этих данных нет смысла искать параметры распределения, поскольку данные не основаны на каком-то одном распределении.
(3) Связь может быть случайной величеной. Понятно, что если эта величена появится в правдоподобии, то крайне желательно, чтобы она была статистически независимой от всего остального, что войдет в правдоподобие :).

-- Чт дек 10, 2009 13:42:18 --

PAV в сообщении #269819 писал(а):
Что же касается (2), то тоже необязательно. Никто не запрещает рассмотреть какую-нибудь модель зависимых данных, просто тогда параметров может быть значительно больше. Однако тоже пример какой-нибудь был бы нелишним для конкретики.

Честно говоря, я не помню почти ни одной теоремы для зависимых данных :) (кроме метода $\chi^2$ для статистически слабо зависимых данных, где эту зависимость пытаются учесть корреляциями).

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group