2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 01:48 


14/08/17
19
Всем, привет!
Возможно кто-то подскажет, как правильно решать подобные задачи

Стоимость покупок в интернет магазине представлена набором
$x_{1}, ..., x_{n}$
Не имея содержательной гипотезы о характере распределения стоимости покупок, предполагается, что эта выборка получена в последовательности независимых испытаний при неизменном распределении вероятностей с постоянной плотностью
$p(x)= \frac{ 1 }{ a }$ на отрезке $[M-\frac{ a }{ 2 }, M+\frac{ a }{ 2 }]$

Методом максимального правдоподобия оценить значения параметров M и a

Решение:
Запишем плотность в следующем виде

$$p(x)=\begin{cases} 
& \text{ } \frac{ 1 }{ a }, M-\frac{ a }{ 2 } \leq x_{i} \leq M+\frac{ a }{ 2 }, i=\overline{1,n}  \\  
& \text{ } 0, x \notin [M-\frac{ a }{ 2 }, M+\frac{ a }{ 2 }]  \end{cases}$$

$$p(x)=\begin{cases} 
& \text{ } \frac{ 1 }{ a }, M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }  \\  
& \text{ } 0, x \notin [M-\frac{ a }{ 2 }, M+\frac{ a }{ 2 }]  \end{cases}$$


Запишем функцию правдоподобия
$L(x,a,M)=\prod\limits_{i=1}^{n}p(x_{i})=\frac{ 1 }{ a^{n} }_{[M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }]}$

Зафиксируем a
$L(x,a,M) \to max$
Запишем неравенство в другой форме
$M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }$
* $M-\frac{ a }{ 2 } \leq x_{1} \Rightarrow M \leq x_{1}+\frac{ a }{ 2 }$
* $x_{n} \leq M+\frac{ a }{ 2 } \Rightarrow M \geq x_{n}-\frac{ a }{ 2 }$
* $x_{n}-\frac{ a }{ 2 } \leq M \leq x_{1}+\frac{ a }{ 2 }$
при $M \leq x_{1}+\frac{ a }{ 2 };$ $\frac{ 1 }{ a^{n} } \to max$ $\Rightarrow \widehat{M}= x_{1}+\frac{ a }{ 2 }$

Зафиксируем M (тут ничего хорошего не получилось)
$L(x,a,M) \to max$
Запишем неравенство в другой форме
$M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }$
* $M-\frac{ a }{ 2 } \leq x_{1} \Rightarrow a \geq 2(M-x_{1} )$
* $x_{n} \leq M+\frac{ a }{ 2 } \Rightarrow a \geq 2(x_{n}-M )$

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 01:54 
Заслуженный участник
Аватара пользователя


16/07/14
8503
Цюрих
kps в сообщении #1241841 писал(а):
при $M \leq x_{1}+\frac{ a }{ 2 };$ $\frac{ 1 }{ a^{n} } \to \max$ $\Rightarrow \widehat{M}= x_{1}+\frac{ a }{ 2 }$
Что такое $\widehat{M}$? И как вообще получен такой переход?

На самом деле функция правдоподобия разбивается в произведение двух, одна из которых не зависит от $M$, а другая принимает только значения $0, 1$. Что с этим можно сделать дальше?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 02:28 
Заслуженный участник
Аватара пользователя


23/11/06
4171
kps в сообщении #1241841 писал(а):
Запишем функцию правдоподобия
$L(x,a,M)=\prod\limits_{i=1}^{n}p(x_{i})=\frac{ 1 }{ a^{n} }_{[M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }]}$

Во-первых, порядковые статистики обозначаются иначе, чем элементы выборки. Например, так: $x_{(1)}$ и $x_{(n)}$. Функция правдоподобия есть
$$L(x,a,M)=\prod\limits_{i=1}^{n}p(x_{i})=\frac{ 1 }{ a^{n} }I\left[M-\frac{ a }{ 2 } \leq x_{(1)} \leq x_{(n)} \leq M+\frac{ a }{ 2 }\right].$$
Или, если выразить $a$ через $M$,
kps в сообщении #1241841 писал(а):
* $M-\frac{ a }{ 2 } \leq x_{1} \Rightarrow a \geq 2(M-x_{1} )$
* $x_{n} \leq M+\frac{ a }{ 2 } \Rightarrow a \geq 2(x_{n}-M )$


$$L(x,a,M)=\frac{1}{a^{n}}I\bigl[a\geq 2\max (M-x_{(1)}, x_{(n)} - M)\bigr].$$
Функция правдоподобия максимальна при минимальном возможном значении $a\geq 2\max (M-x_{(1)}, x_{(n)} - M)$. Такое минимальное значение $a$ можно получить, если взять крайнее $a$ из этой области, и к тому же уменьшить насколько удастся максимум в правой части. Уменьшить его можно, если взять $M$ посредине между $x_{(1)}$ и $x_{(n)}$.

Итого,
$$ \hat{M} = \frac{x_{(1)}+x_{(n)}}{2}, \quad \hat{a} = 2\max (\hat{M}-x_{(1)}, x_{(n)} - \hat{M}) = x_{(n)}-x_{(1)}.$$

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 12:05 


14/08/17
19
--mS-- в сообщении #1241844 писал(а):
Итого,
$$ \hat{M} = \frac{x_{(1)}+x_{(n)}}{2}, \quad \hat{a} = 2\max (\hat{M}-x_{(1)}, x_{(n)} - \hat{M}) = x_{(n)}-x_{(1)}.$$


Если использовать ранее полученное мною
$\widehat{M}= x_{(1)}+\frac{ a }{ 2 }$
получется тот же ответ:
* $a \geq 2(M-x_{(1)} ) \Rightarrow \hat{a} \geq 2(\hat{M} - x_{(1)}) = a$
* $a \geq 2(x_{(n)} - M ) \Rightarrow \hat{a} \geq 2(x_{(n)} - \hat{M}) = x_{(n)} - x_{(1)} $

--mS-- в сообщении #1241844 писал(а):
Такое минимальное значение $a$ можно получить, если взять крайнее $a$ из этой области, и к тому же уменьшить насколько удастся максимум в правой части.


если честно, то такие преобразования мне не очень понятны

Может есть более структурированный спосом решить эту задачу?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 13:25 


20/09/05
85
kps в сообщении #1241896 писал(а):
Может есть более структурированный способ решить эту задачу?

Ну это кому как. По мне, так нету. Ваше нагромождение неравенств на решение не тянет, как и ответ - на ответ. Согласитесь, никак не возможно считать оценкой параметра его выражение через другой, неизвестный параметр. Как тут
kps в сообщении #1241896 писал(а):
$\widehat{M}= x_{(1)}+\frac{ a }{ 2 }$
Можно согласиться с натяжкой, что для оценок выполнены все эти неравенства, но почему максимум функция правдоподобия имеет именно в найденной точке (функция двух переменных), не обосновано.

Кроме того, вы допускаете ошибку, ища максимум по каждой переменной при фиксированном значении другой: результат не обязан совпадать с точкой максимума по совокупности переменных.

А что именно вам непонятно?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение22.08.2017, 18:01 


14/08/17
19
Первое:
--mS-- в сообщении #1241844 писал(а):
порядковые статистики обозначаются иначе, чем элементы выборки. Например, так: $x_{(1)}$ и $x_{(n)}$

Насколько я понимаю, такое обозначение используется при составлении вариационного ряда. Т.е. мы из обычного набора $x_{i}$ составляем вариационный ряд $x_{(i)}$. И дальше работаем с вариационным рядом?

Второе:
--mS-- в сообщении #1241844 писал(а):
Функция правдоподобия максимальна при минимальном возможном значении $a\geq 2\max (M-x_{(1)}, x_{(n)} - M)$. Такое минимальное значение $a$ можно получить, если взять крайнее $a$ из этой области, и к тому же уменьшить насколько удастся максимум в правой части. Уменьшить его можно, если взять $M$ посредине между $x_{(1)}$ и $x_{(n)}$.
Итого,
$$ \hat{M} = \frac{x_{(1)}+x_{(n)}}{2}, \quad \hat{a} = 2\max (\hat{M}-x_{(1)}, x_{(n)} - \hat{M}) = x_{(n)}-x_{(1)}.$$


Как мы пришли к тому, что среднее значение между суммой $x_{(1)}$ и $x_{(n)}$ дало нам оценку по $\hat{M}$?
Как можно проверить, действительно ли при найденных $\hat{M}$ и $\hat{a}$ наша функция правдоподобия будет максимальна?
(Из того, что я знаю по теории)
Оценка ММП должна быть асимптотически несмещенная, а значит
$E(\hat{M}) \to \hat{M}\Rightarrow$
Проверяем $\hat{M}$:
$E(\hat{M}) = \frac{\sum\limits_{i=1}^{n} (\frac{x_{(1)}+x_{(n)}}{2})}{n} = \frac{x_{(1)}+x_{(n)}}{2n} \ne \hat{M} $
Значит оценка по $\hat{M}$ - смещенная
Проверяем $\hat{a}$
$E(\hat{a}) = \frac{\sum\limits_{i=1}^{n} (x_{(1)}+x_{(n)})}{n} = \frac{x_{(1)}+x_{(n)}}{n} \ne \hat{a} $
Значит оценка по $\hat{a}$ - тоже смещенная

Мое нагромождение неравенств тоже мне не нравится. А пришел я к нему основываясь примером 10 из http://www.nsu.ru/mmf/tvims/chernova/ms/lec/node14.html
но тут всего один неизвестный параметр.

Может есть более логичный способ решения, какой-то структурированный алгоритм, которым можно решить подобные задачи?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение22.08.2017, 21:01 


20/09/05
85
kps в сообщении #1242405 писал(а):
Насколько я понимаю, такое обозначение используется при составлении вариационного ряда. Т.е. мы из обычного набора $x_{i}$ составляем вариационный ряд $x_{(i)}$. И дальше работаем с вариационным рядом?

Да.
Насколько я понимаю, --mS-- приписывает вам то, о чем вы даже не подозревали. Вера в человечество.
kps в сообщении #1242405 писал(а):
Как можно проверить, действительно ли при найденных $\hat{M}$ и $\hat{a}$ наша функция правдоподобия будет максимальна?

Матанализ никто не отменял. Проверив, что при остальных значениях параметра эта функция меньше, и другими рассуждениями, которым учат на первом курсе.
kps в сообщении #1242405 писал(а):
Как мы пришли к тому, что среднее значение между суммой $x_{(1)}$ и $x_{(n)}$ дало нам оценку по $\hat{M}$?

--mS-- в сообщении #1241844 писал(а):
$a\geq 2\max (M-x_{(1)}, x_{(n)} - M)$

Функция $L=\frac 1{a^n}$ убывает при росте $a$, поэтому в нашем случае она будет иметь максимальное значение при минимальном значении $a$ из области изменения аргумента $(a,M), \ a>0$. Постройте множество $a\ge 2\max (M-x_{(1)}, x_{(n)} - M)>0$ в плокости $(a,M)$, не забывая об ограничении на параметры. В частности, что $a$ строго положительна. И посмотрите, в какой точке $a$ имеет минимальное значение. Это и будет точка максимума. По обеим переменным, обратите внимание.
Можно и так.
Ввиду специфичности функции, этот способ не хуже и не лучше того, что был раньше.
kps в сообщении #1242405 писал(а):
А пришел я к нему основываясь примером 10 из http://www.nsu.ru/mmf/tvims/chernova/ms/lec/node14.html
но тут всего один неизвестный параметр.

Вы не в тему озаботились этим примером. Он не для этого, положите его на место. Там совершенно ясно написано, что именно он призван иллюстрировать: что делать, когда вдруг функция правдоподобия оказывается постоянной. У вас - не так.

Это:
kps в сообщении #1242405 писал(а):
Оценка ММП должна быть асимптотически несмещенная, а значит
$E(\hat{M}) \to \hat{M}\Rightarrow$
Проверяем $\hat{M}$:
$E(\hat{M}) = \frac{\sum\limits_{i=1}^{n} (\frac{x_{(1)}+x_{(n)}}{2})}{n} = \frac{x_{(1)}+x_{(n)}}{2n} \ne \hat{M} $
Значит оценка по $\hat{M}$ - смещенная
Проверяем $\hat{a}$
$E(\hat{a}) = \frac{\sum\limits_{i=1}^{n} (x_{(1)}+x_{(n)})}{n} = \frac{x_{(1)}+x_{(n)}}{n} \ne \hat{a} $
Значит оценка по $\hat{a}$ - тоже смещенная

тоже, во-первых, неуместно (зачем вам несмещенность?), а во-вторых - очень неграмотно.

(Оффтоп)

Это народу мало, побили бы вас за такое, на самом деле. :)

Оценки - не выборки, что там за подобие выборочных средних нарисовалось в виде сумм? Да, и суммы тоже небрежно посчитаны. На всякий случай, матожидание - тоже не выборочное среднее.

kps в сообщении #1242405 писал(а):
Может есть более логичный способ решения, какой-то структурированный алгоритм, которым можно решить подобные задачи?

Есть, уже два. Если вы чего-то не поняли, это не обязательно дефект решения/изложения. Думайте, читайте, задавайте вопросы, если останутся по размышлении. Но конечно, лучший способ понять - додуматься самому.

В общем, если нужно еще и еще более структурированный алгоритм - то следующий вы рассказываете.

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение23.08.2017, 22:29 


14/08/17
19
Во-первых:
NDP в сообщении #1242437 писал(а):
Насколько я понимаю, --mS-- приписывает вам то, о чем вы даже не подозревали. Вера в человечество.

NDP в сообщении #1242437 писал(а):
Это народу мало, побили бы вас за такое, на самом деле. :)

Язвить и грубить необходимости никакой нет. Если цель самоутверждение, лучше вообще не пишите.

Я пришел на форум, что бы разобраться с методикой решения задач и подтянуть то, что давно забыл. Матанализ я проходил 11 лет назад и увы в памяти мало что осталось.
Для меня очень ценно:
* любое указание на ошибку в решении или рассуждении
* любая рекомендация на конкретную тему, которую требуется разобрать или изучить
* любое доходчивое обьяснение темы или части решения
За что всем большое спасибо! Задачу считаю решенной

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: lantza


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group