2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 01:48 


14/08/17
19
Всем, привет!
Возможно кто-то подскажет, как правильно решать подобные задачи

Стоимость покупок в интернет магазине представлена набором
$x_{1}, ..., x_{n}$
Не имея содержательной гипотезы о характере распределения стоимости покупок, предполагается, что эта выборка получена в последовательности независимых испытаний при неизменном распределении вероятностей с постоянной плотностью
$p(x)= \frac{ 1 }{ a }$ на отрезке $[M-\frac{ a }{ 2 }, M+\frac{ a }{ 2 }]$

Методом максимального правдоподобия оценить значения параметров M и a

Решение:
Запишем плотность в следующем виде

$$p(x)=\begin{cases} 
& \text{ } \frac{ 1 }{ a }, M-\frac{ a }{ 2 } \leq x_{i} \leq M+\frac{ a }{ 2 }, i=\overline{1,n}  \\  
& \text{ } 0, x \notin [M-\frac{ a }{ 2 }, M+\frac{ a }{ 2 }]  \end{cases}$$

$$p(x)=\begin{cases} 
& \text{ } \frac{ 1 }{ a }, M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }  \\  
& \text{ } 0, x \notin [M-\frac{ a }{ 2 }, M+\frac{ a }{ 2 }]  \end{cases}$$


Запишем функцию правдоподобия
$L(x,a,M)=\prod\limits_{i=1}^{n}p(x_{i})=\frac{ 1 }{ a^{n} }_{[M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }]}$

Зафиксируем a
$L(x,a,M) \to max$
Запишем неравенство в другой форме
$M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }$
* $M-\frac{ a }{ 2 } \leq x_{1} \Rightarrow M \leq x_{1}+\frac{ a }{ 2 }$
* $x_{n} \leq M+\frac{ a }{ 2 } \Rightarrow M \geq x_{n}-\frac{ a }{ 2 }$
* $x_{n}-\frac{ a }{ 2 } \leq M \leq x_{1}+\frac{ a }{ 2 }$
при $M \leq x_{1}+\frac{ a }{ 2 };$ $\frac{ 1 }{ a^{n} } \to max$ $\Rightarrow \widehat{M}= x_{1}+\frac{ a }{ 2 }$

Зафиксируем M (тут ничего хорошего не получилось)
$L(x,a,M) \to max$
Запишем неравенство в другой форме
$M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }$
* $M-\frac{ a }{ 2 } \leq x_{1} \Rightarrow a \geq 2(M-x_{1} )$
* $x_{n} \leq M+\frac{ a }{ 2 } \Rightarrow a \geq 2(x_{n}-M )$

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 01:54 
Заслуженный участник
Аватара пользователя


16/07/14
9264
Цюрих
kps в сообщении #1241841 писал(а):
при $M \leq x_{1}+\frac{ a }{ 2 };$ $\frac{ 1 }{ a^{n} } \to \max$ $\Rightarrow \widehat{M}= x_{1}+\frac{ a }{ 2 }$
Что такое $\widehat{M}$? И как вообще получен такой переход?

На самом деле функция правдоподобия разбивается в произведение двух, одна из которых не зависит от $M$, а другая принимает только значения $0, 1$. Что с этим можно сделать дальше?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 02:28 
Заслуженный участник
Аватара пользователя


23/11/06
4171
kps в сообщении #1241841 писал(а):
Запишем функцию правдоподобия
$L(x,a,M)=\prod\limits_{i=1}^{n}p(x_{i})=\frac{ 1 }{ a^{n} }_{[M-\frac{ a }{ 2 } \leq x_{1} \leq x_{n} \leq M+\frac{ a }{ 2 }]}$

Во-первых, порядковые статистики обозначаются иначе, чем элементы выборки. Например, так: $x_{(1)}$ и $x_{(n)}$. Функция правдоподобия есть
$$L(x,a,M)=\prod\limits_{i=1}^{n}p(x_{i})=\frac{ 1 }{ a^{n} }I\left[M-\frac{ a }{ 2 } \leq x_{(1)} \leq x_{(n)} \leq M+\frac{ a }{ 2 }\right].$$
Или, если выразить $a$ через $M$,
kps в сообщении #1241841 писал(а):
* $M-\frac{ a }{ 2 } \leq x_{1} \Rightarrow a \geq 2(M-x_{1} )$
* $x_{n} \leq M+\frac{ a }{ 2 } \Rightarrow a \geq 2(x_{n}-M )$


$$L(x,a,M)=\frac{1}{a^{n}}I\bigl[a\geq 2\max (M-x_{(1)}, x_{(n)} - M)\bigr].$$
Функция правдоподобия максимальна при минимальном возможном значении $a\geq 2\max (M-x_{(1)}, x_{(n)} - M)$. Такое минимальное значение $a$ можно получить, если взять крайнее $a$ из этой области, и к тому же уменьшить насколько удастся максимум в правой части. Уменьшить его можно, если взять $M$ посредине между $x_{(1)}$ и $x_{(n)}$.

Итого,
$$ \hat{M} = \frac{x_{(1)}+x_{(n)}}{2}, \quad \hat{a} = 2\max (\hat{M}-x_{(1)}, x_{(n)} - \hat{M}) = x_{(n)}-x_{(1)}.$$

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 12:05 


14/08/17
19
--mS-- в сообщении #1241844 писал(а):
Итого,
$$ \hat{M} = \frac{x_{(1)}+x_{(n)}}{2}, \quad \hat{a} = 2\max (\hat{M}-x_{(1)}, x_{(n)} - \hat{M}) = x_{(n)}-x_{(1)}.$$


Если использовать ранее полученное мною
$\widehat{M}= x_{(1)}+\frac{ a }{ 2 }$
получется тот же ответ:
* $a \geq 2(M-x_{(1)} ) \Rightarrow \hat{a} \geq 2(\hat{M} - x_{(1)}) = a$
* $a \geq 2(x_{(n)} - M ) \Rightarrow \hat{a} \geq 2(x_{(n)} - \hat{M}) = x_{(n)} - x_{(1)} $

--mS-- в сообщении #1241844 писал(а):
Такое минимальное значение $a$ можно получить, если взять крайнее $a$ из этой области, и к тому же уменьшить насколько удастся максимум в правой части.


если честно, то такие преобразования мне не очень понятны

Может есть более структурированный спосом решить эту задачу?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение20.08.2017, 13:25 


20/09/05
85
kps в сообщении #1241896 писал(а):
Может есть более структурированный способ решить эту задачу?

Ну это кому как. По мне, так нету. Ваше нагромождение неравенств на решение не тянет, как и ответ - на ответ. Согласитесь, никак не возможно считать оценкой параметра его выражение через другой, неизвестный параметр. Как тут
kps в сообщении #1241896 писал(а):
$\widehat{M}= x_{(1)}+\frac{ a }{ 2 }$
Можно согласиться с натяжкой, что для оценок выполнены все эти неравенства, но почему максимум функция правдоподобия имеет именно в найденной точке (функция двух переменных), не обосновано.

Кроме того, вы допускаете ошибку, ища максимум по каждой переменной при фиксированном значении другой: результат не обязан совпадать с точкой максимума по совокупности переменных.

А что именно вам непонятно?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение22.08.2017, 18:01 


14/08/17
19
Первое:
--mS-- в сообщении #1241844 писал(а):
порядковые статистики обозначаются иначе, чем элементы выборки. Например, так: $x_{(1)}$ и $x_{(n)}$

Насколько я понимаю, такое обозначение используется при составлении вариационного ряда. Т.е. мы из обычного набора $x_{i}$ составляем вариационный ряд $x_{(i)}$. И дальше работаем с вариационным рядом?

Второе:
--mS-- в сообщении #1241844 писал(а):
Функция правдоподобия максимальна при минимальном возможном значении $a\geq 2\max (M-x_{(1)}, x_{(n)} - M)$. Такое минимальное значение $a$ можно получить, если взять крайнее $a$ из этой области, и к тому же уменьшить насколько удастся максимум в правой части. Уменьшить его можно, если взять $M$ посредине между $x_{(1)}$ и $x_{(n)}$.
Итого,
$$ \hat{M} = \frac{x_{(1)}+x_{(n)}}{2}, \quad \hat{a} = 2\max (\hat{M}-x_{(1)}, x_{(n)} - \hat{M}) = x_{(n)}-x_{(1)}.$$


Как мы пришли к тому, что среднее значение между суммой $x_{(1)}$ и $x_{(n)}$ дало нам оценку по $\hat{M}$?
Как можно проверить, действительно ли при найденных $\hat{M}$ и $\hat{a}$ наша функция правдоподобия будет максимальна?
(Из того, что я знаю по теории)
Оценка ММП должна быть асимптотически несмещенная, а значит
$E(\hat{M}) \to \hat{M}\Rightarrow$
Проверяем $\hat{M}$:
$E(\hat{M}) = \frac{\sum\limits_{i=1}^{n} (\frac{x_{(1)}+x_{(n)}}{2})}{n} = \frac{x_{(1)}+x_{(n)}}{2n} \ne \hat{M} $
Значит оценка по $\hat{M}$ - смещенная
Проверяем $\hat{a}$
$E(\hat{a}) = \frac{\sum\limits_{i=1}^{n} (x_{(1)}+x_{(n)})}{n} = \frac{x_{(1)}+x_{(n)}}{n} \ne \hat{a} $
Значит оценка по $\hat{a}$ - тоже смещенная

Мое нагромождение неравенств тоже мне не нравится. А пришел я к нему основываясь примером 10 из http://www.nsu.ru/mmf/tvims/chernova/ms/lec/node14.html
но тут всего один неизвестный параметр.

Может есть более логичный способ решения, какой-то структурированный алгоритм, которым можно решить подобные задачи?

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение22.08.2017, 21:01 


20/09/05
85
kps в сообщении #1242405 писал(а):
Насколько я понимаю, такое обозначение используется при составлении вариационного ряда. Т.е. мы из обычного набора $x_{i}$ составляем вариационный ряд $x_{(i)}$. И дальше работаем с вариационным рядом?

Да.
Насколько я понимаю, --mS-- приписывает вам то, о чем вы даже не подозревали. Вера в человечество.
kps в сообщении #1242405 писал(а):
Как можно проверить, действительно ли при найденных $\hat{M}$ и $\hat{a}$ наша функция правдоподобия будет максимальна?

Матанализ никто не отменял. Проверив, что при остальных значениях параметра эта функция меньше, и другими рассуждениями, которым учат на первом курсе.
kps в сообщении #1242405 писал(а):
Как мы пришли к тому, что среднее значение между суммой $x_{(1)}$ и $x_{(n)}$ дало нам оценку по $\hat{M}$?

--mS-- в сообщении #1241844 писал(а):
$a\geq 2\max (M-x_{(1)}, x_{(n)} - M)$

Функция $L=\frac 1{a^n}$ убывает при росте $a$, поэтому в нашем случае она будет иметь максимальное значение при минимальном значении $a$ из области изменения аргумента $(a,M), \ a>0$. Постройте множество $a\ge 2\max (M-x_{(1)}, x_{(n)} - M)>0$ в плокости $(a,M)$, не забывая об ограничении на параметры. В частности, что $a$ строго положительна. И посмотрите, в какой точке $a$ имеет минимальное значение. Это и будет точка максимума. По обеим переменным, обратите внимание.
Можно и так.
Ввиду специфичности функции, этот способ не хуже и не лучше того, что был раньше.
kps в сообщении #1242405 писал(а):
А пришел я к нему основываясь примером 10 из http://www.nsu.ru/mmf/tvims/chernova/ms/lec/node14.html
но тут всего один неизвестный параметр.

Вы не в тему озаботились этим примером. Он не для этого, положите его на место. Там совершенно ясно написано, что именно он призван иллюстрировать: что делать, когда вдруг функция правдоподобия оказывается постоянной. У вас - не так.

Это:
kps в сообщении #1242405 писал(а):
Оценка ММП должна быть асимптотически несмещенная, а значит
$E(\hat{M}) \to \hat{M}\Rightarrow$
Проверяем $\hat{M}$:
$E(\hat{M}) = \frac{\sum\limits_{i=1}^{n} (\frac{x_{(1)}+x_{(n)}}{2})}{n} = \frac{x_{(1)}+x_{(n)}}{2n} \ne \hat{M} $
Значит оценка по $\hat{M}$ - смещенная
Проверяем $\hat{a}$
$E(\hat{a}) = \frac{\sum\limits_{i=1}^{n} (x_{(1)}+x_{(n)})}{n} = \frac{x_{(1)}+x_{(n)}}{n} \ne \hat{a} $
Значит оценка по $\hat{a}$ - тоже смещенная

тоже, во-первых, неуместно (зачем вам несмещенность?), а во-вторых - очень неграмотно.

(Оффтоп)

Это народу мало, побили бы вас за такое, на самом деле. :)

Оценки - не выборки, что там за подобие выборочных средних нарисовалось в виде сумм? Да, и суммы тоже небрежно посчитаны. На всякий случай, матожидание - тоже не выборочное среднее.

kps в сообщении #1242405 писал(а):
Может есть более логичный способ решения, какой-то структурированный алгоритм, которым можно решить подобные задачи?

Есть, уже два. Если вы чего-то не поняли, это не обязательно дефект решения/изложения. Думайте, читайте, задавайте вопросы, если останутся по размышлении. Но конечно, лучший способ понять - додуматься самому.

В общем, если нужно еще и еще более структурированный алгоритм - то следующий вы рассказываете.

 Профиль  
                  
 
 Re: ММП оценить значение параметров на отрезке
Сообщение23.08.2017, 22:29 


14/08/17
19
Во-первых:
NDP в сообщении #1242437 писал(а):
Насколько я понимаю, --mS-- приписывает вам то, о чем вы даже не подозревали. Вера в человечество.

NDP в сообщении #1242437 писал(а):
Это народу мало, побили бы вас за такое, на самом деле. :)

Язвить и грубить необходимости никакой нет. Если цель самоутверждение, лучше вообще не пишите.

Я пришел на форум, что бы разобраться с методикой решения задач и подтянуть то, что давно забыл. Матанализ я проходил 11 лет назад и увы в памяти мало что осталось.
Для меня очень ценно:
* любое указание на ошибку в решении или рассуждении
* любая рекомендация на конкретную тему, которую требуется разобрать или изучить
* любое доходчивое обьяснение темы или части решения
За что всем большое спасибо! Задачу считаю решенной

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group