2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Оценка эмпирической функции распределения
Сообщение01.11.2020, 10:11 


17/03/20
183
Здравствуйте, уважаемые форумчане! Прошу помощи, с заданием!
Задание: Необходимо провести моделирование трех выборок (наблюдения, оценки матожидания и оценки медианы) для нормального распределения, для распределения Коши, для распределения нормального с специальным "загрязнением", чтобы убедиться в робастности ЭФР. Чтобы не загромождать сообщение картинками и числами, прикрепляю файл .xls с проведенным моделированием, и построенными ЭФР (эмпирическая функция распределения):

  • для нормального распределения {Лист 2} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
  • для распределения Коши {Лист 3} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
  • для нормального распределения с "загрязнением" {Лист 4} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)

Для построения ЭФР использовалась гистограмма, выбирался карман, исходя из диапазона значений наблюдения, оцениваемое значение, относительного которого группируются наблюдения и соответсвенно оценки (статистики) равно 17.

Вот на основе этих данных, в каждом случае как понять, какая из оценок является наиболее эффективной, в последнем случае почему и насколько объективно утверждение что ЭФР, которые получают методом бутстрепа, робастны?

По частотам попаданий, например для нормального распределения можно сказать, что среднее и медиана являются эффективными оценками, в случае с распределением Коши, возможно лучшей оценкой является медиана, потому что для такого распределения рассчитать оценку матожидания в принципе невозможно, так что использовать такую статистику не получится. В случае исследования на робастность здесь я не могу сказать какая оценка наиболее эффективна. Как грамотно обосновать мои доводы! Буду благодарен за любую оказанную помощь!

https://drive.google.com/file/d/16yNbv4 ... sp=sharing: ссылка на файл с результатами моделирования и построенными ЭФР, методом бутстрепа!

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:11 


23/12/07
1763
Alm99
Вы бы переформулировали четче задание, потому как совсем непонятно, что вам нужно. Обычно есть выборка, и по ней требуется оценить некоторые характеристики исходного неизвестного распределения вероятностей случайной величины (значения которой и составляют выборку).
В вашем варианте, судя по всему, выборка есть (соответственно, ее не нужно моделировать). И похоже, вам нужно выбрать "робастную" (кстати, термин обычно довольно расплывчатый) оценку для какой-то характеристики. Только вот что за характеристика, и какие оценки вы рассматриваете - остается неясным.

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:18 


17/03/20
183
_hum_
Так я понял ошибку, сейчас уточню: на листе 2 и 3 есть ЭФР для самих наблюдений, а также для оценок среднего и медиан. Вот как можно по графику более грамотно сказать, что медиана оказывается более эффективной оценкой? А в случае с листом 4, как правильно обосновать, что медиана в данном случае является оценкой, которая нечувствительна к выбросам?

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:26 


23/12/07
1763
Alm99 в сообщении #1490511 писал(а):
Вот как можно по графику более грамотно сказать, что медиана оказывается более эффективной оценкой?

Более эффективной оценкой чего? Какой характеристики распределения вероятностей?

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:32 


17/03/20
183
_hum_
Оценкой истинного значения медианы, т.е есть ЭФР статистик, которые являются оценкой истинного значения медианы выборки, причем как и в случае нормального распределения, распределения Коши, так и для нормального распределения, с намеренной записью в нее выбросов!

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:36 


23/12/07
1763
Alm99
хорошо бы все-таки, чтобы вы переписали первый пост по заданию полностью, потому что у вас в каждом новом посте появляются все новые и новые непонятные моменты. В последнем уже появилась ЭФР статистик, которая совсем не то же самое, что просто ЭФР по исходной выборке.

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:47 


17/03/20
183
_hum_
Имеется выборка, данных, есть выборка средних, полученная методом бутстрепа, генерирвлалось 20 выборок,и оценка среднего каждый раз записывалась в выборку, точно таким же образом создана выборка для медиан, полученные выборки среднего и медианы, каждая из них есть выборка статистик (оценок истинного значения среднего и медианы соответственно). Я к сожалению не знаю, как преподаватель запрогал макросы, с помощью которых и генерирвлались выборки, для построения ЭФР. Такие операции были проделаны для выборки нормально распределенной, распределенной по закону Коши, и для номально распределенной, но с намеренными выбросами. И вот по полученным ЭФР сделать выводы, для каждого распределения, какая оценка (статистика) наиболее эффективна {лист 2,3,4}!

-- 03.11.2020, 00:50 --

_hum_
Вот ссылка на методичку, на всякий случай!

https://drive.google.com/file/d/1OM60G5 ... p=drivesdk

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 02:25 


23/12/07
1763
Alm99

если вы делаете по методичке, то там же вроде бы все сказано, что считать робастными оценками:
Цитата:
Робастными называются оценки, которые не изменяются катастрофически при добавлении
в выборку хотя бы небольшого количества сильно выделяющихся наблюдений.

И там же указано, как вам это проверить:
Цитата:
1) Перенесите какую-нибудь одну выборку из нормального распределения на отдельный
рабочий лист.
2) Сгенерируйте ещё не менее 19 раз выборки. Для каждой из них выбирайте одно из
наблюдений (каждый раз с другим номером) и изменяйте его в 10 или в 100 раз. После
редактирования нажимайте кнопку «Обновить последние значения оценок».
3) Перенесите на тот же рабочий лист, что и п .1), значения выборочных средних и
медиан.
4) Постройте снова три ЭФР аналогично предыдущему разделу.
5) Сделайте выводы относительно поведения различных оценок при наличии больших
ошибок в данных.


p.s. На всякий случай, судя по вашей методичке, более "эффективными" считаются те оценки, у которых "разброс меньше".

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 08:35 


17/03/20
183
_hum_
Я так и делал, и ЭФР построил, согласно методичке, я просто хочу понять, кроме как оценить разброс данных визуально, можно ли как-то ещё логически обосновать эти доводы?

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 13:07 
Заслуженный участник
Аватара пользователя


11/03/08
10041
Москва
https://ru.wikipedia.org/wiki/%D0%AD%D1 ... 0%BA%D0%B0
Так что средний квадрат отклонения от истинного значения (которое "заложено" при генерации)

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 13:14 


23/12/07
1763
Alm99
это зависит от того, что на лекциях вам давали.
Вообще, не совсем понятно, к чему вам вообще здесь ЭФР. По идее, если у вас есть возможность получать много независимых выборок $[X]^{(k)}_n = (x^{(k)}_1, \dots, x^{(k)}_n ), k = 1,..,l$, то можно по ним строить выборку $[S]_l = (s_1, \dots, s_l )$ для любой оценки $S = S([X]_n)$. Соответственно, если вам заранее известно, что рассматриваемые оценки несмещенные, то "более хорошими в среднеквадратическом смысле" будут те, у которых меньше дисперсия (конечно, если она вообще существует). Численно эту дисперсию по выборке $[S]_l$ можно оценить с помощью известных формул для оценки выборочной дисперсии.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 11 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: katzenelenbogen


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group