2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Оценка эмпирической функции распределения
Сообщение01.11.2020, 10:11 


17/03/20
183
Здравствуйте, уважаемые форумчане! Прошу помощи, с заданием!
Задание: Необходимо провести моделирование трех выборок (наблюдения, оценки матожидания и оценки медианы) для нормального распределения, для распределения Коши, для распределения нормального с специальным "загрязнением", чтобы убедиться в робастности ЭФР. Чтобы не загромождать сообщение картинками и числами, прикрепляю файл .xls с проведенным моделированием, и построенными ЭФР (эмпирическая функция распределения):

  • для нормального распределения {Лист 2} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
  • для распределения Коши {Лист 3} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
  • для нормального распределения с "загрязнением" {Лист 4} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)

Для построения ЭФР использовалась гистограмма, выбирался карман, исходя из диапазона значений наблюдения, оцениваемое значение, относительного которого группируются наблюдения и соответсвенно оценки (статистики) равно 17.

Вот на основе этих данных, в каждом случае как понять, какая из оценок является наиболее эффективной, в последнем случае почему и насколько объективно утверждение что ЭФР, которые получают методом бутстрепа, робастны?

По частотам попаданий, например для нормального распределения можно сказать, что среднее и медиана являются эффективными оценками, в случае с распределением Коши, возможно лучшей оценкой является медиана, потому что для такого распределения рассчитать оценку матожидания в принципе невозможно, так что использовать такую статистику не получится. В случае исследования на робастность здесь я не могу сказать какая оценка наиболее эффективна. Как грамотно обосновать мои доводы! Буду благодарен за любую оказанную помощь!

https://drive.google.com/file/d/16yNbv4 ... sp=sharing: ссылка на файл с результатами моделирования и построенными ЭФР, методом бутстрепа!

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:11 


23/12/07
1763
Alm99
Вы бы переформулировали четче задание, потому как совсем непонятно, что вам нужно. Обычно есть выборка, и по ней требуется оценить некоторые характеристики исходного неизвестного распределения вероятностей случайной величины (значения которой и составляют выборку).
В вашем варианте, судя по всему, выборка есть (соответственно, ее не нужно моделировать). И похоже, вам нужно выбрать "робастную" (кстати, термин обычно довольно расплывчатый) оценку для какой-то характеристики. Только вот что за характеристика, и какие оценки вы рассматриваете - остается неясным.

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:18 


17/03/20
183
_hum_
Так я понял ошибку, сейчас уточню: на листе 2 и 3 есть ЭФР для самих наблюдений, а также для оценок среднего и медиан. Вот как можно по графику более грамотно сказать, что медиана оказывается более эффективной оценкой? А в случае с листом 4, как правильно обосновать, что медиана в данном случае является оценкой, которая нечувствительна к выбросам?

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:26 


23/12/07
1763
Alm99 в сообщении #1490511 писал(а):
Вот как можно по графику более грамотно сказать, что медиана оказывается более эффективной оценкой?

Более эффективной оценкой чего? Какой характеристики распределения вероятностей?

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:32 


17/03/20
183
_hum_
Оценкой истинного значения медианы, т.е есть ЭФР статистик, которые являются оценкой истинного значения медианы выборки, причем как и в случае нормального распределения, распределения Коши, так и для нормального распределения, с намеренной записью в нее выбросов!

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:36 


23/12/07
1763
Alm99
хорошо бы все-таки, чтобы вы переписали первый пост по заданию полностью, потому что у вас в каждом новом посте появляются все новые и новые непонятные моменты. В последнем уже появилась ЭФР статистик, которая совсем не то же самое, что просто ЭФР по исходной выборке.

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 00:47 


17/03/20
183
_hum_
Имеется выборка, данных, есть выборка средних, полученная методом бутстрепа, генерирвлалось 20 выборок,и оценка среднего каждый раз записывалась в выборку, точно таким же образом создана выборка для медиан, полученные выборки среднего и медианы, каждая из них есть выборка статистик (оценок истинного значения среднего и медианы соответственно). Я к сожалению не знаю, как преподаватель запрогал макросы, с помощью которых и генерирвлались выборки, для построения ЭФР. Такие операции были проделаны для выборки нормально распределенной, распределенной по закону Коши, и для номально распределенной, но с намеренными выбросами. И вот по полученным ЭФР сделать выводы, для каждого распределения, какая оценка (статистика) наиболее эффективна {лист 2,3,4}!

-- 03.11.2020, 00:50 --

_hum_
Вот ссылка на методичку, на всякий случай!

https://drive.google.com/file/d/1OM60G5 ... p=drivesdk

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 02:25 


23/12/07
1763
Alm99

если вы делаете по методичке, то там же вроде бы все сказано, что считать робастными оценками:
Цитата:
Робастными называются оценки, которые не изменяются катастрофически при добавлении
в выборку хотя бы небольшого количества сильно выделяющихся наблюдений.

И там же указано, как вам это проверить:
Цитата:
1) Перенесите какую-нибудь одну выборку из нормального распределения на отдельный
рабочий лист.
2) Сгенерируйте ещё не менее 19 раз выборки. Для каждой из них выбирайте одно из
наблюдений (каждый раз с другим номером) и изменяйте его в 10 или в 100 раз. После
редактирования нажимайте кнопку «Обновить последние значения оценок».
3) Перенесите на тот же рабочий лист, что и п .1), значения выборочных средних и
медиан.
4) Постройте снова три ЭФР аналогично предыдущему разделу.
5) Сделайте выводы относительно поведения различных оценок при наличии больших
ошибок в данных.


p.s. На всякий случай, судя по вашей методичке, более "эффективными" считаются те оценки, у которых "разброс меньше".

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 08:35 


17/03/20
183
_hum_
Я так и делал, и ЭФР построил, согласно методичке, я просто хочу понять, кроме как оценить разброс данных визуально, можно ли как-то ещё логически обосновать эти доводы?

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 13:07 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
https://ru.wikipedia.org/wiki/%D0%AD%D1 ... 0%BA%D0%B0
Так что средний квадрат отклонения от истинного значения (которое "заложено" при генерации)

 Профиль  
                  
 
 Re: Оценка эмпирической функции распределения
Сообщение03.11.2020, 13:14 


23/12/07
1763
Alm99
это зависит от того, что на лекциях вам давали.
Вообще, не совсем понятно, к чему вам вообще здесь ЭФР. По идее, если у вас есть возможность получать много независимых выборок $[X]^{(k)}_n = (x^{(k)}_1, \dots, x^{(k)}_n ), k = 1,..,l$, то можно по ним строить выборку $[S]_l = (s_1, \dots, s_l )$ для любой оценки $S = S([X]_n)$. Соответственно, если вам заранее известно, что рассматриваемые оценки несмещенные, то "более хорошими в среднеквадратическом смысле" будут те, у которых меньше дисперсия (конечно, если она вообще существует). Численно эту дисперсию по выборке $[S]_l$ можно оценить с помощью известных формул для оценки выборочной дисперсии.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 11 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group