Здравствуйте, уважаемые форумчане! Прошу помощи, с заданием!
Задание: Необходимо провести моделирование трех выборок (наблюдения, оценки матожидания и оценки медианы) для нормального распределения, для распределения Коши, для распределения нормального с специальным "загрязнением", чтобы убедиться в робастности ЭФР. Чтобы не загромождать сообщение картинками и числами, прикрепляю файл .xls с проведенным моделированием, и построенными ЭФР (эмпирическая функция распределения):
- для нормального распределения {Лист 2} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
- для распределения Коши {Лист 3} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
- для нормального распределения с "загрязнением" {Лист 4} (наблюдаемые значения - столбец A, оценки матожидания - столбец B, оценки медиан распределения - столбец C)
Для построения ЭФР использовалась гистограмма, выбирался карман, исходя из диапазона значений наблюдения, оцениваемое значение, относительного которого группируются наблюдения и соответсвенно оценки (статистики) равно 17.
Вот на основе этих данных, в каждом случае как понять, какая из оценок является наиболее эффективной, в последнем случае почему и насколько объективно утверждение что ЭФР, которые получают методом бутстрепа, робастны?
По частотам попаданий, например для нормального распределения можно сказать, что среднее и медиана являются эффективными оценками, в случае с распределением Коши, возможно лучшей оценкой является медиана, потому что для такого распределения рассчитать оценку матожидания в принципе невозможно, так что использовать такую статистику не получится. В случае исследования на робастность здесь я не могу сказать какая оценка наиболее эффективна. Как грамотно обосновать мои доводы! Буду благодарен за любую оказанную помощь!
https://drive.google.com/file/d/16yNbv4 ... sp=sharing: ссылка на файл с результатами моделирования и построенными ЭФР, методом бутстрепа!