Когда мы указываем "интервал, в который попадает оцениваемая величина с заданной надежностью" почему это не равно тому, что мы построили "интервал, в который попадает оцениваемая величина с заданной вероятностью"?
Stan2023Доверительная вероятность (вероятность попадания оцениваемого параметра, например, в доверительный интервал) и надежность - это синонимы.
Когда избегают говорить про доверительную вероятность? Например, когда вы получили оценку границ доверительного интервала по одной реализации. То есть конкретный интервал вещественной прямой. Тут возможна путаница, на которую указал ваш источник: а ведь наш, хоть и неизвестный параметр, он либо заведомо в этом интервале, либо заведомо нет. Иначе: интервал либо накроет истинное значение параметра, либо не накроет. Однозначно. И вероятность в одном случае 1, в другом 0.
Когда речь идет о достаточно большом наборе из выборок или еще проще, об оцениваемой случайной величине (параметре) - эта оговорка снимается за ненадобностью.
На практике это вырождается вот во что:
совершенно нормально написать в качестве надежности
(не буду расшифровывать, кто есть кто), но как видим, надежность это таки вероятность. И совершенно
ненормально - подсчитать по этой формуле и данной выборке все значения и написать при
с вероятностью
. Просто потому, что неизвестное
либо содержится в этом интервале (и тогда вероятность 1), либо нет. И тогда вероятность 0. Как бы то ни было, к вероятности попадания истинного значения в интервал это не имеет никакого значения, слишком мало реализаций состоялось, чтобы о чем-то судить.
Что из этого следует. Не надо в ответах к таким задачам писать букву
. Просто указывать интервал.
В качестве дополнения.
тут есть два момента. Во-первых, осознайте, что математическое ожидание случайной величины может даже и близко не лежать к тем значениям, которые она может принимать. И второе: 95%-ный доверительный интервал означает следующее. Вы - исследователь, который получил рабочую (случайную) выборку и построил по ней некоторый доверительный интервал для оценки некоторой характеристики генеральной совокупности. Эта оценка является случайной, причем источник этой случайности - только в выборе этой самой рабочей выборки. Сама генеральная совокупность и оцениваемая характеристика случайными не являются.
Ваш доверительный интервал может накрыть истинное значение характеристики или не накрыть. Второй случай означает, что Вы совершили ошибку.
Теперь представьте себе, что кроме Вас эту же задачу решает еще тысяча независимых исследователей. Все они оценивают ту же самую генеральную совокупность и одинаковое (но всем неизвестное) значение характеристики. Но при этом рабочие выборки у них всех получены случайно и независимо друг от друга, поэтому у всех разные доверительные интервалы. Так вот: если все они договорились строить 95%-ные интервалы, то это обозначает, что в среднем на каждую сотню исследователей будет 95 попаданий и 5 ошибок. Или, возвращаясь к одному исследователю, вероятность ошибки для него составляет 5%. Но картинка с тысячей исследователей мне всегда представляется более наглядной и понятной.