можно ввести веса, между нулём и единицей, которые минимизируют средний квадрат ошибки (сумму квадрата смещения и дисперсии)
Немного не долистал, спасибо.
Прямо-таки в философию влезаем, "вещи в себе" и "вещи для себя". Скоро будем в философских штанах щеголять, украшенных по швам Кантом. А мне отчего-то хочется оставаться в пределах позитивного знания.
В методологию науки немного влезаем, верно. Прежде всего, правила, как нам следует поступать, чтобы правильно применять теорвер для предсказания событий наблюдаемой реальности - это уже физика, а не математика.
Мы уверены, что так, как мы описали, оно и есть. Иначе бы не публиковали. Но честно оговариваем, что возможна ошибка.
Эти три предложения немного противоречивы. Мы знаем, что можем ошибаться - но уверены, что не ошибаемся. На самом деле, мы знаем, что можем ошибаться, но оцениваем риск нашей ошибки как приемлемый, мы для этого сделали всё возможное, и, поэтому, публикуем.
0.05 и т.п. это не "апостериорная вероятность", это "допустимый процент брака", при котором не надо закрывать цех на полную реконструкцию. Если мы публикуем некий факт, указывая, что "значимо на 5% уровне", это не значит, что мы считаем его случайным событием, вероятность которого 95%.
Вот, самое главное. ТС написал, что 0.05 - это вероятность нашей ошибки. Но - нет, это было его заблуждение. Распространённое заблуждение. 0.05 - это вероятность случайного выброса в рамках гипотезы, но никак не нашей ошибки.
Но нас на самом деле интересуют наши собственные риски. Вероятность того, что мы сами ошибаемся. Исходя из этой вероятности и стоимости для нас ошибок первого и второго рода мы можем принимать обоснованное решение, публиковать/использовать гипотезу или продолжить поиски? Почему же мы считаем, что тот или иной уровень значимости для нас приемлем?
А потому, что этот уровень значимости некоторым образом на самом деле связан с вероятностью нашей ошибки. Мы всегда имеем оценку априорной вероятности гипотезы и информативности теста для альтернативной гипотезы. Очень грубую и грязную оценку, возможно, в виде диапазонов вероятностей. И воспользовавшись этой оценкой уже можно оценить апостериорный риск при выбранном уровне значимости, приемлем он или нет для нас? А так как оценка грубая и грязная, мы предпочитаем её замести под ковёр, чтобы не пачкала нашу красивую математику. Но не следует забывать, что под ковром эта грязь, связывающая математику с реальностью, всё же у нас лежит.