Следовательно, гипотеза 'среднее B не больше среднего A' более вероятна, чем 'среднее A не больше среднего B.' " ?
В каком именно смысле вы применили в этом предложении слова "среднее" и "вероятно"? У вас есть какой-то вероятностный процесс, порождающий случайным образом матожидания нормальных распределлений А и В, по которым уже генерируются выборки?
Нет, смотрите, есть зависимые выборки из некоторых генеральных совокупностей, распределение которых неизвестно. Возможно, оно и не нормальное. Для сравнения t-тестом Стюдента для зависимых выборок это необязательно. Доказательство не изменится, если эти величины не будут распределены нормально. Требуется лишь, чтоб разности были распределены нормально (это я проверяю тестом на нормальность).
Под "средним" я понимаю среднее (матожидание) этой генеральной совокупности. Слово "вероятна" в этом предложении я намеренно применил довольно вольно, мне хочется разобраться, почему на основании тех тестов, которые я описал, нельзя сделать никакого вывода, или всё-таки какой-то можно. Спасибо, что помогаете мне в этом.
Несложно придумать такой процесс, для которого ваше утверждение будет неверным, потому что априорная вероятность того, что матожидание В больше матожидания А, перевесит все ваши тесты. Вам бы уточнить смысл вашего вопроса.
Ситуация такая, что априорной вероятности нет принципиально. То есть, я, конечно, знаю, как у меня получаются эти распределения, но использовать эту информацию я не могу, речь идёт о сравнении разных алгоритмов. Ситуация примерно такая: есть чёрные ящики, на входы которых передаются одинаковые данные, на выходе - упомянутые мной выборки.
Чтобы говорить о вероятностях гипотез...
Здравствуйте, Евгений. Спасибо большое, что опять мне помогаете. Я пытался сравнивать непараметрическими тестами. Как Вы и предсказывали, значимой разницы средних не увидел. Причём, даже если просто, "усилием воли", применить тест Стьюдента к не нормально распределённым разностям A-B, то картина, по всей видимости, больше походит на правду, чем с непараметрическим критерием Манна Уитни. Возможно, что если б ситуация была такая, как Вы описали в контрпримере, то есть, если б одно распределение было бы просто сдвинуто, относительно другого, то этот критерий бы сработал. Видимо, он именно для таких случаев.
То, что в одном случае статистика больше, чем во втором, может быть обусловлено как тем, что средняя разность в первом случае больше, а дисперсии примерно равны, так и тем, что дисперсия меньше, и стандартная ошибка среднего с ней. Поскольку нам предоставлено лишь t-отношение, то выбрать из двух утверждений верное не могу.
Просто посчитать среднюю разность я, конечно, могу. Но ведь это не то, что мне надо. Мне ведь недостаточно сказать, что средняя разность выборок, допустим, положительна, и, следовательно, среднее первой выборки больше среднего второй. Мне надо сделать вывод о сравнении параметров распределений генеральных совокупностей, а для этого мне нужно использовать t-отношение целиком.
Ваш контрпример, я вроде бы понял. Только, как я уже писал чуть выше в этом ответе realeugene, у меня принципиально нет дополнительной информации.
Я понимаю, что не могу сказать: "На таком-то разумном уровне значимости гипотеза 'среднее A не больше среднего B' отвергается."
Если более конкретно, то мне бы хотелось принять решение об использовании того или иного алгоритма на основании тех тестов, которые я описал. Кажется, что алгоритм, который представлен выборкой A более предпочтителен, но как это обосновать?