К стати, на счёт ковариационных матриц - при сравнении средних и тоже нужно сравнивать, но только если различия не обнаружены.
Это существенно повысит мощность критерия. Так, если различия в средних не значимы, а ковариационные матрицы существенно отличаются - то распределения
и
не принадлежат одной генеральной совокупности.
Это что касается 1-го способа.
Вопрос сравнения двух многомерных средних с неравными ковариационными матрицами мы обсуждали
тут, есть неплохие ссылки. Но это не относится к первому способу.
На счёт того хороший от или нет - дело вкуса, но по крайней мере он представляется вполне обоснованным.
Они все, на первый взгляд обоснованы, а вот какой более обоснованный? Я с Вами соглашусь только в том, что этот метод самый простой. Если вкус именно в этом, то я не сторонник пренебрегать корректностью ради упрощения без особой на то необходимости. Необходимости нет, все три способа несложно реализуются.
Кажется и со вторым, предложенным Вами способом я разобрался. Вы предлагаете максимизировать
, т.е. найти такие средние, ковариационную матрицу и параметр
при которых вероятность принадлежности всех наблюдений
и всех линейных комбинаций
и
одному и тому же многомерному нормальному распределению будет максимальной?
Не совсем так. Я предлагаю максимизировать
, а в качестве оценки для состава С принять
, оценки составов А и В - просто средние по соответствующим выборкам, линейная комбинация одна единственная. Не нужно комбинировать конкретные единичные определения - комбинируются средние. Запишем для этого случая функцию правдоподобия. Если обозначим
как плотность многомерного нормального распределения с центром
и ковариационной матрицей
, взятой в точке
, то функция правдоподобия
где неизвестными являются
и
, поскольку
и
известны. Ради интереса, конечно, можно попробовать взять тройное произведение со всеми возможными комбинациями, т.е. вместо средних брать конкретные единичные анализы
Есть подозрение, что результат будет тот же, но не уверен.
Аналогичным образом запишется функция максимального правдоподобия для третьего случая
но здесь уже неизвестны ни центры, ни ковариационные матрицы - все оценивается максимумом правдоподобия, все выборки равнозначны.
-- Пт апр 27, 2018 5:40 pm --Попробовал с тройным произведением - результат получился иной - вот и четвертый способ получился