2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3  След.
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 15:39 


07/10/15

2400
К стати, на счёт ковариационных матриц - при сравнении средних и тоже нужно сравнивать, но только если различия не обнаружены.
Это существенно повысит мощность критерия. Так, если различия в средних не значимы, а ковариационные матрицы существенно отличаются - то распределения $S$ и $C$ не принадлежат одной генеральной совокупности.
Это что касается 1-го способа. На счёт того хороший от или нет - дело вкуса, но по крайней мере он представляется вполне обоснованным.

Кажется и со вторым, предложенным Вами способом я разобрался. Вы предлагаете максимазировать $L(f,\overline{C},Cov(C)|Z \cup (1-f)X+fY)$, т.е. найти такие средние, ковариационную матрицу и параметр $f$ при которых вероятность принадлежности всех наблюдений $C$ и всех линейных комбинаций $A$ и $B$ одному и тому же многомерному нормальному распределению будет максимальной?

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 16:42 


07/10/15

2400
Здесь не совсем понятно, как это осуществить, из за параметра смешения $f$. Возникает опять та же неопределенность, о которой я писал - не понятно какое наблюдение из $A$ комбинировать с каким наблюдением из $B$. Тем более, если числа наблюдений в $A$ и $B$ разные - то вычислить функцию правдоподобия будет невозможно в принципе, ведь при её вычислении используются конкретные наблюдения.
Мне кажется, для задачи в Вашей постановке ММП использовать не получится.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 18:27 


27/10/09
602
Andrey_Kireew в сообщении #1307957 писал(а):
К стати, на счёт ковариационных матриц - при сравнении средних и тоже нужно сравнивать, но только если различия не обнаружены.
Это существенно повысит мощность критерия. Так, если различия в средних не значимы, а ковариационные матрицы существенно отличаются - то распределения $S$ и $C$ не принадлежат одной генеральной совокупности.
Это что касается 1-го способа.
Вопрос сравнения двух многомерных средних с неравными ковариационными матрицами мы обсуждали тут, есть неплохие ссылки. Но это не относится к первому способу.
Andrey_Kireew в сообщении #1307957 писал(а):
На счёт того хороший от или нет - дело вкуса, но по крайней мере он представляется вполне обоснованным.
Они все, на первый взгляд обоснованы, а вот какой более обоснованный? Я с Вами соглашусь только в том, что этот метод самый простой. Если вкус именно в этом, то я не сторонник пренебрегать корректностью ради упрощения без особой на то необходимости. Необходимости нет, все три способа несложно реализуются.

Andrey_Kireew в сообщении #1307957 писал(а):
Кажется и со вторым, предложенным Вами способом я разобрался. Вы предлагаете максимизировать $L(f,\overline{C},Cov(C)|Z \cup (1-f)X+fY)$, т.е. найти такие средние, ковариационную матрицу и параметр $f$ при которых вероятность принадлежности всех наблюдений $C$ и всех линейных комбинаций $A$ и $B$ одному и тому же многомерному нормальному распределению будет максимальной?
Не совсем так. Я предлагаю максимизировать $L(f, Cov(C)|Z)$, а в качестве оценки для состава С принять $\hat{C}=S=f \bar{X}+(1-f) \bar{Y}$, оценки составов А и В - просто средние по соответствующим выборкам, линейная комбинация одна единственная. Не нужно комбинировать конкретные единичные определения - комбинируются средние. Запишем для этого случая функцию правдоподобия. Если обозначим $PDF\left( s,  \Sigma, x\right)$ как плотность многомерного нормального распределения с центром $s$ и ковариационной матрицей $\Sigma$, взятой в точке $x$, то функция правдоподобия$$\prod\limits_{i=1}^{n_Z} PDF\left(f \bar{X}+(1-f) \bar{Y},  \Sigma, Z_i \right)$$где неизвестными являются $\Sigma$ и $f$, поскольку $\hat{A}=\bar{X}$ и $\hat{B}=\bar{Y}$ известны. Ради интереса, конечно, можно попробовать взять тройное произведение со всеми возможными комбинациями, т.е. вместо средних брать конкретные единичные анализы$$\prod\limits_{i=1}^{n_Z}\prod\limits_{j=1}^{n_X} \prod\limits_{k=1}^{n_Y} PDF\left(f X_j+(1-f) Y_k,  \Sigma, Z_i \right)$$ Есть подозрение, что результат будет тот же, но не уверен.

Аналогичным образом запишется функция максимального правдоподобия для третьего случая$$\prod\limits_{i=1}^{n_Z} PDF\left(f \hat{A}+(1-f) \hat{B},  \Sigma_C, Z_i \right) \times 
\prod\limits_{i=1}^{n_X} PDF\left(\hat{A},  \Sigma_A, X_i \right) \times 
\prod\limits_{i=1}^{n_Y} PDF\left(\hat{B},  \Sigma_B, Y_i \right)$$но здесь уже неизвестны ни центры, ни ковариационные матрицы - все оценивается максимумом правдоподобия, все выборки равнозначны.

-- Пт апр 27, 2018 5:40 pm --

Попробовал с тройным произведением - результат получился иной - вот и четвертый способ получился

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 19:09 


07/10/15

2400
Посмотрел Вашу дискуссию, правда не до конца, но всё равно интересно. Возникает подозрение, что обе темы связаны одной причиной.

В любом случае, Вы должны понимать - сравнение средних, это не самоцель, а лишь средство. Целью у Вас, как я понял, является сравнение законов распределения. При различии средних законы уже не равны, и с этим Вы согласны. Но при различии ков. матриц они то же не равны, какой смысл в этом случае пытаться сравнивать средние?

А то что Вы записали - это никакое не правдоподобие, вернее правдоподобие, но не понятно чего? Того что средние принадлежат одному нормальному закону?

-- 27.04.2018, 20:23 --

Есть подозрение в недопонимании самого понятия правдоподобия. Правдоподобие - это условная вероятность, а в Ваших записях никаких условий я лично не вижу ...

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 19:24 


27/10/09
602
Очень просто - есть два состава А и В. Сами составы неизвестны, но они опробованы выборками. В процессе своей жизни в этих составах возникли некоторые флуктуации (можно назвать дифференциацией, когда в объеме единый состав начинает давать заметную дисперсию по компонентам, если опробовать в разных частях этого объема, т.е. внутри некоторого замкнутого объема происходит миграция компонентов), и эти флуктуации были разными, соответственно, ковариационные матрицы тоже разные. Вопрос - изначально это один и тот же состав, т.е. А=В, или это изначально разные составы? Т.е. целью является не "сравнение законов распределения", а сравнение именно средних в предположении, что флуктуации приводят к нормальным законам распределения.
Другой пример - сравнение двух аналитических методов на предмет смещенности по одной и той же пробе.
Кстати, это же относится и рассматриваемой нами задаче - после смешения жизнь у трех систем А, В и С была разная.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 19:35 


07/10/15

2400
Ну сейчас Вы обозначили совсем другую задачу.
А применительно к настоящей теме, Вы же сравниваете не ковариационные матрицы А и B а матрицы их линейной комбинации S и смеси С. Эти матрицы должны быть равными, для того чтобы вести речь о том что С - это смесь А и B.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 19:58 


27/10/09
602
Andrey_Kireew в сообщении #1308044 писал(а):
Ну сейчас Вы обозначили совсем другую задачу.
Забудем про старую тему - она понятна, есть решение задачи.
Andrey_Kireew в сообщении #1308044 писал(а):
А применительно к настоящей теме, Вы же сравниваете не ковариационные матрицы А и B а матрицы их линейной комбинации S и смеси С. Эти матрицы должны быть равными, для того чтобы вести речь о том что С - это смесь А и B.
Нет! Ковариационные матрицы не обязаны быть равными (и, на самом деле, редко бывают равными). Оценивается каждая матрица. К тому-же по условию задачи нигде не было, что ковариационные матрицы одинаковые. Мало того, у А, В и С вообще нет ковариационных матриц (поскольку это точные величины, которые неизвестны), ковариационные матрицы есть только у их оценок. Вопрос стоит в получении несмещенных, и, желательно, эффективных оценок этих составов. И, конечно, проверки гипотезы о смешении. Ковариационные матрицы выборок X, Y и Z сравнивать не нужно - возьмем априори, что они не равны. Но это не отменяет задачу.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение27.04.2018, 23:08 


07/10/15

2400
Закрывая старую тему, я так понимаю Вы соглашаетесь с бесперспективностью попыток получения ММП оценок?

И ещё, тут терминологическая путаница, под А, B в C я подразумеваю выборки и соответственно выборочные ковариационные матрицы, теперь понял, что их нужно обозначать X, Y, Z. У отдельных наблюдений разумеется никаких матриц быть не может.

А вообще, учитывая новые обстоятельства, нужно подумать, как это всё друг с другом согласуется.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение28.04.2018, 01:48 


07/10/15

2400
Вопрос- а смесь С после смешения растворов А и Б тоже потом случайным образом изменяется, и тоже с какой то своей дисперсией? или же считается, что отклонения концентраций в С полностью определяются их отклонениями в смешиваемых растворах А и B ?

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение28.04.2018, 06:29 


27/10/09
602
Andrey_Kireew в сообщении #1308132 писал(а):
Закрывая старую тему, я так понимаю Вы соглашаетесь с бесперспективностью попыток получения ММП оценок?
Закрывая старую тему я хотел сказать, что многомерную задачу Беренса — Фишера мы обсудили почти семь лет назад. Что же касается ММП оценок - я пока не вижу им альтернативы, а то, что их очень даже возможно получить, я уже демонстрировал.
Andrey_Kireew в сообщении #1308132 писал(а):
И ещё, тут терминологическая путаница, под А, B в C я подразумеваю выборки и соответственно выборочные ковариационные матрицы, теперь понял, что их нужно обозначать X, Y, Z. У отдельных наблюдений разумеется никаких матриц быть не может.
Тут путаница в понятиях. Я предлагал такие обозначения: А, B и C - это истинные значения составов, истинные значения не являются случайными величинами, у них нет ни дисперсий, ни ковариационных матриц. Узнать их по выборкам невозможно, поскольку вероятность совпадения истинного и выборочного мат.ожиданий равна нулю (для непрерывных случайных величин). По выборкам можно получить их оценки $\hat{A}$, $\hat{B}$ и $\hat{C}$. Любые оценки по выборкам есть случайные величины, у них есть и мат.ожидания, и дисперсии, в нашем случае ковариационные матрицы. Эти мат.ожидания и ковариационные матрицы зависят от способа оценки. И задача сводится к нахождению способа получения оценок, у которых мат.ожидание совпадает с истинными значениями (несмещенные), а дисперсии минимальны (эффективные). Еще неплохо бы, чтобы оценки были состоятельными.

Andrey_Kireew писал(а):
Вопрос- а смесь С после смешения растворов А и Б тоже потом случайным образом изменяется, и тоже с какой то своей дисперсией? или же считается, что отклонения концентраций в С полностью определяются их отклонениями в смешиваемых растворах А и B ?
Еще раз: смешиваются составы А и В, у них нет отклонений (сиречь вариаций с ковариациями). Вариации с ковариациями возникают после смешения.
Можно так - было две жидкости составов А и В. При их смешивании получилась жидкость состава С. А потом это все замерзло, и реально мы имеем дело с тремя кусками льда. Причем один состав замораживался быстро, другой медленно, а третий при замораживании вращался. Лед по составу неоднороден, в каждом куске эта неоднородность своя, поскольку условия замерзания разные (какой кусок как замерзал мы не знаем). Составы А, В и С мы не знаем, мы их не видели, мы видим только лед. Куски большие и проанализировать их целиком нет возможности, поэтому делаем выборочное опробование.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение28.04.2018, 15:05 


07/10/15

2400
То что Вы предлагаете
AndreyL в сообщении #1308019 писал(а):
Я предлагаю максимизировать $L(f, Cov(C)|Z)$, а в качестве оценки для состава С принять $\hat{C}=S=f \bar{X}+(1-f) \bar{Y}$, оценки составов А и В - просто средние по соответствующим выборкам, линейная комбинация одна единственная. Не нужно комбинировать конкретные единичные определения - комбинируются средние. Запишем для этого случая функцию правдоподобия. Если обозначим $PDF\left( s,  \Sigma, x\right)$ как плотность многомерного нормального распределения с центром $s$ и ковариационной матрицей $\Sigma$, взятой в точке $x$, то функция правдоподобия$$\prod\limits_{i=1}^{n_Z} PDF\left(f \bar{X}+(1-f) \bar{Y},  \Sigma, Z_i \right)$$где неизвестными являются $\Sigma$ и $f$, поскольку $\hat{A}=\bar{X}$ и $\hat{B}=\bar{Y}$ известны.


Даст Вам ММП оценку ков. матрицы Z, и матожидания выборки Z, вот и всё. А параметр смешения определяется как $f=\frac{\bar{C}-\bar{Y}}{\bar{X}+\bar{Y}}$, через матожидания выборок A и B. От того, что Вы явно вписали эту формулу в выражение для функции правдоподобия, $\bar{f}$ ММП оценкой не становится. Называть Вы можете её конечно как Вам больше нравится. Но настоящей ММП оценкой она станет только тогда, когда в её оценивании будут участвовать конкретные наблюдения выборок X и Y, а не их выборочные статистики. А Вы оцениваете средние по одним выборкам и "вставляете" их в выражение для функции правдоподобия совсем другой выборки, заявляя, что линейная комбинация этих средних, при определённом $f$ будет оценкой ММП средних выборки Z. Тогда определите условия, при каких это будет так как Вы заявляете, и проверьте данные на их соответствие. Зачем тогда акцентировать внимание на ММП. Работайте со средними.

Известно, что выборочное среднее является ММП оценкой генерального среднего, для нормального распределения. Для линейной комбинации - то же самое. Если у Вас ковариационные матрицы разные, то всё сводится только к сравнению средних. Как это сделать, мы обсудили.
Все Ваши дальнейшие идеи с ММП - это просто некорректное применение научного метода и ничем не оправданные усложнения.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение30.04.2018, 09:47 
Заслуженный участник
Аватара пользователя


11/03/08
10043
Москва
Достаточно тупой, но, вероятно, рабочий вариант.
Задаёмся значением f, принимая выборочные оценки среднего и ковариационной матрицы за истинные величины, получаем для данного f оценки среднего и ковариационной матрицы смесевого распределения. Затем для элементов выборки X вычисляем функцию правдоподобия. Максимизируем по f любым методом одномерной оптимизации (хотя бы простым перебором, хотя есть и лучшие; но гарантии, что функция будет одноэкстремальна, нет, так что я бы сделал перебор по сетке с уточнением чем-то получше, хотя бы "золотым сечением").

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение30.04.2018, 10:40 


27/10/09
602
Правильно ли я понимаю, что функция правдоподобия тут будет
$$\prod\limits_{i=1}^{n_Z} PDF\left(f \bar{X}+(1-f) \bar{Y}, \Sigma, Z_i \right)$$причем $f$ и $\Sigma$ неизвестны? Или как-то не так?

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение30.04.2018, 13:42 
Заслуженный участник
Аватара пользователя


11/03/08
10043
Москва
Думаю, тут и ковариационную матрицу можно оценить, как взвешенное среднее. Или лучше от ковариационных матриц и средних перейти к матожиданиям начальных смешанных моментов, найти их взвешенное среднее, и затем по матрице смешанных моментов оценить ковариационную матрицу.

 Профиль  
                  
 
 Re: смешение многокомпонентных составов
Сообщение30.04.2018, 18:23 


27/10/09
602
Правильно ли я понимаю, что ковариационную матрицу в функции правдоподобия Вы предлагаете оценить как средневзвешенную из ковариационных матриц выборок $X$ и $Y$ с весами $f$ и $1-f$?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 35 ]  На страницу Пред.  1, 2, 3  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group