2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Окончательный вид функции правдоподобия вызывает вопросы
Сообщение29.02.2020, 01:13 


02/05/17
34
Здравствуйте! Я исследую возможность использования теоретико-информационных критериев AIC (критерий Акаике) и MDL (критерий минимальной длины описания) для определения количества источников сигналов по конечной выборке наблюдений сигналов на датчиках некоторой антенной решетки. Насколько я понял, данные критерии работают в ситуации когда имеется некоторый набор наблюдений:$X = \{ x\left( 1 \right), \ldots ,x\left( N \right)\}$ и набор моделей, параметризуемых своими плотностями вероятностей:$f\left( {X|\Theta } \right)$. Необходимо выбрать модель, наилучшим образом описывающую имеющиеся данные. Данные критерии вычисляются в зависимости от количества параметров модели.
$AIC(k) =  - 2 \cdot \log \left( {f\left( {X|\widehat \Theta } \right)} \right) + 2 \cdot k$
$MDL(k) =  - \log \left( {f\left( {X|\widehat \Theta } \right)} \right) + \frac{1}{2} \cdot k \cdot \log \left( N \right)$
Я нашел статью, в которой как раз описывается применение данных критериев для оценки количества источников сигналов. Но при попытке повторить их выводы моя результирующая логарифмическая функция правдоподобия получилась не такой как в статье. Опишу суть проблемы.
Относительно данных предполагаем что каждое наблюдение описывается как комплексный Гауссовский вектор с нулевым математическим ожиданием, статистически независимый от других векторов. Для описания набора моделей в статье описывается семейство корреляционных матриц, параметризуемое количеством сигналов k:
${R^{\left( k \right)}} = {\Psi ^{\left( k \right)}} + {\sigma^2} \cdot I$
Здесь первое слагаемое в правой части это сигнальная часть матрицы, а вторая описывает шумы в каналах решетки с дисперсией ${\sigma ^2}$. В виде спектрального разложения это выражение представляется так:
${R^{\left( k \right)}} = \sum_{i = 1}^k {\left( {{\lambda _i} - {\sigma ^2}} \right) \cdot {V_i} \cdot V_i^T}  + {\sigma ^2} \cdot I$
Здесь ${\lambda _1}, \ldots ,{\lambda _k} и {V_1}, \ldots ,{V_k}$ собственные значения и соответствующие им собственные векторы матрицы ${R^{\left( k \right)}}$.

Вектор параметров модели описывается следующим образом: ${\Theta ^{\left( k \right)T}} = \left( {{\lambda _1}, \ldots ,{\lambda _k},{\sigma ^2},V_1^T, \ldots ,V_k^T} \right)$.
Плотность вероятности N - мерной Гауссовский случайной величины задается в статье так:
$f\left( {x|{\Theta ^{\left( k \right)}}} \right) = \frac{1}{{{\pi ^p} \cdot \left| {{R^{\left( k \right)}}} \right|}} \cdot \exp \left( { - {x^T} \cdot {{\left[ {{R^{\left( k \right)}}} \right]}^{ - 1}} \cdot x} \right)$
Где матрица ${R^{(k)}}$ определяется векторным параметром ${\Theta ^{(k)}}$.
Учитывая статистическую независимость наблюдений совместную плотность веротяности можно записать следующим образом:
$f\left( {x\left( 1 \right), \ldots ,x\left( N \right)|{\Theta ^{\left( k \right)}}} \right) = \prod_{i = 1}^N {f\left( {x\left( i \right)|{\Theta ^{\left( k \right)}}} \right)}$
Теперь если взять от совместной плотности веротяности логарифм и оставить только члены, зависящие от ${\Theta ^{(k)}}$, в статье получилось следующее выражение:
$L\left( {{\Theta ^{(k)}}} \right) =  - N \cdot \log \left| {{R^{\left( k \right)}}} \right| - \operatorname{tr} \left( {{{\left[ {{R^{\left( k \right)}}} \right]}^{ - 1}} \cdot \widehat R} \right)$ (1)
Где $\widehat R = \frac{1}{N} \cdot \sum_{i = 1}^N {x\left( i \right) \cdot x{{\left( i \right)}^T}}$ - максимально правдоподобная оценка выборочной корреляционной матрицы.
На мой взгляд, здесь явно пропущен множитель N во втором слагаемом в правой части. Я повторил весь вывод и провел дополнительно численную проверку и убедился что это действительно так. Для применения выбранных критериев необходим максимум логарифмической функции правдоподобия. Максимум достигается, как доказывается в другой статье, если сформировать вектор параметров следующим образом:
$\widehat {{\lambda _i}} = {l_i}, i = 1, \ldots ,k$,
${\widehat \sigma ^2} = \frac{1}{{p - k}} \cdot \sum_{j = k + 1}^p {{l_j}}$,
${\widehat V_i} = {C_i}, i = 1, \ldots ,k$,
где ${l_1} > {l_2} > {l_3} \cdots  > {l_p} собственные числа и {C_1}, \ldots ,{C_p}$ соответствующие собственным числам собственные векторы выборочной корреляционной матрицы $\widehat R$, $p$ - количество каналов. Как утверждается далее в статье, если сформировать векторный параметр ${\widehat \Theta ^{(k)}} = \{ {\hat \lambda _1}, \ldots ,{\hat \lambda _k},{\hat \sigma ^2},{\hat V_1}, \ldots ,{\hat V_2}\}$ и подставить его в (1), то после несложных преобразований получим:
$L\left( {{{\hat{\Theta }}}^{(k)}} \right)=\log {{\left( \frac{\prod_{i=k+1}^{p}{l_{i}^{{}^\frac{1}{\left( p-k \right)}\;}}}{\frac{1}{p-k}\cdot \sum_{i=k+1}^{p}{{{l}_{i}}}} \right)}^{\left( p-k \right)\cdot N}}$ Я провел преобразования и получил несколько иной вид логарифмической функции правдоподобия:
$L\left( {{{\hat{\Theta }}}^{(k)}} \right)=\log {{\left( \frac{\prod_{j=1}^{k}{l_{i}^{{}^\frac{1}{\left( k-p \right)}\;}}}{\frac{1}{p-k}\cdot \sum_{i=k+1}^{p}{{{l}_{i}}}} \right)}^{\left( p-k \right)\cdot N}}$
При этом численное моделирование показывает что мой вывод соответствует исходной формуле (1). Численное же моделирование общей задачи показывает одинаковое поведение критериев как с исходной так и с моим вариантом функции правдоподобия. Это наводит на мысль о некоем асимптотическом переходе, который усмотрели авторы статьи и не вижу я. Буду очень благодарен если кто - то сможет проверить мои выводы и подтвердить или опровергнуть мои результаты. Буду рад любой полезной информации!

 Профиль  
                  
 
 Posted automatically
Сообщение29.02.2020, 13:06 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Математика (общие вопросы)» в форум «Карантин»
по следующим причинам:

- неправильно набраны формулы (краткие инструкции: «Краткий FAQ по тегу [math]» и видеоролик Как записывать формулы) - каждая формула должна начинаться с доллара и заканчиваться долларом.

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

 Профиль  
                  
 
 Posted automatically
Сообщение01.03.2020, 13:18 
Заслуженный участник


09/05/12
25179
 i  Тема перемещена из форума «Карантин» в форум «Математика (общие вопросы)»

 Профиль  
                  
 
 Re: Окончательный вид функции правдоподобия вызывает вопросы
Сообщение05.03.2020, 21:00 


02/05/17
34
Я слишком много написал ?? И это не принято здесь ?

 Профиль  
                  
 
 Re: Окончательный вид функции правдоподобия вызывает вопросы
Сообщение06.03.2020, 00:26 
Заслуженный участник
Аватара пользователя


15/10/08
12856
SergeiSX в сообщении #1443124 писал(а):
Я слишком много написал ?? И это не принято здесь ?
Наверное, не нашлось столь узко специализированного читателя.

 Профиль  
                  
 
 Re: Окончательный вид функции правдоподобия вызывает вопросы
Сообщение06.03.2020, 01:48 
Заслуженный участник


27/04/09
28128
SergeiSX
Попробуйте ещё спросить на Math.SE или MathOverflow, если не уже.

 Профиль  
                  
 
 Re: Окончательный вид функции правдоподобия вызывает вопросы
Сообщение07.03.2020, 23:44 


02/05/17
34
Огромное спасибо!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group