2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Регрессионный анализ с применением пилот-сигнала
Сообщение11.03.2012, 19:15 


25/02/10
33
Здравствуйте!
Столкнулся со следующей задачей.
Имеется серия измерений
$\xi_k = F(s_k+p_k) + n_k$,
где $F(s)$ - неизвестная, но достаточно гладкая функция, $s_k$ - искомое полезное воздействие, $p_k$ - известный "пилот-сигнал", $n_k$ - шум измерений, предположительно гауссовский.
Вопрос состоит в возможности "вытаскивания" сигнала $s_k$ (или его производной) на основе серии измерений $\xi_k$. Я написал в заголовке темы "регрессионный анализ", но вполне возможно, что данная задача относится к другой категории.
Пока что я остановился на следующем варианте решения.
Будем считать, что в пределах небольшого числа соседних точек измерений справедливо приближенное представление функции $F(s+p)$ урезанным рядом Тейлора
$F(s+p) = F(s) + \frac{dF(s)}{ds}p + \frac{1}{2}\frac{d^2F(s)}{ds^2}p^2$
Далее, при том же предположении функцию $F(s)$ можно представить в виде полинома
$F(s) = a_0 + a_1s+a_2s^2$.
И, наконец, положим, что информационное воздействие меняется с постоянной скоростью на той же ограниченной выборке точек
$s_k = s_0 + \sigma k$.

Объединяя все вышесказанное, получим следующее выражение, пригодное для линейного регрессионного анализа
$\xi_k = x_1 \cdot 1 + x_2 \cdot k + x_3 \cdot k^2 + x_4 \cdot p_k + x_5 \cdot kp_k + x_6 \cdot p_k^2 + n_k$
Здесь
$x_1 = a_0 + a_1s_0 + a_2s_0^2$,
$x_2 = (a_1 + 2a_2s_0)\sigma$,
$x_3 = a_2\sigma^2$,
$x_4 = a_1 + 2a_2s_0$,
$x_5 = 2a_2\sigma$,
$x_6 = a_2$.

Таким образом, оценив величины $x_{1-6}$ можно найти оценку производной информационного воздействия $s$ (что вполне устраивает) по одной из следующей формул (остается вопрос о выборе "наилучшей")
$\sigma = \frac{x_2}{x_4} = \frac{2x_3}{x_5} = \frac{x5}{2x_6}$.

Все выглядит красиво, но при использовании метода МНК для решения регрессионной задачи получается плохо обусловленная матрица. Замечу, что в качестве "пилот-сигнала" используется синусоида с периодом, соизмеримым с длиной анализируемой выборки. Основная проблема в том, что данный метод очень чувствителен как к длине выборки так и к шуму, что не есть хорошо.
Буду рад любым комментариям.

 Профиль  
                  
 
 Re: Регрессионный анализ с применением пилот-сигнала
Сообщение12.03.2012, 08:20 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
А что-то про полезный сигнал известно? Это случайная величина, или детерминированная? Как он может соотносится с "пилотным"?
Ну и в качестве частного совета - регуляризировать задачу не пробовали? Скажем, ридж-регрессией?
Что до трёх формул - чисто эмпирически - посчитал бы по всем трём и взял бы медиану (среднее плохо тем, что если в одном из знаменателей нуль или около того, то оно улетает неизвестно куда).

 Профиль  
                  
 
 Re: Регрессионный анализ с применением пилот-сигнала
Сообщение12.03.2012, 13:25 


25/02/10
33
Про полезный сигнал известны спектральные характеристики, а именно то, что спектр имеет верхнюю границу, причем эта граница меньше частоты пилот-сигнала. В принципе, можно даже утверждать, что частота пилот-сигнала больше удвоенной частоты верхней границы полезного сигнала.
Регуляризацию пробовал, правда не ридж-регрессию (не знал про неё), а по Тихонову, получилось не очень убедительно. Честно говоря, почитав про ридж-регрессию, не понял чем она принципиально отличается от тихоновской.

 Профиль  
                  
 
 Re: Регрессионный анализ с применением пилот-сигнала
Сообщение12.03.2012, 18:45 


25/02/10
33
В принципе, как улучшить обусловленность матрицы вроде бы стало понятно. Так как нас интересует некоторый ограниченный интервал значений $[0,M]$, то вместо полиномиального базиса $1,k,k^2$ целесообразно использовать базис по ортогональным полиномам, например $T_n\left(\frac{2k-M}{M}\right)$. Я уже численно прикинул, матрица, соответствующая базису $1,T_1\left(\frac{2k-M}{M}\right), T_2\left(\frac{2k-M}{M}\right), p_k, T_1\left(\frac{2k-M}{M}\right)p_k, p_k^2$ имеет число обусловленности порядка 100-200, что уже хорошо. Правда информационный параметр при этом вычисляется по более сложной формуле. Отсюда вопрос: не является ли это обменом "шила на мыло", то есть ошибки все равно вылезут, но только они заложены в формуле вычисления информационного параметра. Иными словами, оправдан ли переход к другому базису?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group