2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Выбор лучшего набора экспериментов для определения параметра
Сообщение12.02.2018, 23:19 


08/08/17
13
Здравствуйте.

Пусть даны моменты времени $t_1, \dots, t_N$. В каждый момент времени $t_i$ существует некоторый набор возможных экспериментов $(y_{i_1}, x_{i_1}), \dots, (y_{i_k}, x_{i_k})$, где $x_{i_k}$ -- строчка матрицы плана, $y_{i_k}$ -- элемент свободного вектора.

Выбрав в каждый момент времени эксперимет, мы получим матрицу $X = (x_{1}, \dots, x_{N})^T$ и столбец $y$, на которых мы можем построить регрессию $y = X \theta + \varepsilon$ и оценить параметры $\theta = (\theta_1, \dots, \theta_l)$. Меня интересует лишь оценка $\theta_1$.

Правильно ли я понимаю, что для лучшей оценки параметра $\theta_1$ эксперименты нужно подбирать таким образом, чтобы элемент $(1, 1)$ матрицы $(X^T X)^{-1}$ был минимальным (так как $(X^T X)^{-1}$ ковариационная матрица, и на этом месте в ней будет стоять дисперсия $\theta_1$)? Или в таком случае возможные "большие" ошибки на прочих оцениваемых параметрах будут влиять на точность оценки $\theta_1$? А что нужно потребовать (от $(X^T X)^{-1}$), если необходимо как можно точнее оценить все параметры? Вроде можно попробовать и след, и операторную норму, то есть максимальное собственное число.

Заранее спасибо.

 Профиль  
                  
 
 Re: Выбор лучшего набора экспериментов для определения параметра
Сообщение13.02.2018, 11:15 
Заслуженный участник
Аватара пользователя


11/03/08
10046
Москва
Строгого критерия не назову.
Однако замечу, что помимо диагонального элемента обратной матрицы, которому пропорциональна дисперсия ошибки соответствующего коэффициента, есть и внедиагональные, которым пропорциональны корреляции ошибок этого коэффициента с прочими. Возможно, надо, даже интересуясь лишь одним коэффициентов, учитывать и их.
Кроме того, для такой оценки может пригодиться тождество $(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} )^{-1}=\mathbf {A} ^{-1}+\mathbf {A} ^{-1}\mathbf {B} (\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} )^{-1}\mathbf {CA} ^{-1}$, позволяющее быстро посчитать матрицу, обратную к дополненной новым экспериментом.

 Профиль  
                  
 
 Re: Выбор лучшего набора экспериментов для определения параметра
Сообщение14.02.2018, 01:08 


08/08/17
13
Решил. Можно через характеристические функции найти распределение интересующего параметра даже в модели с коррелируемыми шумами.

Евгений Машеров, спасибо, я пользовался формулой Шермана-Моррисона, которая является частным случаем Вашего тождества.

 Профиль  
                  
 
 Re: Выбор лучшего набора экспериментов для определения параметра
Сообщение15.07.2018, 14:37 


08/08/17
13
Вроде ответ такой:

1. Если $\hat{\theta}$ -- оценка МНК, то, если данные удовлетворяют ослабленной (когда вектор шума $\varepsilon$ имеет произвольную матрицу ковариации $\mathrm{cov}(\varepsilon)$) теореме Гаусса-Маркова, верно: $\theta = \hat{\theta} + \left ( X^T \mathrm{cov}(\varepsilon)^{-1} X \right )^{-1} \mathrm{cov} (\varepsilon)^{0.5}  \left( \mathrm{cov}(\varepsilon)^{-0.5} \varepsilon \right ) = \hat{\theta} + M \left( \mathrm{cov}(\varepsilon)^{-0.5} \varepsilon \right )$. Матрица ковариации положительно определена, потому корень существует.
Легко проверить, что $\left( \mathrm{cov}(\varepsilon)^{-0.5} \varepsilon \right )$ имеет нормальное распределение с единичной матрицей ковариации и нулевым матожиданием. Тогда линейная комбинация $\left \langle M_i, \left( \mathrm{cov}(\varepsilon)^{-0.5} \varepsilon \right ) \right \rangle$ имеет нормальное распределение $\mathcal{N}(0, \sqrt{\sum_{j = 1}^{m}M_{ij}^2} )$.
2. Примерно также можно найти величину, которую следует минимизировать для одновременного уточнения всех параметров. Для этого нужно показать, что для любого $p \in (0, 1)$ $100p$-процентный доверительный интервал будет шаром. Далее, действие матрицы $X$ на шар превратит его в эллипсоид, полуоси которого есть собственный вектора $M$, а их длинна -- соответствующие собственные числа. Для минимизации "разброса" нужно минимизировать лебегову меру данного эллипсоида, то есть произведение собственных чисел. Это эквивалентно максимизации определителя матрицы $M$.

В обоих случаях получается довольно сложная программа и непонятно, как быстрее всего пересчитать получившееся значение, когда к матрице $X$ добавляется новая строчка или удаляется старая.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group