2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Регрессия с не нормальными ошибками
Сообщение20.01.2022, 00:12 


07/03/11
690
Рассмотрим задачу регрессии:
$$y = f(\mathbf x | \mathbf w) + \varepsilon ,$$
где $\varepsilon \sim \mathcal N (0, \sigma ^2)$. Тогда имея выборку $(\mathbf X, \mathbf y)$ мы можем оценить $\mathbf w$ при помощи ММП:
$$y \sim \mathcal N (f(\mathbf x | \mathbf w), \sigma ^2)$$
$$-\ln p(\mathbf y | \mathbf X, \mathbf w, \sigma ^2) = -\sum _i \n p(y_i | \mathbf x _i , \mathbf w, \sigma ^ 2)$$
Если подставить нормальное распределение, то нам повезет и мы сможем оценить $\mathbf w$ не вычисляя $\sigma ^2$:
$$\hat {\mathbf w}(\mathbf y, \mathbf X, \sigma ^2) = \hat {\mathbf w}(\mathbf y, \mathbf X) = {\arg \min} _{\mathbf w} \sum _i (y_i - f(\mathbf x_i | \mathbf w))^2$$
Пусть теперь $\varepsilon \sim \mathcal D(\theta)$ и $\mathbb E \varepsilon = 0$.

Вопрос1: можно ли что-то оценивать, если $\mathbb V \varepsilon = \inf$?
Вопрос2: если нам не повезло, то единственный способ -- решать систему уравнений? Если да, есть какие-то итеративные схемы решения?
Вопрос3: если $\varepsilon \sim \mathcal S (\alpha , \beta , c, 0)$ -- устойчивое распределение с известными $\alpha, \beta, c$, мы можем так же применять ММП для оценки $\mathbf w$? Можно ли получить какую-то простую формулу для $\beta = 0$ и $1 < \alpha < 2$?

 Профиль  
                  
 
 Re: Регрессия с не нормальными ошибками
Сообщение20.01.2022, 07:57 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Можно. Называется робастное оценивание. Хотя обычно рассматривают не такой крутой случай, с бесконечной дисперсией, а просто более тяжёлые хвосты.

 Профиль  
                  
 
 Re: Регрессия с не нормальными ошибками
Сообщение20.01.2022, 15:51 


07/03/11
690
Спасибо! Вот я еще рассмотрел t-распределение:
$$p(x | \nu , \mu , \sigma) = \frac{\Gamma (\frac {\nu + 1}{2})}{\Gamma (\frac {\nu}{2})\sqrt {\pi \nu} \sigma}\left(1 + \frac {1}{\nu}\left(\frac {x - \mu}{\sigma}\right)^2\right)^{-\frac{\nu + 1}{2}}$$
Тогда, чтоб оптимизировать параметры модели, нужно минимизировать функцию потерь:
$$L(\mathbf w | \mathbf y, \mathbf X, \nu, \sigma) = \sum _i\ln\left( 1 + C (y_i - f(\mathbf x_i | \mathbf w))^2\right)\to \min,$$
где $C = \frac {1}{\nu \sigma ^ 2}$. Это я правильно написал?

 Профиль  
                  
 
 Re: Регрессия с не нормальными ошибками
Сообщение20.01.2022, 21:06 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Что-то не то...

 Профиль  
                  
 
 Re: Регрессия с не нормальными ошибками
Сообщение21.01.2022, 10:53 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Если у нас задано $\nu$, то множитель $\frac {\Gamma(\frac{\nu+1}2)}{\Gamma(\frac \nu 2)\sqrt{\pi\nu}}$ можно вынести за скобки, и оценивать по ММП только среднее и дисперсию. Но выражение немного не такое. Оценивание ещё и числа степеней свободы тоже возможно, но вычислительная процедура сложнее.
Есть описание в https://web.itu.edu.tr/~etaner/wseasJ05.pdf
Но я его не проверял.

 Профиль  
                  
 
 Re: Регрессия с не нормальными ошибками
Сообщение21.01.2022, 18:01 


07/03/11
690
Глянул статью, вроде бы все правильно написал. Отдельно оценивать среднее/дисперсию не получится из-за множителя $\frac 1\nu$ в скобках.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: tolstopuz


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group