2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Stochastic Volatility на Исторических Данных
Сообщение26.09.2025, 07:49 
Я пытаюсь сделать модель процесса Stochastic Volatility с частотой 1день, на исторических данных. С дополнительным ограничением - совпадение условных маржинальных вероятностей по периодам 1неделя, 1месяц, 3мес, 6мес, 1год.

Цель:

- Реалистичная динамика, что то вроде Rough Volatility или Markov switching multifractal.
- И реалистичные условные маржинальные вероятности прибыли по долгим срокам от недели до года.

Процесс идет кругами, постоянно возникают странности, вопросы и проблемы. И если вы не против, я открою эту тему о прогрессе и проблемах, возможно кому то тоже это будет интересно и подскажут по вопросам.

Я постараюсь описать проблемы формально, чтобы если вам будет интересно вы могли их самостоятельно повторить или опровергнуть. И буду постепенно добавлять новые (они постоянно возникают).

Проблемы:

"Процесс лог приращений цен не стационарен не только по scale но и location."

Обычно считается что только волатильность нестационарна и ГАРЧ и меры волатильности основаны на этом. Но локация также нестационарна, стационарно арифметическое ожидание прибыли $E[e^{r_t}]$ (точнее, не константа но стабильно и меняется мало). А scale и location в лог пространстве не стационарны и меняются во времени, поскольку связаны условием $E[e^{r_t}] = e^{\mu+\sigma_t^2/2}$. Как проверить - разбить лог прибыль на децили по волатильности и посчитать арифм ожидание прибыли, оно будет примерно одинаково во всех децилях.

Следствие - весь классический аппарат анализа временных рядов, гарч, и т.п. концептуально неверен. Он подразумевает совершенно дикую вещ, что условное арифметич ожид прибыли $E[e^{r_t}] \approx e^{\sigma_t^2}$. Также, мера волатильности, которая считается как среднее (взвешенное) отклонений относительно location в лог пространствe, которое не стабильно и меняется, эта мера также неверна.

Насколько велика ошибка? На деле ошибка проявляется не сильно, и для дневных данных в среднем не велика. Но кто знает как ошибка поведет себя на крайних значениях "не в среднем".

Решение, собственно уже найдено, так называемый риск нейтральный подход и SV модели именно так и делают, и нормализует временую серию как по волатильности так и по локации, ставя ограничение чтобы в каждый момент времени арифм ожид было константой. Мне кажется верный подход должен быть что то подобное.

ВопросЕсли мы зададим такое условие, то для фиттинга нам нужно быстро вычислить $E[e^{r_t}]$ точнее, инверсная задача, вычислить location в лог пространстве зная дисперсию и $E[e^{r_t}]$, и в случае например SkewT обрезанной сверху на 99.97% аналитической формулы нет, и нужно считать численный интеграл, что медленно. Как это решается? Может есть какая то приближенная формула? Вместо SkewT можно использовать GenHyperbolic но она также не имеет аналитической формулы (формула есть только для ее частного случая Normal-inverse Gaussian, но она не может повторить тяжелые хвосты на дневных данных, а для общей формы GenHyperbolic аналитич формулы нет).

-- 26.09.2025, 08:12 --

Проблема: Как сделать фиттинг динамики на исторических данных?

Для SV модели фиттинг обычно делается на IV цены опционов, где все распределения log return и их моменты известны и статичны (цены евро опционов это моменты распределения вероятностей log return).

Но, в случае исторических данных у нас 1) нет этих распределений в явном виде, есть лишь одна реализация случайного процесса 2) Они условны и постоянно меняются. Если для фиттинга по IV распределения безусловны и фиксированы и доступны в явном виде, на исторических данных в явном виде их нет, они условны и меняются с каждым шагом.

Итак, мы не можем делать фиттинг SV модели напрямую используя MLE на историч данных. Чтобы сделать фиттинг сначала нужно посчитать неким образом некие моменты (например автокорреляции и т.п.). Но как их посчитать, если они не стационарны и постоянно меняются и их расчет по идее зависит от того какую структуру SV процесса мы подразумеваем. Получается первое зависит от второго? Что то вроде задачи идентификации динамической системы?

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group