Получить Постериор для Нестационарн Распред? (Калибровка)

Brizon · 03.04.2025, 06:03

Как получить Posterior для нестационарного распределения? Или, может быть, правильнее называть это калибровкой распределения?

Проблема в том, что распределение не стационарно, поэтому получить нужно не просто posterior distribution, но функцию преобразования, которая трансформирует априорное распределение в постериорное, изменяя его среднее, разброс, асимметрию, скошенность.

Дано: Нестационарный Гауссовский Микс как prior, и наблюдаемые значения.

Параметры: sigma1, sigma2, rate
Prior: 0.6N(rate, sigma1) + 0.4N(rate, sigma2)
Цель: найти наилучшее правдоподобие (Likelihood) апостериорного распределения по отношению к return.

Данные:

Код:

sigma1  sigma2  rate  return
0.091   0.231   0.018 0.08
0.097   0.223   0.018 0.28
...

Результат: некая функция преобразования T, которая получив на вход prior (который будет разный для каждой строки данных), преобразует его в posterior PDF .
PDF может быть аналитической, смесью нормальных, либо численным приближением (векторная функция).

Код:

T(sigma1, sigma2, rate) => Posterior_PDF(x: number): number

Возможно использование байесовского или других методов, таких как калибровка распределения, quantile mapping и т.п. (по Байесовскому методу, было бы интересно услышать критику подхода, если например эта задача вообще не подходит для баесовских методов.)

Возможное решение:

Эту функцию можно создать вручную, и улучшить likelehood но это очень времязатратно, и при любых изменениях входных данных (параметров), старую фунцкию трансформы приходится опять переделывать, тратить очень много времени заново подбирая функцию трансформы вручную.

Мне видится как возможное решение: финальное распределение будет гауссовской смесью из 3х компонент (оно достаточно гибкое и может симитировать требуемую форму финального распределения). И тогда можно задать функцию трансформы как преобразование вектора из 3х чисел, в вектор из 9ти чисел, через линейную (или не совсем линейную) регрессию:

Код:

T([sigma1, sigma2, rate]) => [weight1', mean1', sigma1', weight2', mean2', sigma2', weight3', mean3', sigma3']

Вопрос по линейной/нелинейной регрессии. При таком подходе, возникает проблема с исходными параметрами - sigma1 и sigma2 - проблема в том что они могут быть как sigma1 < sigma2 так и sigma1 > sigma2. И (я так думаю) функция преобразования должна знать какое больше а какое меньше. Получается что регрессия должна быть нелинейной с включением условия min/max, какой вариант регрессии может это сделать? (можно использовать хитрость и сделать предобработку исходных данных, подготовить их как sigma1=min(sigma1, sigma2), sigma2=max(sigma1, sigma2. Но, такая предобработка, меняя параметры местами, теряет связь с из весами (0.6 и 0.4), непонятно как это сделать).

P.S.

Данные — с финансового рынка: сигмы - оценки волатильности лог-доходностей акций, rate безрисковая ставка и return наблюдаемая лог-доходность акции.

dsge · 03.04.2025, 13:30

Brizon
Неиспользование стандартной терминологии или некорректное ее использование очень затрудняет понимать написанное вами.
1. Не бывает нестационарного распределения, бывают нестационарные случайные процессы, т.е. такие, у которых распределения различные в разные моменты времени.
2.

Brizon в сообщении #1680915 писал(а):

Дано: Нестационарный Гауссовский Микс как prior, и наблюдаемые значения.
Параметры: sigma1, sigma2, rate
Prior: 0.6N(rate, sigma1) + 0.4N(rate, sigma2)

При Байесовском подходе в статистике, имеются данные, имеется модель, у которой имеются параметры. Предполагается, что параметры имеют случайное распределение, называемое прайор. Используя данные и теорему Байеса, вы получаете постериорное распределение параметров.

В вашем случае, если я понимаю правильно, параметры - sigma1 и sigma2, а rate - фиксированная константа, процентная ставка. Тогда 0.6N(rate, sigma1) + 0.4N(rate, sigma2) будет не прайор для параметров, а распределение для return, смешанное нормальное с вероятность 0.6 одно и 0.4 другое. Или это сумма 2-х нормальных? В любом случае - это непохоже на прайор для коэффициентов sigma.

Для волатильностей, т.к. они должны быть положительными, прайор обычно выбирается гамма распределением. Для некоторых моделей можно вывести аналитическую формулу для постериора, но для большинства нет и надо использовать симуляции - Monte Carlo Markov Chain or Gibbs sampling.

Brizon в сообщении #1680915 писал(а):

Возможно использование байесовского или других методов

В финансах, в портфельной теории, Байес используется, в основном из-за неустойчивости оценок средних return, т.е. если изменить выборку, то меняется сильно и оценка. Поэтому аналитики вводят свои представления об ожидаемой доходности в какой-то будущий момент времени, в итоге получается что-то среднее между прайором и фриквентистской оценкой. James–Stein estimator и Black-Litterman model имеют Байесовскую трактовку.

Brizon · 03.04.2025, 14:24

Благодарю за уточнения.

Цитата:

В вашем случае, если я понимаю правильно, параметры - sigma1 и sigma2, а rate - фиксированная константа, процентная ставка. Тогда 0.6N(rate, sigma1) + 0.4N(rate, sigma2) будет не прайор для параметров, а распределение для return, смешанное нормальное с вероятность 0.6 одно и 0.4 другое. Или это сумма 2-х нормальных? В любом случае - это непохоже на прайор для коэффициентов sigma.

Нет, я постараюсь переформулировать.

Есть Некий Нестационарный Процесс параметры которого нам надо определить. Мы не знаем точную формулу его распределения, но предполагаем что в отдельные моменты времени его можно апроксиммировать Гауссовским Миксом из 3х компонент.

Есть серия наблюдений, измерений этого процесса в N точках. Измерив видимые нам параметры [sigma1, sigma2, rate], и наблюдаемое значение этого процесса [return] мы получили таблицу цифр.

Мы предполагаем, что в первом приближении процесс имеет форму из 2х гауссовских компонент "0.6N(rate, sigma1) + 0.4N(rate, sigma2)". Но такая модель имеет ошибку, которую мы надеемся улучшить уточнив ее.

Нужно уточнить эту модель а) уточнив ее структуру и используя 3 гауссовских компоненты б) найти новые параметры для новой модели, 9 чисел, для 3х компонент гауссовского микса. Мы наблюдаем лишь 3 числа. Нужно найти преобразование видимых нам параметров [sigma1, sigma2, rate] в параметры уточненной модели [weight1, mean1, new_sigma1, weight2, mean2, new_sigma2, weight3, mean3, new_sigma3]

Возможно это не подходит для Bayesian Inference, но это то что хотелось бы сделать, и что можно сделать вручную подобрав функцию преобразования :).

dsge · 03.04.2025, 15:00

Brizon в сообщении #1680945 писал(а):

Есть серия наблюдений, измерений этого процесса в N точках. Измерив видимые нам параметры [sigma1, sigma2, rate]

Что за "видимые нам параметры "? rate - безрисковая ставка (какая? OIS? Tr.bills?), это не параметр, а переменная. sigma1, sigma2 - что такое? Implied volatilities?

Brizon · 03.04.2025, 15:43

dsge в сообщении #1680947 писал(а):

Что за "видимые нам параметры "? rate - безрисковая ставка (какая? OIS? Tr.bills?), это не параметр, а переменная. sigma1, sigma2 - что такое? Implied volatilities?

Код:

rate = Безрисковая ставка, прибыль по ценным бумагам на 1г (Treasury Bills 1y)
sigma1 = Волатильность последнего года
sigma2 = Волатильность за всю историю акции

Научный форум dxdy

Получить Постериор для Нестационарн Распред? (Калибровка)