Добрый день.
У меня есть следующая задача: Пусть для каждой точки планеты мы можем составить "функцию прогноза дождя", которая делает следующее - на вход принимает вектор с описанием погоды (в него могут входить, например - температура, влажность, скорость ветра, скорости изменения этих величин, и т.д.) а на выходе выдает вероятность дождя на следующий день в данной точке планеты и при данных погодных условиях. То есть, каждая конкретная "функция прогноза дождя" (ФПД) определена на многомерном пространстве "вектора погоды", а в качестве результата выдает вероятность дождя, что позволяет считать ее функцией плотности вероятности(давайте не будем заморачиваться с нормализацией, и будем считать, что ее интеграл единичен). Для каждой точки планеты будет своя уникальная ФПД. То есть, данные функции для всех точек нашей планеты образуют некоторое "пространство ФПД". Далее. У нас есть некоторое (10-20) число функций из этого пространства. Например, выбраны 20 точек на поверхности планеты с разнообразным (чтобы базис был побогаче) климатом, и для них нами получены соответствующие функции. У нас нет координат, которым соотфетствуют эти ФПД, нет никакой дополнительной информации, просто функции из этого пространства. Давайте назовем этот набор "базовый набор ФПД".
Задача состоит в следующем - проведя серию экспериментов в определенной точке, то есть, получив опытным путем некоторый набор пар "[вектор погодных условий]:[1 или 0 (был ли дождь на след. день)]" для данной точки планеты, надо получить наилучшее возможное приближение ФПД для данной точки, отталкиваясь только от "базового набора ФПД", но принимая во внимание тот факт, что климат в разных точках планеты определяется схожими закономерностями - наличие гор/водных бассейнов/устойчивых ветров, и т.д. - каждая из которых вносит свой особенный вклад в ФПД (отдельно уточняю, что никакой информации о присутствии гор/бассейнов/итд у нас нет, только ФПД).
Другими словами, нам нельзя просто байесовским выводом определить "к какой из базовых функций наша выборка подходит лучше всего". Нет. Нам надо пройти несколько дальше, и определить "какой климат наиболее вероятен в этой точке земли, если учесть, что в земном климате есть определенные закономерности, которые можно вынести из базового набора ФПД".
Как это решать? Единственный вариант, просматривающийся для меня - разложить имеющиеся базовые функции на какие-то "несущие". То есть, выделить в них "главные функциональные компоненты" и далее уже применять байесовский вывод в пространстве весов для главных компонент, а не самих базовых функций.
Есть 2 проблемы: 1) К сожалению, я не знаю, как выделять несущие произвольного вида для многомерной функции. Сам термин "несущая", насколько я понимаю, взят из разложения одномерной функции в синусовый спектр. Существует ли соотвествующий матаппарат для многомерного случая и прозвольного вида несущих? Если не существует для произвольного вида, то хотелось бы, чтобы среди несущих как минимум были гауссианы. А что еще? Только они? Вряд ли подходят переодические или пороговые (сигмоид) функции - функция плотности вероятности должна иметь конечный интеграл. Как выделять несущие гауссианы? Какая то вариация ЕМ? 2) Даже выделив несущие, не очень ясно, как раскладывать на них не готовую фунцию, а короткую выборку. Из того, что я на данном направлении нарешал (байесом в лоб) все выглядит довольно мрачно. По крайней мере, в том случае, когда несущая может входить в функцию со знаком минуса.
Может, возможны какие то комбинации байесовского вывода для базовых функций и их главных компонент? Например, получить разложения базовых ФПД на несущие, затем с помощью байеса вывести вероятности отнесения данной выборки к каждой из базовых ФПД, используя разложение отдельных ФПД на несущие разложить на несущие их комбинацию, а получив разложение байесовского приближения данной выборки на несущие как-то "подкорректировать" коэффициенты отдельных несущих, использовав байесовский вывод на них.
В целом, чем дольше я решаю задачу, тем больше складывается ощущение, что эта проблема уже должна иметь какой то готовый метод. Кто нибудь знает что-то подобное?
Спасибо за внимание.
|