2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Аппроксимация функций плотности вероятности-байес/ЕМ/несущие
Сообщение18.10.2014, 00:48 
Аватара пользователя
Добрый день.

У меня есть следующая задача:
Пусть для каждой точки планеты мы можем составить "функцию прогноза дождя", которая делает следующее - на вход принимает вектор с описанием погоды (в него могут входить, например - температура, влажность, скорость ветра, скорости изменения этих величин, и т.д.) а на выходе выдает вероятность дождя на следующий день в данной точке планеты и при данных погодных условиях.
То есть, каждая конкретная "функция прогноза дождя" (ФПД) определена на многомерном пространстве "вектора погоды", а в качестве результата выдает вероятность дождя, что позволяет считать ее функцией плотности вероятности(давайте не будем заморачиваться с нормализацией, и будем считать, что ее интеграл единичен). Для каждой точки планеты будет своя уникальная ФПД.
То есть, данные функции для всех точек нашей планеты образуют некоторое "пространство ФПД".
Далее.
У нас есть некоторое (10-20) число функций из этого пространства. Например, выбраны 20 точек на поверхности планеты с разнообразным (чтобы базис был побогаче) климатом, и для них нами получены соответствующие функции. У нас нет координат, которым соотфетствуют эти ФПД, нет никакой дополнительной информации, просто функции из этого пространства. Давайте назовем этот набор "базовый набор ФПД".

Задача состоит в следующем - проведя серию экспериментов в определенной точке, то есть, получив опытным путем некоторый набор пар "[вектор погодных условий]:[1 или 0 (был ли дождь на след. день)]" для данной точки планеты, надо получить наилучшее возможное приближение ФПД для данной точки, отталкиваясь только от "базового набора ФПД", но принимая во внимание тот факт, что климат в разных точках планеты определяется схожими закономерностями - наличие гор/водных бассейнов/устойчивых ветров, и т.д. - каждая из которых вносит свой особенный вклад в ФПД (отдельно уточняю, что никакой информации о присутствии гор/бассейнов/итд у нас нет, только ФПД).

Другими словами, нам нельзя просто байесовским выводом определить "к какой из базовых функций наша выборка подходит лучше всего". Нет. Нам надо пройти несколько дальше, и определить "какой климат наиболее вероятен в этой точке земли, если учесть, что в земном климате есть определенные закономерности, которые можно вынести из базового набора ФПД".

Как это решать?
Единственный вариант, просматривающийся для меня - разложить имеющиеся базовые функции на какие-то "несущие". То есть, выделить в них "главные функциональные компоненты" и далее уже применять байесовский вывод в пространстве весов для главных компонент, а не самих базовых функций.

Есть 2 проблемы:
1) К сожалению, я не знаю, как выделять несущие произвольного вида для многомерной функции. Сам термин "несущая", насколько я понимаю, взят из разложения одномерной функции в синусовый спектр. Существует ли соотвествующий матаппарат для многомерного случая и прозвольного вида несущих? Если не существует для произвольного вида, то хотелось бы, чтобы среди несущих как минимум были гауссианы. А что еще? Только они? Вряд ли подходят переодические или пороговые (сигмоид) функции - функция плотности вероятности должна иметь конечный интеграл. Как выделять несущие гауссианы? Какая то вариация ЕМ?
2) Даже выделив несущие, не очень ясно, как раскладывать на них не готовую фунцию, а короткую выборку. Из того, что я на данном направлении нарешал (байесом в лоб) все выглядит довольно мрачно. По крайней мере, в том случае, когда несущая может входить в функцию со знаком минуса.

Может, возможны какие то комбинации байесовского вывода для базовых функций и их главных компонент?
Например, получить разложения базовых ФПД на несущие, затем с помощью байеса вывести вероятности отнесения данной выборки к каждой из базовых ФПД, используя разложение отдельных ФПД на несущие разложить на несущие их комбинацию, а получив разложение байесовского приближения данной выборки на несущие как-то "подкорректировать" коэффициенты отдельных несущих, использовав байесовский вывод на них.

В целом, чем дольше я решаю задачу, тем больше складывается ощущение, что эта проблема уже должна иметь какой то готовый метод. Кто нибудь знает что-то подобное?

Спасибо за внимание.

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group