Пусть наш обучающий материал представлен в виде пар
, где
- момент времени,
- значение скорости ветра в этот момент,
. Задача интерполирования - это подбор функции
, которая хорошо аппроксимирует наши данные, т.е.
. Когда мы решаем задачу интерполирования, то выбираем некоторый функционал ошибки
, который должен измерять отклонения предсказанных значений от истинных. Чаще всего берут сумму квадратов разностей, т.е.
но возможны и другие варианты. Собственно для решения задачи мы должны задать некоторый класс функций
, среди которых будем искать лучшую. Например, полиномы заданной степени. Т.е. мы ищем
Решение
данной задачи и будет наилучшей аппроксимацией в данном классе, а само наименьшее значение
можно как раз рассматривать как характеристику того, насколько хорошо нам удалось приблизить. Соответственно, если заложить в систему несколько методов (т.е. несколько классов
,
,...) то можно найти наилучшую аппроксимацию в каждом, после чего сравнить значения функционалов ошибок и взять ту аппроксимацию, которая дает самое лучшее приближение. Или можно усреднить значения по нескольким лучшим аппроксимациям, возможно это даст тоже хороший результат.
Кстати, неплохо было бы использовать стандартную методологию деления обучающего материала на две части: собственно обучающую и тестовую. В данном случае это означает, что мы из имеющегося набора точек удаляем некоторую часть (равномерно распределенную по набору) и не используем ее при нахождении аппроксимации. А потом считаем ошибку найденного решения на тех точках, которые не были использованы, и это дает нам хорошую характеристику того, насколько можно верить найденному решению.
Что же касается весов, то речь вот о чем. Каждому слагаемому, входящему в сумму
, можно приписать вес
, т.е. задать функционал ошибки следующим образом
Это означает, что мы штрафуем отклонения истинных значений от предсказанных по-разному. Поскольку у нас t - время, то имеет смысл наибольший вес придавать последнему значению, предыдущему - поменьше и т.д. Можно, например, начать со значения
и уменьшать вес по геометрической прогрессии. При этом интерполирующая система будет больше настраиваться на недавнее поведение погоды, а не на то, что было уже сравнительно давно. Задача минимизации такого функционала не должна быть принципиально сложнее исходного. В частности, если мы в качестве системы функций берем полиномы заданной степени, то решения выражаются через суммы разных функций от имеющихся переменных. Типа сумма, сумма квадратов и т.д. С весами решение будет точно таким же, только ровно те же веса появятся в этих самых суммах.