Юстас писал(а):
Скорость ветра можно считать распределенной нормально,
Я в этом сильно сомневаюсь. Соответственно, более чем уверен, что линейная регрессия по имеющимся данным даст результаты худшие, чем другие виды регрессий.
Вопрос к автору - есть ли в наличии достаточный обучающий материал, т.е. реальные наблюдения для решаемой задачи? Без этого ничего хорошего наверняка не получится, так как с потолка можно предлагать самые разные модели, но никак нельзя проверить, какие из них адекватны, а какие - нет. Только проверкой на реальных данных.
Если данные есть, то с ними нужно поработать. Прежде всего - реализовать разные методы интерполяции (их уже тут много предлагали) и посмотреть на точность их предсказания. Может, удастся выбрать один или несколько лучших. Может, в разных ситуациях лучшими будут то один, то другой метод. Тогда при практическом применении можно попробовать поступать так: аппроксимировать имющиеся данные всеми известными методами, а прогноз делать по тому, который наилучшим образом ложится на эти имеющиеся данные. Или можно брать среднее значение прогнозов разных методов, причем коэффициенты (веса) либо подобрать заранее и фиксировать, либо также определять динамически по тому, насколько хорошо каждый метод интерполировал имеющиеся данные.
Многие методы интерполяции позволяют приписывать разным точкам разные веса. Этим имеет смысл пользоваться (наверное), приписывая меньшие веса более старым наблюдениям.
Самая неприятная вещь - это, конечно, резкое изменение характера поведения предсказываемой величины. Это общая беда любых методов, потому что они все равно на самом деле умеют строить только модель, согласующуюся с наблюдаемыми данными, и резкое изменение поведения учесть не в состоянии. Можно попробовать опять-таки на основе обучающего материала попробовать научиться предсказывать резкое изменение ветра по предыдущим наблюдениям. Но я сильно не уверен, что в данном случае эта задача физически разрешима. Ведь резкий порыв или наоборот стихание ветра в данной точке вызван физическими причинами, находящимися на расстоянии от нее. Вряд ли можно это предсказать по измерениям в этой же точке. Возможно, было бы лучше поставить насколько датчиков вокруг мельницы на определенном расстоянии от нее и снимать информацию с них.
Что можно сделать в рамках стандартного подхода - это на основе набранной статистики понять, могут ли в принципе интерполяционные методы, известные системе, давать надежный прогноз в текущих условиях. И в соответствии с этим давать не только прогноз, но и его надежность. Если надежность невелика, то система должна вести себя так, как если бы прогноза и не было толком, т.е. должна быть готова к любым неожиданностям. Соответственно, в один день, когда погода стабильна и резких изменений нет, система будет давать надежные прогнозы, а в день, когда ветер постоянно резко меняется, система понимает, что надежный прогноз в таких условиях она делать просто не умеет и сообщает об этом на более высокий уровень.