Спасибо за развернутый ответ. Жаль, что с большей его частью придется не согласиться...
1. Критерии оценки должны отражать возможные потери от ошибки прогноза. То есть правильным критерием должна быть функция потерь, отражающая наши убытки от того, что мы вышли без зонтика в дождливый день и от непромокаемого плаща в солнечный и т.п. (причём они, потери, различны для дачника, планирующего день выезда на отдых, водителя, думающего, когда мыть машину, авиатора или сельского хозяина, обдумывающего, когда сеять). Однако выписать общую для всех функцию потерь невозможно. Приходится использовать какое-то приемлемое для всех приближение.
В исходном вопросе не идет речи о функции потерь. Речь идет о правильном предсказании вероятности. Давай считать, что фермер сам знает, что ему делать, если вероятность дождя - 10%. Все, что нужно фермеру от предсказателя - это правильная вероятность. Если в течение года предсказатель все время давал 10% дождю, а дождь был 300 дней, то предсказатель плохой. А если дождь был 36 дней в году - то хороший.
Поскольку мы не знаем, какие потери дороже, в одну или другую сторону, приходится использовать чётные функции,
и
Из любой функции можно сделать четную, применив модуль к аргументу. Исходный вопрос о том, какю функцию выбрать поверх модуля.
Как правило, чем больше ошибка, тем больше потери. Так что косинус не подойдёт.
Мы оцениваем не потери, а точность предсказания. Поэтому вопрос с косинусом - открыт. Кстати, видимо имелся в виду синус.
А вот выбор между модулем, квадратом или четвёртой (или более высокой чётной) степенью не столь ясен
Это верно. Но в этом заключается исходный вопрос.
Однако формальных оснований для выбора тут нет, только содержательные, на основе изучения объекта прогнозирования
Точность предсказателя не зависит от объекта прогнозирования. Исходный вопрос - какой предсказатель точнее. Все, что нам нужно, - это правильная предсказанная вероятность.
3. Квадратичная функция имеет приятные свойства, в частности, её производная линейна, что облегчает как поиск оптимума, так и доказательство его единственности.
Если нам нужны простые вычисления, то давайте возмем просто нулевую функцию. Простота вычислений - немного странный способ для выбора правильной функции.
Однако сумма модулей часто используется, как критерий. Его преимущество - робастность.
В исходном сообщении говорится о том, что модуль не подходит, т.к. показывает, что неправильный предсказатель - лучший.
-- 06.07.2014, 12:37 --Господи, да какая мера отклонения лично Вас устраивает, такой и пользуйтесь. Только не удивляйтесь, что по разным мерам наилучшими будут разные предсказатели.
Призыв к всевышнему немного преждевременный. Я бы взял модуль, но он дает неверный результат, о чем сказано в исходном сообщении. Кроме того у модуля уже есть противники в этой ветке (у модуля излом в нуле).