В чем магия квадрата?

math123 · 06.07.2014, 08:14

Пусть у нас есть предсказатель погоды. Для каждого дня он говорит нам вероятность того, что будет преобладать солнечная погода, пасмурная или дождливая. Сумма этих вероятностей равна 1. Т.е. для каждого дня мы имеем вектор из 3х чисел меньше единицы, сумма которых равна 1. Например

$(0.3, 0.5, 0.2)$

Пусть теперь у нас есть 2 таких предсказателя и мы хотим определить, какой из них лучше работает. Для этого мы используем исторический набор данных за 1 год, где для каждого из 2х предсказателей есть 365 предсказаний и еще есть 365 фактических данных о погоде, т.е. какая на самом деле была погода в каждый из дней. Фактическая погода представляется вектором, где один из элементов равен 1, остальные - нули. Например

$(0, 1, 0)$

Для ответа на этот вопрос мы для каждого дня считаем средне-квадратичное отклонение (ско) каждого из предсказателей от фактической погоды. Например

$[(0.3, 0.5, 0.2) - (0, 1, 0)]^2 = 0.3^2 + 0.5^2 + 0.2^2 = 0.38$

Далее берем среднее по всем дням отклонение в квадрате. Лучшим предсказателем будет тот, у которого ско минимально.

И вот вопрос. Почему именно квадрат? Почему, например, не куб? Понятно, что квадрат уничтожает отрицательные значения, но вряд ли это - его главное свойство. Никто не мешает взять нам куб от модуля разности. Или почему, не степень 1.5 или 3.1415?

Можно легко объяснить, почему степень 1 нам не подходит. Если 90% дней в году - солнечные, то несложными подсчетами легко убедиться, что самым хорошим будет предсказатель, который всегда говорит, что погода будет солнечная с вероятностью 100%. Но это - не то, что нам нужно. В данном случае нам нужен предсказатель, который дает именно 90% солнечной погоде.

Но как быть с остальными степенями?

Lia · 06.07.2014, 08:28

i

Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Карантин»
Тема перемещена в Карантин по следующим причинам:

Запишите формулы в соответствии с требованиями Правил форума, т.е. в $\TeX$ .
Краткие инструкции можно найти здесь: topic8355.html и topic183.html.
Кроме этого, в теме Видео-пособия для начинающих форумчан можно посмотреть видео-ролик "Как записывать формулы".

Исправьте все Ваши ошибки и сообщите об этом в теме Сообщение в карантине исправлено.
Настоятельно рекомендуется ознакомиться с темами Что такое карантин и что нужно делать, чтобы там оказаться и Правила научного форума.

iifat · 06.07.2014, 09:26

Степень 1 нам не подходит именно из-за нечётности. Модуль имеет излом в нуле. Четвёртая срепень подходит, но вторая проще!

math123 · 06.07.2014, 10:10

> Степень 1 нам не подходит именно из-за нечётности
В чем проблема с нечетностью (если всегда брать модуль разности)?

> Модуль имеет излом в нуле
Чем мешает излом в нуле?

> Четвёртая срепень подходит, но вторая проще
6-я степень подходит? Степень 1.5 подходит? Откуда следует, что 4-я подходит?

Lia · 06.07.2014, 10:12

i	math123 Оформляйте цитаты нормально, с помощью кнопок "Цитата" или "Вставка".

Someone · 06.07.2014, 10:22

math123 в сообщении #884423 писал(а):

И вот вопрос. Почему именно квадрат? Почему, например, не куб? Понятно, что квадрат уничтожает отрицательные значения, но вряд ли это - его главное свойство. Никто не мешает взять нам куб от модуля разности. Или почему, не степень 1.5 или 3.1415?

Господи, да какая мера отклонения лично Вас устраивает, такой и пользуйтесь. Только не удивляйтесь, что по разным мерам наилучшими будут разные предсказатели.

Евгений Машеров · 06.07.2014, 10:27

0. Если Вы решаете прикладные задачи - не стоит искать решение, которое будет лучшим со всех мыслимых точек зрения. Всегда будут противоречивые критерии и вынужденные уступки. Искать абсолютный идеал можно в абстрактной области знания, и лучше в богословии или философии - математика для этого всё же излишне конкретна. Приходится работать с приближениями и огрублениями.
1. Критерии оценки должны отражать возможные потери от ошибки прогноза. То есть правильным критерием должна быть функция потерь, отражающая наши убытки от того, что мы вышли без зонтика в дождливый день и от непромокаемого плаща в солнечный и т.п. (причём они, потери, различны для дачника, планирующего день выезда на отдых, водителя, думающего, когда мыть машину, авиатора или сельского хозяина, обдумывающего, когда сеять). Однако выписать общую для всех функцию потерь невозможно. Приходится использовать какое-то приемлемое для всех приближение.
2. Функция потерь должна быть доступной для вычисления (тут важна не столько простота вычисления, сколько доступность всех нужных данных), не противоречить интуитивно определённым потерям от ошибок и иметь "приятные" математические свойства.
Функции потерь, зависящие от последовательности ошибок, могут более точно приближать реальные потери, но вычислять их тяжко. Обычно ограничиваются суммой функций отклонений по отдельным точкам $\Sigma f(x_i)$ .
Очевидно, совершенно точный прогноз должен соответствовать нулевым потерям, а неточный - ненулевым (уже это тривиальное требование позволяет вычеркнуть среднее отклонение - если пророк правильно предрекает число ясных дней, но всегда ошибается в моменте их наступления, среднее отклонение будет 0).
Поскольку мы не знаем, какие потери дороже, в одну или другую сторону, приходится использовать чётные функции, $f(x)=f(-x)$ и $f(0)=0$ (если доступна информация о стоимости ошибок, например, для систем скрининговой диагностики ложноположительный диагноз приводит к затратам на ненужное обследование, а ложноотрицательный - к смерти больного, то функция потерь не обязана быть чётной).
Как правило, чем больше ошибка, тем больше потери. Так что косинус не подойдёт. А вот выбор между модулем, квадратом или четвёртой (или более высокой чётной) степенью не столь ясен. Часто естественно считать, что одна грубая ошибка дороже нескольких мелких, суммарно ей равных, и тогда квадрат лучше модуля, как критерий. С другой стороны, слишком высокая степень слишком завышает значение единичных грубых ошибок. Однако формальных оснований для выбора тут нет, только содержательные, на основе изучения объекта прогнозирования. В ряде случаев квадрат - хорошее приближение реальной функции потерь, в других - опираются на традицию применения в сходных задачах

(Оффтоп)

"Хоть и безобразно, но однообразно"
(С) товарищ майор.

3. Квадратичная функция имеет приятные свойства, в частности, её производная линейна, что облегчает как поиск оптимума, так и доказательство его единственности. Однако сумма модулей часто используется, как критерий. Его преимущество - робастность.

math123 · 06.07.2014, 11:14

Спасибо за развернутый ответ. Жаль, что с большей его частью придется не согласиться...