PAV писал(а):
Насколько я понимаю, речь идет о некоторой системе классификации. Наблюдаются объекты, каждый из которых необходимо отнести либо к классу А, либо к не-А. По каждому объекту измеряется набор характеристик, на основании которых и принимается решение. Построена некоторая система, которая по предъявленному объекту (т.е. набору его характеристик) выдает число от 0 до 1. Нам хочется, чтобы это число было бы вероятностью того, что данный объект принадлежит классу А.
Теперь мы хотим проверить работу системы на некотором множестве данных, в котором известны истинные принадлежности объекта классам.
Именно так
PAV писал(а):
Качество работы системы можно оценивать разными способами. Мне пока не совсем ясна постановка - чего мы хотим. Допустим, некто умный сказал, что ошибка системы - 3%. Что означает это число? Чем ошибка в 3% количественно отличается от ошибки 5%? Я пока не понимаю.
Цель - настроить систему так, чтобы ошибка была как можно ближе к нулю.
PAV писал(а):
Разбить отрезок [0,1] на некоторое количество частей (скажем, 10), может быть частично пересекающихся (скажем, взять отрезки [0;0.1], [0.05;0.15] и т.д. Для каждого отрезка отобрать те события, для которых вероятность, предсказанная системой, попадала в указанный диапазон, и посмотреть, с какой частотой они происходили. На основе этих точек построить график зависимости наблюдаемой вероятности от предсказанной и посмотреть на него.
Эта идея мне нравится. Для каждого прогона системы строим график. Нашей целью будет настроить систему таким образом, чтобы график приближался к прямой, проходящей под 45 градусов к осям. В этом варианте оценки, как я понимаю, чем короче будут отрезки и чем больше их будет, тем точнее будет график. Кроме того, надо использовать интерполяцию, поскольку величины вероятностей соседних отрезков могут давать разброс. Здесь возник еще вопрос: нужно ли при интерполяции учитывать вес отрезка, потому как в разные отрезки попадет разное количество событий?
PAV писал(а):
Качество работы системы можно оценивать разными способами.
Спасибо за вышеописанный. Какие еще способы можете предложить?