Приступив к задаче разработки алгоритма-формулы расчета рейтинга объектов на сайте, пришел к тому, что задача порядком сложнее, чем может показаться на первый взгляд. Учитывая, что своих знаний явно не достаточно, решил обратиться к сообществу за советом. Собственно задача.
У объекта есть n критериев. Каждый из критериев оценивается по шкале [-5; 5] с шагом 1. Для удобства выполнения расчетов значения могут быть нормализованы к диапазону [-1; 1] с шагом 0,25. Вывод результирующих рейтингов должен выполняться в виде дробных чисел в том же диапазоне [-5; 5]. Оценка пользователя может принимать значение 0 (оценка по критерию не указана). Для каждого из объектов в момент выставления оценок необходимо рассчитывать среднее значение критерия, а так же общее значение рейтинга объекта на основании значений отдельных критериев. В результате выборки объектов они могут сравниваться (сортироваться) как по отдельным критериям, так и по общим рейтингам. При расчете общего рейтинга объекта для каждого из критериев должен использоваться свой весовой коэффициент. Формула должна быть стойка к малому количеству голосов. Формула должна возвращать сравнимые значения по отдельным критериям и общим рейтингам объектов для всех объектов системы.
Смотрел сюда.
Как правильно сортировать контент на основе оценок пользователей
http://habrahabr.ru/company/darudar/blog/143188/Комментарий: показалось не применимым по той причине, что на вход подаются значения только 2х типов (да/нет, like/dislike, ...) количество которых считается в дальнейшем. Как расширить формулу под описанные требования и применима ли она в принципе, ума не приложу…
Механизм расчета рейтинга
http://help.yandex.ru/partnermarket/?id=1111429Комментарий: содержит слишком много критериев, как то «оценка службы качества» или «коэффициент качества оценки». Если все их в частном случае принять за 1, то вызывает сомнение эффективность производной формулы
250 лучших фильмов (внизу)
http://www.kinopoisk.ru/level/20/Комментарий: такой параметр как «С – среднее значение рейтинга всех фильмов (сейчас: 7.3261)» в моем случае слабо себе представляю каким должен быть, т.к. система новая и на текущий момент статистики нет никакой.
Описание методики расчета «Народного рейтинга»
http://www.banki.ru/services/responses/methodology/nr_methodology.docКомментарий: все то-же значение «C — средний по всем банкам балл засчитанных голосов с учётом фактора времени» с проблемой, как и в пункте выше.
High-Performance Liquidity Compensation Algorithm to Offset Variability in Very Small Sample Sizes
http://http//answers.oreilly.com/topic/1353-high-performance-liquidity-compensation-algorithm-to-offset-variability-in-very-small-sample-sizes/Комментарий: выглядит вроде убедительно и выбор параметров описан доходчиво. Но в любом случае хотелось бы услышать мнение разбирающихся в вопросе.
В целом от минимального порога голосов за объект хотелось бы если не отказаться вообще, то установить его максимально низким, скажем = 3