2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Какой же все-таки должна быть формула расчёта рейтинга?
Сообщение26.11.2012, 16:57 
Приступив к задаче разработки алгоритма-формулы расчета рейтинга объектов на сайте, пришел к тому, что задача порядком сложнее, чем может показаться на первый взгляд. Учитывая, что своих знаний явно не достаточно, решил обратиться к сообществу за советом. Собственно задача.

У объекта есть n критериев. Каждый из критериев оценивается по шкале [-5; 5] с шагом 1. Для удобства выполнения расчетов значения могут быть нормализованы к диапазону [-1; 1] с шагом 0,25. Вывод результирующих рейтингов должен выполняться в виде дробных чисел в том же диапазоне [-5; 5]. Оценка пользователя может принимать значение 0 (оценка по критерию не указана). Для каждого из объектов в момент выставления оценок необходимо рассчитывать среднее значение критерия, а так же общее значение рейтинга объекта на основании значений отдельных критериев. В результате выборки объектов они могут сравниваться (сортироваться) как по отдельным критериям, так и по общим рейтингам. При расчете общего рейтинга объекта для каждого из критериев должен использоваться свой весовой коэффициент. Формула должна быть стойка к малому количеству голосов. Формула должна возвращать сравнимые значения по отдельным критериям и общим рейтингам объектов для всех объектов системы.

Смотрел сюда.

Как правильно сортировать контент на основе оценок пользователей http://habrahabr.ru/company/darudar/blog/143188/
Комментарий: показалось не применимым по той причине, что на вход подаются значения только 2х типов (да/нет, like/dislike, ...) количество которых считается в дальнейшем. Как расширить формулу под описанные требования и применима ли она в принципе, ума не приложу…

Механизм расчета рейтинга http://help.yandex.ru/partnermarket/?id=1111429
Комментарий: содержит слишком много критериев, как то «оценка службы качества» или «коэффициент качества оценки». Если все их в частном случае принять за 1, то вызывает сомнение эффективность производной формулы

250 лучших фильмов (внизу) http://www.kinopoisk.ru/level/20/
Комментарий: такой параметр как «С – среднее значение рейтинга всех фильмов (сейчас: 7.3261)» в моем случае слабо себе представляю каким должен быть, т.к. система новая и на текущий момент статистики нет никакой.

Описание методики расчета «Народного рейтинга» http://www.banki.ru/services/responses/methodology/nr_methodology.doc
Комментарий: все то-же значение «C — средний по всем банкам балл засчитанных голосов с учётом фактора времени» с проблемой, как и в пункте выше.

High-Performance Liquidity Compensation Algorithm to Offset Variability in Very Small Sample Sizes http://http//answers.oreilly.com/topic/1353-high-performance-liquidity-compensation-algorithm-to-offset-variability-in-very-small-sample-sizes/
Комментарий: выглядит вроде убедительно и выбор параметров описан доходчиво. Но в любом случае хотелось бы услышать мнение разбирающихся в вопросе.

В целом от минимального порога голосов за объект хотелось бы если не отказаться вообще, то установить его максимально низким, скажем = 3

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group