В онлайне непрерывно происходят испытания Бернулли (показ рекламы – ипытание, клик – успех). Цель – как можно раньше задетектировать изменение (факт и величину) вероятности успеха
(CTR).
.
Вижу 2 случая (сильно упрщённых, но хотя бы с ними разобраться для начала):
1)
может меняться непрерывно и достаточно медленно;
2)
кусочно-постоянна, то есть от последнего изменения до последющего
неизменна. Про "время жизни"
нам ничего не известно.
Вопрос такой. Имеются ли какие-то уже разработанные методы для решения данной задачи?
Мои размышления относительно случая 2 такие (мне кажется, этот случай проще).
Давайте строить 2 доверетиельных интервала для
: один на показах с последнего задетектированного изменения
, второй на поседних
показах (
подбирается исходя из уровня значимости и
, который мы хотим детектировать). Но тут сразу видна проблема. Если
слишком большое, то это станет понятно задолго до
показов. Значит, нужно считать доверительные интервалы для
для последних
испытаний. То есть доверительных интервалов у нас получается много. И вот тут возникает проблема как интерпертировать набор этих интервалов. Они могут иметь всевозможные паттерны перекрытий. И вот с этим проблема.
Из доверительных интервалов для вероятности успеха думаю использовать
Wilson Score interval. Его рекомендуют использовать в этой статье –
Confidence Intervals for the Binomial Proportion: A Comparison of Four Methods.