Доброго времени суток. На учебной практике столкнулся с заданием по терверу и на нем основательно завис. Вот суть -
Данные хранятся в некоторых кластерах. Для каждого из них, есть счетчик количества записи данных в кластер. При достижении счетчиком некоего порога К (для всех одинакового), данные из кластера копируются на внешний носитель. Количество кластеров очень большое, наряду с максимальным значением счетчика. Для уменьшения ресурсов планируется использовать вероятностный порог обнаружения. Инкремент счетчика происходит не каждый раз при записи данных, а с некоторой постоянной вероятностью P. Посчтитайте Р , при котором фактическое количество записей данных не превысит К с вероятностью 99%.
У меня есть несколько идей: Т.к количество записей в кластеры число большое и самих кластеров много, то, скорее всего, все эти данные имеют нормальное распределение, где по оси абсцисс числа от 0 до К, обозначающие количество записей в каждый из кластеров, а по ординате, соответственно, как часто эти числа встречаются. Тогда, вроде как логично что 99% квантиль из-за условий будет равно К. А вот как перейти к вероятностному порогу отсюда?
2: Использовать схему, похожу на обнаружение сигнала в шуме... тогда можно чуть иначе взглянуть на условие, ведь получается, что на К записей - 1% ошибок, это значит что в среднем на одну запись для одного кластера - 1/К% вероятность ложной тревоги. А это уже можно как-то оценить, например, по методу максимального правдоподобия. Вот только меня смущает, что такая модель не имеет шума системы и не очень понятно как ее применять.
Подскажите, пожалуйста где я неправ. Спасибо
|