2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Вероятностый порог
Сообщение16.07.2018, 11:43 
Доброго времени суток. На учебной практике столкнулся с заданием по терверу и на нем основательно завис. Вот суть -

Данные хранятся в некоторых кластерах. Для каждого из них, есть счетчик количества записи данных в кластер. При достижении счетчиком некоего порога К (для всех одинакового), данные из кластера копируются на внешний носитель. Количество кластеров очень большое, наряду с максимальным значением счетчика. Для уменьшения ресурсов планируется использовать вероятностный порог обнаружения. Инкремент счетчика происходит не каждый раз при записи данных, а с некоторой постоянной вероятностью P. Посчтитайте Р , при котором фактическое количество записей данных не превысит К с вероятностью 99%.

У меня есть несколько идей:
Т.к количество записей в кластеры число большое и самих кластеров много, то, скорее всего, все эти данные имеют нормальное распределение, где по оси абсцисс числа от 0 до К, обозначающие количество записей в каждый из кластеров, а по ординате, соответственно, как часто эти числа встречаются. Тогда, вроде как логично что 99% квантиль из-за условий будет равно К. А вот как перейти к вероятностному порогу отсюда?

2:
Использовать схему, похожу на обнаружение сигнала в шуме... тогда можно чуть иначе взглянуть на условие, ведь получается, что на К записей - 1% ошибок, это значит что в среднем на одну запись для одного кластера - 1/К% вероятность ложной тревоги. А это уже можно как-то оценить, например, по методу максимального правдоподобия. Вот только меня смущает, что такая модель не имеет шума системы и не очень понятно как ее применять.

Подскажите, пожалуйста где я неправ. Спасибо

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group