где есть много независимых одинаково часто встречающихся признаков. вот как это формализовать?
А этого не понял я, даже интуитивно.
Просто "есть много координат, по которым распределение сильно отличается от точечного, и координаты независимы в совокупности"?
этого я не понял.
Представим себе, что наше подлинное распределение такое: по 

 - красные большие квадраты, красные маленькие квадраты, синие большие круги, синие маленькие круги; по 

 - синие большие квадраты, синие маленькие квадраты, красные большие круги, красные маленькие круги.
Тогда по критерию "разнообразия" выборка по 

 фигур каждого из 8 типов будет лучше, чем по 

 каждого из распространенных типов, и по 

 из нераспространенных.
Но если в выборке фигур каждого типа одинаково - то мы, глядя на нее, не научимся давать предсказания лучше, чем монетка, по второй мы обучимся "красное - это квадрат с вероятностью 

, синее - это круг с вероятностью 

", что является лучшей возможной точностью.