2druggist
Хм, странно... Я слышал о законе Ципфа просто в терминах обратной пропорциональности частоты встречаемости слова и его номера в словаре, упорядоченному по-убыванию частот. Откуда у вас там квадраты взялись (хотя о гиперболическом характере зависимости тоже где-то слышал)...
Вы говорите об "интегральной" форме функции распределения, я же имел в виду "дифференциальную", т.н. плотность распределения вероятности. С несущественными оговорками можно считать

, для получения стандартной формы закона -
размер(частота) vs ранг надо проинтегрировать по

Кстати, если в качестве

взять число городов с населением

будет такая же зависимость

...
2Otez-osnovatel
"Я думаю для китайского, корейского, и японского, закон этот недействителен, так как иероглифы там обозначают не слово, а более того. Чуть ли не абзац."
А какая разница? Знаки делятся на конвенциальные и иконические и обозночают они не "слова" и "абзацы", а объекты и явления внешнего и внутреннего мира... Так что и для иероглифов, если подсчитать соответствующие частоты употребления будет тот же самый закон.
Хотя про китайцев слышал в этой связи, что у них некоторое отличие, точно не помню, касающееся существования зон Брока и Вернике( воспроизведения и восприятия слов) в левом полушарии. Что сказывается на глубинном мировоззрении китайцев...