denny
Закон Ципфа применим к текстам с очень низкой длиной корреляции. Проще говоря, к спискоте: справочники, каталоги и т.п. Художественный текст имеет очень большую длину корреляции, а потому применение аппроксимации вероятностного распределения частотным - шарлатанство. Даже если кому то ранее "удалось". Или он наврал, что удалось
Какое шарлатанство? Закон Ципфа подтверждается на всех художественных текстах, но справедлив в средней части распределения ранг-частота. На первых рангах действует поправка Мандельброта, занижающая частоты в языках синтетического строя (линейный сдвиг по рангам, равна 0 для аналитического английского, который исследовал Ципф, 2 для русского и 4-6 для тюркских), на высоких рангах частоты занижает поправка Ворончака, степенная в зависимости от ранга, и в области средних частот появляется интересное образование - кратер (чаша) углубление, отражающее разнотемность выборки.
Главное то, что все параметры распределения лингвистически обоснованы и в неявном виде использовались лингвистами веками ранее формулировки закона.
Беда в другом - СЕО-шники пытаются доказать что поисковые машины благосклонно относятся к текстам, построенным по закону Ципфа (что абсурд - текст всегда построен по закону Ципфа), и предписывают копирайтерам и рерайтерам генерировать тексты с заранее предписываемыми ими частотами слов. Т.е. человек должен написать текст про зарядку аккумулятора, и употребить в нем слова аккумулятор 100 раз кислота 20 раз а напряжение 5 раз. Есть даже программы, которые после анализа живого текста выдают список слов с указанием, какие следует употребить чаще а какие реже и насколько.
Есть и свернутое сжатие ЗЦ до пары-тройки цифр (названных тошнотностью), которые также якобы характеризуют качество текста.
Бред, но предполагается, что яндекс с гуглом такой текст возлюбят с первого прочтения и будут всем рекомендовать в топе выдачи по запросам.
Это, кстати, одна из причин, что интернет заполнен бредовыми текстами. Это не всегда вина писателя, это требования заказчика. А заказчик обычно владелец цветочного киоска или парикмахерской, СТО (!), которому сеошник объяснил, что владеет секретом, как написать эффективный рекламный текст. Битва экстрасенсов отдыхает.