Я не согласен с расширением закона Ципфа на "цепочку случайных символов".
Там же приводится оригинальная статья, в которой всё объясняется.
На всякий случай поясню ещё раз, почему я был недоволен. Какое бы Вы не выбрали понимание этой цитаты (хоть сколько-нибудь корректное), Вы бы не смогли получить, что "цифра "1" встречается в тексте в 2 раза чаще, чем цифра "0" -- это просто грубая ошибка. Если бы Вы сказали то же не про одну из цифр, а про одну из последовательностей "_0_" или "_1_", тогда я лучше смог бы Вас понять и объяснить, что имеется в виду.
Может быть стоит внести небольшое уточнение в Вики (я сделаю это, если придумаю ёмкое и не ухудшающее ситуацию пояснение). Но не называть это бредом -- в любом случае, сейчас в качестве такого уточнения там есть прямая ссылка на статью.
-- 03.09.2015, 12:13 --atlakatlПоясню в меру своего понимания. Отнеситесь к этой попытке как к первому приближению, а не как к последней инстанции.
В статье говорится о законе Ципфа применительно к длине слова, а не к отдельным словам. Причём автор использует при этом некоторую методику обрезания лишнего и рассматривает в эмпирических обоснованиях (там есть графики) совсем мало "слов" (от 3 до 6 в зависимости от числа символов в алфавите). Автор считает это аналогом закона Ципфа в естественных языках и заключает из этого, что в естественных языках нет необходимости искать что-то мистическое в этом законе. Интуитивно для меня это выглядит скорее правдоподобным, чем бредом, хотя не уверен, что я достаточно глубоко понимаю взаимосвязи.