Допустим, имеются последовательности из
конечного набора элементов. Меня интересуют цифры числа

, остатки от деления простых на данное число и т.п. Какие существуют критерии случайности данной последовательности? Известно, что понятие "случайный" требует осторожного подхода. Но ведь ясно, что цифры числа
более случайны, чем последовательность

. Сам я начал с простой вещи - относительных частот появления данного элемента

. Здесь

- длина анализируемой последовательности. Необходимым условием "случайности" является

Однако, видно, что и

после второго же периода будет удовлетворять этому критерию! Решил разобраться в информационной энтропии
Информационная_энтропияПусть

, где

- количество возможных состояний, для цифр

. Однако для больших

энтропии

и

становятся одинаковыми! Последнее, что пришло мне в голову - это анализировать появление пар, троек и других сочетаний элементов. Формула остаётся той же (???), только

уже означает номер одного из возможных сочетаний (пар цифр, скажем, 100 ).
Смоделировал это на Wolfram. Убедился, что

растёт с ростом

. Но если её определять для пар, то энтропия примитивной последовательности заметно отстаёт от энтропии

; для троек - ещё заметнее.
Правильно ли я сформулировал критерий? Как ещё можно анализировать случайность цифровых последовательностей?