Выборка чего?
Символов из потока. Достаточно большая, чтобы частоты символов считать релевантной оценкой вероятности их появления.
-- 25.06.2024, 15:20 --Допустим, некто регулярно публикует некие статьи в газете. На самом деле этот некто - шпион, задачей которого является передать в "центр" бинарное сообщение, например, о том, планирует ли противник в этом году нападение. Если он публикует в тексте слово "побелка", то это значит, что нападение планируется, а если он вместо этого публикует слово "покраска", то это значит, что нападение не планируется.
И вот, в следующий раз он публикует короткую статью из 1000 символов, в которой нет ни слова "побелка", ни слова "покраска". Какое количество информации получил "центр", читая эту газету? Если Вы начнёте считать количество символов в статье и сколько букв в алфавите, то значит Вы занимаетесь ерундой. А вот если Вы правильно определите вероятности, то поймёте, что центр получил нуль информации.
Это именно пример на различие информации и знания.
Ваш шпион в центр передает именно знания, хотя в шпионских романах это принято называть информацией.
Что делает шпион? Он выбирает канал передачи гораздо более широкий, чем требуется для передачи осмысленной информации, ака знаний. А оставшуюся полосу заполняет шумом с целью стеганографии.
И что?
Неосмысленная информация - тоже информация. Источник информации с максимальной удельной информацией на один символ - это белый шум. Из той же формулы Шеннона следует.
-- 25.06.2024, 15:22 --А вот если Вы правильно определите вероятности, то поймёте, что центр получил нуль информации.
Если шпион передал сообщение, в котором нет знаний о начале военных действий, это совсем не означает, что центр не получил никаких знаний, а получил ноль бит информации.
Такое сообщение, может трактоваться, как сигнал "Alive", то же не пустой, кстати.