ИЗБЫ́ТОЧНОСТЬ СООБЩЕ́НИЙ
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
ИЗБЫ́ТОЧНОСТЬ СООБЩЕ́НИЙ, понятие теории информации, численно оценивающее возможность сокращения записи сообщений. Наличие избыточности в записи сообщений к.-л. источника информации проявляется в возможности записать их в среднем более кратко, используя те же самые знаки (т. е. используя код с тем же алфавитом, см. Кодирование). Напр., если рассматриваемые сообщения представляют собой последовательности знаков $0$ и $1$, в которых единица встречается в среднем один раз на десять знаков, то, применяя кодирование по правилу $00 → 0, 01 → 10, 10 → 110, 11 → 111$, можно в среднем сократить запись почти вдвое. Макс. доля лишних знаков определяется по статистич. свойствам источника сообщений и называется его избыточностью. Для И. с. $R$ справедлива формула $R = 1 – H/\text{log}_2m$, где $m$ – число букв алфавита, $H$ – энтропия источника на букву сообщения. В приведённом примере И. с. равна 0,53. Минимальной И. с., равной нулю, обладает только последовательность, в которой знаки независимы и с вероятностью $1/m$ могут совпадать с любой из букв алфавита.
На практике важен вопрос об оценке И. с. конкретных видов сообщений (таких, как письм. и устная речь, телевизионные изображения). Величина И. с. в них оказывается обычно значительной. Так, напр., И. с. англ. письм. речи не менее 0,6.