70546

ИЗМЕРЕНИЕ ИНФОРМАЦИИ

Конспект

Информатика, кибернетика и программирование

В содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации.

Русский

2014-10-22

19.22 KB

9 чел.

ТЕМА 2. ИЗМЕРЕНИЕ ИНФОРМАЦИИ

2.1. Подходы к измерению информации


     В 
содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. 
     Содержательный подход часто называют 
субъективным, так как разные люди информацию об одном и том же предмете оценивают по-разному.
     
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. информативность последовательности символов не зависит от содержания сообщения, а определяется минимально необходимым количеством символов для ее кодирования. Алфавитный подход является объективным, он не зависит от субъекта, воспринимающего сообщение.

2.2. Единицы измерения информации

Единица измерения информации называется бит (bit) - сокращение от английских слов binary digit, что означает двоичная цифра. 
     В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено - не намагничено. При этом одно состояние принято обозначать цифрой 0, а другое - цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). 
     В информатике часто используется величина, называемая 
байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт. 
     Наряду с байтами для измерения количества информации используются более крупные единицы: 
     1 Кбайт (один килобайт) = 2
10 байт = 1024 байта; 
     1 Мбайт (один мегабайт) = 2
10 Кбайт = 1024 Кбайта; 
     1 Гбайт (один гигабайт) = 2
10 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как: 
     1 Терабайт (Тб) = 1024 Гбайта = 2
40 байта, 
     1 Петабайт (Пб) = 1024 Тбайта = 2
50 байта. 
     Рассмотрим, как можно подсчитать количество информации в сообщении, используя содержательный подход.
     Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х, заключенное в этом сообщении, и число событий N связаны формулой: 
2x = N. Решение такого уравнения с неизвестной х имеет вид: x=log2N. То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Эта формула носит название формулы Хартли. Получена она в 1928 г. американским инженером Р. Хартли.

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, которое несет каждый символ (информационный вес одного символа), вычисляется по формуле:x=log2N, где N - мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

2.3. Вероятностный подход к измерению информации

Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 году. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем выражается формулой: x=log2 (1/p). Чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. 
     

едставление информации в компьютере, единицы измерения информации

В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов.

Знак вместе с его смыслом называют символом.

Набор знаков, в котором определен их порядок, называется алфавитом. Существует множество алфавитов:

Шифрование - кодирование сообщения отправителя, но такое чтобы оно было не понятно несанкционированному пользователю.

Длиной кода называется такое количество знаков, которое используется при кодировании.

Для преобразования числовой, текстовой, графической, звуковой информации в цифровую необходимо применить кодирование. Кодирование – это преобразование данных одного типа через данные другого типа.

Таким образом, единицей информации в компьютере является один бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.

Для кодирования графических данных применяется, например, такой метод кодирования как растр. Координаты точек и их свойства описываются с помощью целых чисел, которые кодируются с помощью двоичного кода. Так черно-белые графические объекты могут быть описаны комбинацией точек с 256 градациями серого цвета, т.е. для кодирования яркости любой точки достаточно 8 - разрядного двоичного числа.

Режим представления цветной графики в системе RGB с использованием 24 разрядов  называется полноцветным. Для поноцветного режима в системе CMYK необходимо иметь 32 разряда.

Одно и то же сообщение можно закодировать разными способами, т. е. выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования. К ним относятся:

  1.  разговорные языки (русский, английский, хинди и др. — всего более 2000);
  2.  язык мимики и жестов;
  3.  язык рисунков и чертежей;
  4.  язык науки (математические, химические, биологические и другие символы);
  5.  язык искусства (музыки, живописи, скульптуры и т. д.);
  6.  специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и др.).


 

А также другие работы, которые могут Вас заинтересовать

41576. Свопы и соглашения о форвардной ставке 119 KB
  С другой стороны компания выпустившая обязательство под плавающий процент и ожидающая в будущем роста процентных ставок сможет избежать увеличения своих выплат по обслуживанию долга за счет обмена плавающего процента на фиксированный. Например компания А с рейтингом ААА может заимствовать на рынке средства под плавающую ставку LIBOR 05' а компания В с рейтингом ВВВ под ставку LIBOR 075. На рынке облигаций компания А может заимствовать на десять лет средства под 13 а компания В под 145. 2 компания А обладает...
41577. Опционы. Оценка опциона 576.45 KB
  Право купить или продать актив имеет покупатель опциона. Из самого определения опциона следует что возможны два типа контрактов соглашение о праве на приобретение опцион на приобретение или опцион “колл†и соглашение о праве на продажу опцион на продажу или опцион “путâ€. Цена по которой покупатель опциона может купить продать базовый актив называется ценой выполнения. Момент времени в который заканчивается действие соглашения называется моментом выполнения опциона.
41578. СУБЪЕКТЫ ТРУДОВОГО ПРАВА 73 KB
  Понятие и классификация субъектов трудового права. Субъектами трудового права являются участники общественных отношений определенные трудовым законодательством которые могут владеть трудовыми правами и соответствующими обязанностями. Которые работают на основании трудового договора за пределами страны.
41579. ТРУДОВЫЕ ПРАВООТНОШЕНИЯ 47 KB
  Понятие трудовых правоотношений Условия возникновения трудовых правоотношений Основания возникновения трудовых правоотношений Содержание трудовых правоотношений
41580. КОЛЛЕКТИВНЫЕ ДОГОВОРЫ И СОГЛАШЕНИЯ 52 KB
  Порядок заключения коллективного договора коллективного договора Условия коллективного договора носят обязательный характер. Коллективный договор как институт трудового права – это совокупность правовых норм которые регулируют трудовые и социально-экономические отношения между наемными работниками и работодателями определяют порядок разработки заключения и исполнения трудового договора комплексно регулируют различные вопросы которые касаются разных аспектов трудовых правоотношений.
41581. ПРАВОВОЕ РЕГУЛИРОВАНИЕ ЗАНЯТОСТИ И ТРУДОУСТРОЙСТВА 57.5 KB
  Понятие занятости населения.Государственная служба занятости ее структура и полномочия.Понятие занятости населения.
41582. Трудовой договор. Понятие трудового договора 169.5 KB
  Понятие трудового договора Стороны трудового договора Содержание трудового договора Общий порядок принятия на работу Трудовой договор о работе по совместительству. Совмещение Контракт как особая форма трудового договора. Изменение условий трудового договора. Прекращение трудового договора.
41583. Рабочее время. Понятие рабочего времени 40.5 KB
  К нему относится: Нормальное; Сокращенное; Неполное рабочее время; Дополнительное – законодательно закрепленное отклонение от основного рабочего времени. К нему относится: Сверхурочные работы; Продолжительность рабочего времени в выходные дни праздничные и нерабочие дни; Виды рабочего времени Различают такие виды рабочего времени: нормированное : нормальное сокращенное неполное ненормированное Нормальное рабочее время согласно ст. Коллективными и трудовыми договорами может быть установлена меньшая продолжительность рабочего...
41584. Время отдыха. Понятие времени отдыха 51.5 KB
  Перерывы в течение рабочего дня ст. не зависимо от гражданства; Время отпуска засчитывается в стаж работы. Виды отпусков: ежегодные отпуска: основной дополнительный;