70546

ИЗМЕРЕНИЕ ИНФОРМАЦИИ

Конспект

Информатика, кибернетика и программирование

В содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации.

Русский

2014-10-22

19.22 KB

13 чел.

ТЕМА 2. ИЗМЕРЕНИЕ ИНФОРМАЦИИ

2.1. Подходы к измерению информации


     В 
содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. 
     Содержательный подход часто называют 
субъективным, так как разные люди информацию об одном и том же предмете оценивают по-разному.
     
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. информативность последовательности символов не зависит от содержания сообщения, а определяется минимально необходимым количеством символов для ее кодирования. Алфавитный подход является объективным, он не зависит от субъекта, воспринимающего сообщение.

2.2. Единицы измерения информации

Единица измерения информации называется бит (bit) - сокращение от английских слов binary digit, что означает двоичная цифра. 
     В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено - не намагничено. При этом одно состояние принято обозначать цифрой 0, а другое - цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). 
     В информатике часто используется величина, называемая 
байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт. 
     Наряду с байтами для измерения количества информации используются более крупные единицы: 
     1 Кбайт (один килобайт) = 2
10 байт = 1024 байта; 
     1 Мбайт (один мегабайт) = 2
10 Кбайт = 1024 Кбайта; 
     1 Гбайт (один гигабайт) = 2
10 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как: 
     1 Терабайт (Тб) = 1024 Гбайта = 2
40 байта, 
     1 Петабайт (Пб) = 1024 Тбайта = 2
50 байта. 
     Рассмотрим, как можно подсчитать количество информации в сообщении, используя содержательный подход.
     Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х, заключенное в этом сообщении, и число событий N связаны формулой: 
2x = N. Решение такого уравнения с неизвестной х имеет вид: x=log2N. То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Эта формула носит название формулы Хартли. Получена она в 1928 г. американским инженером Р. Хартли.

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, которое несет каждый символ (информационный вес одного символа), вычисляется по формуле:x=log2N, где N - мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

2.3. Вероятностный подход к измерению информации

Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 году. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем выражается формулой: x=log2 (1/p). Чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. 
     

едставление информации в компьютере, единицы измерения информации

В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов.

Знак вместе с его смыслом называют символом.

Набор знаков, в котором определен их порядок, называется алфавитом. Существует множество алфавитов:

Шифрование - кодирование сообщения отправителя, но такое чтобы оно было не понятно несанкционированному пользователю.

Длиной кода называется такое количество знаков, которое используется при кодировании.

Для преобразования числовой, текстовой, графической, звуковой информации в цифровую необходимо применить кодирование. Кодирование – это преобразование данных одного типа через данные другого типа.

Таким образом, единицей информации в компьютере является один бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.

Для кодирования графических данных применяется, например, такой метод кодирования как растр. Координаты точек и их свойства описываются с помощью целых чисел, которые кодируются с помощью двоичного кода. Так черно-белые графические объекты могут быть описаны комбинацией точек с 256 градациями серого цвета, т.е. для кодирования яркости любой точки достаточно 8 - разрядного двоичного числа.

Режим представления цветной графики в системе RGB с использованием 24 разрядов  называется полноцветным. Для поноцветного режима в системе CMYK необходимо иметь 32 разряда.

Одно и то же сообщение можно закодировать разными способами, т. е. выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования. К ним относятся:

  1.  разговорные языки (русский, английский, хинди и др. — всего более 2000);
  2.  язык мимики и жестов;
  3.  язык рисунков и чертежей;
  4.  язык науки (математические, химические, биологические и другие символы);
  5.  язык искусства (музыки, живописи, скульптуры и т. д.);
  6.  специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и др.).


 

А также другие работы, которые могут Вас заинтересовать

47143. The attribute. Ways of expressing attributes 66.5 KB
  The attribute is a secondary part of the sentence which characterizes person or non-person expressed by the headword either qualitatively, quantitatively, or from the point of view of situation. Attributes may refer to nouns and other words of nominal nature, such as pronouns gerunds and substitute words, as in...
47145. Определение числовой последовательности и её предела 66.64 KB
  предел функции одной переменной в точке.бесконечно большие и бесконечно малые функции. Предел функциис его помощью определяются многие др. Определение предела функции в точке по Коши число А принадлежащее R называется пределом функции fх в точке х0 если она определена в некоторой проколотой окрестности точки х0 и если для любого сколь угодно малого числа Е 0 можно указать такое число b=b х0 е 0 что для всех х удовлетворяющих условие 0 xx0 b выполняется неравенство fx e если e 0 b 0 то 0 xx0 b Определение предела функции в...
47147. Ответственность за экологический вред, принесенный источником повышенной опасности 67.18 KB
  Возмещение вреда причиненного источником повышенной опасности для окружающей среды характеризуется существенной спецификой. К объектам повышенной опасности ГК РФ относит средства механизмы электрическую энергию высокого напряжения атомную энергию взрывчатые вещества сильнодействующие яды и т. Обязанность возмещения такого вреда возлагается на юридическое лицо или гражданина которые владеют источником повышенной опасности на праве собственности праве хозяйственного ведения или праве оперативного управления либо на ином...
47148. Способи розпізнавання та класифікації помилок ТСП 67.5 KB
  Самые распространенные из них описываются ключевыми словами wire и reg соответственно. Однако следует помнить что средство синтеза не всегда реализует reg в виде триггера. Отличие wire от reg состоит в том что reg способен сохранять присвоенное значение работает как переменная в языках программирования а к wire требуется прилагать непрерывное воздействие driver. Существуют также wnd wor tri0 tri1 trind trior и trireg это цепь а не регистр для моделирования различных типов цепей wnd wired nd tri0 резистор к 0 trireg ...
47149. Международные системы стандартной нумерации изданий (ISBN, ISSN и пр.): сфера применения, состав, структура, расположение в издании и порядок присвоения. Штриховой код EAN 68 KB
  5301 Международная стандартная нумерация книг регламентирующих правила проставления международного стандартного номера книги Interntionl stndrd book number ISBN на книжные издания введенных в действие в январе 1988 г. ISBN позволяет издателям книготорговцам библиотекарям научным работникам признанным во всем мире способом беспрепятственно осуществлять распространение литературы в соответствии со спросом усовершенствовать поиск и заказ изданий весь цикл создания и доведения книги до потребителя. ISBN является обязательным...
47150. Организация как система 71.73 KB
  Xарактеристика организации как системы Организацией признается юридическое лицо которое имеет в собственности хозяйственном ведении или оперативном управлении обособленное имущество и отвечает по своим обязательствам этим имуществом может от своего имени приобретать и осуществлять имущественные и личные неимущественные права нести обязанности быть истцом и ответчиком в суде. Организации могут быть формальными и неформальными. Неформальные организации также представляют группы людей. Различают простые и сложные организации.
47151. Государство, как институт общественной системы. Типология государства, «провалы» государства 68.4 KB
  Типология государства провалы государства. Типология государства провалы государства. Признаки государства как социального института: наличие власти в виде системы государственных органов учреждении и организаций. В структуре государства действует целый ряд социальных институтов с которыми люди постоянно соприкасаются в своей жизни: институты народного представительства осуществляющие в стране публичную власть.