70546

ИЗМЕРЕНИЕ ИНФОРМАЦИИ

Конспект

Информатика, кибернетика и программирование

В содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации.

Русский

2014-10-22

19.22 KB

9 чел.

ТЕМА 2. ИЗМЕРЕНИЕ ИНФОРМАЦИИ

2.1. Подходы к измерению информации


     В 
содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. 
     Содержательный подход часто называют 
субъективным, так как разные люди информацию об одном и том же предмете оценивают по-разному.
     
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. информативность последовательности символов не зависит от содержания сообщения, а определяется минимально необходимым количеством символов для ее кодирования. Алфавитный подход является объективным, он не зависит от субъекта, воспринимающего сообщение.

2.2. Единицы измерения информации

Единица измерения информации называется бит (bit) - сокращение от английских слов binary digit, что означает двоичная цифра. 
     В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено - не намагничено. При этом одно состояние принято обозначать цифрой 0, а другое - цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). 
     В информатике часто используется величина, называемая 
байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт. 
     Наряду с байтами для измерения количества информации используются более крупные единицы: 
     1 Кбайт (один килобайт) = 2
10 байт = 1024 байта; 
     1 Мбайт (один мегабайт) = 2
10 Кбайт = 1024 Кбайта; 
     1 Гбайт (один гигабайт) = 2
10 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как: 
     1 Терабайт (Тб) = 1024 Гбайта = 2
40 байта, 
     1 Петабайт (Пб) = 1024 Тбайта = 2
50 байта. 
     Рассмотрим, как можно подсчитать количество информации в сообщении, используя содержательный подход.
     Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х, заключенное в этом сообщении, и число событий N связаны формулой: 
2x = N. Решение такого уравнения с неизвестной х имеет вид: x=log2N. То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Эта формула носит название формулы Хартли. Получена она в 1928 г. американским инженером Р. Хартли.

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, которое несет каждый символ (информационный вес одного символа), вычисляется по формуле:x=log2N, где N - мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

2.3. Вероятностный подход к измерению информации

Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 году. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем выражается формулой: x=log2 (1/p). Чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. 
     

едставление информации в компьютере, единицы измерения информации

В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов.

Знак вместе с его смыслом называют символом.

Набор знаков, в котором определен их порядок, называется алфавитом. Существует множество алфавитов:

Шифрование - кодирование сообщения отправителя, но такое чтобы оно было не понятно несанкционированному пользователю.

Длиной кода называется такое количество знаков, которое используется при кодировании.

Для преобразования числовой, текстовой, графической, звуковой информации в цифровую необходимо применить кодирование. Кодирование – это преобразование данных одного типа через данные другого типа.

Таким образом, единицей информации в компьютере является один бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.

Для кодирования графических данных применяется, например, такой метод кодирования как растр. Координаты точек и их свойства описываются с помощью целых чисел, которые кодируются с помощью двоичного кода. Так черно-белые графические объекты могут быть описаны комбинацией точек с 256 градациями серого цвета, т.е. для кодирования яркости любой точки достаточно 8 - разрядного двоичного числа.

Режим представления цветной графики в системе RGB с использованием 24 разрядов  называется полноцветным. Для поноцветного режима в системе CMYK необходимо иметь 32 разряда.

Одно и то же сообщение можно закодировать разными способами, т. е. выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования. К ним относятся:

  1.  разговорные языки (русский, английский, хинди и др. — всего более 2000);
  2.  язык мимики и жестов;
  3.  язык рисунков и чертежей;
  4.  язык науки (математические, химические, биологические и другие символы);
  5.  язык искусства (музыки, живописи, скульптуры и т. д.);
  6.  специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и др.).


 

А также другие работы, которые могут Вас заинтересовать

61620. Произведение: Дубровский 18.94 KB
  Цели урока: 1 Познакомить учащихся с жанром романа. 2 Познакомить учащихся с историей создания романа Дубровский. Пушкина Сегодня Вова как раз подготовил нам небольшое сообщение о происхождении жанра романа.
61621. А.С. Пушкин «Сказка о рыбаке и рыбке» 13.15 KB
  Цель: чтение и анализ произведения Задачи: 1 развивать навык правильного сознательного чтения 2 мотивировать на понимание текста а не на механическое чтение 3 учить выделять тему и идею произведения сравнивать образы героев находить символические явления и предметы...
61622. Н. Рыленков «К родине» 20.92 KB
  Цель: формировать навыки словесного рисования; развивать внимание к образным средствам языка; учить умению выражать свои чувства по отношению к прочитанному.
61623. РАБОТА С «КАРТИННОЙ ГАЛЕРИЕЙ». АНДРЕЙ РУБЛЕВ «ТРОИЦА» 18.89 KB
  Цель: развивать умение работать в картиной; обогащать словарный запас детей; воспитывать любовь к литературе и искусству, чувство патриотизма. Оборудование: слайд картины, А. Рублева «Троица», диапроектор
61626. ВЫЧИТАНИЕ С ЗАНИМАНИЕМ ЕДИНИЦЫ ЧЕРЕЗ НЕСКОЛЬКО РАЗРЯДОВ ВИДА 30007-648 42.65 KB
  Складываем сотни 8 пишем под сотнями складываем единицы тысяч 2 пишем под единицами тысяч Что общего заметили у остальных выражений в уменьшаемом отсутствуют единицы некоторых разрядов.
61627. Уравнения. Учимся решать уравнения 25.62 KB
  Этапы урока Деятельность учителя Деятельность учащихся Теоретическое обоснование Молодцы А теперь посмотрим на эту таблицу: d 5 4 3 2 1 D5 11D Ребята объясните как изменятся сумма при изменении одного из слагаемых.