70546

ИЗМЕРЕНИЕ ИНФОРМАЦИИ

Конспект

Информатика, кибернетика и программирование

В содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации.

Русский

2014-10-22

19.22 KB

9 чел.

ТЕМА 2. ИЗМЕРЕНИЕ ИНФОРМАЦИИ

2.1. Подходы к измерению информации


     В 
содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. 
     Содержательный подход часто называют 
субъективным, так как разные люди информацию об одном и том же предмете оценивают по-разному.
     
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. информативность последовательности символов не зависит от содержания сообщения, а определяется минимально необходимым количеством символов для ее кодирования. Алфавитный подход является объективным, он не зависит от субъекта, воспринимающего сообщение.

2.2. Единицы измерения информации

Единица измерения информации называется бит (bit) - сокращение от английских слов binary digit, что означает двоичная цифра. 
     В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено - не намагничено. При этом одно состояние принято обозначать цифрой 0, а другое - цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). 
     В информатике часто используется величина, называемая 
байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт. 
     Наряду с байтами для измерения количества информации используются более крупные единицы: 
     1 Кбайт (один килобайт) = 2
10 байт = 1024 байта; 
     1 Мбайт (один мегабайт) = 2
10 Кбайт = 1024 Кбайта; 
     1 Гбайт (один гигабайт) = 2
10 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как: 
     1 Терабайт (Тб) = 1024 Гбайта = 2
40 байта, 
     1 Петабайт (Пб) = 1024 Тбайта = 2
50 байта. 
     Рассмотрим, как можно подсчитать количество информации в сообщении, используя содержательный подход.
     Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х, заключенное в этом сообщении, и число событий N связаны формулой: 
2x = N. Решение такого уравнения с неизвестной х имеет вид: x=log2N. То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Эта формула носит название формулы Хартли. Получена она в 1928 г. американским инженером Р. Хартли.

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, которое несет каждый символ (информационный вес одного символа), вычисляется по формуле:x=log2N, где N - мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

2.3. Вероятностный подход к измерению информации

Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 году. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем выражается формулой: x=log2 (1/p). Чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. 
     

едставление информации в компьютере, единицы измерения информации

В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов.

Знак вместе с его смыслом называют символом.

Набор знаков, в котором определен их порядок, называется алфавитом. Существует множество алфавитов:

Шифрование - кодирование сообщения отправителя, но такое чтобы оно было не понятно несанкционированному пользователю.

Длиной кода называется такое количество знаков, которое используется при кодировании.

Для преобразования числовой, текстовой, графической, звуковой информации в цифровую необходимо применить кодирование. Кодирование – это преобразование данных одного типа через данные другого типа.

Таким образом, единицей информации в компьютере является один бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.

Для кодирования графических данных применяется, например, такой метод кодирования как растр. Координаты точек и их свойства описываются с помощью целых чисел, которые кодируются с помощью двоичного кода. Так черно-белые графические объекты могут быть описаны комбинацией точек с 256 градациями серого цвета, т.е. для кодирования яркости любой точки достаточно 8 - разрядного двоичного числа.

Режим представления цветной графики в системе RGB с использованием 24 разрядов  называется полноцветным. Для поноцветного режима в системе CMYK необходимо иметь 32 разряда.

Одно и то же сообщение можно закодировать разными способами, т. е. выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования. К ним относятся:

  1.  разговорные языки (русский, английский, хинди и др. — всего более 2000);
  2.  язык мимики и жестов;
  3.  язык рисунков и чертежей;
  4.  язык науки (математические, химические, биологические и другие символы);
  5.  язык искусства (музыки, живописи, скульптуры и т. д.);
  6.  специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и др.).


 

А также другие работы, которые могут Вас заинтересовать

6481. Тематика и особенности сатиры М.Е. Кольцова 44.66 KB
  Тематика и особенности сатиры М.Е. Кольцова История русской сатиры, имея множество образцов, не исследована глубоко и подробно до сих пор ни в отношении ее классической, теперь явно и давно уже вымершей, стихотворной формы, ни тем более в отношении ...
6482. Судьбы мигрантов в правозащитных публикациях Лидии Графовой 43.99 KB
  Судьбы мигрантов в правозащитных публикациях Лидии Графовой В 1990 г. Лидия Графова стала одним из инициаторов создания первой в России общественной организации, помогающей мигрантам, - комитета Гражданское содействие. В 1993 году на базе Граждан...
6483. История через призму рекламы 29.57 KB
  История через призму рекламы История. Что есть история? В переводе с древнегреческого это слово означает расспрашивание, исследование. Профессор Кембриджа, сэр Ричард Дж. Эванс, говорит, что история - это область знаний, а также гуманитарная...
6484. Социальные проблемы на страницах Литературной газеты 50.26 KB
  Социальные проблемы на страницах Литературной газеты Глубокие и сложные процессы в современном российском обществе - социальный кризис, трансформация социальной структуры, политические и духовные изменения, ...
6485. Жанровое разнообразие районной прессы (на примере газеты Усть-Удинские вести) 46.51 KB
  Жанровое разнообразие районной прессы (на примере газеты Усть-Удинские вести) Районная печать, несмотря на ряд исторически сложившихся неблагоприятных факторов (трудная экономическая ситуация, зависимость от местных властей, отсутствие квалифицирова...
6486. Русские журналисты и писатели об Англии (к. XVIII - сер. XX века) 41.12 KB
  Русские журналисты и писатели об Англии (к. XVIII - сер. XX века) Российские писатели проявляли немалый интерес к миру Англии. И связанно это с множеством факторов: как культурных, так и политических. Но это обусловлено и взаимным интерес...
6487. Статья. Тема литературы в произведениях Александра Гениса 46.02 KB
  Тема литературы в произведениях Александра Гениса Александр Генис - советский журналист и писатель, в 1977 году эмигрировавший в США. В настоящее время живет в Нью-Джерси. В Нью-Йорке никто не ждал начинающего писателя (а Генису не было еще и 2...
6488. Хедлайны новостных материалов сетевой ленты slon.ru 32.48 KB
  Хедлайны новостных материалов сетевой ленты slon.ru В последние годы наблюдается тенденция стремительного развития интернет-коммуникации, которая вовлекает все большее число пользователей. Интернет-пространство, в котором информация быстро теряет ак...
6489. Использование темы глобальных катастроф в современной рекламе 32.38 KB
  Использование темы глобальных катастроф в современной рекламе Во второй половине ХХ столетия, цивилизация, достигнув не малых высот в различных сферах общественной жизни-науке, технике, культуре- столкнулась лицом к лицу, с казалось, бы с неразреши...