70546

ИЗМЕРЕНИЕ ИНФОРМАЦИИ

Конспект

Информатика, кибернетика и программирование

В содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации.

Русский

2014-10-22

19.22 KB

29 чел.

ТЕМА 2. ИЗМЕРЕНИЕ ИНФОРМАЦИИ

2.1. Подходы к измерению информации


     В 
содержательном подходе возможна качественная оценка информации: новая, срочная, важная и т.д. информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. 
     Содержательный подход часто называют 
субъективным, так как разные люди информацию об одном и том же предмете оценивают по-разному.
     
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. информативность последовательности символов не зависит от содержания сообщения, а определяется минимально необходимым количеством символов для ее кодирования. Алфавитный подход является объективным, он не зависит от субъекта, воспринимающего сообщение.

2.2. Единицы измерения информации

Единица измерения информации называется бит (bit) - сокращение от английских слов binary digit, что означает двоичная цифра. 
     В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено - не намагничено. При этом одно состояние принято обозначать цифрой 0, а другое - цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). 
     В информатике часто используется величина, называемая 
байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (28). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт. 
     Наряду с байтами для измерения количества информации используются более крупные единицы: 
     1 Кбайт (один килобайт) = 2
10 байт = 1024 байта; 
     1 Мбайт (один мегабайт) = 2
10 Кбайт = 1024 Кбайта; 
     1 Гбайт (один гигабайт) = 2
10 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как: 
     1 Терабайт (Тб) = 1024 Гбайта = 2
40 байта, 
     1 Петабайт (Пб) = 1024 Тбайта = 2
50 байта. 
     Рассмотрим, как можно подсчитать количество информации в сообщении, используя содержательный подход.
     Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х, заключенное в этом сообщении, и число событий N связаны формулой: 
2x = N. Решение такого уравнения с неизвестной х имеет вид: x=log2N. То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Эта формула носит название формулы Хартли. Получена она в 1928 г. американским инженером Р. Хартли.

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, которое несет каждый символ (информационный вес одного символа), вычисляется по формуле:x=log2N, где N - мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

2.3. Вероятностный подход к измерению информации

Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 году. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем выражается формулой: x=log2 (1/p). Чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. 
     

едставление информации в компьютере, единицы измерения информации

В ЭВМ применяется двоичная система счисления, т.е. все числа в компьютере представляются с помощью нулей и единиц, поэтому компьютер может обрабатывать только информацию, представленную в цифровой форме.

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов.

Знак вместе с его смыслом называют символом.

Набор знаков, в котором определен их порядок, называется алфавитом. Существует множество алфавитов:

Шифрование - кодирование сообщения отправителя, но такое чтобы оно было не понятно несанкционированному пользователю.

Длиной кода называется такое количество знаков, которое используется при кодировании.

Для преобразования числовой, текстовой, графической, звуковой информации в цифровую необходимо применить кодирование. Кодирование – это преобразование данных одного типа через данные другого типа.

Таким образом, единицей информации в компьютере является один бит, т.е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.

Для кодирования графических данных применяется, например, такой метод кодирования как растр. Координаты точек и их свойства описываются с помощью целых чисел, которые кодируются с помощью двоичного кода. Так черно-белые графические объекты могут быть описаны комбинацией точек с 256 градациями серого цвета, т.е. для кодирования яркости любой точки достаточно 8 - разрядного двоичного числа.

Режим представления цветной графики в системе RGB с использованием 24 разрядов  называется полноцветным. Для поноцветного режима в системе CMYK необходимо иметь 32 разряда.

Одно и то же сообщение можно закодировать разными способами, т. е. выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования. К ним относятся:

  1.  разговорные языки (русский, английский, хинди и др. — всего более 2000);
  2.  язык мимики и жестов;
  3.  язык рисунков и чертежей;
  4.  язык науки (математические, химические, биологические и другие символы);
  5.  язык искусства (музыки, живописи, скульптуры и т. д.);
  6.  специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и др.).


 

А также другие работы, которые могут Вас заинтересовать

30548. Криптографической системы с открытым ключом 25.48 KB
  Основные компоненты PKI Удостоверяющий центр Сертификат открытого ключа Регистрационный центр Репозиторий Архив сертификатов Конечные пользователи Основные задачи Основные задачи системы информационной безопасности которые решает инфраструктура управления открытыми ключами: обеспечение конфиденциальности информации; обеспечение целостности информации; обеспечение аутентификации пользователей и ресурсов к которым обращаются пользователи; обеспечение возможности подтверждения совершенных пользователями действий с...
30549. Сетевая модель доверительных отношений 189.15 KB
  Вышестоящий центр может передать подчиненному C часть своих функций по выпуску сертификатов. Оконечный центр C предназначен для выдачи сертификатов пользователям PKI в то время как промежуточный C рекомендуется использовать только для выдачи сертификатов подчиненным ему центрам C. В модели P2P существует два метода установления доверительных отношений: с помощью списков сертификатов заслуживающих доверия Сertificte Trust List CTL и кросссертификатов.inf можно устанавливать параметры регулируемых доверительных отношений для сертификатов C...
30550. Классификация демаскирующих признаков и их характеристики 39 KB
  Доска Классификация признаков Демаскирующие признаки характеристик объекта: видовые признаки; признаки сигналов; признаки веществ. Выступление Признаки позволяющие отличить один объект от другого называются демаскирующими. Демаскирующие признаки объекта описывают его различные состояния характеристики и свойства. В общем случае демаскирующие признаки объектов разделяются на опознавательные признаки и признаки деятельности.
30551. Технические каналы утечки информации, классификация и характеристика 26.65 KB
  Для исключения утечки персональных данных за счет побочных электромагнитных излучений и наводок в информационных системах 1 класса могут применяться следующие методы и способы защиты информации: использование технических средств в защищенном исполнении; использование средств защиты информации прошедших в установленном порядке процедуру оценки соответствия; размещение объектов защиты в соответствии с предписанием на эксплуатацию; размещение понижающих трансформаторных подстанций электропитания и контуров заземления; обеспечение...
30552. Оптические каналы утечки информации 67.52 KB
  Отраженный от объекта свет содержит информацию о его внешнем виде видовых признаках а излучаемый объектом свет о параметрах излучений признаках сигналов. Длина протяженность канала утечки зависит от мощности света от объекта свойств среды распространения и чувствительности фотоприемника. Способы и средства противодействия наблюдению в оптическом диапазоне В интересах защиты информации об объекте его демаскирующих признаков необходимо уменьшать контраст объект фон снижать яркость объекта и не допускать наблюдателя близко к объекту.
30553. Структура оптического канала утечки информации 87.73 KB
  Выступление: Оптические каналы утечки информации Структура оптического канала утечки информации Объект наблюдения в оптическом канале утечки информации является одновременно источником информации и источником сигнала потому что световые лучи несущие информацию о видовых признаках объекта представляют собой отраженные объектом лучи внешнего источника или его собственные излучения. Излучаемый свет содержит информацию об уровне и спектральном составе источников видимого света а в инфракрасном диапазоне по характеристикам излучений можно также...
30554. Радиоэлектронные каналы утечки информации 18.65 KB
  Радиоэлектронный канал относится к наиболее информативным каналам утечки в силу следующих его особенностей: независимость функционирования канала от времени суток и года существенно меньшая зависимость его параметров по сравнению с другими каналами от метеоусловий; высокая достоверность добываемой информации особенно при перехвате ее в функциональных каналах связи за исключением случаев дезинформации; большой объем добываемой информации; оперативность получения информации вплоть до реального масштаба времени; скрытность перехвата...
30555. Акустические каналы утечки информации 701.6 KB
  Часть III дополнительно Оценка громкости звука Уровень звука дБ Источник звука Очень тихий 0 10 Усредненный порог чувствительности уха Тихий шепот 1. Порог слышимости соответствует мощности звука 1012 Вт или звуковому давлению на барабанную перепонку уха человека 2105 Па Абсолютный порог минимальное значение воздействующего раздражителя при котором возникает ощущение. Под воздействием звука Рак = 70 дБ кирпичная стена толщиной 05 м совершает вибрационные колебания с ускорением а≈3·105g.
30556. Задачи и принципы инженерно-технической защиты информации 50.5 KB
  Задачи Инженернотехническая защита информации одна из основных составляющих комплекса мер по защите информации составляющей государственную коммерческую и личную тайну. Этот комплекс включает нормативноправовые документы организационные и технические меры направленные на обеспечение безопасности секретной и конфиденциальной информации. Инженернотехническая защита информации включает комплекс организационных и технических мер по обеспечению информационной безопасности техническими средствами и решает следующие задачи:...