9685

Измерение информации. Экспертные методы оценки информации

Реферат

Информатика, кибернетика и программирование

Измерение информации Каждый предмет или явление человек пытается охарактеризовать, для сравнения с подобными, его величиной. Не всегда это можно просто и однозначно сделать. Даже величины физических предметов можно оценивать по-разному...

Русский

2015-01-19

46 KB

2 чел.

Измерение информации

Каждый предмет или явление человек пытается охарактеризовать, для сравнения с подобными, его величиной. Не всегда это можно просто и однозначно сделать. Даже величины физических предметов можно оценивать по-разному: по объему, весу, массе, количеству составляющих его элементов, стоимости. Поэтому, например, понятно, что даже на простой вопрос: ”Что больше, килограммовая гиря или детский воздушный шарик?”- можно ответить по разному. Чем явление более сложно и многопланово и чем больше характеристик у этого явления, тем труднее подобрать для него удовлетворяющее всех, кто занимается этим явлением, определение его величины. Так и количество информации можно мерить по-разному: в количествах книг, страниц, знаков, метрах кинопленки, тоннах архивных материалов, килобайтах оперативной памяти ЭВМ, а также оценивать по эмоциональному восприятию человека, по полученной пользе от обладания информацией, по необходимым затратам на обработку, систематизацию информации и т.д. Попробуйте оценить, где больше информации: в формуле Энштейна E=mc2, лежащей в основе физики водородной бомбы, в картине Айвазовского “Девятый вал” или в ежедневной телевизионной передаче “Новости”.

Видимо проще всего оценить количество информации по тому, сколько необходимо места для ее хранения, выбрав какой-нибудь единый способ представления и хранения информации. С развитием ЭВМ таким единым способом стало кодирование информации с помощью цифр 1 и 0. Кодированием мы здесь называем перезапись информации из одного способа представления в другой. Количество позиций (называемых двоичными), в которых находятся только цифры 1 или 0, необходимое для прямой записи сообщения, является одним из критериев количества информации и называется объемом информации в битах. Для записи одного символа (буквы, цифры, пробела между словами, знаков препинания) в ЭВМ чаще всего используют 8 двоичных позиций, и это называется байтом. Таким образом фраза: ”белоснежка и семь гномов” состоит из 21 буквы (без кавычек) и двух пробелов между словами и будет занимать в памяти ЭВМ 23 байта или 184 бита. Возможна не прямая, а сжатая запись информации, т.е. кодирование его меньшим количеством бит. Это производится за счет специальной обработки и анализа частоты появления, расположения и количества символов в сообщении. На практике человек применяет также сжатие сообщение, исходя из его смысла. Например длинное сообщение объемом в 37 байт “тысяча девятисот девяносто шестой год” можно сжать до четырех символов “1996” .

Формула Шеннона

Клод Элвуд Шеннон предложил в 1948 году теорию информации [2], которая дала вероятностно-статистическое определение понятия количества информации. Каждому сигналу в теории Шеннона приписывается вероятность его появления. Чем меньше вероятность появления того или иного сигнала, тем больше информации он несет для потребителя. Шеннон предложил следующую формулу для измерения количества информации:

где I - количество информации; pi - вероятность появления i-го сигнала;

N - количество возможных сигналов.

Для частного, но широко распространенного и рассмотренного выше случая, когда события равновероятны (pi= 1/N), величину количества информации I можно рассчитать по формуле:

Формула показывает зависимость количества информации от числа событий и от вероятности появления этих событий. Информация равна нулю, если возможно только одно событие. С ростом числа событий информация увеличивается. I=1, если  возможно одно из двух равновероятных событий. Такая единица информации называется “бит”. Бит - основная единица измерения информации.

Бит и байт

В технике возможны два исхода, которые кодируются следующим образом: цифрой один “1” - “да”, “включено”, “ток идет” ... цифрой ноль “0” - “нет”, “выключено”, “ток не идет”. Цифры 1 и 0 являются символами простейшей знаковой системы исчисления. В каждом знаке или символе двоичной системы исчисления содержится один бит информации. Особое значение для измерения объемов символьной информации имеет специальная единица - байт. 1 байт = 8 битов, что соответствует восьми разрядам двоичного числа. Почему именно 8? Так сложилось исторически. Объем информации измеряется также в производных от байта единицах: Кбайтах, Мбайтах и Гбайтах, только приставки “К”, “М” и “Г” не означают, как в физике “кило”, “мега” и “гига”, хотя их часто так и называют. В физика “кило” означает 1000 , а в информатике “К” означает 1024, так как это число более естественно для вычислительных машин. Они в основе своей арифметики используют число 2, как человек в основе своей арифметики применяет число 10. Поэтому числа 10, 100, 100 и т.д. удобны для человека, а числа 2, 4, 8, 16 и наконец число 1024, получающееся перемножением двойки десять раз, “удобны” для ЭВМ.

1 Кбайт (КБ) = 1024 байта = 8192 бита

1 Мбайт (МБ) = 1024 Кбайта = 220  байта = 223 бита

1 Гбайт (МБ) = 1024 Мбайта = 220 Кбайта = 230 байта = 233 бита.

Введенное таким образом понятие количество информации не совпадает с общепринятым понятием количества информации, как важности полученных сведений, но оно с успехом используется в вычислительной технике и связи.

Экспертные методы оценки информации.

Поскольку у информации имеются разнообразные характеристики, практическое значение которых в различных приложениях информатики различно, то не может быть единой меры количества информации, удобной во всех случаях. Например, количеством меры информации может служить сложность вычисления при помощи некоторого универсального алгоритма. Следует ожидать, что дальнейшее проникновение информатики в те направления человеческой деятельности, где она еще слабо применяется, в том числе в искусство, приведет к разработке новых научных определений количества информации. Так восприятие произведения искусства, которое нравится нам, приносит ощущение наполнения новой, неизведанной ранее информацией. Не даром часто эффект, произведенный на человека великим музыкальным произведением, полотном художника, а иногда просто созерцанием природы: живописных гор, глубокого неба, - характеризуют словом “откровение”. Поэтому могут появиться характеристики количества информации, характеризующие ее эстетическое и художественное значение. Пока не созданы простые, математически выраженные определения меры количества того или иного свойства информации, для оценки его величины служат так называемые экспертные оценки, т.е. заключения специалистов в данной области. Они свои оценки дают на основании личного, часто очень субъективного опыта. Профессиональное общение между экспертами и творческое обсуждение предмета анализа приводит к выработке более или менее общепринятых критериев оценки, которые могут в конечном счете стать основой для создания формальной меры, однозначной, как международный эталон метра. Примерами становления будущих мер информации, в ее разных проявлениях, могут служить следующие экспертные оценки и другие уже применяемые показатели:

баллы, даваемые судьями соревнований за художественность исполнения, например, по фигурному катанию;

обзоры кинофильмов в прессе с проставлением балов по степени их интереса кинозрителю;

стоимость произведений живописи;

оценка работы ученого по количеству опубликованных статей;

оценка работы ученого по количеству ссылок на его работы в работах других ученых (индекс реферируемости);

индексы популярности музыкальных произведений и их исполнителей, публикуемые в прессе;

оценки студентов, выставляемые преподавателями колледжа.

Другие единицы измерения.

Кроме измерения объема памяти в битах и байтах, в технике применяются и другие единицы измерения, характеризующие работу с информацией:

количество операций в секунду, характеризующее скорость обработки информации вычислительной машиной;

количество байт или бит в секунду, характеризующее скорость передачи информации;

количество знаков в секунду, характеризующие скорость чтения, набора за компьютером текстов или быстродействие печатающего устройства.


 

А также другие работы, которые могут Вас заинтересовать

28572. Примеры хеш-функций 14.18 KB
  Расширение исходного сообщения Собственно хеширование . Расширение исходного битового сообщения M длины L происходит следующим образом. Алгоритм хеширования работает циклами за один цикл обрабатывается блок исходного сообщения длины 512 бит. Цикл состоит из четырех раундов каждый из которых вычисляет новые значения переменных A B C D на основании их предыдущего значения и значения 64битного отрезка хешируемого 512битного блока исходного сообщения.
28573. Примеры хеш-функций Классификация хеш-функций 13.05 KB
  На бесключевые хешфункции накладываются определенные условия. Предполагается что на вход подано сообщение состоящее из байт хеш которого нам предстоит вычислить. Эту операцию называют проверка хеша hashcheck.
28574. Примеры хеш-функций: применение хеш-функций в системах ЭЦП; хеш-функции с ключом 12.72 KB
  Чтобы избежать этого вместе с цифровой подписью используется хешфункция то есть вычисление подписи осуществляется не относительно самого документа а относительно его хеша. В этом случае в результате верификации можно получить только хеш исходного текста следовательно если используемая хешфункция криптографически стойкая то получить исходный текст будет вычислительно сложно а значит атака такого типа становится невозможной. Также существуют другие преимущества использования хешфункций вместе с ЭЦП: Вычислительная сложность.
28575. Примеры хеш-функций sha 12.54 KB
  Для входного сообщения длина которого меньше 264 бит алгоритм SHA1 выдаёт 160битовый результат. Предназначен SHA1 для использования вместе с алгоритмом цифровой подписи DSA. Цифровая подпись формируется на основе дайджеста SHA1 от сообщения что повышает эффективность процесса подписания.
28578. Сертификаты открытых ключей. Аннулирование сертификатов 20.88 KB
  Сертификаты открытых ключей. Механизмы контроля использования ключей. Подтверждение подлинности ключей Сертификат открытого ключа сертификат ЭЦП сертификат ключа подписи сертификат ключа проверки электронной подписи согласно ст. Предположим что Алиса желая получать зашифрованные сообщения генерирует пару ключей один из которых открытый она публикует какимлибо образом.
28579. Требования к качеству ключевой информации и источники ключей 16.09 KB
  Не все ключи и таблицы замен обеспечивают максимальную стойкость шифра. Исчерпывающий ответ на вопрос о критериях качества ключей и таблиц замен ГОСТа если и можно получить то только у разработчиков алгоритма. Очевидно что нулевой ключ и тривиальная таблица замен по которой любое значение заменяется но него самого являются слабыми. Таблица замен является долговременным ключевым элементом т.
28580. Криптоанализ 12.62 KB
  В частности полнораундовый алгоритм ГОСТ 2814789 может быть вскрыт с помощью дифференциального криптоанализа на связанных ключах но только в случае использования слабых таблиц замен. 24раундовый вариант алгоритма в котором отсутствуют первые 8 раундов вскрывается аналогичным образом при любых таблицах замен однако сильные таблицы замен делают такую атаку абсолютно непрактичной. [править] Критика ГОСТа Основные проблемы ГОСТа связаны с неполнотой стандарта в части генерации ключей и таблиц замен. Тривиально доказывается что у ГОСТа...