9685

Измерение информации. Экспертные методы оценки информации

Реферат

Информатика, кибернетика и программирование

Измерение информации Каждый предмет или явление человек пытается охарактеризовать, для сравнения с подобными, его величиной. Не всегда это можно просто и однозначно сделать. Даже величины физических предметов можно оценивать по-разному...

Русский

2015-01-19

46 KB

2 чел.

Измерение информации

Каждый предмет или явление человек пытается охарактеризовать, для сравнения с подобными, его величиной. Не всегда это можно просто и однозначно сделать. Даже величины физических предметов можно оценивать по-разному: по объему, весу, массе, количеству составляющих его элементов, стоимости. Поэтому, например, понятно, что даже на простой вопрос: ”Что больше, килограммовая гиря или детский воздушный шарик?”- можно ответить по разному. Чем явление более сложно и многопланово и чем больше характеристик у этого явления, тем труднее подобрать для него удовлетворяющее всех, кто занимается этим явлением, определение его величины. Так и количество информации можно мерить по-разному: в количествах книг, страниц, знаков, метрах кинопленки, тоннах архивных материалов, килобайтах оперативной памяти ЭВМ, а также оценивать по эмоциональному восприятию человека, по полученной пользе от обладания информацией, по необходимым затратам на обработку, систематизацию информации и т.д. Попробуйте оценить, где больше информации: в формуле Энштейна E=mc2, лежащей в основе физики водородной бомбы, в картине Айвазовского “Девятый вал” или в ежедневной телевизионной передаче “Новости”.

Видимо проще всего оценить количество информации по тому, сколько необходимо места для ее хранения, выбрав какой-нибудь единый способ представления и хранения информации. С развитием ЭВМ таким единым способом стало кодирование информации с помощью цифр 1 и 0. Кодированием мы здесь называем перезапись информации из одного способа представления в другой. Количество позиций (называемых двоичными), в которых находятся только цифры 1 или 0, необходимое для прямой записи сообщения, является одним из критериев количества информации и называется объемом информации в битах. Для записи одного символа (буквы, цифры, пробела между словами, знаков препинания) в ЭВМ чаще всего используют 8 двоичных позиций, и это называется байтом. Таким образом фраза: ”белоснежка и семь гномов” состоит из 21 буквы (без кавычек) и двух пробелов между словами и будет занимать в памяти ЭВМ 23 байта или 184 бита. Возможна не прямая, а сжатая запись информации, т.е. кодирование его меньшим количеством бит. Это производится за счет специальной обработки и анализа частоты появления, расположения и количества символов в сообщении. На практике человек применяет также сжатие сообщение, исходя из его смысла. Например длинное сообщение объемом в 37 байт “тысяча девятисот девяносто шестой год” можно сжать до четырех символов “1996” .

Формула Шеннона

Клод Элвуд Шеннон предложил в 1948 году теорию информации [2], которая дала вероятностно-статистическое определение понятия количества информации. Каждому сигналу в теории Шеннона приписывается вероятность его появления. Чем меньше вероятность появления того или иного сигнала, тем больше информации он несет для потребителя. Шеннон предложил следующую формулу для измерения количества информации:

где I - количество информации; pi - вероятность появления i-го сигнала;

N - количество возможных сигналов.

Для частного, но широко распространенного и рассмотренного выше случая, когда события равновероятны (pi= 1/N), величину количества информации I можно рассчитать по формуле:

Формула показывает зависимость количества информации от числа событий и от вероятности появления этих событий. Информация равна нулю, если возможно только одно событие. С ростом числа событий информация увеличивается. I=1, если  возможно одно из двух равновероятных событий. Такая единица информации называется “бит”. Бит - основная единица измерения информации.

Бит и байт

В технике возможны два исхода, которые кодируются следующим образом: цифрой один “1” - “да”, “включено”, “ток идет” ... цифрой ноль “0” - “нет”, “выключено”, “ток не идет”. Цифры 1 и 0 являются символами простейшей знаковой системы исчисления. В каждом знаке или символе двоичной системы исчисления содержится один бит информации. Особое значение для измерения объемов символьной информации имеет специальная единица - байт. 1 байт = 8 битов, что соответствует восьми разрядам двоичного числа. Почему именно 8? Так сложилось исторически. Объем информации измеряется также в производных от байта единицах: Кбайтах, Мбайтах и Гбайтах, только приставки “К”, “М” и “Г” не означают, как в физике “кило”, “мега” и “гига”, хотя их часто так и называют. В физика “кило” означает 1000 , а в информатике “К” означает 1024, так как это число более естественно для вычислительных машин. Они в основе своей арифметики используют число 2, как человек в основе своей арифметики применяет число 10. Поэтому числа 10, 100, 100 и т.д. удобны для человека, а числа 2, 4, 8, 16 и наконец число 1024, получающееся перемножением двойки десять раз, “удобны” для ЭВМ.

1 Кбайт (КБ) = 1024 байта = 8192 бита

1 Мбайт (МБ) = 1024 Кбайта = 220  байта = 223 бита

1 Гбайт (МБ) = 1024 Мбайта = 220 Кбайта = 230 байта = 233 бита.

Введенное таким образом понятие количество информации не совпадает с общепринятым понятием количества информации, как важности полученных сведений, но оно с успехом используется в вычислительной технике и связи.

Экспертные методы оценки информации.

Поскольку у информации имеются разнообразные характеристики, практическое значение которых в различных приложениях информатики различно, то не может быть единой меры количества информации, удобной во всех случаях. Например, количеством меры информации может служить сложность вычисления при помощи некоторого универсального алгоритма. Следует ожидать, что дальнейшее проникновение информатики в те направления человеческой деятельности, где она еще слабо применяется, в том числе в искусство, приведет к разработке новых научных определений количества информации. Так восприятие произведения искусства, которое нравится нам, приносит ощущение наполнения новой, неизведанной ранее информацией. Не даром часто эффект, произведенный на человека великим музыкальным произведением, полотном художника, а иногда просто созерцанием природы: живописных гор, глубокого неба, - характеризуют словом “откровение”. Поэтому могут появиться характеристики количества информации, характеризующие ее эстетическое и художественное значение. Пока не созданы простые, математически выраженные определения меры количества того или иного свойства информации, для оценки его величины служат так называемые экспертные оценки, т.е. заключения специалистов в данной области. Они свои оценки дают на основании личного, часто очень субъективного опыта. Профессиональное общение между экспертами и творческое обсуждение предмета анализа приводит к выработке более или менее общепринятых критериев оценки, которые могут в конечном счете стать основой для создания формальной меры, однозначной, как международный эталон метра. Примерами становления будущих мер информации, в ее разных проявлениях, могут служить следующие экспертные оценки и другие уже применяемые показатели:

баллы, даваемые судьями соревнований за художественность исполнения, например, по фигурному катанию;

обзоры кинофильмов в прессе с проставлением балов по степени их интереса кинозрителю;

стоимость произведений живописи;

оценка работы ученого по количеству опубликованных статей;

оценка работы ученого по количеству ссылок на его работы в работах других ученых (индекс реферируемости);

индексы популярности музыкальных произведений и их исполнителей, публикуемые в прессе;

оценки студентов, выставляемые преподавателями колледжа.

Другие единицы измерения.

Кроме измерения объема памяти в битах и байтах, в технике применяются и другие единицы измерения, характеризующие работу с информацией:

количество операций в секунду, характеризующее скорость обработки информации вычислительной машиной;

количество байт или бит в секунду, характеризующее скорость передачи информации;

количество знаков в секунду, характеризующие скорость чтения, набора за компьютером текстов или быстродействие печатающего устройства.


 

А также другие работы, которые могут Вас заинтересовать

68819. ПРИВОД КОНВЕЙЕРА 551.5 KB
  Привод – устройство для приведения в действие двигателем различных рабочих машин. Энергия, необходимая для приведения в действие машины или механизма, может быть передана от вала двигателя непосредственно или с помощью дополнительных устройств (зубчатых, червячных, цепных, ременных и др. передач).
68820. КОРОБКА СКОРОСТЕЙ 1.85 MB
  Коробкой скоростей называется механизм, состоящий из зубчатых передач, выполненный в виде отдельного органа и служащий для передачи вращения от вала двигателя к валу рабочей машины. Назначение коробки скоростей - понижение угловой скорости и повышение вращающего момента ведомого вала по сравнению с ведущим.
68821. Проект привода конвейера 841.5 KB
  Выбираем цилиндрический редуктор с горизонтальным положением колёс. Корпус редуктора выполнен разъемным, литым из чугуна марки СЧ15 ГОСТ 1412-79. Сборка и разборка редуктора производится при снятой крышке. Контроль зацепления колёс производится через смотровой люк.
68823. Привод (Электродвигатель: АИР 100L6) 866 KB
  Наиболее распространены горизонтальные редукторы. Как горизонтальные, так и вертикальные редукторы могут иметь колеса с прямыми, косыми и круговыми зубьями. Корпус чаще всего выполняют литым чугуном, реже сварным стальным. Валы монтируются на подшипниках качения или скольжения.
68824. Перетворення вхідної граматики у LL(1)-граматику 93 KB
  Аналогічне ствердження має місце відносно ліворекурсивного циклу приклад якого дають правила 1. У наведеному прикладі правила 2 3 4 6 утворюють ліворекурсивний цикл який завжди можна вилучити перетворив одне з правил наприклад 6 у ліву рекурсію. Для С існують два правила 4 та 5.
68825. Застосування ДМП-автомату для реалізації висхідного аналізу 179 KB
  Для реалізації висхідного аналізу використовується ДМП-автомат, який працює за таким принципом. Якщо вхідний рядок приймається, то у кожному такті конкатенація символів, що знаходяться у магазині, і символів, що належать до ще непрочитаної частини вхідного рядка, утворює...
68826. Порівняння LL- та LR-методів розбору 180 KB
  Генерація коду проміжний код транслююча граматика Кінцевою ціллю компіляції є отримання програми у машинному коді. Часто генерація коду здійснюється паралельно з побудовою дерева. У разі коли для отримання машинного коду виконуються декілька проходів треба передавати уявлення дерева з одного проходу у інший.
68827. Генерація машинного коду 79.5 KB
  Для перевірки подібних обмежень у компіляторах застосовують таблиці символів у яких запам’ятовують для кожного ідентифікатора його тип а можливо і іншу інформацію. У момент читання прикладної реалізації компілятор здійснює пошук відповідної інформації у таблиці.