89067

Алгоритмы решения задач на определение среднего количества информации

Контрольная

Информатика, кибернетика и программирование

Провести кодирование по одной и блоками по две буквы, используя метод Шеннона-Фано. Сравнить эффективности кодов (величина энтропии). Данные взять из задачи 1. Алфавит передаваемых сообщений состоит из независимых букв Si. Вероятности появления каждой буквы в сообщении заданы.

Русский

2015-05-09

120.96 KB

42 чел.

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

Высшего профессионального образования

«Пензенский государственный технологический университет»

(ПензГТУ)

Факультет «Информационных и образовательных технологий»

Кафедра «Информационные технологии и системы»

Дисциплина «Основы теории информации»

КОНТРОЛЬНАЯ РАБОТА №1

Выполнил: студент группы 13ИС2Б

Чинков М.Ю.

Проверил: ст. преподаватель каф. ИТС

Пискаев К.Ю.

Пенза 2015

СОДЕРЖАНИЕ

ВВЕДЕНИЕ 3

1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО КОЛИЧЕСТВА ИНФОРМАЦИИ 4

2. ЗАВИСИМОСТЬ МЕЖДУ СИМВОЛАМИ МАТРИЦЫ УСЛОВНЫХ ВЕРОЯТНОСТЕЙ 5

3. КОДИРОВАНИЕ МЕТОДОМ ШЕННОНА-ФАНО 6

4. КОДИРОВАНИЕ АЛГОРИТМОМ ХАФФМАНА 8

5. ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА СВЯЗИ 11

заключение 12

список литературы 13


ВВЕДЕНИЕ

Цель данной контрольной работы – актуализация знаний в предмете «Основы теории информации».

В рамках контрольной работы было выполнено 5 заданий в соответствии с моим вариантом (вариант №23):

  1.  Определить среднее количество информации, содержащееся в сообщении, используемом три независимых символа S1, S2, S3. Известны вероятности появления символов p(S1)=p1, p(S2)=p2, p(S3)=p3. Оценить избыточность сообщения.
  2.  В условии предыдущей задачи учесть зависимость между символами, которая задана матрицей условных вероятностей P(Si / Sj).

3.  Провести кодирование по одной и блоками по две буквы, используя метод Шеннона – Фано. Сравнить эффективности кодов (величина энтропии). Данные взять из задачи 1.

4.  Алфавит передаваемых сообщений состоит из независимых букв Si. Вероятности появления каждой буквы в сообщении заданы. Определить и сравнить эффективность кодирования сообщений методом Хаффмана при побуквенном кодировании и при кодировании блоками по две буквы.

5.  Определить пропускную способность канала связи, по которому передаются сигналы Si. Помехи в канале определяются матрицей условных вероятностей P(Si / Sj). За секунду может быть передано N = 10 сигналов.

Простые вычисления и кодирования сообщений в заданиях были сделаны вручную, более сложные были сделаны с помощью среды разработки MATLAB R2014a. Формулы и решения задач были введены с помощью программы MathType.


  1.  ОПРЕДЕЛЕНИЕ СРЕДНЕГО КОЛИЧЕСТВА ИНФОРМАЦИИ

Энтропия источника – среднее количество информации в одном сообщении. Не следует путать энтропию с количеством информации в одном конкретном сообщении. Если в источнике есть множество сообщений, точно знать о каждом из них необязательно. В этом заключается преимущество среднего значения количества информации. Усреднение позволило Шеннону оценить как редкие, так и частые сообщения. Энтропия характеризует источник сообщения. Аналогично можно получить и “энтропийную характеристику сигнала”.

Задание: определить среднее количество информации, содержащееся в сообщении, используемом три независимых символа S1, S2, S3. Известны вероятности появления символов p(S1)=p1, p(S2)=p2, p(S3)=p3. Оценить избыточность сообщения. Вариант №23: p1=0.12; p2=0.13; p3=0.75.

Решение. Максимальное среднее количество информации на символ сообщения имеет место при равновероятном распределении и равно, согласно формуле.

Рассчитаем среднее количество информации на символ сообщения при заданных вероятностях по формуле, где n – число символов в алфавите, p – вероятность появления события.

Оценим избыточность сообщения по формуле.

Максимальная энтропия.

Реальная энтропия.

Избыточность сообщения.


  1.  ЗАВИСИМОСТЬ МЕЖДУ СИМВОЛАМИ МАТРИЦЫ УСЛОВНЫХ ВЕРОЯТНОСТЕЙ

В большинстве реальных случаев появление элемента хi в сообщении зависит от того, какой элемент хj был предшествующим. Взаимосвязь элементов в сообщении характеризуется матрицей условных вероятностей.

Задание: в условии предыдущей задачи учесть зависимость между символами, которая задана матрицей условных вероятностей P(Si / Sj).

Вариант №23.

 

Решение. Рассчитаем энтропию источника по формуле.

Подставим числовые данные, используя задание 1.

Вычисление энтропии в программе MATLAB.

H2=p1*((0.7*log2(0.7)+0.3*log2(0.3)))+p2*((0.5*log2(0.5)+0.5*log2(0.5))++p3*(-(0.1*log2(0.1)+0.5*log2(0.5)+0.4*log2(0.4)));


  1.  КОДИРОВАНИЕ МЕТОДОМ ШЕННОНА-ФАНО

Кодирование Шеннона — Фано (англ. Shannon–Fano coding) — алгоритм префиксного неоднородного кодирования. Относится к вероятностным методам сжатия (точнее, методам контекстного моделирования нулевого порядка). Алгоритм Шеннона — Фано использует избыточность сообщения, заключённую в неоднородном распределении частот символов его (первичного) алфавита, то есть заменяет коды более частых символов короткими двоичными последовательностями, а коды более редких символов — более длинными двоичными последовательностями. Алгоритм был независимо друг от друга разработан Шенноном (публикация «Математическая теория связи», 1948 год) и, позже, Фано (опубликовано как технический отчёт).

Задание: провести кодирование по одной и блоками по две буквы, используя метод Шеннона – Фано. Сравнить эффективности кодов (величина энтропии). Данные взять из задачи 1.

Решение. Проведем кодирование методом Шеннона–Фэно и рассчитаем характеристики кода. Пусть исходный алфавит состоит из трех (по одной букве) и девяти (по две буквы) букв и заданы их вероятности. Проведем разбиения по алгоритму Шеннона–Фэно и составим кодовые комбинации.

xi

P(xi)

1

2

3

4

P3

0.75

0

0

1

P2

0.13

0

0

0

1

P1

0.12

0

0

0

0

Кодовые комбинации по одной букве.


xi

P(xi)

1

2

3

4

5

p3p3

0.5625

1

1

p3p2

0.0975

1

0

p2p3

0.0975

0

1

1

p3p1

0.09

0

1

0

p1p3

0.09

0

0

1

1

p2p2

0.0169

0

0

1

0

p2p1

0.0156

0

0

0

1

p1p2

0.0156

0

0

0

0

1

p1p1

0.0144

0

0

0

0

0

Кодовые комбинации по две буквы.

Рассчитаем энтропию по формуле.

Рассчитаем среднюю длину кодовой комбинации по формуле.

Рассчитаем эффективность кода, согласно формуле. 

Энтропия источника. По одной букве:

По две буквы:

 Средняя длина кодовой комбинации источника. По одной букве:

По две буквы:

Эффективность кода. По одной букве:

По две буквы:

  1.  КОДИРОВАНИЕ АЛГОРИТМОМ ХАФФМАНА

Один из первых алгоритмов эффективного кодирования информации был предложен Д. А. Хаффманом в 1952 году. Идея алгоритма состоит в следующем: зная вероятности символов в сообщении, можно описать процедуру построения кодов переменной длины, состоящих из целого количества битов. Символам с большей вероятностью ставятся в соответствие более короткие коды. Коды Хаффмана обладают свойством префиксности (то есть ни одно кодовое слово не является префиксом другого), что позволяет однозначно их декодировать. Классический алгоритм Хаффмана на входе получает таблицу частот встречаемости символов в сообщении. Далее на основании этой таблицы строится дерево кодирования Хаффмана (Н-дерево).

Задание: алфавит передаваемых сообщений состоит из независимых букв Si. Вероятности появления каждой буквы в сообщении заданы. Определить и сравнить эффективность кодирования сообщений методом Хаффмена при побуквенном кодировании и при кодировании блоками по две буквы. Вариант №23: (0,8;0,0;0,08;0,12).

Решение. Проведем кодирование методом Шеннона–Фэно.

xi

P(xi)

1

2

3

p1

0.8

1

p4

0.12

0

1

p3

0.08

0

0

1

p2

0

0

0

0

По одной букве.

xi

P(xi)

P1p1

0.64

P4p1

0.096

P1p4

0.096

P3p1

0.064

P1p3

0.064

P4p4

0.0144

P4p3

0.0096

P3p4

0.0096

P3p3

0.0064

P4p2

0

P2p4

0

P3p2

0

P2p3

0

P2p1

0

P1p2

0

P2p2

0

По две буквы.

Проведем кодирование по методу Хаффмена. Исходный алфавит состоит из нескольких букв с заданными вероятностями. Составим таблицу.

xi

P(xi)

Вспомогательный столбец

p1

0.8

0.8

p4

0.12

0.2

p3

0.08

p2

0

По одной букве.

xi

P(xi)

Вспомогательные столбцы

P1p1

0.64

0.64

P4p1

0.096

0.096

0.192

0.36

P1p4

0.096

0.096

0.168

P3p1

0.064

0.064

0.128

P1p3

0.064

0.064

0.040

P4p4

0.0144

0.0144

P4p3

0.0096

0.0096

0.0256

P3p4

0.0096

0.0160

P3p3

0.0064

P4p2

0

P2p4

0

P3p2

0

P2p3

0

P2p1

0

P1p2

0

P2p2

0

По две буквы.

Характеристики кода рассчитываются по тем же формулам, что и для кода Шеннона–Фано.

Рассчитаем энтропию по формуле.

Рассчитаем минимальную среднюю длину кодовой комбинации по формуле.

Рассчитаем эффективность кода, согласно формуле. 

Энтропия источника. По одной букве:

По две буквы:

Средняя длина кодовой комбинации источника. По одной букве:

По две буквы:

Эффективность кода. По одной букве:

По две буквы:


  1.  ПРОПУСКНАЯ СПОСОБНОСТЬ КАНАЛА СВЯЗИ

Пропускная способность — метрическая характеристика, показывающая соотношение предельного количества проходящих единиц (информации, предметов, объёма) в единицу времени через канал, систему, узел. В информатике определение пропускной способности обычно применяется к каналу связи и определяется максимальным количеством переданной или полученной информации за единицу времени.

Задание: Определить пропускную способность канала связи, по которому передаются сигналы Si. Помехи в канале определяются матрицей условных вероятностей P(Si / Sj). За секунду может быть передано N = 10 сигналов.

Вариант №23.

 

Решение. Рассчитаем условную энтропию по формуле.

Рассчитаем пропускную способность канала связи по формуле.

Условная энтропия.

Пропускная способность канала связи.


заключение

В рамках контрольной работы были изучены различные алгоритмы решения задач на определение среднего количества информации, содержащейся в сообщении, определение пропускной способности канала связи и алгоритмы кодирования сообщений (метод Шеннона-Фано, алгоритм Хаффмана).

Было выполнено 5 заданий:

1. Определить среднее количество информации, содержащееся в сообщении, используемом три независимых символа S1, S2, S3. Известны вероятности появления символов p(S1)=p1, p(S2)=p2, p(S3)=p3. Оценить избыточность сообщения.

2. В условии предыдущей задачи учесть зависимость между символами, которая задана матрицей условных вероятностей P(Si / Sj).

3.  Провести кодирование по одной и блоками по две буквы, используя метод Шеннона – Фано. Сравнить эффективности кодов (величина энтропии). Данные взять из задачи 1.

4.  Алфавит передаваемых сообщений состоит из независимых букв Si. Вероятности появления каждой буквы в сообщении заданы. Определить и сравнить эффективность кодирования сообщений методом Хаффмана при побуквенном кодировании и при кодировании блоками по две буквы.

5.  Определить пропускную способность канала связи, по которому передаются сигналы Si. Помехи в канале определяются матрицей условных вероятностей P(Si / Sj). За секунду может быть передано N = 10 сигналов.

Простые вычисления и кодирования сообщений в заданиях были сделаны вручную, более сложные были сделаны с помощью среды разработки MATLAB R2014a. Формулы и решения задач были введены с помощью программы MathType.

список литературы

  1.  Зверева Е.Н. Сборник примеров и задач по основам теории информации и кодирования сообщений/ Е.Н. Зверева, Е.Г.Лебедько. – СПб: НИУ ИТМО, 2014. – 76 с.
  2.  Калинцев С.В. Методические указания к контрольной работе по курсу «Теория кодирования»/ С.В.Калинцев. –2012. – 20 с.


 

А также другие работы, которые могут Вас заинтересовать

84475. АДГЕЗИЯ В ПОЛИГРАФИИ 286.49 KB
  Технолог вместе с печатниками экспериментируют с настройками машины и различными лаками пытаясь добиться необходимой адгезии и спасти тираж. Рисунок 1 Рисунок 2 Плохая адгезия лак Прибор для измерения адгезии К сожалению часто бывает непонятно почему же он не держится Все кто занимается УФлакированием сталкиваются с проблемой адгезии УФлака рис. В процессе лакирования печатник должен контролировать адгезию УФлака тестом на скотч и тестом на ноготь. Недостаточное высыхание лака Если между слоем высохшего лака и подложкой окажется...
84476. АНТИКРИЗИСНЫЕ ГРУНТЫ ДЛЯ УФ-ПЕЧАТИ ПО ПЛЁНКАМ И МЕТАЛЛИЗИРОВАННЫМ ОСНОВАМ 457.58 KB
  Причина возникшей проблемы была связана с необходимостью использовать более дешевые запечатываемые материалы не прошедшие специальной обработки для УФпечати. Современные машины для флексографской печати УФкрасками редко оснащены секцией для нанесения грунта на основе растворителей поэтому типографии вынуждены наносить сольвентное покрытие на плёнку отдельно. Появление эффективных УФгрунтов решило бы много проблем благодаря возможности печати в линию на стандартном оборудовании.
84477. ЗАКОНОДАТЕЛЬНЫЕ ОСНОВЫ ВЫБОРА РАСХОДНЫХ МАТЕРИАЛОВ ДЛЯ ПЕЧАТИ УПАКОВКИ ПРОДУКТОВ ПИТАНИЯ 46.7 KB
  Например практически каждый год пополняется список запрещенных веществ попадающих в пищевые продукты из упаковки. Часть заказчиков пищевой упаковки выдвигает свои особые требования которые могут быть более жесткими чем обычные например как это до недавнего времени делала копания Nestle. В то же время потребители упаковки заинтересованы в максимальном снижении цены на упаковку поэтому перед производителем упаковки стоит нелегкая задача создать минимальный по цене продукт соответствующий всем требованиям и при этом остаться в прибыли.
84478. ЦИФРОВАЯ ПЕЧАТЬ. ПЕРСПЕКТИВЫ РАЗВИТИЯ ЦИФРОВЫХ ТЕХНОЛОГИЙ В ПОЛИГРАФИИ 302.18 KB
  По мере развития цифровых устройств скорость качество формат они получили название Цифровые Печатные Машины ЦПМ. Первые устройства офсетные печатные машины которые стали рассматриваться как ЦПМ были основаны на технологии Direct Imging прямое экспонирование. Для ясности понимания разделим ЦПМ на две группы: по признаку наличия или отсутствия какой бы то ни было формной поверхности. Виды струйных принтеров планшетные fltbed широкоформатные wide super wide рулонная Основные производители струйных принтеров: HP Scitex ...
84479. МАСЛЯНЫЕ ОФСЕТНЫЕ КРАСКИ 73.73 KB
  Критерии оценки качества краски В мире насчитывается несколько десятков фирмпроизводителей офсетных красок большая часть которых неизвестна российским полиграфистам. При выборе краски необходимо руководствоваться основными факторами ее оценки: яркость и чистота пигмента первоначальное схватывание краски на оттиске время хранения в кипсейках и не засыхания на валах обеспечивается правильным балансом связующих компонентов скорость окончательного закрепления Пигментация Печатная краска представляет собой коллоидную систему...
84480. ДЕФЕКТЫ В РАБОТЕ С ОФСЕТНЫМИ МАСЛЯНЫМИ КРАСКАМИ И СПОСОБЫ ИХ УСТРАНЕНИЯ 46.41 KB
  Дефект Возможная причина Рекомендации Деформация стопы Неправильное хранение бумаги. Чистить сопло подающее порошок Тонкая бумага Не делать высокую стопу Избыток воды в основном на краях бумаги Уменьшить или отрегулировать равномерность подачи воды Двоение Деформация основы до печати Заменить основу. Проконсультироваться с поставщиком Деформация бумаги вследствие серьезного изменения в гидрометрии Проверить разницу температур в помещении для складирования и в печатном цехе Офсетная резина недостаточно натянута Натянуть офсетную резину...
84481. КРАСКИ УФ-ОТВЕРЖДЕНИЯ 284.88 KB
  Состав красок УФотверждения Рассмотрим отличия в составе традиционной краски и краски УФотверждения. Традиционные краски Краски УФотверждения смола связующее олигомер растительные масла мономер минеральные масла пигмент разбавитель добавки пигмент фотоинициатор добавки стабилизатор сиккатив антисиккатив Компоненты краски влияют на физикохимические и технические характеристики УФкраски. Добавки в УФкраски играют ту же роль что и в традиционных красках. Соответственно вся энергия концентрируется на небольшом...
84482. ГИБРИДНЫЕ КРАСКИ 72.5 KB
  Гибридные краски часто рассматриваются как промежуточный продукт объединяющий в себе свойства обычных масляных и УФотверждаемых красок. Данная технология дает хороший результат но остается ряд проблем: необходимо качественное удаление противоотмарывающего порошка; межслоевая адгезия между краской и УФлаком может варьироваться изза различного содержания воска в краске различные субстраты и различная химия краски могут давать не всегда ожидаемый ре зультат; необходимость целого ряда дополнительных операций и дополнительных...
84483. ОСОБЕННОСТИ ПОДБОРА ЦВЕТА - ПРАКТИКА СМЕШЕНИЯ КРАСОК 41.79 KB
  Поэтому все большее количество типографий используют в своей работе смесевые краски. Смесевые краски позволяют добиться равномерной плашки без использования растра. Еще не так давно типографии смешивали краски сами используя опыт печатников. Современные типографии в основном заказывают необходимые для печати смесевые краски в фирмах специализирующихся на их изготовлении.