67618

Устройства и системы ввода-вывода текстовой и графической информации. Принцип кодирования текстовой информации. Кодирование текстовой информации в ЭВМ

Лекция

Информатика, кибернетика и программирование

Текстовая информация представляется последовательностью алфавитно-цифровых символов каждый из которых определённым образом кодируется. Существуют четыре основных принципа кодирования символов. 1 где S множество всех символов используемых для кодирования текста...

Русский

2014-09-12

147 KB

1 чел.

Устройства и системы ввода-вывода

текстовой и графической информации

Принцип кодирования текстовой информации

1. Кодирование текстовой информации в ЭВМ

Текстовая информация представляется последовательностью алфавитно-цифровых символов, каждый из которых определённым образом кодируется. Существуют четыре основных принципа кодирования символов.

1. Символы кодируются в виде последовательности двоичных цифр. Количество разрядов на один символ определяется по формуле

,                                  (17.1)

где S - множество всех символов, используемых для кодирования текста; HХ(S) - энтропия по Хартли (мера неопределённости). Эта величина характеризует количество информации в каком-либо сообщении.

;                    (17.2)

.

Эта энтропия обладает свойством адитивности, т.е. . Например, код символа складывается из буквенного обозначения и цифрового X={A, B, C, D}, Y={1, 2, 3, 4, 5, 6, 7, …, 16}; тогда

,  .

Большинство кодировок используют один байт для кодирования символов.

2. Символы, относящиеся к одной группе по каким-либо признакам желательно кодировать в виде односвязного множества в одномерном пространстве кодов (рис. 17.1).

Рис. 17.1. Одномерное пространство кодов символов

3. Коды символов должны отражать порядок следования букв в алфавите.

4. Желательно, чтобы преобразование строчных букв в прописные и обратно сводилось к прибавлению или вычитанию некоторой константы или к гашению/записи некоторых бит.

Принцип 2 и 4 не всегда соблюдаются.

Для кодирования символов в качестве внутреннего кода ЭВМ наиболее часто используется двоичный код обработки информации (ДКОИ), построенный на основе международного кода EBCDIC.

Наиболее часто символы в тексте в пределах информационных блоков встречаются с различной вероятностью, что позволяет сократить затраты разрядов на кодирование. Для этого количество информации рассчитывается при помощи энтропии по Шеннону HS(X), и в общем случае HS(S)< HX(S).

,     (17.3)

где N – мощность множества X(N=|X|); Pi – вероятность поступления событий (встречаемость символов в тексте); .

Если события равновероятны, то Pi = 1/N =>

.   (17.4)

Свойства энтропии по Шеннону:

а) она всегда положительна;

б) она максимальна, т.е. равна энтропии по Хартли, когда события равновероятны;

в) для независимых событий из множеств X и Y, энтропия произведения X и Y равна сумме отдельных энтропий

HS(XY)=HS(X)+ HS(Y).

Энтропия по Шеннону и энтропия по Хартли также используются для теоретического анализа каналов передачи информации.

Разобьем множество символов S на m подмножеств (), в которых символы встречаются с равной вероятностью.

,     (17.5)

где рi – вероятность встретить символ, принадлежащий подмножеству Si.

Количество бит для кодирования одного символа определяется как

.        (17.6)

Экономия в разрядах на один символ проявляется, когда n1<nbit, тогда для кодирования используют n1 разряд, а для переключения с одной группы символов на другие используют специальные коды, которые включаются в каждую группу. Таким кодом является международный телеграфный код (МТК-2, МТК-5), который используется в системах связи и телеобработки.

Если условие

  ,                                 (12.7)

где <N> - средняя длина информационного блока, содержащего символы из одной группы; выполняется, то кодирование считается эффективным.

2. Ручной ввод текстовой информации с клавиатуры

Клавиатуры могут характеризоваться:

1) эксплуатационными характеристиками:

а) количество типов клавиш;

б) количество клавиш каждого типа;

в) расположение клавиш. По расположению клавиш наибольшее распространение получила клавиатура QWERTY, однако, возможны и другие варианты расположения символов клавиатуры (Дворака и Делея);

2) механическими характеристиками, основной из которых является функция упругости клавиш.

По способу обнаружения нажатия клавиш выделяют три типа клавиатур:

1) с гальваническим контактом или с открытым (не герметичным контактом). Для них характерна низкая стоимость и малое время наработки на отказ;

2) с магнитным принципом обнаружения (на основе магниточувствительных и проводниковых структур). Для них характерна большая стоимость, но очень высокая надёжность;

3) с ёмкостным принципом обнаружения нажатия. Для них характерна высокая износостойкость, низкая надёжность и сложность настройки.

Принцип кодирования клавиш клавиатуры не зависит от кодирования символов. В системное устройство ПЭВМ посылается не код символа, которому соответствует данная клавиша, а позиционный код клавиши. Переход к коду символа осуществляется специальной схемой управления клавиатурой, которую можно перепрограммировать.

Клавиатура включает в себя совокупность ключей клавиш и схемы управления для формирования кода при замыкании ключа, исключения неоднозначности кодирования из-за “дребезга” контактов и выполнения других управляющих функций. Клавиатура проектируется как конечный автомат (рис. 17.2)

Дешифратор последовательно опрашивает состояние ключей, расположенных с столбцах X матрицы клавиатуры. Если какая-либо клавиша нажата, то сигнал через замкнутый контакт поступает на соответствующую горизонтальную шину Y и через селектор (регистр) поступает на вход ПЛМ. Сигналы с дешифратора и селектора образуют адресный вход ПЛМ, в ячейках которой записаны коды символов (их младшие разряды). Код символа записывается в выходной регистр. Старшие разряды кода определяются содержимым специального регистра, изменяющего своё значение только при нажатии клавиши изменения регистров (Shift, Alt и др.).

Проблема “дребезгов” клавиатуры решается использованием вместо ПЛМ микропроцессора. Вертикальные и горизонтальные шины матрицы контактов подключаются, соответственно, к портам вывода и ввода (Пвыв) и (Пвв), для передачи в ЭВМ сформированного кода символа используется второй порт вывода микропроцессора (см. рис. 17.3).

Для устранения “дребезгов” используется накопление веса нажатой клавиши за несколько циклов опроса, образующих период опроса. Если в период опроса координаты клавиши не совпали, то инициируется сброс счётчика веса и начинается новый период опроса.


 

А также другие работы, которые могут Вас заинтересовать

16270. Исследование устройства декодирующего системы SECAM 681.5 KB
  Лабораторная работа №4 Исследование устройства декодирующего системы SECAM 1 Цель работы: Изучить принцип работы МЦ и СМЦ. Снять осциллограммы в контрольных точках. Сделать выводы о работоспособности блоков. 2 Литература: 2.1 Джакония...
16271. Исследование устройства кодирующего системы SЕCАМ 808 KB
  Лабораторная работа №3 Исследование устройства кодирующего системы SЕCАМ 1 Цель работы: Изучить состав устройства кодирующего ПБ29. Получить практические навыки по работе с устройством кодирующим. 2 Литература: 2.1 Джакония В.Е. Телевиде...
16272. Исследование спектра сигнала спутника Hot Biord 1.7 MB
  Лабораторная работа №4 Исследование спектра сигнала спутника Hot Biord 1 Цель работы: 1.1 Научиться пользоваться спутниковым ресивером. 1.2 Научиться настраиваться на выбранный транспондер и фиксировать его в памяти прибора DL4. 1.2 Научиться заносить данные прибора в ...
16274. Стандарт цифрового телевидения 4:2:2 290 KB
  Лабораторная работа №8 Стандарт цифрового телевидения 4:2:2 1 Цель работы: 1.1 Изучить метод аналогоцифрового преобразования в стандарте 4:2:2. 2 Литература: 2.1 Приложение А. 2.2 Приложение Б. 3 Подготовка к работе: 3.1 Повторить теоретический материал по стандар
16275. Исследование спутникового приемника DCH-4000P-42-S2 354 KB
  Лабораторная работа №100 Исследование спутникового приемника DCH4000P42S2 1 Цель работы: 1.1 Научиться пользоваться спутниковым ресивером. 1.2 Научиться настраиваться на выбранный транспондер 2 Литература: 2.1 Приложение А. 2.2 Приложение Б. 2.3 Приложение В. 3
16276. Общие сведения, простой монтаж в Adobe Premiere Pro 2.0 819 KB
  Лабораторная работа №1 Общие сведения простой монтаж в Adobe Premiere Pro 2.0 1 Цель работы 1.1 Получить первичные навыки работы с программой нелинейного монтажа Adobe Premiere Pro 2.0. 1.2 Научиться производить захват видеоинформации с внешних устройств при помощи Adobe Premiere. 1.3 Научит...
16277. Типы эффектов в Adobe Premire Pro 2.0 123 KB
  Лабораторная работа №2 Типы эффектов в Adobe Premire Pro 2.0 1 Цель работы 1.1 Изучить типы эффектов в программе Adobe Premire Pro 2.0. 1.2 Получить практические навыки работы с эффектами в Adobe Premiere Pro 2.0. 1.3 Смонтировать видеоролик с использованием эффектов. 2 Литература 2.1 Приложе
16278. Создание титров в Adobe Premiere Pro 2.0 187.5 KB
  Лабораторная работа №3 Создание титров в Adobe Premiere Pro 2.0 1 Цель работы 1.1 Изучить методы создания и редактирования титров в программе Adobe Premiere Pro 2.0. 1.2 Смонтировать видеоролик с применением титров/субтитров. 2 Литература 2.1 Приложение Общие сведения о титрах. ...