67618

Устройства и системы ввода-вывода текстовой и графической информации. Принцип кодирования текстовой информации. Кодирование текстовой информации в ЭВМ

Лекция

Информатика, кибернетика и программирование

Текстовая информация представляется последовательностью алфавитно-цифровых символов каждый из которых определённым образом кодируется. Существуют четыре основных принципа кодирования символов. 1 где S множество всех символов используемых для кодирования текста...

Русский

2014-09-12

147 KB

1 чел.

Устройства и системы ввода-вывода

текстовой и графической информации

Принцип кодирования текстовой информации

1. Кодирование текстовой информации в ЭВМ

Текстовая информация представляется последовательностью алфавитно-цифровых символов, каждый из которых определённым образом кодируется. Существуют четыре основных принципа кодирования символов.

1. Символы кодируются в виде последовательности двоичных цифр. Количество разрядов на один символ определяется по формуле

,                                  (17.1)

где S - множество всех символов, используемых для кодирования текста; HХ(S) - энтропия по Хартли (мера неопределённости). Эта величина характеризует количество информации в каком-либо сообщении.

;                    (17.2)

.

Эта энтропия обладает свойством адитивности, т.е. . Например, код символа складывается из буквенного обозначения и цифрового X={A, B, C, D}, Y={1, 2, 3, 4, 5, 6, 7, …, 16}; тогда

,  .

Большинство кодировок используют один байт для кодирования символов.

2. Символы, относящиеся к одной группе по каким-либо признакам желательно кодировать в виде односвязного множества в одномерном пространстве кодов (рис. 17.1).

Рис. 17.1. Одномерное пространство кодов символов

3. Коды символов должны отражать порядок следования букв в алфавите.

4. Желательно, чтобы преобразование строчных букв в прописные и обратно сводилось к прибавлению или вычитанию некоторой константы или к гашению/записи некоторых бит.

Принцип 2 и 4 не всегда соблюдаются.

Для кодирования символов в качестве внутреннего кода ЭВМ наиболее часто используется двоичный код обработки информации (ДКОИ), построенный на основе международного кода EBCDIC.

Наиболее часто символы в тексте в пределах информационных блоков встречаются с различной вероятностью, что позволяет сократить затраты разрядов на кодирование. Для этого количество информации рассчитывается при помощи энтропии по Шеннону HS(X), и в общем случае HS(S)< HX(S).

,     (17.3)

где N – мощность множества X(N=|X|); Pi – вероятность поступления событий (встречаемость символов в тексте); .

Если события равновероятны, то Pi = 1/N =>

.   (17.4)

Свойства энтропии по Шеннону:

а) она всегда положительна;

б) она максимальна, т.е. равна энтропии по Хартли, когда события равновероятны;

в) для независимых событий из множеств X и Y, энтропия произведения X и Y равна сумме отдельных энтропий

HS(XY)=HS(X)+ HS(Y).

Энтропия по Шеннону и энтропия по Хартли также используются для теоретического анализа каналов передачи информации.

Разобьем множество символов S на m подмножеств (), в которых символы встречаются с равной вероятностью.

,     (17.5)

где рi – вероятность встретить символ, принадлежащий подмножеству Si.

Количество бит для кодирования одного символа определяется как

.        (17.6)

Экономия в разрядах на один символ проявляется, когда n1<nbit, тогда для кодирования используют n1 разряд, а для переключения с одной группы символов на другие используют специальные коды, которые включаются в каждую группу. Таким кодом является международный телеграфный код (МТК-2, МТК-5), который используется в системах связи и телеобработки.

Если условие

  ,                                 (12.7)

где <N> - средняя длина информационного блока, содержащего символы из одной группы; выполняется, то кодирование считается эффективным.

2. Ручной ввод текстовой информации с клавиатуры

Клавиатуры могут характеризоваться:

1) эксплуатационными характеристиками:

а) количество типов клавиш;

б) количество клавиш каждого типа;

в) расположение клавиш. По расположению клавиш наибольшее распространение получила клавиатура QWERTY, однако, возможны и другие варианты расположения символов клавиатуры (Дворака и Делея);

2) механическими характеристиками, основной из которых является функция упругости клавиш.

По способу обнаружения нажатия клавиш выделяют три типа клавиатур:

1) с гальваническим контактом или с открытым (не герметичным контактом). Для них характерна низкая стоимость и малое время наработки на отказ;

2) с магнитным принципом обнаружения (на основе магниточувствительных и проводниковых структур). Для них характерна большая стоимость, но очень высокая надёжность;

3) с ёмкостным принципом обнаружения нажатия. Для них характерна высокая износостойкость, низкая надёжность и сложность настройки.

Принцип кодирования клавиш клавиатуры не зависит от кодирования символов. В системное устройство ПЭВМ посылается не код символа, которому соответствует данная клавиша, а позиционный код клавиши. Переход к коду символа осуществляется специальной схемой управления клавиатурой, которую можно перепрограммировать.

Клавиатура включает в себя совокупность ключей клавиш и схемы управления для формирования кода при замыкании ключа, исключения неоднозначности кодирования из-за “дребезга” контактов и выполнения других управляющих функций. Клавиатура проектируется как конечный автомат (рис. 17.2)

Дешифратор последовательно опрашивает состояние ключей, расположенных с столбцах X матрицы клавиатуры. Если какая-либо клавиша нажата, то сигнал через замкнутый контакт поступает на соответствующую горизонтальную шину Y и через селектор (регистр) поступает на вход ПЛМ. Сигналы с дешифратора и селектора образуют адресный вход ПЛМ, в ячейках которой записаны коды символов (их младшие разряды). Код символа записывается в выходной регистр. Старшие разряды кода определяются содержимым специального регистра, изменяющего своё значение только при нажатии клавиши изменения регистров (Shift, Alt и др.).

Проблема “дребезгов” клавиатуры решается использованием вместо ПЛМ микропроцессора. Вертикальные и горизонтальные шины матрицы контактов подключаются, соответственно, к портам вывода и ввода (Пвыв) и (Пвв), для передачи в ЭВМ сформированного кода символа используется второй порт вывода микропроцессора (см. рис. 17.3).

Для устранения “дребезгов” используется накопление веса нажатой клавиши за несколько циклов опроса, образующих период опроса. Если в период опроса координаты клавиши не совпали, то инициируется сброс счётчика веса и начинается новый период опроса.


 

А также другие работы, которые могут Вас заинтересовать

36825. Мировые информационные ресурсы 444 KB
  Задание №1 Сформируйте электронный глоссарий по тематике Мировые информационные ресурсы: Блог Веб страница Интернет ресурс Информационная культура Информационное общество Информационные взаимодействия Информационные ресурсы Информационные сети Информационные системы Информационный портал Информационный потенциал общества Информация Мировые информационные ресурсы Национальные информационные ресурсы Сайт Сервис Средства массовой информации Телеконференция Файловый сервер Чат Электронная база...
36826. Получить навыки работы с электронной таблицей Microsoft Excel 170 KB
  Откройте меню настройки панелей управления Вид Панели инструментов и убедитесь в том что включено отображение только двух панелей: Стандартная и Форматирование. Чтобы настроить масштаб отображения войдите в меню Вид Масштаб. Войдите в меню Сервис Параметры. Для этого достаточно воспользоваться командой меню Правка Отменить.
36827. МОДЕЛИРОВАНИЕ реакции с диффузией в трубчатом реакторе 862.5 KB
  Поэтому математическое описание процессов протекающих в этих реакторах имеет большое значение. Рассмотрим математическое описание трубчатого реактора для проведение реакции с диффузией. Этот поток входит в реактор где одновременно с диффузией осуществляется реакция первого порядка Длина реактора L площадь его поперечного сечения 1 м2. При условии что скорость питания w м3 ч концентрация М равна с0 а коэффициент диффузии М принимается постоянный со значением D м2 ч определить концентрацию М как функцию длины реактора.
36828. ПОВЕРКА МИКРОМЕТРА 227.5 KB
  Лабораторная работа № 2 ПОВЕРКА МИКРОМЕТРА Цель работы: изучить устройство и принцип действия микрометра; получить первичные практические навыки в выполнении поверки СИ осуществить поверку микрометра определить пригодность микрометра к использованию. Устройство и принцип действия микрометра Микрометр относится к классу микрометрических измерительных инструментов принцип действия которых основан на использовании винтовой пары винт гайка позволяющей преобразовать вращательное движение микровинта в поступательное. Устройство...
36829. МНОГОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 124.5 KB
  Для создания таких массивов служит функция meshgrid. [XY]=meshgridxy преобразует область заданную векторами x и y в двухмерные массивы X и Y которые могут быть использованы для вычисления значений функции двух переменных и построения трехмерных графиков. Пример [XY]=meshgrid1:1:46:1:9 X = 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 Y = 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 В этом примере формируются массивы X и Y для построения трехмерной по верхности при изменении x от 1 до 4 с шагом 1 и y от 6 до 9 с шагом 1. Пример [xy]=meshgrid3: .
36830. Исследование разборчивости речи методом артикуляционных измерений при защите речевой информации различными видами маскирующих сигналов 201.5 KB
  Звуковые колебания в жидкой и газообразной среде воздухе представляют собой продольные колебания так как частицы среды колеблются вдоль линии распространения звука. Вследствие этого образуются сгущения и разряжения среды двигающейся от источника колебаний с определенной скоростью называемой скоростью звука. Скорость звука Скорость звука является постоянной величиной для данной среды и метеорологических условий и определяется по формуле ...
36831. СОЗДАНИЕ И ИСПОЛЬЗОВАНИЕ ДИАГРАММ 67 KB
  В табличном процессоре MS Excel создать документ и сохранить его в личной папке под именем ФИО_лабExcel4_группа.xls. В созданном документе выполнить все задания.
36832. РЕШЕНИЕ ОПТИМИЗАЦИОННЫХ ЗАДАЧ 1.05 MB
  В созданном документе выполнить все задания каждое задание оформлять на отдельном листе. ЗАДАНИЕ 1. ЗАДАНИЕ 2. ЗАДАНИЕ 3.
36833. НЕРАЗРУШАЮЩИЙ КОНТРОЛЬ И ДИАГНОСТИКА ЭЛЕКТРООБОРУДОВАНИЯ 110.57 KB
  Научные положения дисциплины «Неразрушающий контроль и диагностика электрооборудования» сформулированы на основе теории электромагнитных полей, специальных разделов математики, таких как теория функций комплексных чисел, конформных преобразований, теории рядов, теории симметрии. При изучении дисциплины необходимо знание высшей математики, основ теории поля, основ программирования.