67618

Устройства и системы ввода-вывода текстовой и графической информации. Принцип кодирования текстовой информации. Кодирование текстовой информации в ЭВМ

Лекция

Информатика, кибернетика и программирование

Текстовая информация представляется последовательностью алфавитно-цифровых символов каждый из которых определённым образом кодируется. Существуют четыре основных принципа кодирования символов. 1 где S множество всех символов используемых для кодирования текста...

Русский

2014-09-12

147 KB

1 чел.

Устройства и системы ввода-вывода

текстовой и графической информации

Принцип кодирования текстовой информации

1. Кодирование текстовой информации в ЭВМ

Текстовая информация представляется последовательностью алфавитно-цифровых символов, каждый из которых определённым образом кодируется. Существуют четыре основных принципа кодирования символов.

1. Символы кодируются в виде последовательности двоичных цифр. Количество разрядов на один символ определяется по формуле

,                                  (17.1)

где S - множество всех символов, используемых для кодирования текста; HХ(S) - энтропия по Хартли (мера неопределённости). Эта величина характеризует количество информации в каком-либо сообщении.

;                    (17.2)

.

Эта энтропия обладает свойством адитивности, т.е. . Например, код символа складывается из буквенного обозначения и цифрового X={A, B, C, D}, Y={1, 2, 3, 4, 5, 6, 7, …, 16}; тогда

,  .

Большинство кодировок используют один байт для кодирования символов.

2. Символы, относящиеся к одной группе по каким-либо признакам желательно кодировать в виде односвязного множества в одномерном пространстве кодов (рис. 17.1).

Рис. 17.1. Одномерное пространство кодов символов

3. Коды символов должны отражать порядок следования букв в алфавите.

4. Желательно, чтобы преобразование строчных букв в прописные и обратно сводилось к прибавлению или вычитанию некоторой константы или к гашению/записи некоторых бит.

Принцип 2 и 4 не всегда соблюдаются.

Для кодирования символов в качестве внутреннего кода ЭВМ наиболее часто используется двоичный код обработки информации (ДКОИ), построенный на основе международного кода EBCDIC.

Наиболее часто символы в тексте в пределах информационных блоков встречаются с различной вероятностью, что позволяет сократить затраты разрядов на кодирование. Для этого количество информации рассчитывается при помощи энтропии по Шеннону HS(X), и в общем случае HS(S)< HX(S).

,     (17.3)

где N – мощность множества X(N=|X|); Pi – вероятность поступления событий (встречаемость символов в тексте); .

Если события равновероятны, то Pi = 1/N =>

.   (17.4)

Свойства энтропии по Шеннону:

а) она всегда положительна;

б) она максимальна, т.е. равна энтропии по Хартли, когда события равновероятны;

в) для независимых событий из множеств X и Y, энтропия произведения X и Y равна сумме отдельных энтропий

HS(XY)=HS(X)+ HS(Y).

Энтропия по Шеннону и энтропия по Хартли также используются для теоретического анализа каналов передачи информации.

Разобьем множество символов S на m подмножеств (), в которых символы встречаются с равной вероятностью.

,     (17.5)

где рi – вероятность встретить символ, принадлежащий подмножеству Si.

Количество бит для кодирования одного символа определяется как

.        (17.6)

Экономия в разрядах на один символ проявляется, когда n1<nbit, тогда для кодирования используют n1 разряд, а для переключения с одной группы символов на другие используют специальные коды, которые включаются в каждую группу. Таким кодом является международный телеграфный код (МТК-2, МТК-5), который используется в системах связи и телеобработки.

Если условие

  ,                                 (12.7)

где <N> - средняя длина информационного блока, содержащего символы из одной группы; выполняется, то кодирование считается эффективным.

2. Ручной ввод текстовой информации с клавиатуры

Клавиатуры могут характеризоваться:

1) эксплуатационными характеристиками:

а) количество типов клавиш;

б) количество клавиш каждого типа;

в) расположение клавиш. По расположению клавиш наибольшее распространение получила клавиатура QWERTY, однако, возможны и другие варианты расположения символов клавиатуры (Дворака и Делея);

2) механическими характеристиками, основной из которых является функция упругости клавиш.

По способу обнаружения нажатия клавиш выделяют три типа клавиатур:

1) с гальваническим контактом или с открытым (не герметичным контактом). Для них характерна низкая стоимость и малое время наработки на отказ;

2) с магнитным принципом обнаружения (на основе магниточувствительных и проводниковых структур). Для них характерна большая стоимость, но очень высокая надёжность;

3) с ёмкостным принципом обнаружения нажатия. Для них характерна высокая износостойкость, низкая надёжность и сложность настройки.

Принцип кодирования клавиш клавиатуры не зависит от кодирования символов. В системное устройство ПЭВМ посылается не код символа, которому соответствует данная клавиша, а позиционный код клавиши. Переход к коду символа осуществляется специальной схемой управления клавиатурой, которую можно перепрограммировать.

Клавиатура включает в себя совокупность ключей клавиш и схемы управления для формирования кода при замыкании ключа, исключения неоднозначности кодирования из-за “дребезга” контактов и выполнения других управляющих функций. Клавиатура проектируется как конечный автомат (рис. 17.2)

Дешифратор последовательно опрашивает состояние ключей, расположенных с столбцах X матрицы клавиатуры. Если какая-либо клавиша нажата, то сигнал через замкнутый контакт поступает на соответствующую горизонтальную шину Y и через селектор (регистр) поступает на вход ПЛМ. Сигналы с дешифратора и селектора образуют адресный вход ПЛМ, в ячейках которой записаны коды символов (их младшие разряды). Код символа записывается в выходной регистр. Старшие разряды кода определяются содержимым специального регистра, изменяющего своё значение только при нажатии клавиши изменения регистров (Shift, Alt и др.).

Проблема “дребезгов” клавиатуры решается использованием вместо ПЛМ микропроцессора. Вертикальные и горизонтальные шины матрицы контактов подключаются, соответственно, к портам вывода и ввода (Пвыв) и (Пвв), для передачи в ЭВМ сформированного кода символа используется второй порт вывода микропроцессора (см. рис. 17.3).

Для устранения “дребезгов” используется накопление веса нажатой клавиши за несколько циклов опроса, образующих период опроса. Если в период опроса координаты клавиши не совпали, то инициируется сброс счётчика веса и начинается новый период опроса.


 

А также другие работы, которые могут Вас заинтересовать

79048. Особенности профессионального труда в науке. 35.5 KB
  Для того чтобы удовлетворить этим требованиям он должен: хорошо знать все то что сделано и делается в его области науки; публикуя результаты своих исследований четко указывать на какие исследования предшественников и коллег он опирался и именно на этом фоне показывать то новое что открыто и разработано им самим. Одной из острых тем обсуждаемых в дискуссиях по вопросам социальной ответственности является свобода научных исследований. Результаты и приложения фундаментальных исследований очень часто непредсказуемы. Но можно сказать что...
79050. Наука как познавательная деятельность 24.5 KB
  Особенности науки и ее взаимосвязи с другими способами познавательной деятельности и культуры находят свое выражение в 3х основных аспектах ее существования и функционирования. Как и другие способы познания наука возникает из практической деятельности людей. Основными системообразующими факторами способствующими превращению науки в важнейший и определяющий способ познавательной деятельности являются: ориентация на объективный характер закономерностей изучаемых предметов и открывает возможность опережающего изучения объектов неохваченных...
79052. Наука как особая сфера культуры 24 KB
  Не следует также забывать что в своем развитии наука взаимодействует и с другими формами общественного сознания искусство мораль философия религия а также и с социальными институтами общества. Поэтому правильное представление о роли и месте науки в общей системе культуры можно получить только тогда когда будут учитываться вопервых многообразные ее связи и взаимодействия с другими компонентами культуры вовторых раскрыты специфические особенности отличающие ее от других форм культуры способов познания и социальных институтов....
79053. Вклад позитивизма в становление философии науки 30 KB
  Вклад позитивизма в становление философии науки. Огюст Конт 1798 1857 родоначальника позитивизма позитивной философии в тех аспектах которые были связаны с высокой оценкой научности как важнейшего качества знания. Понятие ldquo;позитивизмrdquo; обозначает призыв философам отказаться от метафизических абстракций т. Отчасти позитивизм заключается в антифилософской реакции против рационализма идеализма спиритуализма и обращается в тоже время к материализму.
79054. Проблема «опыта» и истины в философии науки нач. 20 в. (Э. Мах, Авинариус, А. Пуанкаре) 34.5 KB
  Проблема опыта и истины в философии науки нач. Эмпириокритицизм философская система чистого опыта критический эмпиризм который стремиться ограничить философию изложением данных опыта при полном исключении всякой метафизики с целью выработки и естественного понятия о мире. Нейтральный элемент опыта одновременное включение духовного и материального начала. Авенариусом буквально означает критику опыта.
79055. Вклад неопозитивизма в развитии логики и методологии науки 37 KB
  Вклад неопозитивизма в развитии логики и методологии науки. Логика науки применение идей методов и аппарата логики в анализе научного познания. Развитие логики всегда было тесно связано с практикой теоретического мышления и прежде всего с развитием науки. Методология науки в традиционном понимании это учение о методах и процедурах научной деятельности а также раздел общей теории познания в особенности теории научного познания эпистемологии и философии науки.
79056. Концепция философии науки Т. Куна 25.5 KB
  Концепция философии науки Т. Важнейшей характеристикой знания является его динамика его рост изменение развитие В современной западной философии проблема роста развития знания является центральной в философии науки. переход к новому периоду нормальной науки . Причем последние гораздо более редки в истории развития науки по сравнению с первыми.