67619

Устройства ввода-вывода текстовой информации с промежуточного носителя

Лекция

Информатика, кибернетика и программирование

ОЧА общего назначения строятся на базе сканеров для которых используется специальное математическое обеспечение для распознавания изображений IREDER. Многие алгоритмы распознавания символов работают на основе распознавания контуров поэтому контура выделяют фильтром Собеля.

Русский

2014-09-12

135 KB

0 чел.

Устройства ввода-вывода текстовой информации

с промежуточного носителя

На всех специальных носителях текстовая информация храниться в двоичной форме, понятной ЭВМ. Однако существуют устройства автоматического ввода, так называемые читающие автоматы (ЧА), предназначенные для ввода текстовой информации с первичного документа.

1. Читающие автоматы

При проектировании читающего автомата большое значение имеет выбор типов распознаваемых шрифтов. Кроме обычных шрифтов (рукописных или машинописных) существуют специальные шрифты:

 кодированные - на основе комбинации точек и штрихов различного тона и ширины (для идентификации изделий);

 стилизованные - изображение символа специально искажено с целью придания каждому символу уникального интегрального свойства. Примером ЧА, использующих стилизованные шрифты, могут служить магнитные ЧА 1259 и 1419 фирмы IBM, обеспечивающих считывание информации при обработке банковских документов со скоростью до 1600 документов в минуту (объём алфавита 14 символов в коде EI3B);

 нормализованные для заполнения от руки символов по выделенным позициями, как шрифты индексов на конвертах.

Все ЧА разделяют на оптические (ОЧА) и магнитные (МЧА). Магнитные читающие автоматы ориентированы на чтение стилизованных шрифтов, нанесённых на носитель при помощи специальных магнитных чернил, которые имеют добавки, придающие чернилам ферромагнитные свойства. Для таких ЧА существует таблица стилизованных шрифтов для различных типов считывания. Считывающая магнитная головка (МГ) по ширине превышает высоту символа и с постоянной скоростью перемещается вдоль строки (рис. 18.1).

Амплитуда А сигнала на выходе МГ пропорциональна площади магнитных чернил, находящихся под головкой в каждый момент, т.е. суммарной ширине всех горизонтальных отрезков в изображении символа для текущего положения Х головки относительно изображения. Полученный сигнал преобразуется в цифровую форму и каждому изображению символа ставится в соответствие фиксированное количество чисел.

Оптические ЧА разделяются на специализированные и общего назначения. Специализированные ОЧА предназначены для ввода только текстовой информации с бумажного носителя. Они позволяют считывать информацию с формата А4, написанного шрифтом РОСА с вероятностью ошибки 0,5% при скорости 300знак/сек. Читающий автомат EC 6037 позволяет считывать с формата А3 и А4 с шрифтом пишущих машинок с вероятностью ошибки 0,1%. ОЧА общего назначения строятся на базе сканеров, для которых используется специальное математическое обеспечение для распознавания изображений AI-READER.

2. Сканеры

И ручные и автоматические сканеры строятся по принципу сканирования бумажного носителя отрезком аппаратуры. Обязательными компонентами сканеров являются рабочий элемент считывания, система закрепления или перемещения вводимого документа, контроллер и программные средства.

Принцип работы сканеров подобен принципу работы печатающих устройств (рис. 18.2).

В большинстве случаев источник света (светодиоды или лазер) освещает рабочее поле вводимого документа. Чувствительный к свету рабочий элемент двигается вдоль изображения или изображение двигается относительного него. Этот элемент за счёт отражённого света считывает фрагменты изображения, которые затем распознаются ПЭВМ и преобразуются в файл. Датчики на приборах с зарядной связью (ПЗС) преобразуют оптическое изображение в электрический сигнал с разрешающей способностью 10 … 30 точек/мм и выше.

Разделяют три основных этапа автоматического чтения ОЧА:

1. Осмотр и восприятие изображения, в процессе которых вырабатывается электрический сигнал, соответствующий графическому начертанию вводимого символа.

1.1. Захват документа, отделение от других.

1.2. Перемещение документа в позицию осмотра.

1.3. Выравнивание.

1.4. Дискретизация изображения - разбиение на пикселы и присвоение им кодов.

2. Выделение существенных признаков и составление описания воспринимаемого изображения символа.

2.1. Контрастирование.

2.2. Отделение строк.

2.3. Подвод к строке.

3. Распознавание символов.

Качество выполнения двух последних этапов во многом зависит от программного обеспечения ЧА. Ниже подробнее рассмотрим способы реализации выделенных функций этих этапов.

3. Алгоритмы контрастирования

Как при повышенной, так и при пониженной контрастности восприятие изображения осложняется. Поэтому при повышенной контрастности используется новая оцифровка, т.е. изображение вводится повторно, а при пониженной контрастности её повышают, используя различные методы.

Метод точечных преобразований основан на “растягивании” уровня яркости по всему диапазону, используя функцию преобразования (рис. 18.3).

Функция преобразования может иметь более сложный вид. Такой метод не всегда даёт положительный эффект, т.к. использует информацию только об одной точке.

Методы локальных операторов. При использовании данного метода новое значение яркости вычисляется не только на основе старого значения, но и с использованием значений яркости рядом лежащих точек. Самый простейший метод из этой группы - это фильтр Гаусса. Он использует маску типа квадратной матрицы степени 3 (рис. 18.4, а) с весами пикселей (рис. 18.4, б), сумма которых равна 16. Новое значение яркости пикселя Р определяется по формуле

                    (18.1)

Такая маска удобна при программной и аппаратной реализации (рис. 18.5).

Для непосредственной реализации этого метода используется двойной объём памяти для хранения исходного поля и поля с результатом обработки. Это является неудобным. Поэтому новое значение яркости пикселей сдвигается в направлении, откуда начата обработка на половину окна в пикселях. После завершения обработки выполняется сдвиг обратно. При этом информация теряется только по границам окна.

Фильтр Гаусса используется для “размазывания” изображения с целью снижения дифракционных и прочих краевых шумов и с целью снижения зернистости изображения.

Многие алгоритмы распознавания символов работают на основе распознавания контуров, поэтому контура выделяют фильтром Собеля. Этот фильтр реализуется посредством использования масок 2-х типов (рис. 18.6). Яркость пикселя определяется по следующей формуле

 

X=(F+2G+H)-(A+2B+C)

Y=(C+2E+H)-(A+2D+F);                          (18.2)

.

Кроме рассмотренных выше фильтров используется ещё и вскрывающий фильтр (рис. 18.7). Он реализуется в виде двух локальных операторов. Первый из них вызывает эрозию - снятие одного слоя пиксела с объекта, а второй вызывает наращивание слоя пикселей:

ЭН-1 - вскрывающий оператор уровня 1;

ЭЭНН-2 - вскрывающий оператор уровня 2.

- эррозия (Э);

- наращивание (Н)     (18.3)

Чем глубже уровень вскрытия, тем чище изображение, но если глубина вскрытия соизмерима с шириной символа, то символ может потеряться.

4. Алгоритм сканирования информации

Определение строк реализуется программой распознавания информации AI-READER совместно с аппаратурой ScanJet.

Исходными данными для процедуры отделения строк являются: исходный читаемый текст, размер букв и средний размер в пикселях интервалов межбуквенных и межстрочных. Алгоритм этой процедуры состоит из 4-х основных этапов:

1. Подвод к первой строке текста.

1.1. Сканирование документа, начиная с верхней границы горизонтальной апертурой (линией) параллельно верхней границе листа до встречи первого засвеченного пикселя.

1.2. Сканирование строки вертикальной апертурой, размер которой определяется как средний размер буквы плюс половина размера интервала между строками. Сканирование начинается с правой границы документа до первого засвеченного пикселя.

1.3. Сканирование буквы линейно вертикальной апертурой той же высоты, в результате которого формируется матрица образа буквы в пикселях [pij].

2. Проверка истинности выражения

                                          ,                              (18.4)

где [pij] - матрица изображения просканированного символа;  - матрица изображения эталонного к-го символа; - функция, которая определяется как  - функция совпадения; Р - порог принятия решения (80% от количества пикселей в эталоне).

Чем больше совпадений тем ближе символ к этому эталону, если порог Р превышен, то это означает, что символ распознан. Если символ не находит своего эталона, то возможно два варианта:

а) в режиме обучения программа запрашивает, что это за символ и запоминает его как эталонный для данного кода;

б) в рабочем режиме программа выдаёт отказ распознавания и символ заменяется на символ  а  .

3. Переход к следующему символу к п. 1.2.

4. Переход к следующей строке к п. 1.1.

Недостатком данного алгоритма является то, что формируется код для перехода на следующую страницу.

Для распознавания символов существуют специальные методы:

 метод сравнения;

 корреляционный метод. Он похож на рассмотренный выше метод, но вычисляется не функция сравнения, а коэффициент корреляции, который сравнивается с порогом Р;

 метод распознавания по вторичным признакам для стилизованных шрифтов;

 методы распознавания, основанные на нейросетях.

4.1. Метод идентификации контуров

Этот метод основан на выделении контура по алгоритму Фримена с последующей идентификацией контура. Цепной код Фримена позволяет представить контур произвольной формы в виде последовательности коротких векторов (рис. 18.8).

Алгоритм Фримена.

  1.  Поиск начальной точки. Сканирование вертикальной линейной апертурой и развёртка горизонтальной апертуры до первого засвеченного пиксела.
  2.  Проверка всех примыкающих пикселей по направлению, начиная с вектора 0, до тех пор, пока не встретится засвеченный пиксель. Поворот от исходной точки осуществляется по возрастанию номеров векторов. Если примыкающих пикселей не найдено, то считается, что обнаружен отдельный пиксель и его не рассматривают.
  3.  Направление последнего вектора отмечается как текущее, а его конец считается текущим пикселем.
  4.  Повторяют сканирование примыкающих пикселей до обнаружения засветки, начиная от пикселя, расположенного слева от текущего вектора по часовой стрелке.
  5.  Алгоритм повторяют с п. 3 до тех пор, пока положение текущего пикселя не совпадёт с начальным.

Недостатком этого метода является то, что распознавание символа зависит от его поворота.

Если вектор кодировать комплексным числом: 0 - (1); 1 - (-1+i) …, то на вращение контура можно не обращать внимание.

Условие распознавания:

              ,                                      (18.5)

где  - кодированный контур;  - эталонный контур; р - порог (0,8-0,9).

4.2. Распознавание символов аппаратными

структурами с помощью нейросетей

Нейросеть (НС) - это большой, сильно взаимосвязанный ансамбль простых элементов. Элементы обычно представляют собой двухуровневые приборы, которые переключаются из одного состояния в другое когда сигнал на входе превышает пороговое значение. Такое направление развивается с 1943 года. Слой принятия решения (рис. 18.9) состоит из нейронов. В нейросетях используются две структуры (рис. 18.10). во второй структуре введены обратные связи. Цепочка 2-3-5-6-2 реализует возвратную активность.

Динамика поведения сети. В каждый момент времени i-й узел может находится в одном из двух состояний . Переход из состояния +1 в -1 определяется пороговым потенциалом

,                           (18.6)

где N -количество нейронов, с которыми связан i-й элемент; Jij - вес связи (сила связи); i - порог срабатывания i-го нейрона. На осях откладывается активность нейронов (у нас 3 нейрона) (рис. 18.11).

В первой структуре распознавание заключается в точке 2. У каждой буквы имеется своя точка. Во второй структуре распознавание заканчивается в жгуте (аттракторе). У каждой буквы имеется свой аттрактор. Вторая структура позволяет запоминать большее количество информации с меньшими аппаратными затратами за счёт существования возрастной активности в сети.

В процессе распознавания символов в систему поступает частичная информация - искажённый образ символа. Это приводит систему в начальное состояние. Наличие “достаточной” информации для данного распознавания означает, что начальное состояние находится в области притяжения, соответствующего искомому результату распознавания. Притягивающий аттрактор, соответствующий символу, опознаётся группой нейронов, образовавшейся в процессе обучения. Множество аттракторов, соответствующее множеству распознаваемых символов образует семантическое пространство.

5. Интерфейсы читающих устройств

Для связи с ЭВМ сканеры могут использовать один из трёх типов интерфейса: последовательный порт, параллельный порт или шина расширения SCSI. Интерфейс SCSI работает быстрее стандартных портов и не занимает порты. Для управления работой сканера необходима соответствующая программа - драйвер, что привязывает к конкретной модели сканера своё программное обеспечение. Однако существует стандарт TWAIN, который разработан для ввода изображения от любого источника растровых данных: ручного сканера, слайдового сканера, цифровой видеокамеры и др. Этот стандарт поддерживают ЭВМ типа Macintosh и такие операционные системы, как Windows, UNIX и OS/2.

Рис. 18.11. Оси активности нейронов для первой (а) и второй структуры нейросети (б)

АТТРАКТОР

Рис. 18.10. Структура связей нейронов

Рис. 18.9. Структура устройства для распознавания символов на основе нейросетей

Рис. 18.8. Матрица векторов Фримена (а), контур (б)

Рис. 18.7. Маска вскрывающего фильтра: А5 = Р

Рис. 18.6. Маски фильтра Собеля

Рис. 18.5. Аппаратная организация фильтра Гаусса:

ВФ1 - весовой умножитель, который выполняет операцию С=А1В1+А2В2; ИМ1 - 8-ми входовой сумматор; ИР1 - регистр 8-4 на базе Т-тригеров, сдвигающий разряды в любом направлении; ВФ3 - специальный вычислитель; 2 и 1 - “1” и “2” в обратном двоичном коде

n

Рис. 18.4. Маска фильтра Гаусса

Рис. 18.3. Простейшая функция преобразования уровня яркости

Рис. 18.2. Устройство лазерного сканера

Рис. 18.1. Считывание стилизованных шрифтов МЧА


 

А также другие работы, которые могут Вас заинтересовать

85117. Знаходження різниці, коли зменшуване містить кілька нулів 125.56 KB
  Ознайомити учнів з випадком віднімання багатоцифрових чисел коли зменшуване містить кілька нулів; закріплювати уміння виконувати перевірку дій додавання і віднімання розв\\\'язувати задачі. а Розв\\\'язати з перевіркою. б Скласти і розв\\\'язати задачу за скороченим записом.
85118. Додавання кількох доданків. Задачі на знаходження довжини сторони трикутника 77.3 KB
  Закріплювати вміння учнів застосовувати сполучний і переставний закони додавання для зручних обчислень та виконувати додавання і віднімання багатоцифрових чисел письмово; вправляти у розв\\\'язуванні задач. б Скільки всього десятків сотень тисяч у числі 109256 в Скласти і розв\\\'язати задачу за поданим скороченим записом. Розв\\\'язання: 1 11650 7650 = 4000л надоїла третя доярка; 2 7650 3750 = 3900 л надоїла друга доярка. Розв\\\'язати задачу.
85119. Знаходження значень виразів на сумісні дії першого ступеня та виразів з дужками 37.15 KB
  Закріплювати вміння учнів виконувати дії додавання і віднімання над багатоцифровими числами; навчати узагальнених прийомів розв\\\'язування задач. а Розв\\\'язати і зробити перевірку. 1 Розв\\\'яжи задачу. Розв\\\'язання.
85120. Додавання і віднімання іменованих чисел, виражених в одиницях довжини та маси 37.67 KB
  Ознайомити учнів із прикладами письмового додавання і віднімання іменованих чисел виражених в одиницях вимірювання довжини та маси; закріплювати вміння учнів розв...
85121. Круглі числа. Периметр прямокутної ділянки. Знаходження суми і різниці багатоцифрових чисел 156 KB
  В ході колективного аналізу задачі на дошці ведеться запис: с км пройшов турист до зустрічі; с 3 км проїхав велосипедист до зустрічі; с с 3 км відстань між містом і селом. Першого дня автомобіль проїхав а км другого Ь кілометрів третього на 385 км менше ніж за перші два дні разом. Скільки кілометрів проїхав автомобіль третього дня Складіть вираз і розвяжіть задачу якщо а = 472; b = 368. а км проїхав автомобіль першого дня; b км проїхав другого дня; а b км проїхав за два дні разом; а b 385 проїхав...
85122. Застосування способу округлення при додаванні і відніманні 38.13 KB
  Ознайомити учнів з прийомом округлення при додаванні і відніманні; закріплювати навички письмового додавання і віднімання багатоцифрових чисел вміння розвязувати задачі. а Записати кожне з чисел 79 і 346 у вигляді суми й різниці круглого числа та одноцифрового. Суму чисел 3600 і 1200 зменшити на 325. Число 100800 збільшити на різницю чисел 19374 і 8752.
85123. Тематичне опитування. Контроль навчальних досягнень учнів з теми Додавання і віднімання багатоцифрових чисел 33.89 KB
  На лісовій ділянці посадили 125 лип берізок на 75 більше ніж лип а дубів на 320 більше ніж беріз. Учні першої школи зібрали 12 кг 400 г шипшини другої на 5 кг 200 г менше ніж першої а третьої на 10 кг 700 г менше ніж учні першої і другої шкіл разом. У перших класах 180 учнів у других на 20 учнів більше ніж у перших а в третіх на 60 учнів менше ніж у других. Перша бригада відремонтувала 5 км 500 м дороги друга на 1 км 100 м більше ніж перша а третя на 4 км 900 м менше ніж перша і друга бригади разом.
85124. Аналіз тематичного опитування. Поняття про швидкість. Задачі на знаходження швидкості руху 86.98 KB
  Поняття про швидкість. Провести аналіз тематичного опитування; зясувати типові помилки; організувати роботу над помилками; ознайомити учнів з поняттям швидкість руху простими і складеними задачами на знаходження швидкості. Таблиця Швидкість. Щоб знайти швидкість треба відстань поділити на час.
85125. Задачі на знаходження відстані за даними швидкістю і часом. Знаходження значень виразів на додавання і віднімання 80.59 KB
  Ознайомити учнів зі способом визначення відстані за відомими швидкістю і часом; формувати вміння розвязувати задачі на основі творчих видів роботи; розвивати обчислювальні навички.