10759

Распознавание автомобильных номеров с помощью нейронных сетей

Курсовая

Информатика, кибернетика и программирование

Курсовая работа на тему: Распознавание автомобильных номеров с помощью нейронных сетей. Содержание Введение. 3 Постановка задачи 4 Глава 1. Существующие системы и методы распознавания 4 Глава 2. Шаблоннонейросетевой метод распознавания 8 Ито

Русский

2013-04-01

171.5 KB

239 чел.

Курсовая работа на тему:

Распознавание автомобильных номеров с помощью нейронных сетей.

Содержание

Введение.          3

Постановка задачи        4

Глава 1. Существующие системы и методы распознавания  4

Глава 2. Шаблонно-нейросетевой метод распознавания  8

Итоги и дальнейшие пути развития      11

Литература.         12

Приложения         13


Введение.

В последнее время на дорогах стали встречаться аппаратно-программные комплексы, фотографирующие нарушителей скоростного режима, такие как «Сова-2», «Авто-Интеллект» и «Авто-Инспектор». Правоохранительные органы заинтересовались применением данных устройств для отслеживания транспортного потока и выявлению разыскиваемых автомобилей.

Также комплексы применяются для охраны и регистрации транспорта на автостоянках и охраняемых территориях.

Для реализации данного проекта необходимо распознавание номера автомобиля. Но современные системы  малоэффективны при зашумленности изображения из-за использования шаблонных и структурных алгоритмов распознавания. Поэтому была сделана попытка привлечения нейронных сетей для решения данной задачи. Чему и посвящена эта работа.


Постановка задачи.

С камеры поступает цветная фотография проезжающего мимо автомобиля. При этом автомобиль может находиться в любом месте снимка, его номерной знак может быть загрязнен. Расположение номерной пластины заранее определено, и задано 4 параметрами. Номерная пластина расположена горизонтально (возможны небольшие отклонения). Необходимо распознать государственный номер автомобиля, для запроса к базе данных разыскиваемых автомобилей.

Глава 1. Существующие системы и методы распознавания.

Система «Авто-Инспектор».

Система «Авто-Инспектор», является одним из лидеров на Российском рынке. Ее алгоритм использует традиционные методы распознания образов, при этом их эффективность снижается, при сильных помехах (дождь, загрязненный номер и т.д.)

  1.  Нормализация изображения.
  2.  Локализация номера в видеокадре.
  3.  Преобразование исходного изображения.
  4.  Проверка результатов распознавания.
  5.  Сравнение результатов распознавания с информацией базы данных

Удаление в видеопотоке шумов, нивелирование эффектов потери фокуса, неравномерного распределения яркости от источников света, удаление рисунков или иной графики с фона номерной пластины обеспечивает высокую точность распознавания.

Выделение областей, по рисунку потенциально содержащих номер, осуществляется по результатам анализа видеоизображения на основе формального представления о масштабных характеристиках номерного знака.

рис.1

Графическое изображение номера приводится в векторную форму, максимально походящую для быстрого распознавания: выделяются отдельные символы для дальнейшего анализа по ключевым характеристикам. Используемый при этом алгоритм позволяет осуществлять распознавание независимо от масштаба, используемого шрифта символов номера, оптических искажений, налипания грязи и разрывов.

Уточнение результатов распознавания осуществляется на основе заданных шаблонов, что позволяет избежать тривиальных ошибок – ложного распознавания артефактов, определения неправильного количества символов в номере, распознавания близких символов и т.д.

Экспортирование распознанного номера в собственную или внешнюю базу данных для сопоставления с имеющейся информацией и дальнейшей реализации заданной реакции системы и оповещения оператора по результатам распознавания и сравнения.

АПК «Сова-2»[5]

«Сова-2» - аппаратно-программный комплекс от фирмы «Проминформ» для распознавания автомобильных номеров, отличается высокой скоростью распознавания за счет выделения отдельного контроллера распознавания. Обладает возможностью распознавания номерных знаков разных типов.

В АПК «Сова-2», реализован механизм распознавания, основанный на шаблонном методе, что обеспечивает быстрое, но некачественное распознавание номерных знаков.

Также АПК «Сова-2» реализуется в мобильном исполнении, однако их процент распознавания ниже, за счет невозможности точной настройки камеры.

Система «Авто-интеллект»

По заявлению создателей, система «Авто-интеллект» является лидером российского рынка (судя по рекламе). Она обеспечивает наивысший процент распознавания, и создатели не разглашают принципы действия.

Прочие системы

На рынке присутствует множество других систем, однако их характеристики значительно уступают системам описанным выше.

Сравнительные характеристики систем распознавания номеров

Сова-2

Авто-Инспектор

Авто-Интеллект

Процент распознавания днем

90

88

До 92

Процент Распознавания ночью

80

-

80

Время распознавания, мс

50

-

-

Стоит отметить, что процент распознавания считается на специальных проверочных видеозаписях и автомобили, номера которых человек не может распознать, не учитываются. При этом нельзя точно судить о качестве распознавания из заявленных цифр, т.к. они могут быть занижены или завышены, исходя из подбора тестовых записей.

Методы распознавания символов

В данной главе описываются существующие методы распознавания символов.

Структурные методы. [7]

Алгоритм работы данных методов заключается в разбиении исходного образа на составные части, описываемые как стабильные идеальные элементы.

Одни из методов данного направления используют для распознавания топологическое описание изображений, когда последние можно считать плоскими графами. Возможные изображения, составляющие тот или другой класс, можно представить как результат гомеоморфных преобразований некоторого эталонного изображения, соответствующего этому классу. Задача распознавания в этом случае может быть сведена к установлению гомеоморфности предъявленного изображения с одним из эталонных. Ее можно обнаружить с помощью топологических инвариантов - таких свойств изображения, которые не изменяются при его гомеоморфных преобразованиях. Инвариантом, позволяющим дать численное описание изображений, является, например, количество сходящихся в точке линий. Соответствующее описание получается обходом в определенном порядке контуров изображения с одновременной фиксацией индексов точек. Установление гомеоморфности - собственно распознавания - сводится к сравнению описаний предъявленного изображения и эталонных изображений классов. Важное достоинство топологического описания - его нечувствительность к сильным деформациям изображения, включающим все преобразования подобия, если связывать с каждым изображением некоторую характерную точку, из которой начинается обход. Обучение топологическому коду состоит в ведении набора эталонных описаний.

Другие структурные методы реализуют алгоритм событийного распознавания. Событийный метод опирается на топологическую структуру объекта, состоящую из линий и не изменяющуюся при малых деформациях образа. Линией называется часть образа, в каждом сечении которого имеется всего один интервал. Линии, огрубленные на некоторой сетке, определяют события. Событийное представление является не только формальным набором признаков, но и адекватным топологическим описанием. Обучение метода сводится к составлению списка эталонов на достаточно большой последовательности образов. При распознавании для исходного растра определяется событийное представление, которому сопоставляется эталонный класс.

Достоинствами метода являются способность распознавания искаженных символов и быстродействие при малом алфавите.

Шаблонные методы [6]

Алгоритм работы шаблонных методов опирается на сопоставление входного графического изображения, идеальному шаблону.  В процессе распознавания, перебираются шаблоны, и вычисляется расстояние от образа до шаблона. Класс, шаблоны которого находятся на минимальном расстоянии от входного образа, является результатом распознавания.

Данные методы делятся на два класса шрифтозависимые и шрифтонезавизимые. Шрифтонезависимые методы используют заранее определенные шаблоны, и универсальны для всех типов шрифтов. Однако при таком подходе снижается вероятность правильного распознавания. Шрифтозависимые алгоритмы рассчитаны только на один тип шрифта, это повышает качество их работы, но они совершенно не работоспособны при использовании других шрифтов. Были предложены методы для распознавания больших объемов текста, когда часть символов гарантированно распознается шрифтонезависимыми методами, а затем на основании распознанных символов строятся шаблоны для шрифтозависимых алгоритмов.

К достоинствам данного алгоритма относятся: простота реализации, надежная работа в условиях отсутствия помех, быстрота при малом алфавите.

К недостаткам можно отнести: сильную зависимость от шаблонов и сложность подбора оптимальных шаблонов, медленная работа при большом количестве помех, чувствительность к вращению, шумам и искажениям.

Нейросетевые методы [1],[2]

Нейросетевые методы основаны на применении различных типов искусственных нейронных сетей. Идея этих методов – моделирование работы мозга человека. На вход заранее обученной нейронной сети поступает вектор, который является представлением входного образа (пиксели, частотные характеристики, вэйвлеты). На выходе нейрон, соответствующий классу распознанного символа, выдает максимальное значение функции активации. Или же на выход поступает множество ключевых характеристик изображения, которые затем обрабатываются другими системами. Обучение нейронных сетей происходит на множестве обучающих примеров. Причем возможно обучение с учителем (персептрон) или самоорганизация (сеть Кохонена).

Достоинствами метода являются: способность к обобщению, высокая скорость, особенно при параллельных вычислениях.

Недостатки: чувствительность к вращению и искажению символов, сложность подбора обучающей выборки и алгоритма обучения.


Глава 2. Шаблонно-нейросетевой метод распознавания.

Для решения задачи распознавания образов предлагаю использовать метод, основанный на применении нейронных сетей, обученных на множестве шаблонов. Отличие данного метода от стандартных нейросетевых заключается в небольшом размере обучающей выборки и тщательной ее подготовке. В условиях стандартизированных изображений данный метод эффективнее, т.к. при обучении не закладывается отклонения выборки от идеального изображения

Исходные данные

Алгоритм распознавания работает с данными предоставленными системой «Сова-2», номерной знак уже найден, и определены углы рамки. Размер номерного знака примерно 100х20 пикселей. Исходные изображения представлены в формате JPEG, что добавляет помех и ухудшает качество распознавания, по сравнению с «живой» картинкой камеры.

Разбор номерного знака

Для осуществления процесса распознавания необходимо выделить отдельные символы с номерной пластины. Местоположение пластины заранее определено. Возможен небольшой угол наклона пластины. Первым делом производится бинаризация изображения пластины, на основе представлений о виде чистого номера.

рис.2

После бинаризации осуществляется разбор номерного знака. Разбор производится по шаблону в два этапа. На первом этапе каждый символ берется в заранее заданном «окне» (рис.2). Окно гораздо шире символа, это сделано для устранения погрешности установления позиции номера в кадре. На втором этапе происходит обрезание краев, программа обрезает лишние пробелы по краям и оторванные фрагменты. В виду слишком мелкого изображения номера региона и небольшого расстояния между символами, вычленяются сразу оба символа, в последствии они разделяются точно посередине.

Представление данных

На вход нейронной сети поступают пиксели полученного бинаризованного изображения символа. При этом пиксели могут группироваться по квадратам 2х2 или 3х3, что позволяет сгладить шумы. Стоит отметить, что изображение символа предварительно масштабируется до размеров 10х15 для букв и 9х18 для цифр, для исключения смещения.

Структура нейронной сети

Для цифр и для букв использовались разные нейронные сети. Мною было опробовано 2 вида нейронных сетей однослойный и двухслойный персептроны. Было замечено, что при использовании алгоритма обратного распространения однослойный персептрон показывает более высокие результаты. Число входных нейронов зависит от размера сетки. Число нейронов промежуточного слоя было подобрано опытным путем, для минимизации ошибки обобщения.

Обучающая выборка

Обучающая выборка (рис.3) состоит из изображений символов,  приближенных к эталонам, определенным в ГОСТ, в разных вариациях (жирный, обычный, тонкий),

(рис.3)

впоследствии дополненная изображениями символами, которые являлись результатами некорректной работы алгоритма разделения и бинаризации номера, а также масштабирования символов.

Алгоритмы обучения

Кроме общеизвестного алгоритма обратного распространения[1,2,3], мною был использован метод упругого обратного распространения [3], также известный как дельта-дельта с чертой. Данный метод относится к классу градиентных методов пакетной обработки. На каждой эпохе вычисляется средний градиент ошибки по всем обучающим наблюдениям, затем, один раз за эпоху, корректируются веса. Веса корректируются по тем же формулам, что и в методе обратного распространения, с той разницей, что коэффициент инерции не используется, а каждый вес имеет свою собственную, зависящую от времени скорость обучения.

В начале всем скоростям обучения присваиваются одинаковые стартовые значения; затем на каждой эпохе они корректируются по следующим формулам.

Значение "Дельта с чертой" вычисляется так:

d(t) - производная функции ошибок,

q - константа сглаживания.

Скорость обучения для каждого веса корректируется по формулам:

k - величина линейного ускорения,

f - множитель замедления.

Здесь какая-то путаница.

Нигде в формулах не используется d(t), q, f. Непонятно как задается первоначальное значение дельта. Для скорости обучения используются разные буквы  и . Описание алгоритма упругого обратного распространения я приложил – сравни у тебя тот же самый или нет ?

Полученные результаты

В ходе экспериментов с различными видами нейронных сетей, алгоритмами обучения были получены следующие проценты распознавания. Наивысшие результаты были достигнуты при использовании алгоритма упругого обратного распространения  и при использовании сетки 2х2 пикселя 100% на цифрах и 92% в общем. Наименьший процент распознавания достигнут на номере региона. Это объясняется мелким размером цифр региона.


Итоги и дальнейшие пути развития.

Полученные результаты превосходят результаты уже реализованных систем, при том что распознавание производилось из кадров сжатых в формат JPEG, а не с «живой» картинки, что также накладывает свои шумы и помехи.

В дальнейшем планируется расширение возможностей по распознаванию номеров различных типов. Подключение нейронных сетей других типов. Опробовать механизм частотных характеристик, для улучшения распознавания номера региона, исходя из местоположения комплекса.


Литература

  1.  С. Хайкин «Нейронные сети»
  2.  Л.Н. Ясницкий «Введение в искусственный интеллект»
  3.  www.statsoft.ru
  4.  www.itv.ru
  5.  www.prominform.com
  6.  В.Л. Арлазаров, В.В. Троянкер, Н.В. Котович «Адаптивное распознавание символов» www.ocrai.narod.ru
  7.  Н.В.Котович, О.А.Славин «Распознавание скелетных образов» www.ocrai.narod.ru


EMBED Excel.Chart.8 \s

EMBED Excel.Chart.8 \s


 

А также другие работы, которые могут Вас заинтересовать

23829. Дані та змінні 367.5 KB
  Спроектував додаток Обмін значеннями таким чином щоб після запуску програми на виконання поля на зазначеній формі розміщуються відповідно до своїх написів. Програмний код: Зовнішній вигляд програми до і після завершення виконання : 2. Спроектував додаток який реалізує: зміну положення командної кнопки на екранній формі після активізації командної кнопки; зміну кольору командної кнопки на екранній формі після активізації командної кнопки; зміну розміру командної кнопки на екранній формі після активізації...
23830. Форматування абзаців тексту 974 KB
  Атрибут ALIGN також можна використати з багатьма іншими дескрипторами HTML для вирівнювання зображень вмісту таблиць і інших елементів сторінки. Щоб полегшити їм перегляд можна розбити документ на логічні розділи кожний з яких буде присвячений одній темі. Найкраще використати заголовки вважаючи їх елементами структури документа У заголовках можна використати атрибут ALIGN як і в дескрипторі P .
23831. Форматування за допомогою таблиць 37 KB
  Вихідний код сторінки: html head title Країни Індокитаю title head body p align= center ; font size= 6 Країни Індокитаю font p div align= center table border= 1 width= 459 height= 216 tr td height= 40 width= 97 rowspan= 2 h3 align= center Країна h3 td td height= 24 width= 347 colspan= 2 h4 Характеристика країни h4 td tr tr td height= 24 width= 169 h5 align= center Населення h5 td td height= 24 width= 172 h5 align= center Площа h5 td tr tr td height= 36 width= 97 align= left valign= top font...
23832. Використання фреймів 34.5 KB
  Вихідний код сторінки: HTML HEAD TITLE FRAMES TITLE HEAD FRAMESET COLS=2575 FRAMESET ROWS=3070 FRAME SRC= zmist.html FRAME SRC= cast.html FRAMESET FRAMESET ROWS=5050 FRAME SRC= inflist.html FRAME SRC= empty.
23833. Використання каскадних листів стилів 29.5 KB
  Виконання завдань: Створити три гіпертекстових сторінки з наступними характеристиками: Для першої сторінки: визначити стиль для документу – фон блакитний; визначити стиль для заголовку шрифт Arial колір червоний вирівнювання за центром сторінки; визначити стиль для абзацу шрифт Sans Serif курсив. Для другої сторінки: визначити стиль для заголовку шрифт Times New Roman розмір 14 пунктів колір зелений; визначити стиль для абзацу шрифт Courier напівжирний. Для третьої сторінки розбитої на два розділи: застосувати стиль 1ої...
23834. Створення та налагодження форм 34.5 KB
  html fieldset style= padding: 2 legend Характеристики legend p Назва країни: span lang= uk nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp; span input type= text name= T1 size= 20 p p span lang= uk Місце розташування: span span lang= uk nbsp;nbsp;nbsp; span input type= text name= T1 size= 20 p p span lang= uk Столиця span : span lang= uk nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp;nbsp; span nbsp; input...
23835. Форматування символів 38 KB
  Вихідний код сторінки: html head title Країни АСЕАН title head body BGCOLOR=Black TEXT=White BASEFONT SIZE=3 H1 ALIGN=CENTER FONT COLOR= RED Малайзія FONT H1 H3 ALIGN=LEFT FONT FACE= Comic Sans MS COLOR = YELLOW Столиця FONT H3 P SAMP U Столиця КуалаЛумпур. U SAMP P H3 ALIGN=LEFT FONT FACE= Comic Sans MS COLOR = YELLOW Географічне розташування FONT H3 P EM Малайзія розташована в екваторіальному поясі. EM P H3 ALIGN=LEFT FONT FACE= Comic Sans MS COLOR = YELLOW Державний устрій FONT H3 P B Малайзія це федерація яка складається з 13 штатів...
23836. Створення посилань на мережеві ресурси 33.5 KB
  Вихідний код сторінки: html head title Дарфурський конфлікт title head body BGCOLOR=Azure TEXT=Black BASEFONT SIZE=3 A NAME= Top A H1 ALIGN=CENTER FONT COLOR= RED Конфлікт у Дарфурі FONT H1 H3 ALIGN=LEFT FONT FACE= Monotype Corsiva COLOR = Black A HREF= mailto:ork@email.ua Автор: Киричук Олег A FONT H3 H3 ALIGN=LEFT FONT FACE= Arial COLOR = Green OL TYPE=1 LI Опис регіону FONT H3 P EM Дарфур араб. EM P H3 ALIGN=LEFT FONT FACE= Arial COLOR = Green OL START=2 LI Опис конфлікту FONT H3 P Дарфурський конфлікт міжетнічний конфлікт що вилився...
23837. Використання графіки при створенні HTML 38.5 KB
  Вихідний код сторінки: html head title Індокитай title head body bgcolor= 99FF33 p align= center b i font size= 7 color= FF0000 Індокитай font i b p p align= left b i img border= 0 src= Flag_of_Vietnam.png width= 184 height= 125 align= left Соціалістична Республіка В'єтнам i b країна в південносхідній Азії на узбережжі ПівденноКитайського моря межує на півночі з Китаєм на півдні та заході з Камбоджею і Лаосом; омивається Південнокитайським морем затока Тонкін. 2006 p p align= center nbsp; p p align= center img border= 0 src=...