75604

СРЕДСТВА ИДЕНТИФИКАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ

Лекция

Информатика, кибернетика и программирование

Hассмотрен классический подход к решению задачи обнаружения сигнала приведенный ниже. либо сумму детерминированного сигнала Vt и шума. Будем считать что факт наличия сигнала Vt тоже случаен. Для решения вопроса о наличии сигнала в данный момент можно принять правило: сигнал присутствует если...

Русский

2015-01-15

1.07 MB

4 чел.

ОИ. Лекция 17

СРЕДСТВА ИДЕНТИФИКАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ 

Одной из задач цифровой обработки изображений является идентификация объектов по их изображениям, выделение признаков их сходства и отличия.

Один из известных способов идентификации объектов по их изображениям основан на корреляционном сравнении текущего изображения объекта (например, лица человека) с эталонными изображениями этого же человека, сделанными в различном масштабе и в различных ракурсах съемки.

Критерием сходства текущего изображения с одним из эталонных изображений является коэффициент взаимной корреляции (кросскорреляции). Полной идентичности будет соответствовать коэффициент взаимной корреляции, равный единице. Однако, поскольку полная идентичность очень маловероятна из-за различий в ракурсах съемки, освещенности, масштаба, то идентичность можно считать установленной, если коэффициент корреляции превысит некоторый пороговый уровень, например, 0.9. Максимально возможное значение нормированного коэффициента кросс-корреляции в случае полной идентичности сравниваемых фрагментов изображений равно единице.

При корреляционном анализе сравниваются два прямоугольных фрагмента изображений, причем первый  фрагмент должен быть по размеру меньше второго или равен ему. Меньший по размерам фрагмент сравнивается с равным ему по площади участком большего фрагмента и вычисляется коэффициент кросс-корреляции. Эта операция повторяется многократно при смещениях центра участка большего фрагмента по X и Y. В результате вычисляется двумерная функция кросс-корреляции. Функция будет иметь ярко выраженный максимум, если существует участок на фрагменте второго изображения, где фрагмент первого изображения близок к изображению на этом участке.

Программа crosscorr.m позволяет проанализировать изображения в файлах first.tif и second.tif 1 описанным выше способом. Анализируемые фрагменты изображений, представленных в этих файлах, помечаются интерактивно мышью в ходе работы этой программы. В процессе работы программы crosscorr.m на экране дисплея последовательно отображаются 7 изображений:

  •  Исходное первое (эталонное) изображение объекта, например, (рис. 2.14);

Рис.2.14

  •  Исходное второе изображение, например,  (Рис. 2.15);

                          

Рис. 2.15

  •  Выделенный (помеченный) фрагмент первого изображения (рис. 2.16);

                                                        

Рис. 2.16

  •  Выделенный (помеченный) фрагмент второго изображения (рис. 2.17);

                            

                     

Рис. 2.17

В результате работы программы будут получены:

  •  График двумерной функции кросс-корреляции (рис. 2.18);

               

Рис. 2.18

  •  Исходное второе изображение (рис. 2.19);

                

Рис. 2.19

  •  Результирующее изображение, полученное путем удаления участка второго изображения в том месте, в котором коэффициент кросс-корреляции имеет ярко выраженный максимум, и последующего замещения изображения на этом участке выделенным участком первого изображения (рис. 2.20).

                                   

Рис. 2.20

Примечание. В случае, если вычисленная функция кросскорреляции не имеет ярко выраженного максимума, т.е. если факт сходства (близости) фрагмента первого изображения ни с одним фрагментом второго изображения не установлен, п.п. 6 и 7 не выполняются. Наличие ярко выраженного максимума функции кросс-корреляции может быть установлено также и визуально по графику двумерной функции кросс-корреляции (максимум выделяется красным цветом). Факт сходства может быть также проверен визуально по признаку идентичности или близости результирующего изображения с выделенным фрагментом второго изображения. График функции кросскорреляции можно получить и в виде проекции на плоскость с тем, чтобы оценить численное значение максимума функции кросскорреляции (Рис. 2.21)

                     

Рис. 2.21

Описанный выше корреляционный способ сравнения изображений, может быть использован для анализа фотоизображений людей с целью поиска в базе данных наиболее похожих фотоизображений на целевое фотоизображение. Пример экранной формы программы автоматического поиска в базе данных наиболее похожих фотоизображений на целевое фотоизображение приведен на рис. 2.22.

Рис. 2.22

Экранная форма визуально разделена на три части:

  •  Левая часть содержит целевое фотоизображение, полученное из базы данных.
  •  Нижняя часть содержит до десяти фотоизображений, выбранных из база данных в результате кросскорреляции. Каждому изображению присвоен порядковый номер, который отображается над изображением. Нумерация фотоизображений произведена в порядке убывания коэффициента кросскорреляции, который приведен под фотоизображениями.
  •  Правая часть содержит выбранное пользователем фотоизображение из фотоизображений представленных в нижней части экранной формы.

Между левой и правой частями экранной формы расположен фрейм, содержащий кнопки управления окном, информацию о целевом изображении и окно выбора номера найденного в базе данных фотоизображения. С целью ускорения поиска изображений в базе данных имена файлов изображений в базе данных кодируются: в имени файла содержится в виде цифрового кода пол, возраст и цвет волос изображенного человека. В галерее изображений, представленных в нижней части экранной формы, содержатся 9 фотоизображений, наиболее близких целевому. Изображения расположены в порядке убывания  степени сходства с целевым.

Рекомендуемый порядок действий при работе в режиме автоматического поиска в базе данных наиболее похожих фотоизображений на целевое фотоизображение.

  1.  Загрузить целевое фотоизображение из базы данных.
  2.  Выбрать с помощью кнопки «Кадрировать» область корреляции.
  3.  Запустить поиск в базе данных.
  4.  Получив результат в виде уменьшенных фотоизображений в нижней части экранной формы, выбрать нужный номер найденного фотоизображения и нажать кнопку «Просмотр».
  5.  Если поиск не дал результатов или эти результаты неудовлетворительны можно:
    1.  провести повторное кадрирование целевого изображения, уменьшив или увеличив площадь выбираемой области. Затем повторить действия 3-4.
    2.  изменить параметры поиска фотоизображений в базе данных, выбрав нужные пункты в ниспадающих меню во фрейме, расположенном между левой и правой частью экранной формы. Затем повторить действия 2-4.

Окна с трех- и двухмерными графиками коэффициента корреляции представлены на рис. 2.23, 2.24. Красная область на рис. 2.23 – область максимального коэффициента кросскорреляции. Синяя область – область минимального коэффициента кросскорреляции. Ярко выраженный пик на двухмерной функции говорит о схожести изображений. Если такого пика нет, то можно уверенно заявлять, что на изображениях разные люди.  

     

Рис. 2.23

      

Рис. 2.24

Корреляционный способ сравнения изображений может быть применен также в системах контроля доступа к каким-либо ресурсам. В этом случае задача состоит в различении «своих» и «чужих».

При этом возможны ошибки идентификации: «чужой» может быть принят за «своего» или «свой» принят за «чужого». Эта проблема возникает в любых задачах автоматического распознавания сигналов при наличии шумов.

В ряде задач приёма сигналов в присутствии шумов необходимл  количественно оценить достоверность полученных данных. (например, координатах цели по данным радиолокатора). Вследствие случайного характера помех принципиально невозможно добиться их полного устранения. Использование рассмотренных выше «оптимальных» фильтров меняет характеристики случайного процесса, но процесс остаётся случайным. Путём совершенствования приёмных устройств можно снизить вероятность ошибки только до некоторого уровня . [13 ].


РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ПРИ НАЛИЧИИ ШУМОВ

В [6] рассмотрен классический подход к решению задачи обнаружения сигнала, приведенный ниже. Пусть на выходе приёмного устройства имеется некий сигнал — случайный процесс:

                                U(t) = V(t) + z (t)                                                        (1)

Этот процесс может представлять либо только шумы — z (t) . либо сумму детерминированного сигнала V(t) и шума. Будем считать, что факт наличия сигнала V(t) тоже случаен.

Для решения вопроса о наличии сигнала в данный момент можно принять правило: сигнал присутствует, если U (t) > E, т.е. превышает некоторый уровень  (порог) и  что сигнал отсутствует в противоположном случае, т.е. при  U(t) < E.

Ошибочный ответ может быть дан в двух несовместимых между собою случаях :

1) когда сигнал отсутствует, V(t) = 0, но напряжение шума превышает уровень Е (событие А = «ложная тревога»).

2) Когда сигнал присутствует, V(t) <>0, но сумма сигнала и шума не превышает уровня U(t) (событие Б = «пропуск сигнала»).

Вероятность ложной тревоги (событие А), т. е. того, что будут совмещены два события — отсутствие сигнала и превышение шумом уровня Е , равна априорной вероятности отсутствия сигнала, умноженной на апостериорную вероятность превышения шумом уровня Е. Априорной вероятностью q отсутствия сигнала зададимся, а апостериорную вероятность превышения шумом уровня Е легко получить по одномерной функции распределения шума W(x).

        , тогда                                      (2)  

Вероятность того, что будут совмещены два события — присутствие сигнала и непревышение суммарным напряжением уровня Е (вероятность события Б) равна априорной вероятности присутствия сигнала, умноженной на апостериорную вероятность непревышения уровня Е при условии, что сигнал присутствует. Априорная вероятность присутствия сигнала равна:

Апостериорную вероятность непревышения уровня Е можно получить, используя одномерную функцию распределения суммы сигнала и шума — .

       , тогда                             (3)

Так как события А и Б несовместимы, то вероятность ошибочного ответа Р(А или Б) равна:

Р(А или Б) = Р(А) + Р(Б) =

                       (4) 

Следовательно, искомая вероятность правильного ответа равна:

                                       (5)

Возникает вопрос: как выбрать пороговый уровень Е? Ясно, что если уровень выбрать высоким , то вероятность Р(А) — ложной тревоги будет мала, но вероятность пропуска имеющегося сигнала будет велика. Наоборот, при низком уровне Е мала будет вероятность пропуска сигнала, но будет значительной вероятность ложной тревоги Р (А).Эти качественные рассуждения можно облечь в количественные соотношения, зависящие от конкретной задачи.

Может быть поставлена задача нахождения оптимальной величины порога Е, для которого вероятность правильного ответа (5) при заданных функциях распределения сигнала и шума максимальна. Вычисляя производную выражения (5) по Е и приравнивая её нулю, получаем уравнение для определения оптимального уровня:

                что даёт                                      (6)  

Статистический критерий (6), обеспечивающий максимальную вероятность правильного ответа при одном или нескольких измерениях , называется критерием «идеального наблюдателя».

Как следует из уравнения (6), определяемый уровень зависит от вида функций распределения.

Рассмотрим решение этого уравнения на примере обнаружения положительной телеграфной посылки (положительного импульса с амплитудой V) на фоне шума, подчиняющемуся нормальному закону распределения, с дисперсией . Наличие или отсутствие сигнала скажется только на среднем значении суммарного сигнала (1).

Плотности распределения будут иметь вид:

,                        (7)

соответственно.

Смысл выбора порога (см. уравнение 6) иллюстрируется рис. 2.25, 2.26 .

                     Рис. 2.25                                                         Рис.2.26 

Оптимальный уровень определяется точкой пересечения графика (1) — распределения шума с графиком (2) - совместного распределения сигнала и шума.( с учётом масштабных коэффициентов q, p). Как показано на рис. 2.25 при сильном сигнале уровень Е должен выбираться высоким, а при слабом, как показано на  рис. 2.26, этот уровень приближается к среднеквадратичному напряжению шума.

В случае, когда априорная вероятность появления сигнала неизвестна, часто полагают р=1/2, считая, что априорно равновероятно, как наличие, так и отсутствие сигнала. (заметим, что при этом q=1/2 тоже). Тогда для распределений (7) величина порога оказывается равной Е= V/2. ( См. рис. 2.25).

Если уровень Е выбран, то для рассматриваемого примера, где плотность распределения вероятностей шума и сигнала с шумом определены выражениями (7), для вероятностей ложной тревоги и пропуска сигнала, используя (2) и (3), получаются выражения:

                                           (8)

Здесь

- функция Крампа [6].

На практике обычно интересуются не вероятностью пропуска сигнала, а вероятностью правильного обнаружения D (при условии, что превышен уровень Е):

( при p=1/2)                                                    (9)

Приведём другой пример. Подлежащий определению сигнал является огибающей суммарного высокочастотного колебания, которое вызвано как воздействием шума, так и полезного высокочастотного сигнала (радиоимпульса).

При воздействии одного шума плотность распределения огибающей r высокочастотного колебания описывается функцией Релея:

   при    ,    и          при r=0  

- дисперсия шума.

При совместном воздействии шума и высокочастотного сигнала огибающая имеет плотность распределения, подчиняющуюся закону Релея — Райса:

 при r>0                                         (11)

и  , при r модифицированная функция Бесселя.

                       Рис.2.27 

Графики функций (10) и (11) приведены на рис. 2.27.

Если в этом примере принять p=q, то оптимальный уровень определится точкой пересечения кривой распределения шума с кривой совместного распределения сигнала и шума. Из рисунка видно: при сильном сигнале уровень Е должен выбираться высоким, а при слабом сигнале этот уровень приближается к среднеквадратичному напряжению шума. При p<>q масштабы графиков функций (10) и (11) соответственно изменятся, но оптимальный уровень будет по-прежнему определяться уравнением (6),   т. е. точкой пересечения соответствующих графиков.

Рассмотренный критерий идеального наблюдателя, когда как ложное обнаружение, так и пропуск сигнала нежелательны в одинаковой степени, наиболее характерен для систем радиосвязи.

В радиолокационных системах обнаружения используется другой критерий, называемый критерием Неймана-Пирсона. Использование другого критерия объясняется тем, что ложное обнаружение цели может иметь весьма нежелательные последствия. Поэтому вероятность ложной тревоги должна быть весьма малой, обычно задаются её значением порядка  - . Часто её значение не может быть увеличено даже учитывая то , что при этом снижается вероятность обнаружения сигнала. Итак, при использовании критерия Неймана-Пирсона вероятность ложной тревоги фиксируется изначально. Так как вероятность ложной тревоги функционально связана с относительным порогом, то последний также оказывается заданным

Практически стараются удовлетворить одновременно двум противоречивым требованиям :  чтобы, с одной стороны, вероятность Р(Б) пропуска сигнала не превосходила некоторой заданной величины, и, с другой стороны, вероятность ложного обнаружения, не была слишком большой.  На рис. 2.28 приведены две функции распределения.

Левая  функция  представляет   , а правая  - .

Рис.2.28

Вертикальная линия, восстановленная из точки соответствующего значения относительного порога (E/s), совместно с графиками ограничивает площади, соответствующие вероятностям Р(А) и Р(Б).Они отмечены разной штриховкой.. Приведенные графики позволяют качественно проанализировать различные ситуации. Так при увеличении отношения сигнал /шум (а/s) график функции будет смещаться вправо. Поэтому для сохранения допустимой величины Р(Б) -вероятности пропуска сигнала, окажется возможным увеличить относительный порог E/s. При этом площадь Р(А) — вероятность ложной тревоги уменьшится! Верно и обратное.

Поэтому единственной возможностью увеличения вероятности правильного обнаружения цели остаётся повышение отношения сигнал /шум на входе порогового устройства , т. е. на выходе линейного тракта приёмного устройства. Эти вопросы были рассмотрены в предыдущих разделах. Методики расчета конкретных радиотехнических устройств и количественных оценок вероятностных характеристик приема реальных флуктуирующих сигналов в присутствии шума достаточно сложны и изложены в специальной литературе.

Рассмотрим данный подход применительно к задаче распознавания людей по изображению лица при использовании для распознавания кросскорреляции.

Пусть имеется М*N фотоизображений N людей, полученных в идеальных условиях при павильонной съемке. Каждому человеку поставлено в соответствие М фотоизображений, отличающихся масштабом, ракурсом, яркостью, контрастностью. Эти фотоизображения представляют базу данных. Требуется идентифицировать человека по фотографии, полученной в других условиях, например, при съемке с помощью WEB-камеры, при которых могут быть случайные отклонения масштаба, ракурса, яркости и контрастности. Полученное таким образом фотоизображение сравнивается последовательно со всеми изображениями этого человека и других людей,  результатами сравнения являются максимальные коэффициенты корреляции. Результат идентификации принимается положительным, если коэффициент корреляции будет больше порогового значения. Для определения оптимального порогового значения необходимо знать функции распределения коэффициентов корреляции при сравнении «свой» - «свой» и «свой» - «чужой». Эти функции распределения могут быть получены путем анализа интервальных гистограмм по экспериментальным данным.

На основе гистограмм  произвести с использованием средств подгонки кривых Curve Fiitting, описанных выше подбор аппроксимирующей аналитической зависимости, которая определит законы распределения. Ниже на рис. 3  приведены примеры полученных таким образом гистограмм и аппроксимирующих зависимостей, пример проверки гипотез о законах распределения по критерию Хи-квадрат.

                      А                                                           Б

                                В                                                              Г  

Рис. 3. Пример гистограммы и функции распределения f1(x), полученной по программе 1 (А, В) при объеме выборки 100, гистограммы и функции распределения f2(x), полученной по программе 3 при объеме выборки 10000 (Б, Г).

Найденная с помощью программы подгонки кривых аналитическая зависимость для рис. 3В имеет вид:

      f1(x) =  a1*exp(-((x-b1)/c1)^2) + a2*exp(-((x-b2)/c2)^2), где

       a1 =       43.22  (40.21, 46.22)

       b1 =      0.9855  (0.9849, 0.986)

       c1 =     0.01191  (0.01059, 0.01324)

       a2 =   3.35e+014  (-7.02e+019, 7.02e+019)

       b2 =       45.52  (-2.87e+005, 2.871e+005)

       c2 =       7.821  (-2.514e+004, 2.515e+004)

а для рис. 3Г:

f2(x) =  a2*exp(-((x-b2)/c2)^2) + a3*exp(-((x-b3)/c3)^2), где

   a2 =       3.778  (2.256, 5.3)

   b2 =      0.6809  (0.6494, 0.7124)

   c2 =     0.09731  (0.08075, 0.1139)

   a3 =       1.948  (0.557, 3.34)

   b3 =      0.5589  (0.4949, 0.623)

   c3 =     0.09961  (0.0621, 0.1371)

Проверка гипотез о законах распределения по критерию Хи-квадрат.

Воспользуемся формулой для расчета хи-квадрат (критерий согласия Пирсона):

с степенями свободы. В последней формуле r – число параметров распределения, определяемые по выборке.

l=21

1: r=6; 2:. r=9; уровень значимости α=0,05.

- табличная частота;  - теоретич. частота, где - вероятность функции распределения и вычисляется по формуле:

Рассчитав значения и выбрав уровень значимости , по таблице -распределения определяют . Если , то гипотезу Н0  отвергают, если  то гипотезу принимают.

Таким образом были найдены значения Хи-квадрат:

1. =23,5;
2. =
19,9;

Определение порога принятия решения по принципу максимума правдоподобия

Порог принятия решения xp может быть найден исходя из принципа максимума правдоподобия из условия f1(xp)=f2(xp). При этом ошибки первого и второго рода могут быть вычислены по формулам:

Функция максимального правдоподобия для непрерывной случайной величины примет вид

где f - функция плотности вероятности непрерывной случайной величины X.

1cbvf Файлы  должны быть размещены в каталоге C:\MATLAB6p5\toolbox\images\imdemos


 

А также другие работы, которые могут Вас заинтересовать

10366. Классный руководитель в современной школе. Основные направления его деятельности с коллективом учащихся. Психология малых групп 45 KB
  Классный руководитель в современной школе. Основные направления его деятельности с коллективом учащихся. Психология малых групп. Планирование и организация работы классного руководителя. Особенности организации взаимодействия учителя с семьей школьника. Формы виды ра...
10367. Инновационные процессы в образовании. Типы инновационных учебных заведений и особен-ности организации в них учебно-воспитательного процесса 43 KB
  Инновационные процессы в образовании. Типы инновационных учебных заведений и особенности организации в них учебновоспитательного процесса. Негосударственные учебные заведения. Процедура создания и регламентация деятельности образовательных учреждений. Лицензионная...
10368. Регионализация образования. Состояние и развитие Тульской областной системы образования. Региональная программа развития образования 38 KB
  Регионализация образования. Состояние и развитие Тульской областной системы образования. Региональная программа развития образования. Основные направления экспериментальной инновационной работы в учреждениях образования Тульской области. Регионализация системы ...
10369. Шпаргалка по педагогике (для педагогов) 1.87 MB
  Шпаргалка по педагогике для педагогов 1. Понятие педагогики и этапы ее развития Слово педагогика греческого происхождения. В дословном переводе означает детовождение. В современном понимании педагогика представляет собой совокупность знаний и умений по...
10370. АВГУСТИН Блаженный (Augustinus Sanctus) Аврелий 45.72 KB
  АВГУСТИН Блаженный Augustinus Sanctus Аврелий 13.11.354 Тагаст Сев. Африка Нумидия 28.8.430 Гишюн Сев. Африка христ. теолог представитель зап. патристики. Прошёл через увлечение манихейством и скептицизмом в 387 принял крещение. С 395 епископ Гиппона. Онтология А. и его уч...
10371. АДЛЕР (Adler) Альфред 33.73 KB
  АДЛЕР Adler Альфред 7.2.1870 Вела 28.5.1937 Абердин Шотландия австр. врач и психолог создатель индивидуальной психологии. Примыкал сначала к сторонникам 3. Фрейда затем основал собств. школу получившую наибольшее влияние в 20х гг. с созданием Междунар. ассоциации инд
10372. ФОМА АКВЙНСКИЙ, (Thomas Aquinas) 47.64 KB
  ФОМА АКВЙНСКИЙ Thomas Aquinas 1225 или 122i замок Роккасекка близ Акуино Юж. Италия 7. 3. 1274 монастырь Фоссануова Юж. Италия ср.век философ и теолог систематизатор ортодоксальной схоластики основатель томизма; монахдоминиканец с 1244. В 1567 признан пятым учителем ...
10373. Предмет и задачи политологии. Методы изучения политических явлений 55.5 KB
  Предмет и задачи политологии. Методы изучения политических явлений. Политология это наука о политической власти и управлении о закономерностях развития политических отношений и процессов функционирования политических систем и институтов политического поведения и...
10374. Основные понятия категории науки о политике 61.5 KB
  Всякий раз, когда мы ставим перед собой задачу вычленить какую-либо научную дисциплину из всей совокупности научных дисциплин, мы сталкиваемся с вопросом о ее понятийно-категоричном аппарате. Политика зачастую представляет собой не только четко очерченную, раз и навсегда...