75604

СРЕДСТВА ИДЕНТИФИКАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ

Лекция

Информатика, кибернетика и программирование

Hассмотрен классический подход к решению задачи обнаружения сигнала приведенный ниже. либо сумму детерминированного сигнала Vt и шума. Будем считать что факт наличия сигнала Vt тоже случаен. Для решения вопроса о наличии сигнала в данный момент можно принять правило: сигнал присутствует если...

Русский

2015-01-15

1.07 MB

5 чел.

ОИ. Лекция 17

СРЕДСТВА ИДЕНТИФИКАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ 

Одной из задач цифровой обработки изображений является идентификация объектов по их изображениям, выделение признаков их сходства и отличия.

Один из известных способов идентификации объектов по их изображениям основан на корреляционном сравнении текущего изображения объекта (например, лица человека) с эталонными изображениями этого же человека, сделанными в различном масштабе и в различных ракурсах съемки.

Критерием сходства текущего изображения с одним из эталонных изображений является коэффициент взаимной корреляции (кросскорреляции). Полной идентичности будет соответствовать коэффициент взаимной корреляции, равный единице. Однако, поскольку полная идентичность очень маловероятна из-за различий в ракурсах съемки, освещенности, масштаба, то идентичность можно считать установленной, если коэффициент корреляции превысит некоторый пороговый уровень, например, 0.9. Максимально возможное значение нормированного коэффициента кросс-корреляции в случае полной идентичности сравниваемых фрагментов изображений равно единице.

При корреляционном анализе сравниваются два прямоугольных фрагмента изображений, причем первый  фрагмент должен быть по размеру меньше второго или равен ему. Меньший по размерам фрагмент сравнивается с равным ему по площади участком большего фрагмента и вычисляется коэффициент кросс-корреляции. Эта операция повторяется многократно при смещениях центра участка большего фрагмента по X и Y. В результате вычисляется двумерная функция кросс-корреляции. Функция будет иметь ярко выраженный максимум, если существует участок на фрагменте второго изображения, где фрагмент первого изображения близок к изображению на этом участке.

Программа crosscorr.m позволяет проанализировать изображения в файлах first.tif и second.tif 1 описанным выше способом. Анализируемые фрагменты изображений, представленных в этих файлах, помечаются интерактивно мышью в ходе работы этой программы. В процессе работы программы crosscorr.m на экране дисплея последовательно отображаются 7 изображений:

  •  Исходное первое (эталонное) изображение объекта, например, (рис. 2.14);

Рис.2.14

  •  Исходное второе изображение, например,  (Рис. 2.15);

                          

Рис. 2.15

  •  Выделенный (помеченный) фрагмент первого изображения (рис. 2.16);

                                                        

Рис. 2.16

  •  Выделенный (помеченный) фрагмент второго изображения (рис. 2.17);

                            

                     

Рис. 2.17

В результате работы программы будут получены:

  •  График двумерной функции кросс-корреляции (рис. 2.18);

               

Рис. 2.18

  •  Исходное второе изображение (рис. 2.19);

                

Рис. 2.19

  •  Результирующее изображение, полученное путем удаления участка второго изображения в том месте, в котором коэффициент кросс-корреляции имеет ярко выраженный максимум, и последующего замещения изображения на этом участке выделенным участком первого изображения (рис. 2.20).

                                   

Рис. 2.20

Примечание. В случае, если вычисленная функция кросскорреляции не имеет ярко выраженного максимума, т.е. если факт сходства (близости) фрагмента первого изображения ни с одним фрагментом второго изображения не установлен, п.п. 6 и 7 не выполняются. Наличие ярко выраженного максимума функции кросс-корреляции может быть установлено также и визуально по графику двумерной функции кросс-корреляции (максимум выделяется красным цветом). Факт сходства может быть также проверен визуально по признаку идентичности или близости результирующего изображения с выделенным фрагментом второго изображения. График функции кросскорреляции можно получить и в виде проекции на плоскость с тем, чтобы оценить численное значение максимума функции кросскорреляции (Рис. 2.21)

                     

Рис. 2.21

Описанный выше корреляционный способ сравнения изображений, может быть использован для анализа фотоизображений людей с целью поиска в базе данных наиболее похожих фотоизображений на целевое фотоизображение. Пример экранной формы программы автоматического поиска в базе данных наиболее похожих фотоизображений на целевое фотоизображение приведен на рис. 2.22.

Рис. 2.22

Экранная форма визуально разделена на три части:

  •  Левая часть содержит целевое фотоизображение, полученное из базы данных.
  •  Нижняя часть содержит до десяти фотоизображений, выбранных из база данных в результате кросскорреляции. Каждому изображению присвоен порядковый номер, который отображается над изображением. Нумерация фотоизображений произведена в порядке убывания коэффициента кросскорреляции, который приведен под фотоизображениями.
  •  Правая часть содержит выбранное пользователем фотоизображение из фотоизображений представленных в нижней части экранной формы.

Между левой и правой частями экранной формы расположен фрейм, содержащий кнопки управления окном, информацию о целевом изображении и окно выбора номера найденного в базе данных фотоизображения. С целью ускорения поиска изображений в базе данных имена файлов изображений в базе данных кодируются: в имени файла содержится в виде цифрового кода пол, возраст и цвет волос изображенного человека. В галерее изображений, представленных в нижней части экранной формы, содержатся 9 фотоизображений, наиболее близких целевому. Изображения расположены в порядке убывания  степени сходства с целевым.

Рекомендуемый порядок действий при работе в режиме автоматического поиска в базе данных наиболее похожих фотоизображений на целевое фотоизображение.

  1.  Загрузить целевое фотоизображение из базы данных.
  2.  Выбрать с помощью кнопки «Кадрировать» область корреляции.
  3.  Запустить поиск в базе данных.
  4.  Получив результат в виде уменьшенных фотоизображений в нижней части экранной формы, выбрать нужный номер найденного фотоизображения и нажать кнопку «Просмотр».
  5.  Если поиск не дал результатов или эти результаты неудовлетворительны можно:
    1.  провести повторное кадрирование целевого изображения, уменьшив или увеличив площадь выбираемой области. Затем повторить действия 3-4.
    2.  изменить параметры поиска фотоизображений в базе данных, выбрав нужные пункты в ниспадающих меню во фрейме, расположенном между левой и правой частью экранной формы. Затем повторить действия 2-4.

Окна с трех- и двухмерными графиками коэффициента корреляции представлены на рис. 2.23, 2.24. Красная область на рис. 2.23 – область максимального коэффициента кросскорреляции. Синяя область – область минимального коэффициента кросскорреляции. Ярко выраженный пик на двухмерной функции говорит о схожести изображений. Если такого пика нет, то можно уверенно заявлять, что на изображениях разные люди.  

     

Рис. 2.23

      

Рис. 2.24

Корреляционный способ сравнения изображений может быть применен также в системах контроля доступа к каким-либо ресурсам. В этом случае задача состоит в различении «своих» и «чужих».

При этом возможны ошибки идентификации: «чужой» может быть принят за «своего» или «свой» принят за «чужого». Эта проблема возникает в любых задачах автоматического распознавания сигналов при наличии шумов.

В ряде задач приёма сигналов в присутствии шумов необходимл  количественно оценить достоверность полученных данных. (например, координатах цели по данным радиолокатора). Вследствие случайного характера помех принципиально невозможно добиться их полного устранения. Использование рассмотренных выше «оптимальных» фильтров меняет характеристики случайного процесса, но процесс остаётся случайным. Путём совершенствования приёмных устройств можно снизить вероятность ошибки только до некоторого уровня . [13 ].


РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ПРИ НАЛИЧИИ ШУМОВ

В [6] рассмотрен классический подход к решению задачи обнаружения сигнала, приведенный ниже. Пусть на выходе приёмного устройства имеется некий сигнал — случайный процесс:

                                U(t) = V(t) + z (t)                                                        (1)

Этот процесс может представлять либо только шумы — z (t) . либо сумму детерминированного сигнала V(t) и шума. Будем считать, что факт наличия сигнала V(t) тоже случаен.

Для решения вопроса о наличии сигнала в данный момент можно принять правило: сигнал присутствует, если U (t) > E, т.е. превышает некоторый уровень  (порог) и  что сигнал отсутствует в противоположном случае, т.е. при  U(t) < E.

Ошибочный ответ может быть дан в двух несовместимых между собою случаях :

1) когда сигнал отсутствует, V(t) = 0, но напряжение шума превышает уровень Е (событие А = «ложная тревога»).

2) Когда сигнал присутствует, V(t) <>0, но сумма сигнала и шума не превышает уровня U(t) (событие Б = «пропуск сигнала»).

Вероятность ложной тревоги (событие А), т. е. того, что будут совмещены два события — отсутствие сигнала и превышение шумом уровня Е , равна априорной вероятности отсутствия сигнала, умноженной на апостериорную вероятность превышения шумом уровня Е. Априорной вероятностью q отсутствия сигнала зададимся, а апостериорную вероятность превышения шумом уровня Е легко получить по одномерной функции распределения шума W(x).

        , тогда                                      (2)  

Вероятность того, что будут совмещены два события — присутствие сигнала и непревышение суммарным напряжением уровня Е (вероятность события Б) равна априорной вероятности присутствия сигнала, умноженной на апостериорную вероятность непревышения уровня Е при условии, что сигнал присутствует. Априорная вероятность присутствия сигнала равна:

Апостериорную вероятность непревышения уровня Е можно получить, используя одномерную функцию распределения суммы сигнала и шума — .

       , тогда                             (3)

Так как события А и Б несовместимы, то вероятность ошибочного ответа Р(А или Б) равна:

Р(А или Б) = Р(А) + Р(Б) =

                       (4) 

Следовательно, искомая вероятность правильного ответа равна:

                                       (5)

Возникает вопрос: как выбрать пороговый уровень Е? Ясно, что если уровень выбрать высоким , то вероятность Р(А) — ложной тревоги будет мала, но вероятность пропуска имеющегося сигнала будет велика. Наоборот, при низком уровне Е мала будет вероятность пропуска сигнала, но будет значительной вероятность ложной тревоги Р (А).Эти качественные рассуждения можно облечь в количественные соотношения, зависящие от конкретной задачи.

Может быть поставлена задача нахождения оптимальной величины порога Е, для которого вероятность правильного ответа (5) при заданных функциях распределения сигнала и шума максимальна. Вычисляя производную выражения (5) по Е и приравнивая её нулю, получаем уравнение для определения оптимального уровня:

                что даёт                                      (6)  

Статистический критерий (6), обеспечивающий максимальную вероятность правильного ответа при одном или нескольких измерениях , называется критерием «идеального наблюдателя».

Как следует из уравнения (6), определяемый уровень зависит от вида функций распределения.

Рассмотрим решение этого уравнения на примере обнаружения положительной телеграфной посылки (положительного импульса с амплитудой V) на фоне шума, подчиняющемуся нормальному закону распределения, с дисперсией . Наличие или отсутствие сигнала скажется только на среднем значении суммарного сигнала (1).

Плотности распределения будут иметь вид:

,                        (7)

соответственно.

Смысл выбора порога (см. уравнение 6) иллюстрируется рис. 2.25, 2.26 .

                     Рис. 2.25                                                         Рис.2.26 

Оптимальный уровень определяется точкой пересечения графика (1) — распределения шума с графиком (2) - совместного распределения сигнала и шума.( с учётом масштабных коэффициентов q, p). Как показано на рис. 2.25 при сильном сигнале уровень Е должен выбираться высоким, а при слабом, как показано на  рис. 2.26, этот уровень приближается к среднеквадратичному напряжению шума.

В случае, когда априорная вероятность появления сигнала неизвестна, часто полагают р=1/2, считая, что априорно равновероятно, как наличие, так и отсутствие сигнала. (заметим, что при этом q=1/2 тоже). Тогда для распределений (7) величина порога оказывается равной Е= V/2. ( См. рис. 2.25).

Если уровень Е выбран, то для рассматриваемого примера, где плотность распределения вероятностей шума и сигнала с шумом определены выражениями (7), для вероятностей ложной тревоги и пропуска сигнала, используя (2) и (3), получаются выражения:

                                           (8)

Здесь

- функция Крампа [6].

На практике обычно интересуются не вероятностью пропуска сигнала, а вероятностью правильного обнаружения D (при условии, что превышен уровень Е):

( при p=1/2)                                                    (9)

Приведём другой пример. Подлежащий определению сигнал является огибающей суммарного высокочастотного колебания, которое вызвано как воздействием шума, так и полезного высокочастотного сигнала (радиоимпульса).

При воздействии одного шума плотность распределения огибающей r высокочастотного колебания описывается функцией Релея:

   при    ,    и          при r=0  

- дисперсия шума.

При совместном воздействии шума и высокочастотного сигнала огибающая имеет плотность распределения, подчиняющуюся закону Релея — Райса:

 при r>0                                         (11)

и  , при r модифицированная функция Бесселя.

                       Рис.2.27 

Графики функций (10) и (11) приведены на рис. 2.27.

Если в этом примере принять p=q, то оптимальный уровень определится точкой пересечения кривой распределения шума с кривой совместного распределения сигнала и шума. Из рисунка видно: при сильном сигнале уровень Е должен выбираться высоким, а при слабом сигнале этот уровень приближается к среднеквадратичному напряжению шума. При p<>q масштабы графиков функций (10) и (11) соответственно изменятся, но оптимальный уровень будет по-прежнему определяться уравнением (6),   т. е. точкой пересечения соответствующих графиков.

Рассмотренный критерий идеального наблюдателя, когда как ложное обнаружение, так и пропуск сигнала нежелательны в одинаковой степени, наиболее характерен для систем радиосвязи.

В радиолокационных системах обнаружения используется другой критерий, называемый критерием Неймана-Пирсона. Использование другого критерия объясняется тем, что ложное обнаружение цели может иметь весьма нежелательные последствия. Поэтому вероятность ложной тревоги должна быть весьма малой, обычно задаются её значением порядка  - . Часто её значение не может быть увеличено даже учитывая то , что при этом снижается вероятность обнаружения сигнала. Итак, при использовании критерия Неймана-Пирсона вероятность ложной тревоги фиксируется изначально. Так как вероятность ложной тревоги функционально связана с относительным порогом, то последний также оказывается заданным

Практически стараются удовлетворить одновременно двум противоречивым требованиям :  чтобы, с одной стороны, вероятность Р(Б) пропуска сигнала не превосходила некоторой заданной величины, и, с другой стороны, вероятность ложного обнаружения, не была слишком большой.  На рис. 2.28 приведены две функции распределения.

Левая  функция  представляет   , а правая  - .

Рис.2.28

Вертикальная линия, восстановленная из точки соответствующего значения относительного порога (E/s), совместно с графиками ограничивает площади, соответствующие вероятностям Р(А) и Р(Б).Они отмечены разной штриховкой.. Приведенные графики позволяют качественно проанализировать различные ситуации. Так при увеличении отношения сигнал /шум (а/s) график функции будет смещаться вправо. Поэтому для сохранения допустимой величины Р(Б) -вероятности пропуска сигнала, окажется возможным увеличить относительный порог E/s. При этом площадь Р(А) — вероятность ложной тревоги уменьшится! Верно и обратное.

Поэтому единственной возможностью увеличения вероятности правильного обнаружения цели остаётся повышение отношения сигнал /шум на входе порогового устройства , т. е. на выходе линейного тракта приёмного устройства. Эти вопросы были рассмотрены в предыдущих разделах. Методики расчета конкретных радиотехнических устройств и количественных оценок вероятностных характеристик приема реальных флуктуирующих сигналов в присутствии шума достаточно сложны и изложены в специальной литературе.

Рассмотрим данный подход применительно к задаче распознавания людей по изображению лица при использовании для распознавания кросскорреляции.

Пусть имеется М*N фотоизображений N людей, полученных в идеальных условиях при павильонной съемке. Каждому человеку поставлено в соответствие М фотоизображений, отличающихся масштабом, ракурсом, яркостью, контрастностью. Эти фотоизображения представляют базу данных. Требуется идентифицировать человека по фотографии, полученной в других условиях, например, при съемке с помощью WEB-камеры, при которых могут быть случайные отклонения масштаба, ракурса, яркости и контрастности. Полученное таким образом фотоизображение сравнивается последовательно со всеми изображениями этого человека и других людей,  результатами сравнения являются максимальные коэффициенты корреляции. Результат идентификации принимается положительным, если коэффициент корреляции будет больше порогового значения. Для определения оптимального порогового значения необходимо знать функции распределения коэффициентов корреляции при сравнении «свой» - «свой» и «свой» - «чужой». Эти функции распределения могут быть получены путем анализа интервальных гистограмм по экспериментальным данным.

На основе гистограмм  произвести с использованием средств подгонки кривых Curve Fiitting, описанных выше подбор аппроксимирующей аналитической зависимости, которая определит законы распределения. Ниже на рис. 3  приведены примеры полученных таким образом гистограмм и аппроксимирующих зависимостей, пример проверки гипотез о законах распределения по критерию Хи-квадрат.

                      А                                                           Б

                                В                                                              Г  

Рис. 3. Пример гистограммы и функции распределения f1(x), полученной по программе 1 (А, В) при объеме выборки 100, гистограммы и функции распределения f2(x), полученной по программе 3 при объеме выборки 10000 (Б, Г).

Найденная с помощью программы подгонки кривых аналитическая зависимость для рис. 3В имеет вид:

      f1(x) =  a1*exp(-((x-b1)/c1)^2) + a2*exp(-((x-b2)/c2)^2), где

       a1 =       43.22  (40.21, 46.22)

       b1 =      0.9855  (0.9849, 0.986)

       c1 =     0.01191  (0.01059, 0.01324)

       a2 =   3.35e+014  (-7.02e+019, 7.02e+019)

       b2 =       45.52  (-2.87e+005, 2.871e+005)

       c2 =       7.821  (-2.514e+004, 2.515e+004)

а для рис. 3Г:

f2(x) =  a2*exp(-((x-b2)/c2)^2) + a3*exp(-((x-b3)/c3)^2), где

   a2 =       3.778  (2.256, 5.3)

   b2 =      0.6809  (0.6494, 0.7124)

   c2 =     0.09731  (0.08075, 0.1139)

   a3 =       1.948  (0.557, 3.34)

   b3 =      0.5589  (0.4949, 0.623)

   c3 =     0.09961  (0.0621, 0.1371)

Проверка гипотез о законах распределения по критерию Хи-квадрат.

Воспользуемся формулой для расчета хи-квадрат (критерий согласия Пирсона):

с степенями свободы. В последней формуле r – число параметров распределения, определяемые по выборке.

l=21

1: r=6; 2:. r=9; уровень значимости α=0,05.

- табличная частота;  - теоретич. частота, где - вероятность функции распределения и вычисляется по формуле:

Рассчитав значения и выбрав уровень значимости , по таблице -распределения определяют . Если , то гипотезу Н0  отвергают, если  то гипотезу принимают.

Таким образом были найдены значения Хи-квадрат:

1. =23,5;
2. =
19,9;

Определение порога принятия решения по принципу максимума правдоподобия

Порог принятия решения xp может быть найден исходя из принципа максимума правдоподобия из условия f1(xp)=f2(xp). При этом ошибки первого и второго рода могут быть вычислены по формулам:

Функция максимального правдоподобия для непрерывной случайной величины примет вид

где f - функция плотности вероятности непрерывной случайной величины X.

1cbvf Файлы  должны быть размещены в каталоге C:\MATLAB6p5\toolbox\images\imdemos


 

А также другие работы, которые могут Вас заинтересовать

17689. Самофокусування світла 33.92 KB
  Самофокусування світла Самофокусування світла це ефект самовпливу що виникає при розповсюдженні в нелінійному середовищі інтенсивного світлового пучка що має обмежений поперечний переріз. Розглянемо феноменологічне матеріальне рівняння де поляризованість...
17690. Скін-ефект. Аномальний скін-ефект 18.65 KB
  Скінефект. Аномальний скінефект Проникнення єлектронномагнітної хвилі в тонкий поверхневий шар металу є частковим випадком скінефекту. Сам шар у який проникає електромагнітне поле називається скіншаром. Напруженість поля в скіншар зменшується експоненційно таки
17691. Теорія випромінювання Ейнштейна 19.17 KB
  Теорія випромінювання Ейнштейна Це по суті новий теоретичний вивід формули Планка. Нехай значення енергії які може набувати атом чи будьяка атомна система. Розглянемо багато однакових атомів у світловому полі яке є ізотропним і неполяризованим. Нехай і кіль...
17692. Товсті та тонкі голограми 96.74 KB
  Товсті та тонкі голограми. Голографія набір технологій для точного запису відтворення і переформатування хвильових полів. Це спосіб одержання обємних зображень предметів на фотопластинці голограми за допомогою когерентного випромінювання лазера. Голограма фік
17693. Умови інтерференції двох хвиль 17.49 KB
  Умови інтерференції двох хвиль. Інтерференція зміна середньої інтенсивності що обумовлена принципом суперпозиції. Для інтерференції хвиль необхідною умовою є їх когерентність: однакові частоти однаково поляризованілінійно стала в часі різниця фаз. ...
17694. Фазовий синхронізм у параметричних явищах 36.72 KB
  Фазовий синхронізм у параметричних явищах. Нелінійний доданок до поляризації середовища в нульовому наближені:перший доданок не залежить від часу так зване оптичне детектування. Другий доданок гармонічно змінюється з часом. З ним повязана генерація в нелінійному сер...
17695. Фізіологічні властивості ока 20.29 KB
  Фізичні та фізіологічні властивості зору. Гострота зору. Навпроти зіниці в сітківці знаходиться так звана жовта пляма в середині якої центральна ямка. Щільність зорових клітин паличок і колбочок в цьому місці найбільшатому тут найвища гострота зору. Акомодація
17696. Формула Планка 22.79 KB
  Формула Планка. Виводячи формулу для спектральної густини енергії рівноважного випромінювання Планк висунув гіпотезу про те що випромінення й поглинання світла речовиною відбувається не неперевно а кінцевими порціями які називаються квантами світла або енергії. ...
17697. Формули енергетичної світності Стефана-Больцмана і зміщення Віна 73.39 KB
  Формули енергетичної світності СтефанаБольцмана і зміщення Віна. Закон СтефанаБольцмана: Повна потужність теплового випромінювання зростає пропорційно четвертому ступеню абсолютної температури тіла. Енергетичною світністю R називається відношення потоку випр