ГОЛОГРАФИ́ЧЕСКОЕ РАСПОЗНАВА́НИЕ О́БРАЗОВ
-
Рубрика: Физика
-
Скопировать библиографическую ссылку:
ГОЛОГРАФИ́ЧЕСКОЕ РАСПОЗНАВА́НИЕ О́БРАЗОВ, распознавание изображения объекта методами голографии и когерентной оптики, состоящее в сравнении изображения распознаваемого объекта с его эталонным изображением, известным заранее. Мерой близости изображения объекта и эталона является их функция взаимной корреляции (ФВК). Задача Г. р. о. заключается в установлении наличия распознаваемого объекта в анализируемом изображении и определении его координат в поле зрения системы распознавания. Для этого вычисляется ФВК распознаваемого образа и его эталона и сравнивается максимум этой функции с пороговым значением, определяемым вероятностью правильного распознавания. Если сигнал корреляции превышает порог, объект обнаружен, если сигнал корреляции ниже порога, объекта в анализируемом изображении нет. Одновременно определяются координаты объекта по положению максимума корреляционной функции.
Г. р. о. осуществляется в голографич. корреляторе Ван дер Люгта и корреляторе совместного преобразования. Оба коррелятора используют оптич. систему пространственной фильтрации изображений, в частотной плоскости которой установлен голографич. согласованный фильтр (ГСФ) в виде фурье-голограммы распознаваемого образа либо обобщённой фурье-голограммы. Действие коррелятора основано на свойстве линзы осуществлять двумерное фурье-преобразование изображения при когерентном освещении (см. Фурье-оптика). ФВК синтезируется в частотной плоскости коррелятора путём сравнения пространственно-частотных спектров распознаваемого образа и эталонного, записанного в виде голограммы.
Процесс распознавания состоит из двух этапов: на первом изготавливается голографич. согласованный фильтр на распознаваемый образ (эталон), а на втором осуществляется собственно распознавание. При изготовлении фильтра (рис. 1) в передней фокальной плоскости линзы $L_1$ устанавливается транспарант с записью распознаваемого образа $s(x,y)$, а в задней фокальной плоскости – голографич. фотопластинка, на которую направляется опорный пучок под углом $θ$ к оптич. оси. После экспонирования и фотохимич. обработки полученный фильтр помещается в плоскость $P_2$ (рис. 2) точно в то место, где находилась фотопластинка при его записи, а в плоскости $P_1$ устанавливается транспарант с записью анализируемого изображения $g(x,y)=s(x,y)+n(x,y)$, содержащего не только распознаваемый образ $s(x,y)$, но и изображения др. объектов $n(х,у)$. Линза $L_1$ формирует в плоскости $P_2$ пространственно-частотный спектр $S(ν_x,ν_y)+N(ν_x,ν_y)$ анализируемого изображения, где $S(ν_x,ν_y)$ – фурье-образ распознаваемого изображения, $N(ν_x,ν_y)$ – фурье-образ др. объектов, $ν_x, ν_y$ – пространственные частоты по осям $x$ и $y$ соответственно.
В результате дифракции пространственно-частотного спектра на голографич. согласованном фильтре образуются три дифракционных пучка: нулевого и ±1-го порядков. Пучок +1-го порядка, распространяющийся в направлении опорного пучка при записи фильтра, после прохождения через линзу $L_2$ формирует в плоскости $P_3$ поле корреляций эталонного изображения объекта с изображениями др. объектов в анализируемом изображении, а пучок –1-го порядка образует в плоскости $P_3$ область свёрток этих изображений. Угол $θ$ выбирают таким, чтобы поля корреляций свёрток не перекрывались с областью нулевого порядка. В месте расположения распознаваемого образа формируется функция автокорреляции в виде яркого сфокусированного пятна размером 50–100 мкм, а в местах расположения др. объектов – функция взаимной корреляции в виде расфокусированных пятен большего размера и меньшей интенсивности. Рис. 3 иллюстрирует процесс распознавания конкретного кит. иероглифа среди других.
На практике вместо фототранспарантов и голографич. пластинок используют управляемые транспаранты с оптич. и электрич. адресацией, а также фоторефрактивные кристаллы и фотополимеры.
Достоинство Г. р. о. – быстрота вычислений двумерной функции взаимной корреляции (наносекунды) и независимость времени распознавания от размерности анализируемого изображения и распознаваемого образа. Недостаток – зависимость интенсивности сигнала корреляции от рассогласования с эталоном по углу и размерам. В зависимости от сложности распознаваемого образа рассогласование в 2–3° по углу и 5–10% по размерам приводит к уменьшению сигнала корреляции в 2 раза. Г. р. о. используется при идентификации отпечатков пальцев, лиц, кредитных карт, иероглифов, деталей на конвейере при автоматич. сборке, наземных ориентиров в системах навигации и т. п.