Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа
На правах рукописи
ХАФИЗОВ Ринат Гафиятуллович
СИСТЕМЫ РАСПОЗНАВАНИЯ ПЛОСКИХ И ОБЪЕМНЫХ ИЗОБРАЖЕНИЙ ПО ИХ ФОРМЕ НА ОСНОВЕ
КОНТУРНОГО АНАЛИЗА
Специальность 05.12.04 – Радиотехника, в том числе системы и устройства телевидения
Автореферат
диссертации на соискание ученой степени
доктора технических наук
Казань – 2009
Работа выполнена на кафедре радиотехнических и медико-биологических систем Марийского государственного технического университета
Научный консультант: | доктор технических наук, профессор Фурман Яков Абрамович, ГОУ ВПО «Марийский государственный технический университет», г. Йошкар-Ола |
Официальные оппоненты: | доктор физико-математических наук, профессор Надеев Адель Фирадович, ГОУ ВПО «Казанский государственный технический университет им А.Н. Туполева», г. Казань доктор технических наук, профессор Попов Дмитрий Иванович, ГОУ ВПО «Рязанский государственный радиотехнический университет», г. Рязань доктор технических наук, профессор Петров Евгений Петрович,Вятский государственный технический университет», г. Киров |
Ведущая организация: | ФГУП НПО «Государственный институт прикладной оптики», г Казань |
Защита состоится «__»________20__ г. в ___ часов на заседании диссертационного совета Д 212.079.04 при ГОУ ВПО «Казанский государственный технический университет им. А.Н. Туполева» по адресу: 420111, Казань, ул. К. Маркса, 31/7
Отзывы на автореферат просим присылать по адресу: 420111, Казань, ул. К. Марк-са, 10. КГТУ им. А.Н. Туполева, ученому секретарю диссертационного совета
С диссертацией можно ознакомиться в библиотеке Казанского государственного технического университета им. А.Н. Туполева
Автореферат разослан «___»______________20__ г.
Ученый секретарь диссертационного совета
кандидат технических наук, профессор В. Р. Линдваль
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Современный этап развития радиотехнических информационных систем характеризуется следующей общей тенденцией. Она заключается в том, что объектом их обработки являются различного рода изображения, достаточно сложные по структуре и с неоднородными статистическими свойствами. Примером могут служить телевизионные, диагностические и охранные системы, системы наблюдения за земной и водной поверхностями, ближним космическим пространством и др. Задачей таких систем является не только такая пассивная функция, как формирование самих изображений, но, в первую очередь, понимание изображений – обнаружение на сложном статистически неоднородном и многоградационном по яркости фоном представляющих интерес объектов, распознавание и оценка их параметров. Аэрокосмические сцены поверхности Земли и сцены с изображениями медико-биологических объектов относятся к наиболее сложным для обработки изображениям. Чаще всего изображения содержащихся в них объектов весьма несовершенны, обладают недостаточной по отношению к фону контрастностью, четкостью, искажены помехами и шумами. По этим сигналам оператору затруднительно принимать необходимые решения в темпе поступления изображения, т.е. в реальном масштабе времени. Особенно остро стоит эта проблема в полностью автоматизированных системах. Требуемая для решения поставленных задач производительность цифрового процессора составляет 108-1014 и более элементарных операций в секунду, что затрудняет, а в целом ряде случаев, исключает получение результатов обработки в реальном или близком к нему масштабах времени.
В последние годы задача значительно осложнилась в связи с необходимостью обработки не только плоских, 2D изображений, но и пространственных, 3D изображений. Как показывает обзор достигнутых результатов в этой области, решение таких задач, как с теоретических, так и с практических позиций, далека от завершения. Существует немало причин для подобного вывода, но необходимо отметить, что такая часто приводимая причина как недостаточная степень развития вычислительной техники, является, на наш взгляд, второстепенной. Отсутствие результатов обработки изображений, сопоставимых по своей эффективности с возможностями человека, объясняется, в первую очередь, недостаточно развитыми теоретическими подходами. В большинстве публикаций по вопросам обработки изображений рассматриваются различные эвристические подходы и даются рекомендации в пользу слабо проверенных и сильно ограниченных методов.
Особенностью данной диссертационной работы является компромисс, состоящий в выборе упрощенной, но достаточно адекватной модели изображения, и применение на базе такой модели строгих теоретических подходов для обработки реальных изображений, основанных на теории сигналов. Рассматриваемая в диссертации упрощенная модель изображения, представляет в аналитическом виде форму этого изображения, задаваемую ее контуром. Форма изображения является концентратором информации, содержащейся в изображении. Она интерпретируется как заданный в аналитическом виде сигнал, для обработки которого используются известные и новые разработанные в диссертации методы контурного и кватернионного анализа сигналов.
В экспериментальных исследованиях по психологии оператора радиолокационной станции обзора земной поверхности было показано, что процесс предварительного формирования у него зрительного образа состоит из следующих этапов: грубое различение общих пропорций изображения объекта и его положения на экране индикатора, мерцание формы, различение резких перепадов яркости, выделение отдельных деталей, восприятие формы и контура изображения объекта. Приводится гипотеза о формировании зрительного образа в сознании человека. Предполагается, что при восприятии глаз осуществляет отслеживание границы изображения объекта. В результате в сознании человека отличаются характерные особенности формы объекта. Также высказывается мнение о том, что при восприятии в сознании человека вырабатываются два образа: образ формы и образ внутренней части изображения объекта. Вместе с тем, общепринятое определение формы объекта отсутствует. В большинстве работ, где определение этого термина является важным моментом, указывается на сложность данного вопроса.
Большой вклад в развитие теории распознавания изображений внесли: У. Прэтт, Р. Гонсалес, Т. Павлидис, Ю.И. Журавлев, В.А. Сойфер, В.С. Киричук, Ю.Г. Васин, В.С. Титов, К.К. Васильев, А.А. Потапов, Г.И. Василенко, П.А. Бакут и многие другие. Важнейшие результаты в области анализа радиотехнических сцен и распознавания образов получены учеными, входящими в Российскую общественную организацию «Ассоциация распознавания образов и анализа изображений»
Научная проблема, на решение которой направлена диссертационная работа, заключается в разработке методов распознавания изображений, инвариантных к преобразованиям переноса, масштабирования и вращения этих изображений при условии сохранении их формы. Выбор в качестве адекватной модели изображения аналитического представления формы этого изображения, задаваемую ее контуром, позволяет с единых позиций теории сигналов подходить к обработке реальных изображений. Интерпретация формы изображения как заданный в аналитическом виде сигнал, для обработки которого используются разработанные в диссертации методы контурного и кватернионного представления сигналов, должно послужить основой для применения аналитических методов обработки 3D изображений при создании новых, более совершенных, систем.
Цель диссертационной работы заключается в разработке методов распознавания плоских и объемных изображений по их форме, заданной в аналитическом виде на основе контурного и кватернионного анализа. Для достижения этой цели в диссертационной работе решаются следующие задачи:
1) выбор пространства для представления сигналов при решении задачи распознавания изображений;
2) формирование адекватных моделей изображений плоских и объемных изображений на основе контурного и кватернионного анализа;
3) разработка аналитического представления формы плоских и объемных изображений на основе контурного и кватернионного анализа;
4) разработка методов фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений;
5) разработка методов обработки и распознавания, расположенных на плоскости и в 3D пространстве изображений по их форме;
6) реализация разработанных методов обработки и распознавания 2D и 3D изображений по их форме и оценка их эффективности.
Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, контурного и кватернионного анализа, цифровой обработки сигналов и изображений, теории вероятностей, теории функции комплексного переменного, алгебры гиперкомплексных чисел, численные методы и методы математического моделирования.
Научная новизна определяется результатами, полученными в диссертации впервые, и заключается в следующем:
1. Разработаны методы распознавания двумерных и трехмерных изображений по их форме, инвариантные к преобразованиям переноса, масштабирования и вращения этих изображений.
2. Исследованы методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений. Получены аналитические соотношения для согласованной фильтрации поливекторных сигналов и выяснены механизмы работы таких фильтров. Обнаружен эффект расщепления кватернионным фильтром гармоник спектра фильтруемого сигнала.
3. Разработан метод обработки изображений на основе согласованно-избирательной фильтрации для решения задачи обнаружения изображений объектов на сложном многоградационном и статистически неоднородном фоне.
4. Разработан на базе анализа векторных полей метод детектирования формы участков 3D поверхности.
Практическая значимость работы.
1. Полученные методы распознавания изображений по их форме, задаваемой контуром в комплекснозначном (для 2D изображений) или в кватернионном (для 3D изображений) виде, применены для решения задач распознавания плоских и объемных изображений биомедицинских объектов при создании информационных автоматизированных систем поддержки хирурга.
2. Разработанный метод согласованно-избирательной фильтрации изображений позволил решить задачу обнаружения изображений объектов на сложным нестационарном фоне в ландшафтных сценах и в сценах с изображениями медико-биологических объектов.
3. На базе фильтров, согласованных с комплекснозначными и кватернионными сигналами, решены инвариантно к преобразованиям переноса, масштабирования, вращения и сдвига начальной точки задачи распознавания плоских и объемных изображений по их форме.
4. Разработанный метод детектирования формы участков 3D поверхности использован для решения задач визуализации пространственных изображений.
Реализация результатов работы. Теоретические и практические результаты диссертационной работы использованы в НИР «Притирка-1К» и «Эксперт» при разработке распределенных информационных систем специального назначения ФГУП «Курский НИИ» МО РФ, а также при проведении НИР № 200/01709 («Статуэтка-УПКБ») в ОАО «УПКБ «Деталь». Результаты диссертационной работы использованы в следующих НИР, выполняемых автором в качестве исполнителя по грантам РФФИ (№№ 97-01-00906, 99-01-00186, 01-01-14029, 01-01-00298, 03-01-14065д, 04-01-00243, 05-01-96510 р_поволжье_а), Министерства общего и профессионального образования РФ (1997-1998 гг.), Миннауки и технологий (№0201.05.021, 1998г.), Минобразования РФ (№03.01.06.001, 2000г.), а также в НИР, выполняемых автором в качестве руководителя по г/б НИР в рамках Государственного контракта от «28» февраля 2006 г. №02.442.11.7328 ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 годы» «Единая теория обработки изображений групповых точечных объектов» (шифр 2006-РИ-19.0/001/348), а также по гранту РФФИ «Разработка методов и создание информационной технологии визуализации и сравнительного анализа сопряженных пространственных статических и динамических сцен», проект 08-01-12000-офи. Результаты диссертационной работы внедрены в учебный процесс по направлениям подготовки «Радиотехника» и «Биомедицинская инженерия».
Апробация работы. Результаты работы обсуждались на международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (Нижний Новгород, 1997; Великий Новгород, 2002; Санкт-Петербург, 2004; Йошкар-Ола, 2007; Нижний Новгород, 2008); на Всероссийской конференции «Математические методы распознавания образов» (Москва, 2003, 2005, 2009); на Всероссийской научно-технической конференции «Компьютерные технологии в науке, проектировании и производстве» (Нижний Новгород, 1999); на международной конференции «Распознавание» (Курск, 2001, 2005, 2008); на международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей В.А. Котельникова» (Москва, 2003); на региональной научно-технической конференции (Казань, 2004); на международной научно-практической конференции «Авиакосмические технологии и оборудование» (Казань, 2006); на ежегодных научных конференциях по итогам НИР МарГТУ и научных семинарах кафедры радиотехнических и медико-биологических систем и др.
Публикации. Всего по теме диссертации опубликовано 67 работ: из них 2 монографии (издательство «Физматлит», Москва); 14 –в центральных научных журналах из Перечня ВАК; 26 – материалы конференций;
18 – в других научных изданиях и депонированные в ВИНИТИ; 6 – свидетельств об официальной регистрации программ в Роспатент.
Структура и объем работы. Диссертация состоит из введения, 6 глав, заключения и содержит 140 рисунков, 8 таблиц. Список литературы включает 179 наименований. Основная часть работы изложена на 322 стра-ницах.
На защиту выносятся.
1. Метод аналитического представления формы плоских и объемных изображений, обладающего метрическими свойствами и содержащим необходимую для их распознавания информацию.
2. Методы распознавания плоских и объемных изображений по их форме, обеспечивающие инвариантность к преобразованиям переноса, масштабирования и вращения этих изображений.
3. Методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений, обеспечивающие формирование достаточной статистики для принятия решения при распознавании изображений по их форме.
4. Метод обработки изображений на основе согласованно-избирательной фильтрации, обеспечивающий обнаружение изображений объектов на сложном многоградационном и статистически неоднородном фоне.
5. Метод детектирования формы 3D изображений поверхности на базе принципа обработки множества ближайших точек генерального точечного поля и анализа векторных полей.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, сформулирована цель, направление исследований и основные научные положения, показана научная новизна и практическая значимость полученных результатов.
В первой главе исследовано современное состояние и проблемы теории обработки и распознавания изображений. Показано, что эти проблемы обусловлены действием следующих факторов: низкое отношение сигнал/шум; высокая степень детальности изображений объектов в анализируемой сцене; необходимость получения результатов распознавания в реальном или близком к нему масштабов времени; сильная статистическая неоднородность многоградационных по яркости фонов и изображений объектов; неинвариантность применяемых алгоритмов к линейным преобразованиям изображений, в первую очередь, к их повороту; несовершенство теоретических подходов к обработке и распознаванию изображений, особенно в 3D сценах, вызванных использованием эвристических подходов.
Рассмотрен метод распознавания, относящийся к классу алгоритмов вычисления оценок (АВО). Алгоритм основан на вычислении приоритетов (оценки сходства, меры близости, меры сходства), характеризующих «близость» распознаваемого и эталонного объектов по системе ансамблей признаков, представляющей собой систему подмножеств заданного множества признаков. Важным частным случаем АВО применительно к решению задач распознавания сигналов и изображений являются алгоритмы распознавания, основанные на геометрическом подходе. В соответствии с ним, сигнал в виде непрерывной функции может обрабатываться (преобразовываться) методами математического анализа. При дискретизации функции с интервалом дискретизации ей можно поставить в соответствие вектор , компонентами которого являются отсчеты функции . Векторный сигнал обрабатывается с применением методов векторного анализа. По векторному сигналу с некоторой ошибкой восстанавливается непрерывный сигнал . Эта ошибка стремится к нулю при уменьшении интервала дискретизации . Таким образом, бесконечномерный векторный сигнал полностью адекватен непрерывному сигналу . Если же выполняются условия теоремы Котельникова (теоремы отсчетов), то адекватность и наблюдается и при некотором конечном значении интервала . По s-мерному векторному сигналу в s – мерном пространстве можно задать точку с координатами, равными компонентам векторного сигнала . При наблюдается полная адекватность непрерывной функции , точки и вектора , заданных в бесконечномерном пространстве. Отсюда следует, что для обработки сигналов с одинаковым конечным результатом, (естественно, с разными затратами и ресурсами) можно применять методы математического анализа, дискретной математики и геометрии.
Сформулирована следующая научная концепция диссертационного исследования: использование упрощенных моделей изображений объектов, не связанных со значительной потерей содержащейся в изображении информации, позволяющих исключить эвристические подходы и использовать для распознавания изображений аппарат теории обработки сигналов. Подход, основанный на этой концепции, заключается в отказе от обработки каждого элемента изображения и переходе к обработке лишь его контуров, концентрирующих содержащую в изображении информацию.
Во второй главе в качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих сигналов, как меры схожести изображений, выбраны четыре пространства, в которых определены основные арифметических действия – сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство R, линейное комплексное пространство C и псевдолинейные кватернионное H и октавное O пространства. В пространстве R возможно представление и обработка как плоских, так и пространственных (трехмерных) изображений, в пространстве C – только плоских изображений. Псевдолинейность пространства H обусловлена некоммутативными свойствами операции умножения; в нем возможно представление и обработка трехмерных и четырехмерных изображений.
Пусть и - два одинаковой мощности s подмножества в аффинном пространстве, задающие одноименные векторные сигналы и (рис. 1). Радиус-векторы и , , назовем элементарными векторами (ЭВ) или моновекторами. Если с аффинным пространством сопоставляется линейное действительное пространство , то ЭВ содержат в качестве своих компонент вещественные числа, равные длинам проекций точек подмножеств на оси системы от-счета:
сигналы: ; , ,
сигналы: ; .
Рис. 1. 2D и 3D векторные сигналы, заданные подмножествами точек и
Для этого случая сигналы и - вещественные векторные сигналы. Когда с аффинным пространством сопоставляется линейное комплексное пространство , то моновекторы сигналов и задаются комплексными числами: ; , .
Такие сигналы назовем комплекснозначными сигналами. Если же с аффинным пространством сопоставляется псевдолинейное кватернионное пространство , то моновекторы представляются векторными кватернионами: ; .
Подобные сигналы назовем кватернионными сигналами (КТС). Решение задачи распознавания векторных сигналов связано с формированием меры схожести распознаваемого сигнала с каждым из эталонных сигналов , , алфавита классов и принятием, с теми или иными вариациями, решения в пользу класса, эталонный сигнал которого наиболее близок к распознаваемому сигналу . Различие между двумя ЭВ и определяется величиной реальной части скалярного произведения нормированных векторов и .
Векторные сигналы, представленные в пространствах R,C и H, содержат в качестве своих компонент соответственно двумерные или трехмерные декартовые координаты точек, комплексные числа и кватернионы. Каждая из таких компонент может рассматриваться в качестве вектора. Для подчеркивания этой особенности в ряде случаев векторные сигналы будем называть поливекторными. С целью обоснованного выбора пространства для представления сигналов при решении задачи распознавания изображений исследованы информативные свойства скалярного произведения поливекторных сигналов и их моновекторов в пространстве R,C и H.
Показано, что скалярное произведение плоских изображений, в виде скалярного произведения нормированных поливекторных сигналов, заданных в пространстве R, обладает функциональной зависимостью от угла между распознаваемым и эталонным изображениями. Поэтому при случайном значении скалярное произведение не может быть использовано в качестве меры схожести плоских изображений для их распознавания. Показано, что при проведении дополнительных вычислений, связанных с поворотом изображения, решением системы линейных уравнений и рядом тригонометрических вычислений возможно получение инвариантной к повороту меры схожести. Однако при определении обратных тригонометрических функций, появляются неоднозначные значения этой меры. Для трехмерных изображений, представленных в R, получение такой инвариантной меры возможно лишь в частных случаях, например, когда изображения расположены в одной гиперплоскости.
Исследованы свойства векторных сигналов, задающих плоские изображения в линейном комплексном пространстве C, и получено выражение для их скалярного произведения. Показано, что это произведение включает в качестве своей составной части скалярное произведение векторных сигналов в пространстве R. Реальная часть скалярного произведения многомерных поливекторных сигналов равна скалярному произведению этих сигналов в пространстве R: . Она содержит всю информацию о схожести сигналов и , которая определяется величиной расстояния между поливекторами и . Значение этого расстояния зависит как от угла между поливекторами и , так и от различия форм, задаваемых ими изображений. Мнимая часть скалярного произведения, равная , содержит дополнительную информацию о векторных сигналах. Она позволяет однозначно определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве R, найти инвариантное к вращению изображений значение меры их схожести.
Поскольку процесс линейной фильтрации сигналов связан с последовательным вычислением значений скалярного произведения фильтруемого сигналом с сигналом в виде импульсной характеристики фильтра, то приведенные выше свойства скалярного произведения в пространстве С позволяют получить инвариантные к вращению фильтруемого сигнала результаты фильтрации. Отмечено, что платой за обеспечение подобной инвариантности является ухудшение примерно в два раза отношения сигнал/шум, вызванное необходимостью учитывать влияние шума как по косинусному, так и по синусному каналам.
Получено аналитическое выражение для скалярного произведения векторных сигналов с трехмерными моновекторами в кватернионном пространстве H и исследованы его информативные свойства. Показано, что скалярное произведение таких сигналов в пространстве R является его составной частью, а дополнительная гиперкомплексная часть обеспечивает более высокую информативность меры схожести объемных изображений.
Кватернионный сигнал (КТС) представляет собой упорядоченную совокупность множества точек в аффинном пространстве, радиус-векторы которых являются элементами псевдолинейного кватернионного пространства и заданы векторными кватернионами. КТС представляет поливекторный сигнал, а кватернионы , , являются его моновекторами (элементарными векторами ).
Решены прямая и обратная задачи вращения поливекторного сигнала в трехмерном пространстве. Прямая задача вращения поливекторного сигнала сформулирована следующим образом: определить вид поливекторного сигнала , полученного в результате поворота 3D векторного сигнала вокруг оси. Повороту на угол вокруг оси, задаваемой вектором , подвергается по отдельности каждый моновектор , вектора . Представлена оценка трудоемкость решения прямой задачи вращения в пространствах R и H.
Получено, что применение матричных методов для поворота вектора на заданный угол вокруг оси с направляющим вектором требует 55 операций сложения, умножения, деления и извлечения корня. Подобная процедура с применением кватернионов требует 43 операции сложения и умножение, т.е. в 1,3 раза меньше. Число сложений для обоих методов одинаково, а число более сложных операций, таких как умножение, деление и извлечение корня при использовании матричных методов значительно больше. Поэтому реальный выигрыш при решении прямой задачи вращения за счет применения кватернионов может быть намного большим. Приведено количество операций для случая, когда направляющий вектор оси вращения является одновременно нормалью к собственной плоскости, в которой расположены исходный и результирующий моновекторы. Здесь число требуемых операций меньше в 2,4 раза. Если операция вращения с одними и теми же параметрами и выполняется для нескольких векторов, то выигрыш в числе требуемого количества операций, обеспечиваемый кватернионами, уменьшается и при большом количестве векторов целесообразно использовать матричные методы. Причина в том, что последние требуют много операций на подготовительном этапе при вычислении элементов матрицы, а кватернионные методы – на этапе вычисления результата вращения. Разработан алгоритм оценки угла поворота распознаваемого кватернионного сигнала по отношению к эталонному сигналу своего класса на основе решения обратной задачи вращения поливекторов в трехмерном пространстве, использующего интерпретацию кватерниона как совокупность значений косинуса угла поворота и направляющего вектора оси вращения.
В третьей главе введено определение понятия формы изображения объекта как аналитического представления контура этого изображения, инвариантного к преобразованиям масштабирования, поворота и смещения начальной точки контура. В качестве понятия «форма изображения» принята следующая трактовка этого термина Т. Павлидисом: «форма изображения представляет собой информацию, содержащуюся в его контуре ». Данное определение предполагает, что контур кроме информации о форме, дополнительно содержит информацию о параметрах его линейных преобразований , или, что форма является инвариантой к представлению в аналитическом виде контура к ряду преобразований, которым может подвергаться изображение , а, следовательно, и контур , без искажения формы, т.е.: , где - обозначение инвариантности аналитического описания изображения к некоторым функциональным преобразованиям или к преобразованиям , касающихся аналитического описания контура . Минимизация расстояния между двумя контурами и , задающими соответственно формы и , приводит к устранению влияния линейных преобразований на величину этого расстояния. Минимальное значение расстояния будет мерой разности форм, если форму определить как аналитическое представление контура, инвариантное к классу преобразований , где , преобразование масштабирования в раз и поворота на угол , - параметр сдвига начальной точки на моновекторов, а – параметр смещения изображения. Выражение для вектор-формы записывается в виде:
.
Полученное аналитическое представление для формы позволило конкретизировать наметившийся в последнее время подход к понятию формы изображения как инварианты к заданной группе аналитических преобразований этого изображения. Форма изображения содержит в концентрированном виде информацию о классе объекта, мало меняется при смене вида датчика, формирующего изображения, определяется значениями яркостей пикселей (вокселов) в приграничной части изображения и допускает простое аналитическое описание. Поэтому задание формы в качестве элемента линейного пространства, можно рассматривать как получение упрощенной, но достаточно адекватной модели изображения, допускающей обработку с позиции теории сигналов. Такая модель дает возможность применить для решения задачи распознавания изображений строгие методы оптимальной обработки сигналов и отказаться от эвристических подходов. Следовательно, выбор формы изображения в качестве сигнала соответствует принятой научной концепции диссертационного исследования.
Показано, что для решения задачи распознавания плоских изображений объектов по их форме целесообразно использовать аппарат контурного анализа в линейном комплексном пространстве С. Описаны основные подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с комплексными компонентами.
Выражение для элемента кода в полигональном представлении имеет вид: , где ; ; и – модуль и аргумент ЭВ. Достоинством подхода к описанию контуров последовательностью комплексных чисел, задающих их ЭВ, является возможность выполнять преобразования этих контуров аналитическим путем. Интерпретируя обработку полигональных комплекснозначных контуров, обладающих свойствами периодичности и замкнутости, как дискретных сигналов, можно ввести понятие сигнального контура. Этот контур представляет собой исходный (эталонный) контур , подвергнутый группе заданных преобразований:
.
Показано, что для решения задачи распознавания изображений трехмерных объектов по их форме целесообразно использовать аппарат кватернионного анализа в псевдолинейном кватернионном пространстве H. Рассмотрены подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с кватернионными компонентами. Получен на базе преобразования Кели-Диксона ортогональный базис в пространстве H в виде полного семейства элементарных кватернионных сигналов и выполнено разложение контура изображения произвольного пространственного объекта в виде линейной комбинации элементарных кватернионных сигналов.
К кватернионным сигналам приводит упорядоченное в трехмерном пространстве множество точек , задающее групповой точечный объект (ГТО). Если выбрать в этом пространстве некоторую точку и принять ее в качестве начала системы отсчета, то можно сформировать с полюсом в этой точке пучок из векторов , соединяющих т. с точками множества , и каждый из этих векторов будем рассматривать как чисто векторный кватернион , , где , и – мнимые единицы. В отличие от умножения вещественных и комплексных чисел, операция умножения кватернионов является некоммутативной: , , . Кватернионы тесно связаны с комплексными числами и выражаются через них. Их можно представить как сумму двух комплексных чисел, одно из которых берется с весом, равным мнимой единице.
При повороте КТС на угол вокруг оси, направление которой определяется единичным вектором , на данный угол поворачиваются все радиус-векторы сигнала вокруг оси: , где - вращающий кватернион, имеющий вид
.
КТС со смещенной на величину нумерацией его кватернионов записываются в виде . В общем случае масштабированный в раз, повернутый на угол вокруг оси, задаваемой единичным вектором , со смещенной на величину нумерацией кватернионов КТС представляется как .
Для получения аналитического представления формы 3D изображения использован такой же подход, как и при получении формы плоского изображения. В качестве тестового изображения выбран пространственный дельтовидный контур , обладающий в классе замкнутых контуров непрерывным спектром. Элементарные векторы , , задаются векторными кватернионами . Требование равномерности спектра дельтовидного пространственного контура накладывает требование на равномерность спектра составляющих КТС комплексных сигналов и . Получено аналитическое представление формы пространственного изображения при выборе пространственного контура в качестве тестового. Вектор-форма записывается в виде:
.
Рассмотрен вопрос об аналитическом представлении контуров плоских изображений в виде непрерывной, недискретизированной на сетчатке рецепторного поля, линии. Такой контур задан функцией комплексного переменного. Контур в виде непрерывной замкнутой кривой на комплексной плоскости задан в виде , где , –длина контура, и – амплитудное и фазовое представление функции . При многократном обходе вдоль замкнутой кривой контур можно представить как периодическую функцию с периодом , т.е. , . Получено выражение для скалярного произведения непрерывных контуров и рассмотрены его свойства. Найдены аналитические выражения для элементарных контуров, полное семейство которых задает ортогональный базис. Рассмотрено преобразование Фурье непрерывной контурной линии и исследованы его свойства.
В четвертой главе рассмотрены вопросы фильтрации КТС. Получены аналитические соотношения для согласованной фильтрации КТС и выяснены механизм работы таких фильтров. Показано, что их основная особенность по сравнению с фильтрами для вещественных и комплекснозначных сигналов заключается в расщеплении каждой -ой гармоники входного сигнала на две: одна по частоте соответствующей исходной, на частоте , другая – на зеркальной частоте .
Следствием этого является нарушение привычного для линейных систем соответствия между спектрами входного и выходного сигналов, хотя для кватернионных фильтров принцип суперпозиции не нарушается: если и - реакции фильтра на входные КТС и , а - на сумму этих КТС, то . Такое поведение фильтра обусловлено некоммутативностью операции перемножения кватернионов. В математическом плане эффект расщепления гармоники входного сигнала на исходную и зеркальную вызван следующим отличием алгебры кватернионов от алгебры комплексных чисел. Если , - ортогональный базис в комплексном линейном пространстве , то операция сопряжения ЭК не приводит к выходу из этого базиса, т.е. есть компонента базиса , равная . Поэтому линейная фильтрация как сигнала , так и сигнала , характеризуется монохроматичностью выходных сигналов, т.е. и - это собственные векторы линейного оператора фильтрации, а частотный коэффициент передачи - характеристическое число этого оператора.
Если же , - ортогональный базис в кватернионном пространстве, то операция сопряжения из-за некоммутативности операции умножения является причиной выхода кватернионного сигнала за пределы базиса, т.е. если при , то .
В связи с этим операция кватернионного сопряжения, выполняемая в процессе фильтрации, приводит к появлению на выходе фильтра зеркальной частотной компоненты, отсутствующей во входном сигнале. В результате частотный коэффициент фильтра имеет уже не скалярный, а векторный характер. Компоненты этого вектора и определяют реакцию фильтра на гармонику входного сигнала с частотой , вызывающую отклик на частотах и . В том случае, когда процесс фильтрации не сопровождается операцией сопряжения, например, у фильтра скользящего среднего, расщепление входной гармоники не происходит.
Рис. 2. Влияние спектра входного сигнала КвЛФ на образование гармоник спектра выходного сигнала () |
При фильтрации произвольного КТС в образовании -ой гармоники спектра выходного сигнала принимают участие -ая и -ая гармоники входного сигнала соответственно с коэффициентами передачи и . Таким образом, КТС частотного коэффициента передачи фильтра состоит из элементов , каждый из которых представляет собой двухкомпонентный вектор , . Первая компонента является коэффициентом передачи по частоте исходной гармоники, а второй – по частоте зеркальной гармоники (рис. 2).
Показано, что кватернионный фильтр представляет собой совокупность из двух параллельно работающих звеньев: комплексного и гиперкомплексного (рис. 3). В момент реакция кватернионного фильтра на согласованный с ним сигнал, как и у комплекснозначного фильтра, представляет собой вещественный сигнал, равный по величине энергии фильтруемого сигнала. Это максимально возможная по величине реакция фильтра на произвольный нормированный входной сигнал. Следовательно, в момент на выходе фильтра образуется пиковый по величине сигнал.
Рис. 3. Структура кватернионного фильтра |
Показано, что обнаружение изображений объектов на сложном многоградационном по яркости фоне должно осуществляться на основе пространственного фильтра, учитывающего статистические свойства широкополосного и фонового шумов. Реальные сцены природных ландшафтов и медико-биологических объектов характеризуются сильной статистической неоднородностью. Модели реальных ландшафтных сцен и сцен медико-биологического содержания имеют аддитивно-мультипликативный характер: , где - постоянная составляющая яркости, обеспечивающая условие .
Одномерные АКФ в сценах природных аэроландшафтов, вещательного телевидения и с изображениями медико-биологических объектов в пределах локально-однородной области хорошо аппроксимируются экспоненциально-косинусной функцией вида: , где - дисперсия фонового шума, - декремент затухания непериодической, а - круговая частота периодической составляющей АКФ. В рамках принятой модели, несмотря на ее значительно более сложный, чем у аддитивной модели вид, ЧКП оптимального фильтра усложняется незначительно:
,
где - спектр сигнала , - спектральная плотность белого шума, - координаты центра тяжести изображения, - энергетический спектр функции фона , - нормирующий множитель. Согласованное звено оптимального фильтра не изменилось, а ЧКП фоноподавляющего звена стал равен .
Задача обнаружения начальной точки контура изображения объекта в рамках принятой модели ставится аналогично задаче обнаружения самого объекта, только вместо функции яркости всего изображения обнаруживается наличие в смеси функции яркости только границы . Фильтр обнаружителя, начальной точки контура изображения должен содержать два звена: фоноподавляющее и согласованное с формой скачка яркости на границе фон/объект.
Для формирования меры схожести форм изображений принят метод согласованно-избирательной фильтрации, Он основан на том, что спектральная плотность мощности фона в реальных ландшафтных сценах и в сценах с медико-биологическими объектами в области высоких пространственных частот хорошо аппроксимируется функцией квадратичной гиперболы. Учитывая, что при описании спектральных свойств изображений фонов интерес представляет область высоких пространственных частот, а область низких частот содержит избыточную информацию и оказывает мешающее воздействие на процесс опознавания, целесообразно обеспечить согласование фильтра с сигналом не во всем диапазоне его спектра, а лишь в высокочастотной части, для которой функциональная зависимость для спектральной плотности фона известна. В этом случае удается получить в общем виде аналитическое описание оптимального фильтра в составе обеляющего и согласованного звеньев. Согласованно-избирательный фильтр осуществляет корреляцию фильтруемого изображения с контуром, т.е. с формой эталонного и в пространственной области реализуется в виде свертки фильтруемого сигнала с лапласианом эталонного сигнала. Выходной сигнал СИФ с точностью до константы равен второй производной сигнала обычного согласованного фильтра.
Рассмотрены вопросы согласованно-избирательной фильтрации одномерных, 2D и 3D скачков и импульсов яркости с прямоугольными, линейными и параболическими фронтами. Приведены графики зависимостей входного и выходного отношения сигнал/шум для СИФ при условии, что дисперсия фонового шума на входе равна единице, а параметры АКФ фонового шума выбраны равными . Приведена зависимость выигрыша в отношении сигнал/фоновый шум при фильтрации линейного скачка яркости, как функции длительности фронта . Получено, что выигрыш максимален для фильтра, избирательно согласованного с прямоугольным скачком яркости.
В пятой главе рассмотрены вопросы обработки и распознавания, расположенных на плоскости изображений по их форме. Решена задача обнаружения зашумленного контура . В отличие от классической постановки задачи обнаружение сигнала на фоне белого шума, здесь имеются следующие особенности. Во-первых, из-за двумерного характера задачи имеются два неинформативных угловых параметра – угол поворота и сдвиг начальной точки сигнального контура. Второй параметр задается не угловыми единицами измерения, а количеством элементарных векторов. Во-вторых, закон распределений вероятностей значений масштаба зависит от способа формирования изображений. При этом часто масштаб является не случайной, а просто неизвестной величиной.
Рассмотрены особенности решения задачи обнаружения, когда в качестве сигнала используется зашумленный контур , где - сигнальный контур. Устройство обнаружения содержит формирователь скалярного произведения ФСП и пороговое устройство ПУ. Получены по методу максимального правдоподобия оценки параметров , и d зашумленного контура по результатам его фильтрации фильтром согласованного с эталонным контуром . Оценки найдены по значению векторного отсчета фильтра с максимальным значением модуля. Оценки угла поворота равна аргументу вектора, оценка растяжения - отношению модуля вектора к квадрату нормы эталонного контура, а оценка сдвига начальной точки контура инкрементированному номеру вектора.
Рис. 4. Структура устройства оценки параметров зашумленного контура
Устройство оценки параметров зашумленного контура содержит согласованный с контуром фильтр КСФ, формирователь ФМ модулей отчетов этого фильтра и экстремальное устройство ЭУ, определяющее параметр отсчета с максимальным модулем (рис. 4). По номеру выделяется соответствующий отсчет и далее определяются оценки , и параметров сигнального контура .
На рис.5 представлен пример решения задачи обнаружения заданного фрагмента береговой линии на изображении участка места. Максимальный на графике модуля нормированного выходного сигнала фильтра отсчет соответствует моменту, когда окно фильтра совместилось с искомым фрагментом. Область, выделенная маркером, соответствует решению, принятому обнаружителем о положении этого фрагмента.
Решена задача оптимального распознавания контуров изображений, заданных поливекторными комплекснозначными сигналами. Показано, что для принятия решения о классе формируется статистика в виде отношения функций правдоподобия зашумленного распознаваемого контура и контура эталонного изображения проверяемого класса.
а) | б) в) | г) | |
Рис. 5. Обнаружение заданного фрагмента береговой линии: а) исходная сцена, б) контур заданного фрагмента, в) контур протяженного участка береговой линии, г) результат обнаружения фрагмента, д) реакция контурного согласованного фильтра | д) |
Важным для принятия методики диссертационного исследования является тот фактор, что эта статистика для случая нормально распределенных шумов сводится к величине расстояния между поливекторами. При переходе к нормированным значениям всех поливекторных сигналов, как распознаваемого, так и эталонных, то такой статистикой будут служить скалярные произведения соответствующих контуров. Если кроме условия нормированности, потребовать выполнение условий совпадения начальных точек и нулевого значения угла поворота между распознаваемым и эталонным контурами, то задача распознавания плоских зашумленных изображений по их форме сводится к задаче распознавания их контуров.
Исследовано влияние поворота распознаваемого изображения относительно эталонного изображения своего класса и показано при увеличении угла поворота эффективность распознавания уменьшается до нулевого значения даже при отсутствии шумов. Показано, что оптимальный алгоритм распознавания контура со случайным углом поворота заключается в формировании модуля скалярного произведения распознаваемого контура с каждым из эталонных контуров и принятия решения в пользу класса, для которого величина этого модуля максимальна.
Рассмотрено применение полученного алгоритма распознавания к алфавиту плоских изображений. Результаты эксперимента по распознаванию незашумленного изображения с контуром в алфавите переменного объема M=2,3,4,5 и поворота на произвольный угол приведены на рис. 6,а.
а б
Рис. 6 Зависимости вероятности для объекта класса от угла
График 1 соответствует распознаванию по критерию максимума модуля скалярного произведения , m=1,2,3,4; m=1,2,3; m=1,2 и m=1. Для этого графика вероятность везде равна единице, т.е. принятый критерий обеспечивает инвариантность результатов распознавания при любом значении угла поворота . Графики , , соответствуют результатам распознавания незашумленного контура по критерию максимума реальной части скалярного произведения при разных значениях объема алфавита. Как следует из этого семейства графиков, вероятность принимает либо нулевое, либо единичное значение, причем зона нулевых значений расширяется по мере увеличения объема алфавита. Таким образом, подтверждается, что даже при полном отсутствии шумов при задании сигналов в действительном пространстве R существует обширный диапазон углов поворота контура , при котором форма изображения класса не может быть распознана. На рис. 6,б приведены результаты распознавания зашумленных изображений по их форме. Отношение к сигнал/шуму в контуре распознаваемого изображения класса равно . Графики 1 и 2 построены для критерия максимума реальной части скалярного произведения, причем график 1 относится к случаю, когда алфавит имеет объем M=5, а график 2 – для случая M=2. Из этих графиков видно, что появление шумов в распознаваемом сигнале и рост объема алфавита приводит к расширению зоны с очень низким значением . Графики 3 и 4 характеризуют процесс распознавания по критерию максимума модуля скалярного произведения. Влияние шумов привело к снижению вероятности , но зато эта вероятность не меняется при повороте распознаваемого контура. Уменьшение объема алфавита (график 4) способствует росту вероятности .
На рис. 7,а приведены графики, характеризующие снижение эффективности распознавания в случае, когда решение о распознавании принимается по критерию максимума реальной части скалярного произведения (графики 1 и 3).
а б
Рис. 7. Зависимость для объекта класса : а - от отношения сигнал/шум в распознаваемом сигнале; б - от количества накопленных значений скалярных произведений
Возможность распознавания при также характеризуется графиком 1, а график 2 указывает на резкое снижение эффективности распознавания по критерию максимума при повороте распознаваемого изображения на угол . На рис. 7,б представлены графические зависимости вероятности правильного распознавание от количества накопленных значений n скалярных произведений распознаваемого и эталонных сигнала. Для принятия решения в зависимости от применяемого алгоритма выбирались либо модуль, либо реальная часть нормированного по значению n накопленного комплексного числа. Отношение сигнал/шум в распознаваемом сигнале равно .
Решена задача о виде алфавита изображений с оптимальными по критерию максимума вероятности правильного распознавания формами. Такой алфавит состоит из M=s классов изображений. Контуры всех классов изображений составляют полное семейство элементарных контуров, образующих s – мерный ортонормированный базис. Высокая помехоустойчивость распознавания, обеспечиваемая таким алфавитом, объясняется нулевым значением меры схожести между эталонами разных классов. На рис. 8 приведены результаты распознавания зашумленного изображения, форма которого задается контуром . Алфавит состоит из полного семейства элементарных контуров размерности : ; ; ; .
Рис. 8. Зависимость вероятности правильного распознавания зашумленного элементарного контура в алфавите от угла поворота: 1 – по критерию максимума модуля скалярного произведения, 2 - по критерию максимума реальной части скалярного произведения |
Решена применительно к ландшафтным сценам и к сценам медико-биологического содержания задача обнаружения контуров изображений объектов на сложных многоградационных по яркости коррелированных фонах. Решение задачи обеспечивается особыми свойствами АКФ фонов в этих сценах. Рассмотренный в данной главе обнаружитель использует для формирования статистики принцип согласованно-избирательной фильтрации. На рис. 9 приведены характеристики обнаружения прямоугольного скачка яркости на фоне сильнокоррелированного шума.
Рис. 9. Характеристики обнаружения границы при использовании фильтра, избирательно согласованного с прямоугольным скачком яркости |
Существует важный класс объектов, для которых можно принять решение об обнаружении контура их изображений не по одной, а по значительно большему количеству его точек. Таким классом являются объекты антропогенного вида, границы изображений которых содержат протяженные прямолинейные фрагменты. Если фрагмент такой границы расположить вертикально к направлению строк сцены и сложить яркости строк, через которые проходит этот фрагмент, то возникает скачок яркости, значительно превосходящий по величине значение яркости остальных изображений в других точках суммарной строки. В результате накопления энергии всех пикселов прямолинейного участка контура изображения создаются благоприятные условия его обнаружения. Поскольку ориентация прямолинейного фрагмента контура произвольна, описанную выше процедуру необходимо проводить для целого ряда сцен, получаемых последовательным поворотом исходной на небольшой угол. Решение об обнаружении принимается только для той сцены, в которой эта граница расположена вертикально. На рис.10 приведены характеристики обнаружения прямолинейной границы при накоплении и строк.
а б
Рис. 10. Характеристики обнаружения прямолинейной границы: а – для ; б – для . Фильтр избирательно согласован с прямоугольным скачком яркости
В шестой главе в соответствии с концепцией диссертационного исследования для обработки и распознавания, расположенных в 3D пространстве изображений объектов использованы упрощенные модели, не связанные со значительной потерей информации, но позволяющие привлечь для этого строгие методы теории сигналов. Эти модели задают форму объекта, задаваемую его нормированным вектор-контуром (оболочкой), с фиксированной угловой ориентацией и фиксированной начальной точкой.
Получена базовая процедура обработки 3D поверхностей, заданных зашумленным полем отсчетов (глобальным множеством точек). Процедура основана на принципе МБТ (множества ближайших точек): участок 3D поверхности в пределах 3D окрестности с центром в текущей точке (полюсе) при достаточно малом радиусе сферы имеет плоскую форму. Принцип МБТ является основой для операции планиметрии – кусочно-ломанной аппроксимации произвольной 3D поверхности множеством плоских участков, а также векторного поля с амплитудно-угловой модуляцией, адекватно связанного с формой подстилающей 3D поверхности.
Базовая процедура выполняется для каждой точки глобального множества и содержит следующие операции: низкочастотную фильтрацию точек глобального множества, формирование текущего МБТ, получение средней нормали к плоскости МБТ и уравнения этой плоскости, вычисление контура МБТ, проецирование точек МБТ на плоскость МБТ и оценка погрешности аппроксимации МБТ плоскостью.
Решена задача планиметрии произвольной зашумленной 3D поверхности. На основе принципа МБТ каждой точке генерального множества был поставлен в соответствие участок плоской поверхности, ограниченный контуром МБТ (сегмент). Множество сегментов образует чешуйчатого типа 3D поверхность, покрывающую исходную 3D поверхность. Для получения плоскосегментированной 3D поверхности оставляются лишь непересекающиеся между собой сегменты. На рис. 11 представлена структура алгоритма планиметрии 3D поверхности.
Рис. 11. Структура операции планиметрии произвольной 3D поверхности
Получена векторно-полевая модель произвольной 3D поверхности. Элементом векторного поля служит средняя нормаль к плоскости МБТ. Исследована информативность такого поля и показано, что аргумент вектора определяет ориентацию текущего сегмента, а его длина зависит от степени неровности участка поверхности в пределах соответствующего МБТ. Для возможности разрешения расположенных на 3D поверхности фрагментов с одинаковыми параметрами своих векторных полей введена необходимая классификация исходного точечного поля: инцидентность точек и коммутативность точек генерального множества. При этом, векторным полем 3D поверхности называется совокупность нормалей к каждой точке генерального множества
В зависимости от формы фрагмента поверхности нормали его векторного поля будут обладать некоторым общим свойством Е. Оно задает закон амплитудной и фазовой модуляции векторов . Если же поверхность содержит несколько фрагментов, обладающих одним и тем же свойством, то такие фрагменты можно разрешить на основе свойств связности точек генерального множества поверхности F.
Решена задача детектирования формы участков 3D поверхности. Получены основанные на результатах анализа векторных полей алгоритмы детектирования фрагментов плоской, цилиндрической, сферической и конической форм. Показано, что детектирование фрагментов с произвольными формами может быть реализовано в общем случае на базе кватернионных согласованных фильтров, импульсные характеристики которых отражают закономерности этих форм. На базе проволочных моделей распознаваемого и эталонных объектов были синтезированы оптимальные алгоритмы распознавания изображений полностью известных 3D объектов по их форме, задаваемой ассоциированным с ним многогранником. Также были получены алгоритмы распознавания изображений с неизвестным номером начального кватерниона проволочной модели, основанные на применении кватернионных согласованных фильтров, и алгоритмы распознавания объектов при неизвестной величине угла между распознаваемым изображением и эталонным изображением своего класса. На рис. 12 представлен пример многогранника и его проволочная модель.
а) | б) |
Рис. 12. Многогранник и его проволочная модель
Структура устройства распознавания точно известного КТС приведена на рис. 13.
Рис. 13. Структура устройства распознавания полностью известного КТС |
В случае распознавания многогранников с неизвестным номером начальной точки проволочной модели для принятия решения о классе сигнального КТС необходимо сформировать для эталонного сигнала каждого из классов не одно, а s-1 скалярных произведений. Данную процедуру реализуют кватернионные фильтры, согласованные с каждым из М эталонных сигналов и обрабатывающие один и тот же входной сигнал (рис. 14).
Рис. 14. Структура распознающего устройства изображений 3D объектов с неизвестным номером начального кватерниона проволочной модели |
В отличие от контурных согласованных фильтров аналогичные кватернионные фильтры не инвариантны к углу поворота фильтруемого КТС. Это следует из неинвариантности модуля скалярного произведения двух КТС при вращении одного из них. В связи с этим появляется зависимость принимаемого решения от угла поворота распознаваемого многогранника относительно эталонного многогранника класса , к которому принадлежит . Поэтому при формировании мер схожести перед получением скалярных произведений , , необходимо оценить угол поворота многогранника относительно эталонного многогранника . Поскольку класс распознаваемого КТС неизвестен, необходимо оценить значение для эталонных многогранников всех s классов. Далее при сравнении распознаваемого КТС с эталонным сигналом , , КТС поворачивается на угол , . В результате исходная задача сводится к задаче распознавания полностью известного сигнала. Структура распознающего устройства для данного случая приведена на рис. 15. По сравнению со структурой устройства для полностью известного сигнала здесь в каждом канале состоит корректор угла поворота (КУП), решающий обратную задачу вращения кватернионного сигнала.
Рис. 15. Структура устройства распознавания КТС с неизвестным углом поворота
Неинвариантность модуля скалярного произведения КТС к величине угла их взаимного поворота в значительной степени, по сравнению со случаем комплекснозначных сигналов, усложняет процедуру распознавания. В связи с этим значительный интерес представляют подходы к распознаванию КТС, свободные от дополнительных по сравнению с комплекснозначными сигналами операций. Один из таких подходов базируется на задании кватернионного сигнала в собственной системе отсчета. В этом случае все амплитудные и фазовые данные для текущего кватерниона задаются относительно кватерниона с предыдущим номером либо по отношению к интегральной характеристике всего КТС. Рассмотрен один из подходов к заданию КТС в собственной системе отсчета. Такое представление может быть получено при использовании свойства конформности (сохранения углов между кватернионами) операции вращения векторного КТС, т.е. угол между двумя кватернионами и , сохраняется при любых вращениях КТС в пространстве.
Сложность обработки изображения компактно расположенной в пространстве группы точечных объектов по сравнению с изображением сплошного объекта заключается в проблеме однозначного восстановления непрерывной функции по ее дискретным отсчетам. Однозначность достигается при переходе от изображения группы точек к полигональной, пространственно расположенной линии, проходящей через эти точки. Такую линию можно получить, если пронумеровать точки объекта и соединить их в порядке нарастания номеров. Если теперь задать в аналитическом виде каждое звено этой линии ("проволоки"), то получим аналитическое представление пространственного группового точечного объекта (проволочную модель ПГТО). На основании этой модели можно вычислить значение мер схожести распознаваемого ПГТО с эталонными ПГТО каждого класса алфавита и обоснованно отнести его к одному из классов. Проблема такого подхода состоит в обеспечении устойчивого аналитического описания ПГТО в виде проволочной модели к масштабированию и вращению ПГТО в условиях действия координатных шумов. Для получения аналитической модели ПГТО ему ставится в соответствие (ассоциируется) непрерывный пространственный объект – выпуклый многогранник, в который в качестве его вершин встроены граничные точки ПГТО. На базе подмножества оставшихся точек ПГТО строится следующий выпуклый многогранник, вершинами которого служат граничные точки этого подмножества и т.д. Доказаны теорема существования таких многогранников и теорема единственности получения одного и того же многогранника независимо от выбора начальной точки ПГТО, с которой начинается процесс построения. Теоремы существования и единственности обуславливают получение одного и того же, с точностью до параметров поворота и масштабирования, ассоциированного с ПГТО многогранника.
Разработана методика нумерации граней ассоциированного с ПГТО выпуклого многогранника и упорядочения (нумерации) его вершин. Результатом данной процедуры является проволочная модель ПГТО, являющаяся его аналитическим представлением в виде кватернионного сигнала. Оценена устойчивость проволочной модели и отмечена тесная связь этого параметра с устойчивостью формы ПГТО. Приведены результаты эксперимента по распознаванию зашумленных ПГТО в зависимости от их размерности и объема алфавита . Как видно из графиков на рис. 16, для выбранного алфавита ПГТО, как рост размерности объекта, так и увеличение дисперсии координатного шума снижают вероятность правильного распознавания.
Рис. 16. Зависимости вероятностей правильного распознавания зашумленного ПГТО класса от СКО координатного шума для трех значений размерности объекта |
Разработана аналитическая модель ПГТО, учитывающая не только пространственные координаты его точек, но и их яркость. Основой модели является полный кватернион, векторная часть которого задает положение точки в пространстве, а вещественная – уровень излучаемой ею энергии - яркость, цвет и др. Показано, что использование яркостного портрета ПГТО повышает устойчивость проволочной модели ПГТО для случаев, когда грани ассоциированного многогранника слабо отличаются друг от друга по форме.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ
1. В качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих сигналов, как меры схожести изображений, выбраны четыре пространства, единственные, в которых определены четыре арифметических действия – сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство R, линейное комплексное пространство C и псевдолинейные кватернионное H пространства. В пространстве R возможно представление и обработка как плоских, так и пространственных изображений, в пространстве C – только плоских изображений, в пространстве H –представление и обработка трехмерных и четырехмерных изображений.
2. Показано, что для решения задачи распознавания плоских изображений объектов по их форме целесообразно использовать аппарат контурного анализа в линейном комплексном пространстве С. Описаны основные подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с комплексными компонентами. Исследованы свойства векторных сигналов, задающих плоские изображения в линейном комплексном пространстве C. Показано, что для решения задачи распознавания изображений трехмерных объектов по их форме целесообразно использовать аппарат кватернионного анализа в псевдолинейном кватернионном пространстве H. Рассмотрены подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с кватернионными компонентами.
Исследованы информативности скалярных произведений векторных сигналов в пространствах R, С, и H, задающих плоские и объемные изображения. Показано, что это скалярные произведения векторных сигналов в линейном комплексном пространстве C и в кватернионном пространстве H включают в качестве своей составной части скалярное произведение векторных сигналов в пространстве R. Дополнительная информация о степени схожести сигналов содержится в комплексной и гиперкомплексной частях скалярных произведений. Она позволяет определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве R, найти инвариантное к вращению изображений значение меры их схожести.
3. Разработан метод аналитического представления формы изображения (плоского и объемного) как аналитическое представление контура этого изображения, инвариантного к преобразованиям масштабирования, поворота и смещения начальной точки контура. Различие между формами двух изображений выражается расстоянием между векторами, задающими эти формы. Форма изображения содержит в концентрированном виде информацию о классе объекта, мало меняется при смене вида датчика, формирующего изображения, определяется значениями яркостей пикселей (вокселов) в приграничной части изображения и допускает простое аналитическое описание. Задание формы в качестве элемента линейного пространства, можно рассматривать как получение упрощенной, но достаточно адекватной модели изображения, допускающей обработку с позиции теории сигналов. Такая модель дает возможность применить для решения задачи распознавания изображений строгие методы оптимальной обработки сигналов и отказаться от эвристических подходов.
4. Разработаны методы фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений. Показано, что в отличие от согласованных фильтров для вещественных сигналов, согласованный фильтр для комплекснозначных сигналов обладает свойством инвариантности модуля пикового отсчета к преобразованию поворота. При нормировании входного сигнала модуль пикового отсчета такого фильтра инвариантен также к преобразованиям масштабирования и сдвига начальной точки контура изображения. Благодаря этим свойствам контурный согласованный фильтр целесообразно использовать для нахождения количественного значения меры схожести двух плоских форм. Получены аналитические соотношения для кватернионного согласованного фильтра. Работа такого фильтра во многом аналогична работе контурного согласованного фильтра, но имеет особенности, связанные с некоммутативным характером операции перемножения кватернионов. Исследован механизм работы кватернионного фильтра при обработке согласованного и несогласованного с ним кватернионного сигнала. Доказан аналог неравенства Коши-Буняковского для кватернионных сигналов.
Разработан метод согласованно-избирательной фильтрации изображений объектов на сложном многоградационном по яркости фоне для решения задач их распознавания. Метод согласованно-избирательной фильтрации основан на том, что спектральная плотность мощности фона в реальных ландшафтных сценах и в сценах с медико-биологическими объектами в области высоких пространственных частот хорошо аппроксимируется функцией квадратичной гиперболы.
5. Разработан метод оптимального распознавания контуров изображений, заданных поливекторными комплекснозначными сигналами. Показано, что для принятия решения о классе формируется статистика в виде отношения функций правдоподобия зашумленного распознаваемого контура и контура эталонного изображения проверяемого класса. Важным для принятия методики диссертационного исследования является тот фактор, что эта статистика для случая нормально распределенных шумов сводится к величине расстояния между поливекторами. При переходе к нормированным значениям всех поливекторных сигналов, как распознаваемого, так и эталонных, то такой статистикой будут служить скалярные произведения соответствующих контуров. Если кроме условия нормированности, потребовать выполнение условий совпадения начальных точек и нулевого значения угла поворота между распознаваемым и эталонным контурами, то задача распознавания плоских зашумленных изображений по их форме сводится к задаче распознавания их контуров.
6. Получена базовая процедура обработки 3D поверхностей, заданных зашумленным полем отсчетов. Процедура основана на принципе множества ближайших точек. Принцип МБТ является основой для операции планиметрии – кусочно-ломанной аппроксимации произвольной 3D поверхности множеством плоских участков, а также векторного поля с амплитудно-угловой модуляцией, адекватно связанного с формой подстилающей 3D поверхности. Решена задача планиметрии произвольной зашумленной 3D поверхности. На основе принципа МБТ каждой точке генерального множества был поставлен в соответствие участок плоской поверхности, ограниченный контуром МБТ. Разработана векторно-полевая модель произвольной 3D поверхности. Элементом векторного поля служит средняя нормаль к плоскости. Исследована информативность такого поля и показано, что аргумент вектора определяет ориентацию текущего сегмента, а его длина зависит от степени неровности участка поверхности в пределах соответствующего МБТ. Разработан метод детектирования формы участков 3D поверхности. Показано, что детектирование фрагментов с произвольными формами может быть реализовано в общем случае на базе кватернионных согласованных фильтров, импульсные характеристики которых отражают закономерности этих форм.
7. Разработан метод распознавания изображений расположенных на 3D поверхности объектов по форме, задаваемой совокупностью пересекающихся между собой плоских фрагментов. Единое правило упорядочения вершин многогранника дает возможность получить 3D контур (проволочной моделью многогранника), элементарные векторы которого соединяют в установленном порядке, как вершины многогранника эталонного объекта, так и соответствующие вершины многогранника распознаваемого объекта, инвариантно его угловому положению, масштабу и смещению (в определенных пределах) положения вершин из-за действия координатных шумов. Такая модель была получена на основе операции объективного упорядочения граней многогранника, задающего форму объекта. Она представляет кватернионный сигнал, каждый кватернион которого задает вектор, соединяющий две вершины с соседними номерами. На базе проволочных моделей распознаваемого и эталонных объектов синтезированы оптимальные методы распознавания изображений полностью известных 3D объектов по их форме, задаваемой ассоциированным с ним многогранником. Показано, что форма пространственного группового точечного объекта задается выпуклым многогранником, вершинами которого служат граничные точки объекта. Доказаны теорема существования таких многогранников и теорема единственности получения одного и того же многогранника независимо от выбора начальной точки пространственного группового точечного объекта, с которой начинается процесс построения. Разработана аналитическая модель пространственного группового точечного объекта, учитывающая не только пространственные координаты его точек, но и их яркость.
СПИСОК ОСНОВНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ
Монографии
- Введение в контурный анализ и его приложения к обработке изображений и сигналов / Фурман Я. А., Кревецкий А. В., Передреев А. К., Роженцов А. А., Хафизов Р. Г. и др.; под ред. Я. А. Фурмана. – М.: Физматлит, 2002.
- Комплекснозначные и гиперкомплексные системы в задачах обработки многомерных сигналов / Фурман Я. А., Кревецкий А. А., Роженцов А. А., Хафизов Р. Г. и др.; под ред. Я. А. Фурмана. – М.: Физматлит, 2004.
Статьи в периодических изданиях, рекомендованных ВАК
- Хафизов, Р. Г. Обнаружение и оценка параметров плоских изображений / Р. Г. Хафизов // Известие Вузов. Приборостроение. – 2006. – № 4. – С. 36-45.
- Хафизов, Р. Г. Распознавание плоских зашумленных изображений по их форме / Р. Г. Хафизов, И. Л. Егошина // Известие Вузов. Приборостроение. –2006. – № 4. – С. 46-51.
- Хафизов, Р. Г. Фильтрация кватернионных сигналов / Р. Г. Хафизов, Я. А. Фурман, А. А. Роженцов // Радиотехника и электроника. – 2007. – Т. 52. –
№ 1. – С. 42-50. - Фурман, Я. А. Дискретно–кодированные сигналы на базе композиционных контуров / Я. А. Фурман, А. А. Роженцов, Р. Г. Хафизов // Автометрия. – 1996. –
№ 1. – С.72–79. - Фурман, Я. А. Согласованно-избирательная фильтрация изображений протяженной формы в реальных ландшафтных сценах / Я. А. Фурман, Р. Г. Хафизов // Автометрия. – 1999. – № 2. – С. 12–27.
- Furman, Ya. A. Detection of Extended Object Images in Optical Scenes / Ya. A. Furman, R. G. Khafizov // Pattern Recognition and Image Analysis. – 1998. –
№ 2. – P. 267–268. - Хафизов, Р. Г. Анализ сопряженных пространственных статических и динамических сцен при проведении трансуретральной резекции предстательной железы в режиме предварительного осмотра / Р. Г. Хафизов, В. Н. Дубровин, Ю. Е. Третьякова // Биомедицинские технологии и радиоэлектроника. – 2009. – №3. – С. 14-20
- Хафизов, Р. Г. Анализ непрерывных комплекснозначных сигналов, задающих контуры изображений плоских объектов / Р. Г. Хафизов // Вестник Казанского государственного технического университета им. А.Н. Туполева. – 2006. – № 4. – С. 24-27.
- Хафизов, Р. Г. Нейронная система обнаружения 3D изображений объектов рентгеновской томографии / Р. Г. Хафизов, Д. М. Ворожцов // Биомедицинские технологии и радиоэлектроника. – 2006. – № 1-2. – С. 89-95.
- Furman, Y. A. Detection of Images of Extended–Shape Object Among the Scenes of Underlying Surface / Y. A. Furman, R. G. Khafizov // Pattern Recognition and Image Analysis. – 1998. – Vol. 8. – № 4. – P. 612–640.
- Khafizov, R. G. Image Recognition of Spatial Objects on the Basis of Their Quaternion Models / R. G. Khafizov, Ya. A. Furman, D. G. Khafizov // Pattern Recognition and Image Analysis. – 2003. – Vol. 13. – № 1. – P. 101-102.
- Хафизов, Р. Г. Распознавание групповых точечных объектов на основе представления в собственной системе отсчета / Р. Г. Хафизов, Д. Г. Хафизов // Автометрия. – 2005. – №3. – С. 19-30.
- Detection and Recognition of Three-Dimensional Man-Made Objects / A. V. Krevetskii, R. G. Khafizov, I. L. Egoshina, A. N. Leukhin, D. M. Vorozhtsov// Pattern Recognition and Image Analysis. – 2005. – Vol. 15. – № 3. – P. 112-114.
Свидетельство об официальной регистрации программы
- Хафизов, Р. Г. Расчет характеристик распознавания гиперкомплексных сигналов / Р. Г. Хафизов, Д. Г. Хафизов, Я. А. Фурман и др. // Свидетельство об официальной регистрации программы для ЭВМ №2003611694, РОСПАТЕНТ, 16.07.2003.
- Хафизов, Р. Г. Программный комплекс по исследованию статистических характеристик изображений / Р. Г. Хафизов, Д. М. Ворожцов, Д. С. Чернов // Свидетельство об официальной регистрации программы для ЭВМ № 2005610655, РОСПАТЕНТ, 17.03.2005.
- Фурман, Я. А. Программный комплекс для построения контурных сцен «POCOS» / Я. А. Фурман, Ю. Ю. Мальгин, Р. Г. Хафизов и др. // Свидетельство об официальной регистрации программы для ЭВМ № 2005612227, РОСПАТЕНТ, 5.07.2005.
- Хафизов, Д. Г. Программы для ввода пространственных групповых точечных объектов «Сфера» / Д. Г. Хафизов, Р. Г. Хафизов // Свидетельство об официальной регистрации программы для ЭВМ № 2006612542, РОСПАТЕНТ, 19.07.06.
- Хафизов, Д. Г. Распознавание изображений пространственных групповых точечных объектов на основе их амплитудно-фазовых моделей / Д. Г. Хафизов, Р. Г. Хафизов // Свидетельство об официальной регистрации программы для ЭВМ № 2006613053, РОСПАТЕНТ, 01.09.06.
- Программа для решения обратной задачи вращения поливекторных сигналов / Р. Г. Хафизов, И. Л. Егошина, Я. А. Фурман и др. // Свидетельство о государственной регистрации программы для ЭВМ № 2009610894 от 09.02.2009.
Публикации в других изданиях
- Furman, Ya. A. Matched-Selective Filtering of Stretched Images in Real Landscape Scenes / Ya. A. Furman, R. G. Khafizov // Optoelectronics, Instrumentation and Data Processing. – 1999. – №. 2. – P. 10-23.
- Furman, Ya. A. Filtering of quaternion signals / Ya. A. Furman, R. G. Khafizov, A. A. Rozhentsov // Journal of Communications Technology and Electronics. – 2007. – № 1. – P. 42-50.
- Хафизов, Р. Г. Согласованно-избирательная фильтрация изображений / Р. Г. Хафизов. – Йошкар-Ола: МарГТУ, 2000.
- Фурман, Я. А. Изображения ориентиров оптимальной формы / Я. А. Фурман, А. В. Кревецкий, Р. Г. Хафизов // Вестник ВВО АТН РФ. Серия «Высокие технологии в радиоэлектронике, информатике и связи». – 2000. – С. 19-28.
- Фурман, Я. А. Обнаружение изображений объектов протяженной формы в оптических сценах / Я. А. Фурман, Р. Г. Хафизов // Материалы Всероссийской конференции «Распознавание образов и анализ изображений». – Нижний Новгород. – 1997. – Ч.1. – С. 283–285.
- Хафизов, Р. Г. Распознавание изображений объектов, заданных в пространстве, на основе анализа их формы / Р. Г. Хафизов, Д. Г. Хафизов // Материалы 5-й Всероссийской научно-технической конференции «Динамика нелинейных дискретных электротехнических и электронных систем». – Чебоксары. – 2003. –
С. 239-240. - Хафизов, Р. Г. Повышение качества обработки и анализа изображений рентгенограмм за счет учета шумовых свойств фона / Р. Г. Хафизов // Сборник материалов 5-ой международной конференции «Распознавание-2001». – Курск. – 2001. – С. 248-250.
- Фурман, Я. А. Распознавание изображений пространственных объектов на базе их кватернионных моделей / Я. А. Фурман, Д. Г. Хафизов, Р. Г. Хафизов // Труды 6-й Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» РОАИ-6-2002. – Великий Новгород. – 2002. – С. 586-589.
- Хафизов, Р. Г. Распознавание кватернионных сигналов на основе их представления в собственной системе отсчета / Р. Г. Хафизов // Труды 11-й Всероссийской конференции «Математические методы распознавания образов». – М. – 2003. – С. 471-473.
- Хафизов, Р. Г. Аналитическое представление формы кватернионных сигналов, инвариантное к преобразованиям масштабирования и вращения / Р. Г. Хафизов, Д. Г. Хафизов // Труды международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей В. А. Котельникова». – М. 2003. – С. 134-135.
- Detection and Recognition of Three-Dimensional Anthropogenous Objects / A. V. Krevetskii, R. G. Khafizov, I. L. Egoshina, A. N. Leukhin, D. M. Vorozhtsov //
7th International Conference on “Pattern Recognition and Image Analysis”. – St. Peterburg. – 2004. – P. 756-759. - Хафизов, Р. Г. Автоматизация обработки и анализа 3D рентгеновских изображений на базе согласованно-избирательной фильтрации / Р. Г. Хафизов, Д. М. Ворожцов // Вестник Вятского научного центра Верхне-Волжского отделения Академии технологических наук РФ. – 2004. – № 1(5). – С. 73-79.
- Хафизов, Р. Г. Информационная технология визуализации и многоцелевого анализа пространственных динамических изображений предстательной железы для подготовки и проведения трансуретральной операции / Р. Г. Хафизов, Ю. Е. Третьякова // Вестник МарГТУ. – 2008. – №2. – С. 27-34.
- Khafizov, R. G. For Problems of Creation of the Unity Theory of Group Point Object Image Processing / R. G. Khafizov // Proceedings of Fourth International Conference “Information and Telecommunication Technologies in Intelligent Systems”. – Katania. – 2006. – P. 79-81.
- Хафизов, Р. Г. Распознавание 2D и 3D изображений по их форме в системах навигации летательных аппаратов / Р. Г. Хафизов // Материалы Международной научно-практической конференции «Авиакосмические технологии и оборудование. Казань-2006». – Казань. – 2006. – С. 201-202.
- Khafizov, R. G. Recognition of spatial image by means of form / R. G. Khafizov // 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007).– Yoshkar-Ola. – 2007. P. 146-149.
- Furman, Ya. A. The detection of the three-dimensional objects surfaces / Ya. A. Furman, R. G. Khafizov // 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007).– Yoshkar-Ola. – 2007. – P. 89-93.
- Khafizov, R. G. Models of flat and spatial images contours on the basis of the theory of a complex variable function / R. G. Khafizov, А. Nefyodov // 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007).– Yoshkar-Ola. – 2007. – P. 150-152.
- Хафизов, Р. Г. Синтез формы с метрическими свойствами плоских и пространственных изображений / Р. Г. Хафизов // Сборник материалов VIII Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации». – Курск. – 2008. – С. 149-150.
- Furman, Ya. A. Unitary space as a basic one for signal representation at solving the problems of flat images recognition / Ya. A. Furman, R. G. Khafizov, D. G. Khafizov // 9th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). – Nizhniy Novgorod. – 2008. – P. 150-153.
- Dubrovin, V. N. Development of a surgeon information support system for conducting transurethral surgery on prostate gland / V. N. Dubrovin, V. V. Sevastyanov, R. G. Khafizov // 9th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). – Nizhniy Novgorod. – 2008. – P. 104-107.
- Khafizov, R. G. Modeling point fields on 3D objects surfaces / R. G. Khafizov // 9th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). – Nizhniy Novgorod. – 2008. – P. 284-286.
Усл. п. л. 2,0. Печать офсетная. Тираж 100 экз. Заказ № 4276.
Отпечатано в редакционно-издательском центре МарГТУ
424006 Йошкар-Ола, ул. Панфилова, 17.