Разработка и исследование моделей поведения динамических объектов на основе интеллектуального анализа видеопотоков данных
На правах рукописи
УДК 004.89
Целых Юлия Александровна
РАЗРАБОТКА И ИССЛЕДОВАНИЕ МОДЕЛЕЙ ПОВЕДЕНИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ НА ОСНОВЕ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ВИДЕОПОТОКОВ ДАННЫХ
Специальность: 05.13.18 – Математическое моделирование, численные методы и комплексы программ
05.13.17 – Теоретические основы информатики
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата технических наук
Таганрог – 2010
Работа выполнена на кафедре прикладной информатики Технологического института Южного федерального университета в г. Таганроге
Научный руководитель: доктор технических наук, доцент
Сергеев Николай Евгеньевич
(ТТИ ЮФУ, г. Таганрог)
Официальные оппоненты: доктор технических наук, профессор
Ромм Яков Евсеевич
(Таганрогский государственный
педагогический институт, г. Таганрог)
доктор технических наук, профессор
Гуда Александр Николаевич
(Ростовский государственный университет
путей сообщения, г. Ростов-на-Дону)
Ведущая организация: Федеральное государственное унитарное
предприятие научно-исследовательский
институт «Спецвузавтоматика»,
г. Ростов-на-Дону
Защита диссертации состоится « 31 » августа 2010 г. в 14.20 на заседании диссертационного совета Д 212.208.22 при Южном федеральном университете по адресу: 347928, ГСП-17 А, Ростовская область, г. Таганрог, пер. Некрасовский, 44, ауд. Д-406.
С диссертацией можно ознакомиться в Зональной научной библиотеке Южного федерального университета по адресу: 344000, Ростов-на-Дону, ул. Пушкинская, 148.
Автореферат разослан « 8 » июля 2010 г.
Учёный секретарь
диссертационного совета
д.т.н., профессор Лебедев Б.К.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования обусловлена стремительным ростом объемов видеоинформации, которая нуждается в оперативном анализе. По прогнозам специалистов, мировой рынок средств видеоаналитики в 2010 году составит 600 млн. долларов.
Особую актуальность данная тема приобретает в связи с участившимися случаями террористических актов. Так, Правительство РФ приняло решение о разработке проекта централизованной системы видеонаблюдения в реальном времени для Московского метрополитена с возможностью автоматического анализа видеоизображений.
Современные средства видеоаналитики должны совмещать в себе высокую эффективность оперативного видеоконтроля, комплексный анализ сцены и расширенные возможности автоматической индексации потока видеоизображений.
Решать подобные задачи возможно с помощью классической теории распознавания образов. Однако современные достижения этой теории не всегда применимы в силу больших затрат вычислительных ресурсов и времени. Поэтому предлагается использовать основные положения теории искусственного интеллекта с выделением характеризующих признаков и получением их значений, достаточных для описания сцен по видео- и фотоизображениям. Это значительно упрощает анализ действий объекта на кадрах видеоизображения. Примером такого подхода является представление объекта в виде фантома и выделение основных точек на теле человека. Предлагаемая модель может служить как воспринимающим аппаратом, так и инструментом моделирования действий человека и дальнейшего анализа.
Основная проблема при создании архива появлений объекта, например, лица человека, в поле зрения видеокамеры состоит, во-первых, в сильной избыточности информации, а во-вторых, в необходимости определения объекта на каждом кадре. Идеально это может делать человек, однако он имеет ограниченные возможности и не в состоянии следить за большим количеством объектов одновременно. А зачастую присутствие человека невозможно. Поэтому требуется помощь компьютера и возникает необходимость в использовании интеллектуальных систем видеонаблюдения.
Характерными особенностями видеоданных являются гигантский объем и высокая размерность, подверженность ошибкам и пропускам, неполнота и неточность. Эти сложности в полной мере учитывают современные методы и алгоритмы интеллектуального анализа данных – междисциплинарного направления исследований по выявлению в больших объемах сырых данных практически полезных и доступных интерпретации знаний, необходимых для принятия качественных решений.
Системы, основанные на знаниях, используются при решении следующих задач обработки видеоизображений:
- выделение отдельных смысловых важных фрагментов сцен;
- интерпретация символов и сигналов;
- анализ переднего и заднего плана видеокадра;
- принятие решений в условиях неопределенности.
О важности использования методов интеллектуальной обработки видеоизображений также свидетельствует распространение систем мониторинга «Безопасный город» и разработка и опубликование проекта Федерального закона Российской Федерации «О технических средствах обеспечения противокриминальной защиты объектов и имущества». Закон определяет основные положения технического регулирования в области криминальной безопасности и устанавливает общие требования к техническим средствам обеспечения противокриминальной защиты объектов и имущества.
В соответствии с основными положениями закона, под системой охраны и мониторинга понимается совокупность технических средств, связанных между собой каналами передачи данных, использующих систему для определения параметров пространственно-временного положения подвижных объектов и предназначенных для противодействия преступным посягательствам.
Целью диссертационной работы является разработка и исследование моделей поведения динамических объектов при обработке видеоизображений для решения задач анализа данных и распознавания сцен.
Поставленная цель определяет следующие основные задачи диссертационного исследования:
- Исследовать и разработать нечеткие модели представления пространственно-временных знаний и данных для задач обработки видеоизображений.
- Разработать алгоритм распознавания сцен для моделей поведения динамических объектов.
- Разработать систему распознавания сцен и анализа действий объектов на видеокадре.
- Реализовать практическое решение задачи интеллектуального анализа данных и распознавания сцен в виде программного комплекса.
Методы исследования основаны на использовании теории нечетких множеств и нечеткой логики, теории графов и гиперграфов, моделей искусственного интеллекта, методов интеллектуального анализа данных.
Достоверность полученных в диссертации результатов подтверждается корректными математическими доказательствами и аналитическими оценками, результатами программного и численного эксперимента на ЭВМ, практическим использованием разработанных в диссертации моделей, методов и алгоритмов.
Основные положения диссертации, выносимые на защиту:
1. Разработка и исследование нечетких моделей представления пространственно-временных данных для задач обработки видеоизображений.
2. Алгоритм распознавания сцен при обработке видеоизображений.
3. Информационная система автоматического распознавания сцен и анализа действий объектов на видеокадре.
4. Модель обобщенного гиперграфа для описания сцен.
5. Результаты экспериментов с использованием методов интеллектуального анализа данных и разработанного программного комплекса.
Научная новизна диссертационной работы:
1. Разработаны и исследованы математические модели для описания положения объектов на видеокадре, отличающиеся от известных использованием нечетких пространственно-временных атрибутов и лингвистических переменных, что позволяет на основе моделирования нечетких рассуждений вырабатывать компетентные решения в условиях неопределенности и сложной пространственно-временной обстановки.
2. Разработаны вычислительные методы и алгоритмы анализа видеокадров, отличающиеся возможностью реализации нечетких процедур поиска и слежения за компонентами объекта, что позволяет оперативно и адекватно формировать сценарии и описания ситуаций в системах анализа видеоизображений.
3. Разработана графово-гиперграфовая модель описания сцен и ситуаций, отличающаяся использованием понятия обобщенного гиперграфа, что позволяет с высокой степенью достоверности имитировать процедуры получения экспертных решений.
4. Разработан программный комплекс «Система мониторинга динамических объектов», предназначенный для анализа видеокадров и распознавания сцен, позволяющий определить требования к основным параметрам и характеристикам таких систем и предложить принципы создания интеллектуальных систем обработки видеоизображений, отличающиеся возможностью принятия решений в условиях неполноты и противоречивости исходной информации.
Практическая значимость.
1. Разработанные модели и методы обработки видеоизображений могут быть использованы для создания систем мониторинга сложных объектов с возможностью анализа видеоизображений.
2. Предложенные принципы создания адаптивной интеллектуальной системы могут быть применены для создания систем принятия решений в сложной пространственно-временной обстановке.
3. Разработанная система распознавания сцен и анализа действий объекта на кадрах видеоизображения, реализованная в виде программного комплекса, может служить инструментом для моделирования действий человека в информационных системах искусственного интеллекта.
Реализация результатов работы.
Диссертация выполнена в соответствии с основным направлением научно-исследовательской работы Технологического института Южного Федерального университета в г. Таганроге «Формальные системы, искусственный интеллект и системы принятия решений».
Основные результаты диссертационной работы использованы при выполнении научно-исследовательских работ, в том числе:
– при выполнении НИР № 15551 «Разработка теории, моделей и методов принятия решений в интегрированных интеллектуальных системах на основе нечетких знаний и смешанного представления атрибутов», при выполнении НИР № 15552 «Разработка теории, моделей и методов, основанных на использовании нечетких ситуационных систем и нечетких классификационных моделей для целей принятия решений в сложной пространственно-временной обстановке», выполняемых на кафедре прикладной информатики Таганрогского технологического института Южного федерального университета в 2006-2010 г.г.;
– при выполнении хоздоговорных НИР, выполняемых Ростовским областным центром новых информационных технологий (РОЦ НИТ) при Южном федеральном университете в 2007-2010 г.г.;
– в учебном процессе кафедры прикладной информатики ТТИ ЮФУ при чтении лекций, проведении практических и лабораторных занятий, а также при выполнении студентами курсовых и дипломных работ.
Использование результатов диссертационной работы подтверждается соответствующими актами.
Апробация работы.
Основные результаты диссертационной работы докладывались и обсуждались на международных научно-технических конференциях и молодежных научных конференциях: «Интеллектуальные системы 2009. Интеллектуальные САПР 2009». (Дивноморск, 2007-2009 г.г.); VIII, IX, X Всероссийских научных конференциях студентов и аспирантов “Техническая кибернетика, радиоэлектроника и системы управления” (Таганрог, 2007, 2008, 2009 г.г.); III Межгосударственной научно-практической конференции “Экономико-организационные проблемы проектирования и применения информационных систем” (Ростов-на-Дону, 2008 г.), XII Всероссийской научной конференции молодых ученых и аспирантов “Новые информационные технологии. Разработка и аспекты применения” (Таганрог, 2009 г.); на ежегодных научно-технических конференциях профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ.
Публикации. Результаты диссертации отражены в 10-ти печатных работах, в том числе в 5-ти работах, опубликованных в изданиях, рекомендованных ВАК.
Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения, списка использованной литературы (96 наименований) и 3-х приложений. Диссертация содержит 203 страницы машинописного текста, включая 69 рисунков, 15 таблиц, 37 страниц приложений.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационной работы, сформулированы цель и задачи исследования, охарактеризованы научная новизна работы, ее практическая ценность, реализация и апробация результатов работы, дано краткое содержание структуры диссертации.
В первой главе дана формальная постановка задач и определены общие принципы формирования моделей предметной области. Представлены нечеткие пространственно-временные атрибуты для описания положения объектов на видеокадре. Дается интерпретация понятия нечеткого множества исходя из процессов, лежащих в основе формирования значений описываемых атрибутов. Введены специальные типы лингвистических переменных (ЛП), каждая из которых содержит в своей структуре элементы логического вывода, что позволяет проектировать эффективное представление предметной области для динамических систем:
Составная ЛП определена на предметных шкалах и непересекающихся подмножествах термов.
Сдвоенная ЛП использовалась при описании атрибутов, плохо определенных на одной шкале при наличии информации от нескольких сенсоров.
Сложная ЛП определена на множестве термов, где каждый терм представляет самостоятельную переменную, которая и в дальнейшем может использоваться самостоятельно или в качестве элемента терм-множества другой переменной. Сложные ЛП имеют трехмерные функции принадлежности, получаемые путем вращения симметричных функций принадлежности. При переходе к треугольным/трапециевидным функциям поверхности, функции принадлежности приобретают формы конусов, усеченных конусов и четвертьконусов.
Пространственное положение объекта определяется как значение лингвистической переменной по изображениям, последовательно полученным через равные промежутки времени. От трехмерных функций принадлежности мы переходим к проекциям сечений, параллельных основанию (рисунок 1). Эллиптическая форма проекций объясняется разными размерами изображения по вертикали и горизонтали.
Рис.1. Схематическое изображение положения объекта на предметной плоскости
Предложен порядок учета временных факторов восприятия внешней обстановки и предсказания движений оператора. Введены темпоральные отношения и описана взаимосвязь объектов темпоральных отношений.
Предложен способ представления знаний в моделях поведения оператора с помощью продукций и фреймов. Перечислены требования, которым должен удовлетворять набор процедур фреймовой сети.
Во второй главе рассматриваются особенности применения методов интеллектуального анализа данных для обработки видеоизображений. Разработаны концепция и методика создания интеллектуальной системы автоматического описания сцен по видеоизображениям.
На основе нечетких пространственно-временных атрибутов разработан алгоритм анализа видеоизображений, который реализован программно на языке C++ и в совокупности с комплексом аппаратных средств составляет систему мониторинга динамического объекта (СМДО).
Для анализа функционирования разработанной системы мониторинга динамических объектов был проведен эксперимент с использованием технических и программных средств обработки видеоизображений.
В ходе проведенного эксперимента задача идентификации положения объекта на видеокадре была представлена как задача классификации. Системе было предложено провести классификацию одной тысячи видеокадров с различными положениями рук. В качестве исходных данных были использованы значения углов, полученные от сенсоров. Предварительная обработка данных была произведена в программной среде SAS Enterprise Miner. Прогнозная модель построена на основе ряда известных алгоритмов, применяемых в интеллектуальном анализе данных (рисунок 2).
Рис.2. Построение прогнозных моделей в SAS Enterprise Miner
На диаграмме роста (рисунок 3) видно, что по результатам эксперимента наибольшую эффективность показала ансамблированная модель. Она в 1,6 раза превосходит модель, не использующую знаний, извлеченных из данных. Точность прогнозов составила 97%.
Рис.3. Оценка эффективности и сравнение моделей
В работе показано, что используемый подход имеет и свои недостатки: длительность процесса обучения, загрубление результатов, сложность настройки и отладки моделей, а также то, что эти алгоритмы работают по принципу «черного ящика».
В третьей главе предложена модель системы анализа видеоизображений, которая может быть использована как самостоятельный продукт, так и в качестве составного элемента более сложных программно-аппаратных комплексов. Описан алгоритм функционирования системы анализа видеоизображений. Приводится алгоритмическая и программная реализация системы распознавания сцен и поведения объекта, которая позволила осуществлять анализ видеоизображений большого объема и сложной структуры.
На рисунке 4 представлен алгоритм системы мониторинга динамических объектов, описывающий работу системы поиска и слежения за компонентами объекта на видеоизображениях. На схеме присутствуют три основных элемента: это оператор, СМДО и фантом. СМДО – это подсистема, которая управляет всеми действиями, выполняет основные операции и обновляет данные, которые использует для своего отображения фантом. Фантом является графическим представлением объекта в кадре. Он повторяет действия объекта находящегося перед камерой.
Рис.4. Алгоритм системы мониторинга динамических объектов
Рассмотрим представленный выше алгоритм поэтапно.
Анализ сцен начинается с выделения отдельных стационарных и динамических объектов на видеокадре. С каждым изображением объекта производится следующая последовательность действий:
1. Первоначально система получает кадр от видеокамеры и передает его на обработку.
2. Затем осуществляется темпоральная привязка видеокадра.
3. На следующем этапе осуществляется процесс поиска объекта и выделение его контура на видеокадре, который необходим для дальнейшего распознавания, а именно для разбиения контура на последовательность контрольных точек.
4. Процесс поиска контрольных точек заключается в нахождении на некотором контуре набора характерных точек, каждая из которых четко позиционирует отдельную часть объекта. Контрольные точки могут быть следующих типов: кисти рук, плечевые и локтевые суставы, голова, суставы ног, ступни ног.
5. Далее контрольные точки соединяются характеризующими линиями, которые с некоторой достоверностью определяют положение интересующих частей объекта. По изменению углов таких линий мы будем характеризовать динамику объекта.
6. После первоначального размещения контрольных точек на наблюдаемую часть объекта накладываются контрольные интервалы (рисунок 5). Смещение объекта или изменение формы объекта определяется заполнением контрольных интервалов точками цели с одной стороны и точками фона с другой. При этом предполагается, что изображение объекта отличается от фона цветом или интенсивностью. Контрольные интервалы выбираются в следующих основных направлениях: северное, южное, восточное и западное.
Рис.5. Расположение контрольных интервалов
При перемещении объекта атрибуты объекта описываются нечеткими лингвистическими переменными. Наблюдателю предоставляется возможность изменять формы функций принадлежности в реальном времени и наблюдать за изменением получаемых решений.
Атрибут «Сенсор правой руки» описывается лингвистическими переменными с терм-множествами:
T right hand = {«СЛЕГКА ПОДНЯТА», «ПОДНЯТА», «СИЛЬНО ПОДНЯТА»}
T right hand = {«СЛЕГКА СОГНУТА», «СОГНУТА», «СИЛЬНО СОГНУТА»}
Атрибут «Сенсор левой руки» описывается лингвистическими переменными с терм-множествами:
T left hand = {«СЛЕГКА ПОДНЯТА», «ПОДНЯТА», «СИЛЬНО ПОДНЯТА»}
T left hand = {«СЛЕГКА СОГНУТА», «СОГНУТА», «СИЛЬНО СОГНУТА»}
Функция принадлежности термов T right hand, T left hand будет иметь следующий вид (рисунок 6):
T1 T2 T3
0 0,1 0,3 0,7 0,8 x
Рис.6. Функция принадлежности термов «Положение правой руки»
Лингвистическая переменная описывает статическое положение отдельных частей тела (рука, нога, кисть, ступня и т.д.) по результатам размещения контрольных точек объекта. Значения ЛП образуют описание сцен. Представим описание сцен в виде графов следующего вида (рисунок 7):
Рис.7. Графы описания положения объектов
где – сенсор правой руки; – сенсор левой руки; – сенсор правой ноги; – сенсор левой ноги.
Лингвистическая переменная (положение сенсора правой руки) описывает статическое положение точек объекта, ;
Лингвистическая переменная имеет базовое терм-множество ={Ti}. Каждый терм описывается нечетким подмножеством множества значений и некоторой базовой переменной >, где – имя лингвистической переменной, – множество значений лингвистической переменной, X – интервал числовых значений переменной.
7. После того как контрольные точки размещены на объекте, производится замена изображения объекта упрощенным макетом – фантомом и привязка «фантома» к изображению. Графическое представление объекта и соответствующее ему изображение фантома представлено на рисунке 8.
Рис.8. Описание положения объекта по положению фантома
Осуществляется процедура нечеткой классификации различных положений объекта: стационарного положения «фантома», изменения положения объектов и классификация сцен.
8. Далее происходит запуск агентов слежения за расположение контрольных точек. На рисунке 9 представлена структурная схема алгоритма управления агентами слежения. В соответствии с терминологией теории агентов, миссией агента является слежение за компонентами объекта, средой агента – адресное пространство видеокадра. Рецепторами агента – контрольные интервалы, расположенные вокруг наблюдаемой части объекта. Агент имеет два типа эффекторов: одни обеспечивают перемещение самого агента в пространстве видеокадра и перемещение контрольных интервалов, другие сообщают данные о расположении компонентов объекта.
Рис.9. Схема управления агентами слежения
9. Минимальное темпоральное расстояние между видеокадрами ограничено максимальной частотой видеокамеры. Число пропущенных видеокадров зависит от скорости движения объекта и от наличия движущихся объектов. Для решения задачи описания сцен могут не потребоваться все видеокадры. В этом случае осуществляется «прореживание» видеокадров.
10. Новое размещение фантома для следующего кадра производится в случае потери объекта. В случае сохранения объекта в кадре, производится корректировка положения характеризующих линий и последующего движения фантома.
11. Запись данных с системы ведется в специальный файл (протокол). В результате система выдает команду для реагирования на ситуацию, например сигнал тревоги.
Представлена графово-гиперграфовая модель описания сцен по видеоизображениям. Такие графы составлены на основе классификации двигательных действий и сцен. Окончанием маршрута является вершина, которая соответствует данному положению, перемещению или сцене. Кодом или индексом видеокадра или последовательности видеокадров является перечисление числовых обозначений вершин маршрута.
Введено понятие и исследованы свойства гиперграфа специального вида – обобщенного гиперграфа. Такая модель может отображать как отношения целых групп элементов, так и отношения между отдельными элементами. Предложенная модель используется для описания функционирования систем анализа видеоизображений.
На рисунке 10 показан пример обобщенного гиперграфа, в котором вершины задаются лингвистическими переменными.
Обобщенным гиперграфом назовем тройку следующего вида:
HX=(X, E, Gh (X)), X={x1, x2,…,xn},
E={E1, E2,…,Em}, E1, E2,…,Em X,
Gh (X)=(X,U), U={u1,u2,…,ul,…,us}, ul=(xi, xj), xi, xj X.
Такое определение оставляет возможность представления отношений между вершинами разных ребер гиперграфа.
Частный случай обобщенного гиперграфа определяет графовые отношения только внутри рёбер гиперграфа:
HX=(X,EX ), X={x1, x2,…,xn}, EX = {(E1,GE1), (E2,GE2),…,(Er,GEl),…,(Em,GEm)},
E1, E2,…, Er,…, Em X, GEr =(Er,Ur),Ur={u1,u2,…,ul,…,uk}, ul=( xi, xj), xi, xj Er.
Рис.10. Пример обобщенного гиперграфа HX
В таблице 1 представлена смежность вершин гиперграфа HX1, изображенного на рисунке 10. Отношения в гиперграфе HX1 вершин x2, x6 описаны парой (1/E2). Это означает, что существует ребро (x2, x6) – “1” и они обе связаны ребром E2. Пара x4, x3 (0/E2,E3) непосредственно ребром (x4,x3) не связана, но входит в ребра E2 и E3.
Нетрудно предположить, каким образом будет выглядеть таблица смежности нечеткого обобщенного гиперграфа. В ней должны присутствовать элементы следующих видов <µU(xi, xk)/(xi, xk)>, <µX(xi )/(xi)>, <µEi(xi )/(xi)>.
Таблица 1. Смежность вершин гиперграфа HX1
На рисунке 11 предлагается пример представления обобщенного гиперграфа HX1. На представление гиперграфа H1 двудольным графом GK=(X UEX,V) наложены “графовые” связи вершин:
Рис.11. Обобщенный гиперграф HX1
С математической точки зрения, понятие обобщенного гиперграфа отличается от классического гиперграфа тем, что отношения между вершинами внутри ребра могут описываться неполным графом. Такая модель позволяет отображать сложные функциональные и смысловые связи.
Приведены результаты эксперимента по решению задачи определения положения объекта на видеокадре с помощью системы интеллектуального анализа видеоизображений. Результаты эксперимента позволили сделать следующие выводы:
- Непосредственное применение традиционных методов систем интеллектуального анализа данных (СИАД) для анализа видеопотоков данных невозможно, поскольку входные данные для такой системы должны быть представлены в текстовом (буквенно-цифровом) виде, а получить такие данные из видеопотоков можно лишь с применением методов СМДО, где эти функции выполняют многоагентные компоненты.
- Для отладки и обеспечения корректного функционирования систем анализа данных необходимо иметь возможность объяснения, каким образом были получены те или иные результаты. Большинство методов и алгоритмов, реализованных в СИАД, работают по принципу «черного ящика».
- Для работы системы интеллектуального анализа данных необходимо предоставить обучающие примеры. Для сложных сцен может потребоваться несколько тысяч примеров. При этом для каждого примера эксперт должен сделать свое заключение. Для работы СМДО необходимо только построить функции принадлежности лингвистических переменных.
- СМДО дает результат, начиная от нижнего уровня иерархии сцены (например, поднятая рука) до описания сцены в целом. Систему интеллектуального анализа данных необходимо заново обучать на каждом уровне и независимо от других уровней.
В заключении перечислены основные результаты работы.
В приложении 1 представлены примеры работы системы мониторинга динамических объектов на видеоизображении.
В приложении 2 приведен листинг программного кода, реализующего работу системы автоматического описания сцен по видеоизображениям.
В приложении 3 представлены акты об использовании результатов работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ
В ходе проведенных исследований получены следующие основные научные и практические результаты:
1. Разработаны и исследованы нечеткие модели на основе пространственно-временных атрибутов для описания положения объектов на видеокадре, использование которых позволило проводить интеллектуальный анализ видеопотоков данных, аналогичный деятельности человека-оператора.
2. Предложены принципы создания интеллектуальных систем обработки изображений и определены требования к основным параметрам и характеристикам таких систем, что позволило разработать комплексную систему мониторинга динамических объектов и осуществить ее практическое применение в задачах обработки видеоизображений.
3. Введено понятие гиперграфа специального вида – обобщенного гиперграфа. Такая модель может отображать как отношения целых групп элементов, так и отношения между отдельными элементами. Предложенная модель использовалась для описания сцен при формировании сценариев и ситуаций в системах анализа видеоизображений.
4. Разработан алгоритм работы системы мониторинга динамических объектов и программный комплекс, реализующий поиск и слежение за компонентами объекта для анализа видеокадров и распознавания сцен, что позволило получить достоверные результаты при анализе видеоизображений большого объема и сложной структуры.
Основные результаты диссертационной работы использованы при выполнении научно-исследовательских работ и в учебном процессе вуза, что подтверждается соответствующими актами.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ
Публикации в ведущих рецензируемых изданиях,
рекомендованных ВАК РФ
- Целых Ю.А. Мультиагентная реализация описания сложных сцен по видеоизображениям // Известия ЮФУ. Технические науки. Тематический выпуск «Интеллектуальные САПР». – Таганрог: Изд-во ТТИ ЮФУ, 2009,
№ 12(101). – С.149-153.
- Сергеев Н.Е., Целых Ю.А. Информационная система автоматического описания сцен по видеоизображениям // Известия ЮФУ. Технические науки. №3. – Таганрог: ЮФУ, 2009. С. 253-259.
- Сергеев Н.Е., Целых Ю.А. GH-модели социальных сетей // Известия ЮФУ. Технические науки. №1. – Таганрог: ЮФУ, 2009. С. 90-95.
- Целых Ю.А. Теоретико-графовые методы анализа нечетких социальных сетей // Программные продукты и системы. №2 (82), 2008. С. 48-50.
- Сергеев Н.Е., Целых Ю.А. Использование темпоральных отношений при описании сложных сцен по видеоизображениям // Известия ЮФУ. Технические науки. Тематический выпуск «Интеллектуальные САПР». – Таганрог: Изд-во ТТИ ЮФУ, 2009, № 12(101). – С.134-142.
Публикации в других изданиях
- Tselykh J.A. Decision Search Methods in a Fuzzy Semantic Network // Proceedings of International Conference «Intelligent Systems (IEEE AIS’04)». Scientific publication in 3 volumes. Vol. 3. – Moscow. “Fizmatlit”, 2004. P. 18-21.
- Целых Ю.А. Особенности моделирования процедур принятия решений в интегрированных интеллектуальных системах // Перспективные информационные технологии и интеллектуальные системы. – № 2/2004 (18). – Таганрог, Изд-во ТРТУ. С.11-14.
- Целых Ю.А. Нечеткие модели поиска информации в гипертекстовой среде // Перспективные информационные технологии и интеллектуальные системы. – № 4/2004 (20). – Таганрог, Изд-во ТРТУ. С.57-61.
- Tselykh J.A. Decision Search Methods in Fuzzy Situational Systems // Proceedings of XIII International Scientific and Technical Conference «Mathematical Methods and Information Technologies in Economy, Sociology and Education» (MK-36-94). – Penza, 2004. P. 74-76.
- Сергеев Н.Е., Целых Ю.А. Использование гиперграфов специального вида для некоторых задач моделирования // Конгресс «AIS-IT 2009» по интеллектуальным системам и информационным технологиям. Интеллектуальные системы 2009. Интеллектуальные САПР 2009. Труды конгресса. Том 1. – Дивноморское, 2009. С. 553.
Личный вклад автора в работах, опубликованных в соавторстве:
[2, 5] – разработана система поиска и слежения за компонентами объекта для анализа видеокадров и распознавания образов;
[3] – предложена графово-гиперграфовая модель;
[10] – введено понятие обобщенного гиперграфа для описания функционирования систем анализа видеоизображений.
Соискатель Ю.А. Целых