Развитие методов контроля и диагностирования распределенных систем железнодорожной автоматизации на основе анализа информационных потоков
На правах рукописи
Терновой Владимир Павлович
РАЗВИТИЕ МЕТОДОВ КОНТРОЛЯ
И ДИАГНОСТИРОВАНИЯ РАСПРЕДЕЛЕННЫХ СИСТЕМ ЖЕЛЕЗНОДОРОЖНОЙ АВТОМАТИЗАЦИИ
НА ОСНОВЕ АНАЛИЗА ИНФОРМАЦИОННЫХ ПОТОКОВ
Специальность 05.13.06 – Автоматизация и управление
технологическими процессами и производствами
(на транспорте)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата технических наук
Ростов-на-Дону
2013
Работа выполнена на кафедре «Автоматика и телемеханика на железнодорожном транспорте» федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Ростовский государственный университет путей сообщения» (ФГБОУ ВПО РГУПС)
Научный руководитель | доктор технических наук, профессор Ковалев Сергей Михайлович |
Официальные оппоненты | Безродный Борис Федорович – доктор технических наук, профессор, главный инженер ПКТБ автоматики и телемеханики – филиала ОАО «РЖД» Тарасов Валерий Борисович – кандидат технических наук, доцент кафедры «Компьютерные системы автоматизации производства» Московского государственного технического университета им. Н.Э. Баумана (МГТУ им. Н.Э. Баумана) |
Ведущая организация | Открытое акционерное общество «Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте» (ОАО «НИИАС») |
Защита состоится «15» ноября 2013 г. в 15 часов на заседании диссертационного совета Д 218.010.03 в Ростовском государственном университете путей сообщения по адресу: 344038, г. Ростов-на-Дону, пл. им. Ростовского Стрелкового Полка Народного Ополчения, д. 2, конференц-зал.
С диссертацией можно ознакомиться в научной библиотеке ФГБОУ ВПО РГУПС по адресу: 344038, г. Ростов-на-Дону, пл. им. Ростовского Стрелкового Полка Народного Ополчения, д. 2.
Автореферат разослан «14» октября 2013 г.
Ученый секретарь
диссертационного совета Д 218.010.03
доктор технических наук, профессор Бутакова М.А.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность. Проблемы повышения уровня контролепригодности и диагностируемости современных систем железнодорожной автоматики и автоматизации в настоящее время затрагивают не только традиционные аспекты диагностирования программно-аппаратных средств, но и распространяются на область информационно-технологического контроля и диагностирования. Особо остро они стоят перед разработчиками интегрированных систем железнодорожной автоматизации (ИСЖА), основанных на компьютерных сетях, обладающих сложной разветвленной архитектурой. Кроме ИСЖА управление технологическими процессами осуществляют различные подсистемы, входящие в интегрированный комплекс автоматизированных систем управления на железнодорожном транспорте (АСУЖТ).
Для обеспечения требуемого уровня надежности функционирования ИСЖА и повышения достоверности их контроля в настоящее время активно разрабатываются новые подходы, базирующиеся на современных информационно-диагностических технологиях. В этом плане перспективными представляются интеллектуальные технологии, основанные на использовании в контрольно-диагностических системах нескольких типов математических моделей, оперирующих различными признаковыми пространствами и использующих различные механизмы выработки решений. В качестве эффективных моделей поддержки процессов контроля и диагностирования ИСЖА могут использоваться математические модели, основанные на анализе сетевых трафиков, описывающих процессы информационного взаимодействия между отдельными сетевыми элементами системы с привлечением статистической и экспертной информации о характере их поведения в различных режимах функционирования системы. Основная идея заключается в том, что поскольку большинство технологических, аппаратных и программных сбоев в конечном итоге приводят к информационным сбоям, то есть к искажениям сетевого трафика, то появляется возможность использовать характеристики трафика в качестве информационных диагностических признаков в подсистемах информационно-технологического контроля ИСЖА.
Для целей выявления отклонений в трафиках информационных потоков от нормальных режимов можно использовать активно разрабатываемые в современной теории принятия решений и искусственного интеллекта методы распознавания аномальных событий и процессов. В этом плане представляются перспективными методы идентификации аномалий в моделях временных рядов, разрабатываемые в рамках теории нелинейных динамических систем и интеллектуальных технологий теории искусственных иммунных систем. Искусственные иммунные системы, обладая рядом замечательных свойств, заимствованных у биологических аналогов, открывают новые возможности диагностирования программных, информационных, технологических и иных типов отказов при неполной априорной информации о возможном характере отказов или даже ее полном отсутствии, что недоступно традиционным методам диагностирования.
Актуальность тематики подтверждается тем фактом, что работа поддержана грантами РФФИ: 11-07-13110-офи-м-2011-РЖД «Методы, модели и алгоритмы оценки качества функционирования и синтеза надежного программного обеспечения информационно-управляющих систем на железнодорожном транспорте» (2011–2012 гг.); 12-08-00798 «Математическое и программное обеспечение интеллектуальной обработки неполных и слабоструктурированных данных в информационно-управляющих системах с повышенными требованиями к надежности и качеству функционирования» (2012–2014 гг.).
Целью диссертации является разработка новых методов информационно-технологического контроля и диагностирования распределенных ИСЖА на основе интеллектуальных моделей анализа и обработки трафиков информационных потоков.
Предметом исследования являются распределенные технологические процессы на железнодорожном транспорте и распределенные ИСЖА.
Объектом исследования являются интеллектуальные и стохастические модели представления, анализа и обработки трафиков информационных потоков в системах железнодорожной автоматизации.
Задачами исследования являются:
1 Анализ особенностей работы распределенных ИСЖА и протекающих в них информационных процессов с целью выявления факторов, нарушающих устойчивое функционирование систем, и разработки нового подхода к диагностированию ИСЖА на основе анализа телекоммуникационных трафиков.
2 Разработка нового подхода к информационно-технологическому диагностированию компьютерных систем на основе анализа сетевых трафиков с использованием современных интеллектуальных технологий и методов нелинейной динамики.
3 Разработка моделей и методов выявления аномальных паттернов в представляющих трафик моделях временных рядов с целью их использования в подсистемах информационно-технологического контроля ИСЖА.
4 Разработка методов и алгоритмов статистического исследования моделей трафиков с целью выявления диагностических признаков для подсистем информационно-технологического контроля ИСЖА.
5 Разработка алгоритмов анализа телекоммуникационных трафиков и их программная реализация в системе Mathworks Matlab R2011a.
Степень разработанности проблемы.
Вопросы автоматизации сложных технологических процессов на транспорте рассматривались в трудах Ю.И. Жаркова, В.Н. Иванченко, Ю.И. Кравцова, В.М. Лисенкова, В.В. и В.Вл. Сапожниковых, Д.В. Шалягина и др.
Новые концепции диагностики и мониторинга распределенных объектов контроля и диагностики разработаны в трудах И.Д. Долгого, П.П. Пархоменко, Д.А. Поспелова, В.В. Сапожникова, Вл.В. Сапожникова, И.Б. Шубинского и др.
Технологии искусственного интеллекта в исследуемой области разрабатывались Л.С. Берштейном, М.А. Бутаковой, А.Н. Гудой, С.М. Ковалевым, Э.А. Мамаевым, С.В. Соколовым, А.О. Таракановым, А.Н. Шабельниковым,
Методы исследования основываются на элементах теории искусственного интеллекта, принятия решений и стохастического анализа.
Объект исследования находятся в рамках паспорта специальности 05.13.06 «Автоматизация и управление технологическими процессами и производствами (на транспорте)», а именно пунктов: «12. Методы контроля, обеспечения достоверности, защиты и резервирования информационного и программного обеспечения АСУТП, АСУП, АСТПП и др. 13. Теоретические основы и прикладные методы анализа и повышения эффективности, надежности и живучести АСУ на этапах их разработки, внедрения и эксплуатации. 15. Теоретические основы, методы и алгоритмы интеллектуализации решения прикладных задач при построении АСУ широкого назначения».
Достоверность и обоснованность результатов диссертации подтверждаются обоснованностью и корректностью постановок задач, имитационным моделированием и публикациями в реферируемых журналах.
Научная новизна диссертации заключается в следующем:
1 На основе комплексного исследования особенностей информационных потоков и информационного обмена в сетевых подсистемах ИСЖА установлена тесная связь между фактами проявления информационно-технологических сбоев в работе системы и вызванными ими изменениями в сетевых трафиках, что позволило предложить новый подход к информационно-технологическому контролю ИСЖА на основе выявления аномалий во временных рядах.
2 Предложен новый подход к выявлению аномалий во временных рядах на основе использования интеллектуальной технологии искусственных иммунных систем, позволяющий в отличие от известных подходов обнаруживать аномалии при отсутствии априорной информации об их характере, что обеспечивает возможность информационно-технологического контроля распределенных ИСЖА в условиях неполноты исходной информации.
3 Разработаны новые модели представления темпоральных паттернов для различных типов трафиков, позволяющие выявлять аномалии во временном ряду с учетом априорных экспертных знаний о характере представляемого им трафика.
4 Разработан новый метод online-детектирования аномальных паттернов в потоковых данных на основе их точечного представления с целью обнаружения информационных сбоев на ранних стадиях их проявления в контролируемом потоке данных.
5 Предложены нелинейно-динамическая модель и разработанный на ее основе комбинированный метод локального прогнозирования временного ряда, обладающий повышенной достоверностью предсказания аномалий на малых интервалах развития сетевого трафика.
Практическая значимость результатов диссертации состоит в разработке программно-математического и алгоритмического обеспечения для подсистемы информационно-технологического контроля информационно-вычислительного центра Северо-Кавказской железной дороги на основе интеллектуальных моделей анализа сетевых трафиков. К практическим результатам исследования относятся:
– общая структура и программно-математическое обеспечение подсистемы сбора характеристик информационных потоков, циркулирующих между подсистемами и региональными узлами информационно-вычислительного центра Северо-Кавказской железной дороги;
– общая структура и алгоритмы функционирования подсистемы обеспечения надежности и информационно-технологической безопасности распределенной информационно-вычислительной сети центра Северо-Кавказской железной дороги.
Апробация и внедрение результатов исследования. Теоретические и практические результаты работы прошли апробацию и докладывались на семинарах кафедр «Автоматика и телемеханика на железнодорожном транспорте» и «Информатика» РГУПС, на международных научно-практических конференциях «Интеллектуальные системы на транспорте» (Санкт-Петербург, 2011 г.), международном конгрессе по интеллектуальным системам и информационным технологиям «AIS-IT» (Дивноморское, 2010 г.), Российской выставке научно-технического творчества молодежи (Москва, НТТМ, 2010 г.), отраслевых выставках ОАО «РЖД» и ОАО «НИИАС» (Москва, Санкт-Петербург), Молодежной научно-технической конференции «Интеллектуальные системы – 2010» («ИС-2010») в рамках Конгресса по интеллектуальным системам и информационным технологиям «AIS-IT'10» (Дивноморское, 2010 г.), Молодежной научно-технической конференции «Интеллектуальные системы – 2011» («ИС-2011») в рамках Конгресса по интеллектуальным системам и информационным технологиям «AIS-IT'11» (Дивноморское, 2011 г.), на 1-м Международном симпозиуме «Гибридные и синергетические интеллектуальные системы: теория и практика» (Калининград, 2012 г.), «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (Коломна, 2013 г.).
Структура и объем работы. Диссертационное исследование последовательно раскрывает цель и задачи исследования и состоит из введения, четырех глав, заключения, списка использованных источников, включающего 118 наименований, и приложения. Общий объем диссертации составляет 137 страниц основного текста.
СОДЕРЖАНИЕ РАБОТЫ
Во введении показана актуальность темы диссертации, определена цель исследования, поставлены задачи, изложены научная новизна, теоретическая и практическая значимость полученных результатов.
В первой главе рассматриваются особенности информационных потоков и информационного обмена в сетевых подсистемах ИСЖА на примере трех типов систем – распределенных систем горочной автоматизации, автоматизированных систем распределенного мониторинга объектов железнодорожной инфраструктуры и системы диспетчерского управления «ДЦ-ЮГ» с распределенными контролируемыми пунктами.
Детально исследуются свойства информационных процессов, протекающих в компьютерной сети интегрированной системы диспетчерского управления (ИСДУ) типа «ДЦ ЮГ С РКП». Информационные потоки, генерируемые в ИСДУ устройствами контроля, порождаются процессом движения поезда по контролируемому участку. При этом объем передаваемой информации зависит от путевого развития станции, длины и скорости движения подвижных единиц и имеет определенную структуру, Допустимые варианты последовательностей сообщений в массиве передаваемых данных о результатах контроля поезда представлены порождающим графом G, вершины которого соответствуют различным типам сообщений, а связи – очередность следования (рис. 1).
На основе порождающего графа G выявляются все возможные варианты сообщений и трафиков, характеристики которых могут выступать в качестве информационных признаков диагностической модели. При этом выявляется ряд общих свойств трафиков, описывающих нормальное течение процесса, в частности, всегда наблюдаются увеличение интенсивности трафика в момент задания маршрута, его спад в момент замыкания маршрута, а также ряд характерных шейпов временного ряда (ВР), представляющего сетевой трафик в процессе перемещения поезда и передачи контрольных сообщений.
Рис. 1.
В заключение главы дается постановка задачи и общий подход к обнаружению аномалий в сетевых трафиках с использованием новой интеллектуальной технологии, разрабатываемой в теории искусственных иммунных систем. В основу подхода заложен базовый иммунологический принцип отрицательного отбора, основная идея которого заключается в формирование на основе моделей нормального поведения трафика множества детекторов, способных реагировать на существенные отклонения во ВР, представляющим сетевой трафик.
Во второй главе разрабатывается иммунологический подход к выявлению аномалий в трафиках, основанный на имитации биологических механизмов, присущих иммунным системам, при решении задач распознавания аномалий в трафиках.
В основу предлагаемого подхода к выявлению аномалий в сетевых трафиках положены иммунологические механизмы положительного и отрицательного отбора. Исходным объектом контроля является модель трафика в виде числового временного ряда: . Предполагается наличие достаточной информации о вариантах трафика, характеризующих нормальное течение техпроцесса. Варианты «нормального» трафика представлены в обучающем множестве О. Задан критерий J, на основе которого устанавливается сходство между ВР. Задача заключается в том, чтобы на основе анализа множества О сформировать систему классифицирующих правил, позволяющих распознавать как «нормальные» все примеры из множества О и «близкие» к ним по критерию J, а реализации ВР, «существенно» отличающиеся от «нормальных», классифицировать как аномалии. В силу наличия в приведенной постановке задачи нечетко определенных категорий, классифицирующие правила представляются нечетко-логическими формулами.
Приводится модифицированный вариант обобщенного алгоритма положительного и отрицательного отбора применительно к идентификации аномалий во ВР:
1 Формируется обучающее множество из фрагментов трафика нормального течения техпроцесса.
2 На основе множества O с использованием методов кластеризации ВР формируется множество «Я»-строк, являющихся детекторами нормального течения техпроцесса.
3 На основе множества «Я»-строк формируется множество «НЕ-Я»-строк, выступающих в качестве детекторов аномалий.
В рамках иммунного подхода подлежащие контролю входные данные интерпретируются как антигены, детекторы аномалий – как антитела, а механизму иммунного взаимодействия антител с антигенами соответствует механизм распознавания входных строк детекторами.
Ключевым вопросом при реализации иммунного подхода является выбор моделей представления для антител и механизма их взаимодействия с антигенами. Разрабатываются несколько типов моделей представления в зависимости от условий задачи и особенностей входных данных. Для регулярных ВР, допускающих представление небольшим числом типовых шейпов, используются кусочно-агрегированные и фазовые модели ВР, для ВР со сложными корреляционными зависимостями используются модели на основе нелинейных и нечетко-динамических систем.
Кусочно-агрегированная модель ВР представляется последовательностью шейпов в виде темпорально-интервальных событий (ТИС), характеризующих интегральные признаки ВР (усредненные значения ВР, углы наклона аппроксимирующей прямой, типы нечетких трендов ВР).
Определение 1. Темпорально-интервальным событием называется кортеж
,
где – диапазон изменения признака, характеризующего шейп ВР; – нижнее значение признака, – верхнее значение признака; – диапазон изменения продолжительности признака.
Определение 2. Кусочно-агрегированной моделью W называется последовательность строго следующих друг за другом ТИС
,
где rts – временное отношение непосредственного следования.
Соответствие ВР S модели W устанавливается путем интерпретации W на S.
Определение 3. Интерпретацией W на ВP S называется разбиение S на m интервалов такое, что для каждого ТИС и соответствующего ему интервала имеет место:
,
где – продолжительность сегмента , – нижняя граница продолжительности ТИС, – верхняя граница продолжительности ТИС, – числовое значение ВР, принадлежащее интервалу .
Для рассматриваемого класса моделей в качестве механизма распознавания предлагается полиномиальный алгоритм нахождения интерпретаций, основанный на принципах динамического программирования.
Определение 4. Темпорально-признаковым графом называется граф , определенный на множестве вершин , связи между которыми определяются отношением R:
.
Определение 5. Композиционным графом называется граф
полученный путем композиции темпорально-признаковых графов в порядке их вхождения в W.
Теорема. Для модели W существует интерпретация на S тогда и только тогда, когда в композиционном графе имеет место .
Приведенная теорема положена в основу разработки алгоритма распознавания аномалий, имеющего полиномиальную оценку алгоритмической сложности.
Для представления моделей сложных нерегулярных трафиков предлагается нелинейная авторегрессионная модель в виде адаптивной нечетко-динамической системы, обеспечивающей возможность настройки структуры и параметров модели под реальные потоки данных в сети. Модель ВР представляется в виде нелинейной авторегрессии
,
где – нелинейная функция, e(t) – ошибка, k – порядок модели.
Нелинейная зависимостьзадана в виде нечетко-динамической системы (НДС), входами которой являются k предшествующих значений ВР, а выходом – прогнозируемое значение x(t). База правил НДС содержит m правил вида:
,
где – нечеткие термы на числовой шкале X, характеризующие интенсивность трафика.
Правило представляется нечеткой формулой:
.
База знаний НДС представляется объединением нечетких формул:
. (1)
В контексте иммунного подхода коньюнкты в (1) являются детекторами положительного отбора. Детекторы отрицательного отбора (детекторы аномалий) получаются путем инверсии (1), то есть:
В результате раскрытия скобок получаются коньюнктов – детекторов аномалий:
.
Механизм обнаружения аномалий заключается в вычислении по k+1 поступившим значениям ВР нечетко-истинностных значений всех входящих в БЗ детекторов. При срабатывании одного или более детекторов отрицательного отбора и несрабатывании ни одного из детекторов положительного отбора в исходном ВР фиксируется аномалия.
Для учета большого многообразия возможных вариантов ВР, описывающих нерегулярные трафики, предлагается фазовая модель нечеткого ВР. Она образуется путем сопоставления элементам ВР числовых пар , где – нормализованное значение ; – нормализованный уклон (производная). Множество пар представляет на плоскости фазовую траекторию. Фазовая модель нечеткого ВР получается в результате гранулирования шкал и и сопоставления с ними нечетких переменных ЗНАЧЕНИЕ и УКЛОН со значениями на числовой лингвистической шкале. В результате исходный ВР S преобразуется в лингвистический ВР (ЛВР) , элементами которого являются пары термов , где – нечеткий терм переменной ЗНАЧЕНИЕ, – нечеткий терм переменной УКЛОН. Механизм распознавания основан на сравнении контролируемого трафика с фазовой моделью нормального поведения, представленной в виде ЛВР. В его основе лежит ряд утверждений.
Определение 1. Лингвистический ВР и тестовый ВР называются -схожими, если .
Определение 2. Тестовый ВР называется нормальным относительно ЛВР , если в найдется пара , начиная с которой ЛВР будет -схожим с ВР .
Определение 3. Тестовый ВР называется аномальным относительно ЛВР , если он не является нормальным относительно .
Утверждение 1. Тестовый ВР будет нормальным относительно ЛВР тогда и только тогда, когда для любого фрагмента ВР S в ЛВР найдется -схожий с ним фрагмент.
Утверждение 2. Для того чтобы тестовый ВР был аномальным относительно , необходимо и достаточно, чтобы в S нашелся фрагмент, который не является -схожим ни с одним из фрагментов .
С целью разработки методов упреждающего распознавания аномалий в трафиках предлагается точечная модель нечеткого темпорального паттерна. Она задается в виде пересечения нечетких множеств, соответствующих последовательным значениям ВР, представленным в виде параметрических функций принадлежности (ФП):
,
. (2)
Модель нечеткого темпорального паттерна длины N представляется в виде многомерного нечеткого множества с ФП , определенного в N-мерном пространстве путем пересечения N нечетких множеств (2) в виде свертки:
.
Предложенный вариант оператора пересечения имеет принципиальное значение для упреждающего распознавания, поскольку позволяет при должном подборе параметра компромисса избежать быстрого спада к нулю результирующего значения с увеличением размерности паттерна N, который был бы неизбежен при использовании в качестве оператора коньюнкции обычной Т-нормы. Свертка из соображений простоты ее рекурсивной реализации представляется в виде выражения:
, (3)
где и – результаты применения операторов T-норма и T-конорма.
Сравнение текущего объекта (развивающегося фрагмента ВР) с моделью нечеткого темпорального паттерна осуществляется путем соотнесения N последовательных точек ВР S с описанием нечеткого паттерна . Если известны только первые k (k < N) значений поступившего на вход классификатора паттерна, то на основе (3) оказывается возможным получение предварительного результата классификации , который может быть интерпретирован как прогноз конечного результата классификации .
В третьей главе диссертации предлагается ряд новых моделей и алгоритмов для идентификации и обнаружения аномалий в информационных потоках, циркулирующих между подсистемами АСУЖТ, которые связаны между собой посредством корпоративной сети передачи данных ОАО «РЖД». Характеристики информационного трафика являются детерминированно-стохастическими, поэтому приемлемыми можно считать методы нелинейно-динамического анализа, однако данное обстоятельство в процессе исследования потребовало обоснования. Для этого в диссертации: разработан алгоритм идентификации трафика (рис. 2); была организована система сбора статистических характеристик трафика, не влияющая на режимы функционирования подсистем АСУЖТ (рис. 3). Данный алгоритм был построен на основе статистического анализа данных телекоммуникационного оборудования фирмы Cisco, применяемого в распределенных АСУЖТ с программным обеспечением Cisco Net Flow.
Предложенный в диссертации метод прогнозирования динамики функционирования информационно-управляющих систем железнодорожного транспорта на основе нелинейного анализа телекоммуникационного трафика включает следующие этапы:
- предварительный анализ телекоммуникационного трафика в АСУЖТ, развертывание аппаратно-программной системы сбора показателей телетрафика, сохранение файлов с объемами телетрафика за периоды времени, извлечение характеристик телетрафика и получение временных рядов;
- принятие решения о применимости методов нелинейного анализа и прогноза;
- реконструкция фазового пространства по одномерным временным рядам с определением временного лага и размерности вложения;
- алгоритм линейного прогнозирования динамики телекоммуникационного трафика АСУЖТ.
Необходимость 3-го этапа указанного метода обусловлена тем, что динамика систем рассматриваемого класса реконструируется по одномерным временным рядам – поступающим объемам телетрафика. Суть реконструкции состоит в следующем. Для одномерного временного ряда образовываются векторы вида: , где – размерность вложения, – временной лаг (запаздывание), .
Таким образом, из ряда формируется матрица размерностью , каждая строка которой определяет точку в -мерном реконструируемом пространстве:
. (4)
Так, например, при , , будет сформирована матрица , а при увеличении и формировании матриц по выражению (4) восстанавливается динамика системы как отображение .
Рис. 2. Алгоритм идентификации трафика и выбора возможных методов его исследования
Рис. 2 (продолжение)
Рис. 3. Схема организации сбора характеристик телетрафика
в региональном узле информационно-вычислительного центра
Северо-Кавказской железной дороги
Известными, однако неэффективными, вычислительными процедурами определения временного лага и необходимой размерности вложения являются вычисления, использующие автокорреляционную функцию временного ряда и метод «ложных» ближайших соседей соответственно. Новые вычислительно-эффективные алгоритмы расчета указанных характеристик предложены в четвертой главе диссертации.
Заключительным этапом предложенного в диссертации метода является разработка алгоритма прогнозирования телекоммуникационного трафика АСУЖТ. Как один из простых и приемлемых вариантов можно рассматривать применение линейной модели, состоящей из следующих шагов.
Шаг 1. По данным временных рядов телетрафика АСУЖТ выполнить реконструкцию фазового пространства.
Шаг 2. Для каждой реконструированной координаты найти D-мерный вектор ближайших соседних точек , причем , – размерность пространства вложения.
Шаг 3. Рассматривая уравнение
и используя вектор , вычислить коэффициенты , по методу Левенберга-Марквардта.
Шаг 4. Рассчитывать прогнозируемое значение по выражению
.
Завершающим результатом исследования явилась разработка программного обеспечения на базе следующих новых алгоритмов (глава 4).
Первый алгоритм предназначен для определения временной задержки в процессе реконструкции фазового пространства системы. Второй алгоритм использует результаты алгоритма 1 и предназначен для вычисления корреляционной размерности реконструируемой системы. Он обладает не более чем квадратичной сложностью вычислений. Определять участки линейности на показанных графиках визуальным образом нецелесообразно, поэтому далее предложен алгоритм 3, который позволяет автоматически определить окно линейности на графиках. В алгоритме 4 автоматизирован процесс достижения требуемой точности вычислений корреляционной размерности и размерности вложения восстанавливаемой динамической системы. Пятый алгоритм предназначен для выполнения аналогичных вычислений в условиях зашумления исходных данных. Изменение динамики нелинейной системы влияет на значение еще одной её характеристики – спектр показателей Ляпунова. На практике из всего спектра показателей Ляпунова обычно пользуются максимальным из них . Эта характеристика оказывается полезной для обнаружения аномалий в телекоммуникационном трафике по следующим причинам: если , то трафик поступает без аномалий, иначе – в телетрафике есть некоторые аномалии, например, информационные перегрузки, преднамеренные искажения, вызванные сетевыми атаками и т.д.
Приведем пояснения формулы для расчета максимального показателя Ляпунова по временному ряду. Рассмотрим -мерное реконструированное пространство , динамической системы. Пусть – состояние динамической системы на момент времени , тогда при эволюции системы через интервалы временного лага будут наблюдаться изменения . Вследствие рекуррентности изменения фазового пространства системы расчет максимального показателя Ляпунова по временному ряду можно выполнить по формуле
, (5)
где – количество значений временного ряда, – ближайшее расстояние между двумя соседними координатами соответственно на исходный и -й интервалы времени.
Алгоритм 6 предназначен для вычисления максимального показателя Ляпунова по временному ряду телекоммуникационного трафика. Последний алгоритм 7 предназначен для обнаружения аномалий в телекоммуникационном трафике с помощью методов нелинейной динамики. Приведем последние два алгоритма полностью.
Алгоритм 6 «Вычисление максимального показателя Ляпунова
по временному ряду телекоммуникационного трафика»
Входные параметры: временной ряд объемов трафика АСУЖТ – количество измерений; – расстояние между координатами на восстанавливаемом аттракторе;
- Восстановить фазовое пространство систем, вычислив временной лаг и размерность вложения по алгоритму 4.
- Выбрать некоторую (любую) координату временного ряда и назначить её исходной координатой .
- Цикл от до .
- Найти ближайшую к соседнюю координату .
- Сохранить значение расстояния .
- Ввести .
- Пока
- Найти ближайшую к соседнюю координату
- Сохранить значение расстояния .
- Конец цикла 2.5.
- Конец цикла 3.
- Выполнить расчет по формуле (5).
- Вывести параметр .
- Конец алгоритма.
Алгоритм 7 «Обнаружения аномалий в телекоммуникационном трафике
с помощью методов нелинейной динамики»
1 Разделить временной ряд объемов трафика АСУЖТ – количество измерений на неперекрывающихся интервалов, которые будем называть «окнами».
2 Для каждого -го «окна» рассчитывать показатель Ляпунова по алгоритму 7.
3 Сохранить последовательность .
4 Для каждого окна рассчитывать и сохранять значение индикатора , если , иначе , где – пороговое значение (может задаваться экспертным способом).
5 Рассматривая последовательность , можно сделать вывод об аномальном поступлении телекоммуникационного трафика.
6 Конец алгоритма.
Разработанные в диссертации алгоритмы были реализованы в среде Mathworks Matlab R2011a в виде 17 программных функций и скриптов общим объемом более 500 строк исходного текста. Примеры работы программного комплекса приведены на рисунках 4 и 5.
Рис. 4. Пример интерфейса вывода расчета по алгоритму 5 при значениях , для аттрактора динамической системы
Рис. 5. Выходные данные расчета для тестового примера аттрактора
динамической системы
В заключении обобщаются основные результаты диссертационной работы.
Публикации по теме диссертации
Публикации в ведущих рецензируемых изданиях, рекомендованных ВАК РФ
1 Гуда, А.Н. Алгоритмы и программное обеспечение для обнаружения аномалий в телекоммуникационном трафике автоматизированных систем управления железнодорожным транспортом методами нелинейной динамики / А.Н. Гуда, М.А. Бутакова, В.П. Терновой // Вестник Ростовского государственного университета путей сообщения. – 2011. – № 3. – C. 21–30.
2 Терновой, В.П. Моделирование информационных потоков на основе нечетких динамических систем / В.П. Терновой, С.М. Ковалев // Известия ЮФУ. Технические науки. Тематический выпуск Методы и средства адаптивного управления в энергетики. – 2011. – № 2. – С. 132–137.
3 Ковалев, С.М. Прогнозирование динамики функционирования автоматизированных систем управления железнодорожным транспортом на основе нелинейного анализа телекоммуникационного трафика / С.М. Ковалев, В.П. Терновой // Известия Южного федерального университета. Технические науки. – 2012. – № 2. – С. 212–220.
4 Терновой, В.П. Модели информационных трафиков и методы их идентификации в распределенных системах диспетчерского управления / В.П. Терновой [и др.] // Вестник Ростовского государственного университета путей сообщения. – 2012. – № 4.
Публикации в других изданиях
1 Бутакова, М.А. Способы генерации случайных процессов в задачах имитационного моделирования информационных систем / М.А. Бутакова, В.П. Терновой // Обозрение прикладной и промышленной математики. – М.: Изд-во ОППМ, Т. 17. – 2010. – № 6. – С. 859–860.
2 Ковалев, С.М. Иммунный подход к выявлению аномалий во временных рядах / С.М. Ковалев, В.П. Терновой // Обозрение прикладной и промышленной математики. – М. : ОППМ, Т. 18. – Вып. 4. – 2011.
3 Ковалев, С.М. Упреждающее онлайн-распознавание нечетких темпоральных паттернов в потоковых данных / С.М. Ковалев, В.П. Терновой // Гибридные и синергетические интеллектуальные системы : теория и практика : материалы 1-го международного симпозиума / под ред. проф. А.В. Колесникова. – Калининград : Изд-во БФУ им. И. Канта, 2012. – С. 364–375.
4 Терновой, В.П. Детектирование темпоральных аномалий на основе распознавания циклов фазовой модели представления временного ряда / В.П. Терновой [и др.] // Труды конгресса по интеллектуальным системам и информационным технологиям. – М. : Физматлит, 2012. – Т. 1. – С. 432–438.
5 Терновой, В.П. Иммунологические системы технического мониторинга и обеспечения безопасности рассредоточенных объектов железнодорожного транспорта / В.П. Терновой [и др.] // Обозрение прикладной и промышленной математики. – М. : ОППМ, Т. 18.– Вып. 4. – 2011.
6 Терновой, В.П. Метод интеллектуальной идентификации информационных потоков по временным рядам в автоматизированных системах управления железнодорожным транспортом / В.П. Терновой // VI Межд. науч.-практ. конф. «Интегрированные модели и мягкие вычисления в искусственном интеллекте» г. Коломна, 16–19 мая 2011 г. – М. : Физматлит, 2011. – Т. 1.– С. 261–271.
Личный вклад автора в работах, опубликованных в соавторстве:
[1, 6, 8] – метод обнаружения аномалий, разработка программного обеспечения; [2, 7] – модели потоков, алгоритм распознавания; [3] – алгоритм линейного метода прогнозирования; [4] – алгоритм идентификации трафика; [5] – обзор методов генерации случайных процессов; [9] – иммунологический подход к выявлению аномалий в трафиках.
Терновой Владимир Павлович
РАЗВИТИЕ МЕТОДОВ КОНТРОЛЯ
И ДИАГНОСТИРОВАНИЯ РАСПРЕДЕЛЕННЫХ СИСТЕМ
ЖЕЛЕЗНОДОРОЖНОЙ АВТОМАТИЗАЦИИ НА ОСНОВЕ АНАЛИЗА ИНФОРМАЦИОННЫХ ПОТОКОВ
Автореферат
диссертации на соискание ученой степени
кандидата технических наук
Подписано в печать 08.10.2013. Формат 6084/16.
Бумага офсетная. Печать офсетная. Усл. печ. л. 1,25.
Уч.-изд. л. 1,0. Тираж 100 экз. Заказ №
Ростовский государственный университет путей сообщения.
Ризография РГУПС.
Адрес университета: 344038, г. Ростов-на-Дону, пл. им. Ростовского Стрелкового
Полка Народного Ополчения, д. 2.