WWW.DISUS.RU

БЕСПЛАТНАЯ НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 

Pages:     || 2 | 3 | 4 | 5 |
-- [ Страница 1 ] --

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

"ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ"

В. Г. Спицын, Ю.Р. Цой

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ

В ИНФОРМАЦИОННЫХ СИСТЕМАХ

Учебное пособие

Издательство ТПУ

Томск 2006

УДК 681.3.016

C 72

Спицын В.Г., Цой Ю.Р.

C 72 Представление знаний в информационных системах:

учебное пособие. – Томск: Изд-во ТПУ, 2006. – 146 с.

В учебном пособии рассматриваются современные модели представления знаний в информационных системах и принципы построения экспертных систем; обсуждаются проблемы применения нечеткой логики, генетических алгоритмов и нейронных сетей в интеллектуальных информационных системах; содержатся методические указания и задания для выполнения лабораторных работ. Пособие подготовлено на кафедре вычислительной техники, соответствует программе дисциплины и предназначено для студентов специальности 071900 «Информационные системы и технологии».

УДК 681.3.016

Рекомендовано к печати Редакционно-издательским Советом

Томского политехнического университета

Рецензент

Доктор технических наук, профессор, заведующий

кафедрой автоматизированных систем управления ТУСУРа

А.М. Кориков

© Томский политехнический университет, 2007

© Оформление. Издательство ТПУ, 2007

© В.Г. Спицын, Ю.Р. Цой, 2007

ВВЕДЕНИЕ

В предлагаемом вниманию читателя учебном пособии приведены современные модели представления знаний, принципы построения экспертных систем (ЭС) и перспективные направления развития систем, основанных на знаниях. Первая глава посвящена краткому изложению истории возникновения систем искусственного интеллекта, процесса мышления человека, классификации систем, основанных на знаниях, а также методов извлечения знаний из экспертов инженером по знаниям.

Содержание следующих двух глав составляют современные модели представления знаний, архитектура и технология разработки ЭС, описание систем анализа и синтеза входных и выходных сообщений. В заключительных трех главах излагаются получившие широкое распространение методы решения неформализованных задач. К этим методам относятся нечеткая логика, генетические алгоритмы и искусственные нейронные сети.

В результате освоения изложенного материала студент сможет самостоятельно приступить к разработке ЭС в роли инженера по знаниям.

Глава 1
СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХ

1.1. История со здания искусственного интеллекта

Родоначальником искусственного интеллекта считается средневековый испанский философ, математик и поэт Раймонд Луллий. Он еще в XIII в. попытался создать механическую машину для решения различных задач на основе разработанной им всеобщей классификации понятий. В XVIII в. Лейбниц и Декарт независимо друг от друга предложили универсальные языки классификации всех наук. Эти работы можно считать первыми теоретическими работами в области искусственного интеллекта.

Появление искусственного интеллекта как научного направления произошло после создания ЭВМ в 40-х годах XX в. В это время Норберт Винер создал свои основополагающие работы по кибернетике. Вскоре после признания искусственного интеллекта (ИИ) отдельной отраслью науки произошло разделение его на два направления: нейрокибернетика и кибернетика “черного ящика”. Эти направления развиваются практически независимо, существенно различаясь как в методологии, так и в технологии. И только в настоящее время появились тенденции к их объединению [1].

Основная идея первого направления заключается в том, что единственный объект, способный мыслить, – это человеческий мозг. Поэтому любое “мыслящее” устройство должно каким-то образом воспроизводить его структуру. Нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. Как известно из физиологии, человеческий мозг содержит до взаимодействующих между собой нервных клеток – нейронов [1, 2]. В рамках нейрокибернетики создавались нейроноподобные элементы, которые объединялись в функционирующие системы, называемые нейронными сетями.

В основу второго направления ИИ, называемого кибернетикой “черного ящика”, был положен альтернативный принцип, суть которого заключается в том, что не имеет значения, как построено “мыслящее” устройство. Требуется, чтобы на заданные входные воздействия оно реагировало так же, как и человеческий мозг.

Это направление ИИ было ориентировано на поиски алгоритмов решения интеллектуальных задач на существующих моделях компьютеров. В 1963–1970-х годах решение задач стало основываться на методах математической логики. Робинсоном был предложен метод резолюций, на основе которого автоматически доказывались теор емы при наличии набора исходных аксиом. В это же время русский ученый Ю.С. Маслов предложил метод обратного вывода, решающий ту же задачу другим способом [1, 3]. На основе метода резолюций француз Албер Кольмероэ в 1973 г. создал язык логического программирования Пролог.

В США в середине 1970-х годов на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. Появились первые коммерческие системы, основанные на знаниях, или экспертные системы. Начиная с середины 1980-х годов, повсеместно происходит коммерциализация ИИ. Растут капиталовложения и создаются промышленные ЭС. Искусственный интеллект становится одной из наиболее перспективных и престижных областей информатики (computer science).

Следует отметить, что уровень теоретических исследований по ИИ в России сопоставим с мировым. Но, к сожалению, начиная с 1980-х годов, на прикладных работах начинает сказываться отставание в технологии. По оценкам специалистов, отставание в области разработки интеллектуальных промышленных систем составляет 3–5 лет [1].

1.2. Процесс мышления

Процесс мышления, протекающий в человеческом сознании, чрезвычайно сложен. Одна ячейка человеческого глаза способна выполнять за 10 мс обработку, эквивалентную решению системы из 500 нелинейных дифференциальных уравнений. Компьютеру Cray-1 потребовалось бы несколько минут для решения этих уравнений. Поскольку глаз человека насчитывает не менее ячеек и каждая из них взаимодействует с другими, то компьютеру Cray-1 необходимо затратить по меньшей мере 100 лет, чтобы воспроизвести процессы, происходящие ежесекундно в человеческом глазу [4].

Данные из внешнего мира воспринимаются человеком с помощью одного из пяти органов чувств и затем помещаются в буфер кратковременной памяти для анализа. В другой области памяти (долговременной) хранятся символы и смысловые связи между ними, которые используются для объяснения новой информации, поступающей из кратковременной памяти. В долговременной памяти хранятся не столько факты и данные, сколько объекты и связи между ними, т.е. символьные образы. Большие объемы данных постоянно записываются в кратковременную память, и мы непрерывно анализируем и фильтруем получаемую информацию для того, чтобы определить степень ее важности и то, как она соотносится с образами, хранящимися в долговременной памяти (рис. 1.1).

 1. Система обработки информации у человека Учеными -2

Рис. 1.1. Система обработки информации у человека

Учеными установлено местоположение всех областей памяти в человеческом мозге. Логично предположить, что имеющиеся в мозге области памяти объединяются в единую структуру, в которой и происходит обработка поступающей информации.

Доступ к информации в долговременной памяти осуществляется достаточно эффективно. Практически любой элемент данных может быть извлечен в течение цикла обработки продолжительностью не более 70 мс и затем преобразован. Например, мы инстинктивно отдергиваем руку от горячей печки или резко поворачиваем руль автомобиля при возникновении препятствия на дороге, используя образы, ранее запомненные в долговременной памяти.

Механизм запоминания информации в долговременной памяти представляет собой самостоятельную и обширную тему для исследований. Требуется приблизительно 7 секунд для записи одного образа в долговременную память и установления всех связей, необходимых для извлечения этого образа в будущем. Перемещение данных из кратковременной памяти в долговременную память занимает приблизительно 15–20 минут. Если человек в автокатастрофе получил мозговую травму, то долговременная память может восстановиться почти полностью. Однако вся информация, поступившая в течение 15–20 минут до катастрофы, будет потеряна и никогда не восстановится [4].

Можно провести аналогию между кратковременной памятью человека и оперативной памятью ЭВМ, для которой отключение электропитания означает полное уничтожение всех данных. Долговременная память человека похожа на дисковую память ЭВМ. В долговременной памяти образы существуют в виде циркулирующих электрохимических импульсов и физических нейронных взаимодействий. Человек часто полностью выздоравливает после повреждения мозга и уничтожения нейронов в автокатастрофе, если у него не разрушены речевые центры или нейроны, управляющие двигательной системой. Нейроны других типов, даже если они частично повреждаются при травме, могут сохранять работоспособность благодаря зафиксированной ранее информации.

Целесообразно остановиться на организации хранения информации в человеческой памяти. Эта тема представляет наибольший интерес для разработчиков интеллектуальных систем. Способ хранения символьных образов в долговременной памяти во многом схож со способом хранения числовой информации в базах данных сетевого типа. Человеческая память хранит не числовые данные, как, например, номера элементов некоторой совокупности, а образы или символы. В памяти существует система указателей, позволяющая нам быстро извлечь любой нужный символ и все данные, которые с ним связаны. Мозг человека организован более совершенно, чем компьютерные базы данных, так как символьные образы в нем объединены в чанки – наборы фактов и связей между ними, запомненные и извлекаемые как единое целое. Чанки хранятся совместно с взаимосвязями между ними. В каждый момент времени человек может обрабатывать и интерпретировать не более четырех-семи чанков.

Чтобы убедиться в этом, прочтите следующую строку, закройте книгу и попытайтесь написать на листе бумаги то, что вы прочли:

Нлонмйкртс зрззйнк внбнм гвссмзл.

Теперь проверьте написанный вами текст и подсчитайте, сколько символов вам удалось воспроизвести правильно. Вероятно, их окажется от четырех до семи.

Повторите эксперимент со следующим предложением:

Экспертные системы почти разумны.

На этот раз вы, видимо, написали все буквы правильно. При этом оба предложения состоят из одинакового количества букв и слов. Почему же так отличаются результаты? Во втором случае вы объединили все объекты (буквы) в четыре чанка и в действительности запомнили только их и связи между ними, что соответствует допустимому для человеческого мозга диапазону. В первом же примере вы должны были запомнить 30 чанков, т.е. выйти за пределы допустимого числа чанков.

Используя ту же стратегию, опытный шахматист может, бегло взглянув на доску, запомнить положение всех фигур. При этом он запоминает не положение каждой фигуры, а их комбинации (чанки), и поэтому безошибочно восстанавливает расположение фигур на доске.

Способность формировать чанки отличает эксперта в данной конкретной области от неэксперта. Эксперт развивает свою способность объединять в чанки большие объемы данных и устанавливать иерархические связи между ними для того, чтобы быстро извлекать эти данные из памяти и с их помощью распознавать новые ситуации по мере поступления информации о них в мозг. Средний специалист в конкретной предметной области помнит от 50 000 до 100 000 чанков, которые могут быть использованы для решения той или иной проблемы. Их накопление в памяти человека и построение указателей для такого объема данных требуют от 10 до 20 лет [4].

1.3. Основные понятия и классификация систем,
основанных на знаниях

Искусственный интеллект ориентирован на создание методов дублирования функций живых интеллектуальных систем искусственными системами. Технология разработки интеллектуальных программных средств основана на том, что знания о решении задач отделяются от программ и реализуются в виде базы знаний, а в программах реализуется алгоритм манипулирования этими знаниями. Этот алгоритм называют механизмом логического вывода. Знания являются явными и доступными, что отличает интеллектуальные системы от большинства традиционных программных средств.

К знаниям относят информацию о логике решения задач, а к данным – информацию, которая должна быть проанализирована в соответствии с этой логикой. Поэтому имеются специфические признаки, отличающие знания от данных:

  • внутренняя интерпретируемость, означающая, что в знаниях находится информация, раскрывающая смысл элементов знаний;
  • структурированность знаний, заключающаяся в возможности декомпозиции сложных объектов на более простые и установлении соответствующих связей между ними;
  • связность знаний отражает причинно-следственные и временные отношения между фактами, процессами и явлениями;
  • активность знаний, так как они могут содержать планы действий и управляющие процедуры.

Знания, которыми обладает специалист в какой-либо области (дисциплине), можно разделить на формализованные (точные) и неформализованные (неточные) знания.

Формализованные знания формулируются в виде общих и строгих суждений (законов, формул, моделей и алгоритмов), отражающих универсальные знания.

Неформализованные знания отличаются конкретностью, субъективностью и приблизительностью. Обычно они являются результатом обобщения многолетнего опыта работы и интуиции специалистов и представляют собой многообразие эмпирических приемов и правил.

В зависимости от того, какие знания преобладают в той или иной предметной области, ее относят к формализованной (если преобладают точные знания) или к неформализованной (если преобладают неточные знания) предметной области. Задачи, решаемые на основе точных знаний, называют формализованными, а задачи, решаемые с помощью неточных знаний, – неформализованными [5].

Традиционное программирование в качестве основы для разработки программ использует алгоритм, то есть формализованное знание. Поэтому до недавнего времени считалось, что ЭВМ не приспособлены для решения неформализованных задач. Расширение сферы использования ЭВМ показало, что неформализованные задачи составляют очень важный класс задач, по-видимому, значительно больший, чем класс формализованных задач. Неумение решать неформализованные задачи сдерживает внедрение ЭВМ в описательные науки. Поэтому исследования в области ЭС имеют большое значение и занимают важное место в информатике.

К неформализованным задачам относятся те, которые обладают одной или несколькими из следующих особенностей [5]:

  • алгоритмическое решение задачи неизвестно (хотя, возможно, и существует) или не может быть использовано из-за ограниченности ресурсов ЭВМ (времени, памяти);
  • задача не может быть представлена в числовой форме (требуется символьное представление);
  • цели задачи не могут быть выражены в терминах точно определенной целевой функции.

Как правило, неформализованные задачи обладают неполнотой, ошибочностью, неоднозначностью и (или) противоречивостью знаний (как данных, так и используемых правил преобразования). Экспертные системы отличаются от традиционных программ тем, что ориентированы на решение неформализованных задач. Основными особенностями ЭС являются:

  • алгоритм решения неизвестен заранее, а строится самой системой с помощью символических рассуждений, базирующихся на эвристических приемах;
  • способность анализа и объяснений своих действий и знаний;
  • способность приобретения новых знаний от пользователя – эксперта, не знающего программирования, и изменения в соответствии с ними своего поведения;
  • обеспечение “дружественного”, как правило естественно-языкового, интерфейса с пользователем.

С точки зрения пользователя, наиболее важными свойствами ЭС являются:

  • возможность предоставления подробных объяснений полученных решений;
  • возможность постепенного наращивания баз знаний без перепрограммирования;
  • знания из баз знаний обладают самостоятельной ценностью и могут распространяться.

Перечислим основные виды интеллектуальных систем, отличающиеся целью и реализацией знаний:

  • интеллектуальные информационные поисковые системы, обеспечивающие в процессе диалога взаимодействие конечных пользователей с базами знаний на профессиональных языках пользователей;
  • интеллектуальные пакеты прикладных программ, в которых, в отличие от обычных пакетов, реализуются знания о процессе решения задач предметной области;
  • экспертные системы, обеспечивающие возможность решения задач в полностью неформализованных областях, причем вся информация о решении задач предметной области реализуется в виде баз знаний.

Экспертные системы представляют собой класс компьютерных программ, которые выдают советы, проводят анализ, выполняют классификацию и ставят диагноз. Они ориентированы на решение задач, обычно требующих проведения экспертизы человеком-специалистом. В отличие от машинных программ, использующих процедурный анализ, ЭС решают задачи в узкой предметной области на основе дедуктивных суждений.

Классификация ЭС по решаемой задаче [1]:

1. Интерпретация. Это анализ исходных данных с целью определения их смысла.

2. Диагностика. Это процесс поиска неисправности в системе, который основан на интерпретации данных

3. Мониторинг (наблюдение). Это задача непрерывной интерпретации сигналов и выдачи оповещений в тех случаях, когда контролируемые параметры выходят за допустимые пределы. Мониторинг является частью диагностической системы, которая работает в реальном масштабе времени.

4. Прогнозирование. Это предсказание хода развития системы в будущем на основании ее поведения в прошлом и настоящем. Эти системы содержат блоки обработки статистики, блоки принятия решения на основе неполной информации, блоки генерации альтернативных путей развития системы.

5. Планирование. Под планированием понимается определение планов действий, относящихся к объектам, способным выполнять некоторые функции.

6. Проектирование. Цель: помочь человеку при нахождении им эвристических решений в процессе творчества или автоматизировать рутинную работу. Проектирование состоит в подготовке спецификаций на создание “объектов” c заранее определенными свойствами.

7. Обучение. Под обучением понимается использование компьютера для обучения какой-то дисциплине или предмету. Системы обучения диагностируют ошибки при изучении какой-либо дисциплины с помощью ЭВМ. Система получает информацию о деятельности некоторого объекта (например студента) и анализирует его поведение. База знаний изменяется в соответствии с поведением объекта. Примером такого обучения может служить компьютерная игра, сложность которой автоматически увеличивается.

8. Контроль и управление. Системы, основанные на знаниях, могут применяться в качестве интеллектуальных систем контроля и управления. Они способны принимать решения, анализируя данные, поступающие из разных источников. Такие ЭС уже работают на атомных электростанциях, управляют воздушным движением и осуществляют медицинский контроль.

9. Поддержка принятия решений. Поддержка принятия решений – это совокупность процедур, обеспечивающая лицо, принимающее решения, необходимой информацией и рекомендациями, облегчающими процесс принятия решения. Эти ЭС помогают специалистам выбрать и сформировать оптимальное решение в конкретной ситуации.

1.4. Экспертные системы
как элемент искусственного интеллекта

Искусственный интеллект (ИИ), как наука, появился более 50 лет назад. Задачей этой науки является воссоздание с помощью искусственных устройств (в основном с помощью ЭВМ) разумных рассуждений и действий.

При этом возникают трудности двух типов:

1. В большинстве случаев, выполняя какие-то действия, мы сами не осознаем, как мы это делаем. Нам неизвестен точный способ (или алгоритм), как именно происходит понимание текста, узнавание лица, доказательство теоремы, выработка плана действий, решение задач и т.д.

2. ЭВМ априори далеки от человеческого уровня компетентности: до начала любой их работы необходимо составить соответствующие программы. Однако в действительности языки программирования дают возможность выражать только элементарные понятия.

Следовательно, методы ИИ представляют собой экспериментальную научную дисциплину. Под экспериментом в данном случае понимается проверка и уточнение моделей (представляющих собой программы для ЭВМ) на многочисленных примерах-наблюдениях над человеком с целью раскрыть эти модели и лучше понять функционирование человеческого разума.

В течение последних пятнадцати лет в рамках исследований по ИИ сформировалось самостоятельное направление – экспертные системы или инженерия знаний.

Отличительной чертой компьютерных программ, называемых ЭС, является их способность накапливать знания и опыт наиболее квалифицированных специалистов (экспертов) в какой-либо узкой предметной области. Затем с помощью этих знаний пользователи ЭС, имеющие обычную квалификацию, могут решать свои текущие задачи столь же успешно, как это сделали бы сами эксперты. Такой эффект достигается благодаря тому, что ЭС в своей работе воспроизводит примерно ту же систему рассуждений, которую обычно применяет человек-эксперт при анализе проблемы. Тем самым ЭС позволяет копировать и распространять знания, делая уникальный опыт нескольких высококлассных профессионалов доступным широким кругам рядовых специалистов.

Большой интерес со стороны пользователей к ЭС вызван по крайней мере тремя причинами. Во-первых, они ориентированы на решение широкого круга задач в неформализованных областях, на приложения, которые до недавнего времени считались малодоступными для вычислительной техники. Во-вторых, с помощью ЭС специалисты, не знающие программирования, могут самостоятельно разрабатывать интересующие их приложения, что позволяет расширить сферу использования вычислительной техники. В-третьих, ЭС при решении практических задач достигают результатов, не уступающих, а иногда и превосходящих возможности людей-экспертов, не оснащенных ЭС.

В настоящее время технология ЭС получила широкое распространение. Так, на американском и западноевропейском рынке систем искусственного интеллекта организациям, желающим создать ЭС, фирмы разработчики предлагают сотни инструментальных средств для их построения. Тысячи прикладных ЭС способны успешно решать специализированные задачи. Это позволяет говорить о том, что ЭС сейчас составляют мощную ветвь в индустрии программных средств.

Вместе с тем следует отметить, что на пути к тому прочному положению, которое ЭС теперь занимают в качестве важного компонента новой информационной технологии, были и спады и подъемы. ЭС довелось пережить и период безграничной веры во всемогущество, и период, когда высказывались сомнения в их полезности вообще. Неэффективность ЭС проявлялась, как правило, лишь в случаях их некорректного применения, или на низко производительной аппаратуре, не соответствующей сложности предметной области, или в задачах, для решения которых они не предназначались.

Разочарование постигало разработчиков ЭС, как правило, тогда, когда они пытались их использовать в качестве инструмента для решения задач, требующих привлечения чисто человеческих приемов мышления, – аналогий, ассоциаций и интуиции. Следует отметить, что перечисленные выше приемы мышления вначале отсутствовали в ЭС даже в зачаточном состоянии.

Компьютерные системы, которые могут лишь повторить логический вывод эксперта, принято относить к ЭС первого поколения.

Однако специалисту, решающему интеллектуально сложную задачу, нужно, чтобы ЭС выступала в роли полноценного помощника и советника. ЭС должна быть способна проводить анализ нечисловых данных, выдвигать и отбрасывать гипотезы, оценивать достоверность фактов, самостоятельно пополнять свои знания, контролировать их непротиворечивость, делать заключения на основе прецедентов и, может быть, даже порождать решение новых, ранее не рассматривавшихся задач. Наличие таких возможностей является характерным для ЭС второго поколения. Экспертные системы, относящиеся ко второму поколению, называют партнерскими системами или усилителями интеллектуальных способностей человека. Их общими отличительными чертами является умение обучаться и развиваться, т.е. эволюционировать.

В настоящее время ЭС применяются в различных областях человеческой деятельности: химии, геологии, медицине и т.д. Наибольшее распространение ЭС получили в проектировании интегральных микросхем, в поиске неисправностей, в военных приложениях и автоматизации программирования.

Применение ЭС позволяет [5]:

  • при проектировании интегральных микросхем повысить (по данным фирмы NEC) производительность труда в 3–6 раз, при этом выполнение некоторых операций ускоряется в 10–15 раз;
  • ускорить поиск неисправностей в 5–10 раз;
  • повысить производительность труда программистов (по данным фирмы Toshiba) в 5 раз;
  • при профессиональной подготовке сократить (без потери качества) в 8–12 раз время на индивидуальную работу с обучаемым персоналом.

В настоящее время ведутся разработки ЭС для следующих приложений: раннее предупреждение национальных и международных конфликтов и поиск компромиссных решений; принятие решений в кризисных ситуациях; охрана правопорядка; законодательство; образование; планирование распределения ресурсов; системы организационного управления (кабинет министров, муниципалитет, учреждения) и т.д.

Рассмотрим наиболее популярные ЭС. Система PROSPECTOR предназначена для выдачи геологам следующей информации: о наличии в анализируемой местно сти залежей полезных ископаемых; об оценке геологических ресурсов района, о выборе мест, благоприятных для бурения. Система создана фирмой SRI International. Работы над системой начаты в 1974 г. и продолжались до 1983 г. Трудозатраты на создание системы оцениваются в 30 человеко-лет, система достигла промышленной стадии. При этом БЗ системы содержат свыше 1000 правил и включают классификацию более 1000 геологических понятий.

Система PROSPECTOR решает задачи, не вникая в суть происходящих в проблемной области процессов. Состояние проблемной области описывается в виде утверждений о проблемной области, например: “условия района благоприятны”. В системе реализованы объяснительные возможности, выявляющие причины задания вопроса или состояние решения задачи. Во время решения задач не вводится новых утверждений о проблемной области. Все утверждения должны быть априорно перечислены экспертом.

Система MYCIN разработана в Стэндфордском университете и достигла стадии действующего прототипа. Назначение системы – оказание помощи лечащим врачам в постановке диагноза и назначение лечения в сложных случаях инфекционных заболеваний крови. Цель системы – определить организмы, являющиеся причиной заболевания, и назначить антибиотики избирательного действия. Система способна давать объяснения, ПОЧЕМУ потребовалась запрашиваемая информация и КАК получен результат. Система содержит около 800 правил.

Система R1 предназначена для определения конфигурации компонентов ЭВМ VAX 11/780, удовлетворяющей требованиям заказчика. В состав ЭВМ VAX 11/780 входит 420 компонентов, каждый из которых может иметь до 8–10 характеристик. Естественно, что число возможных конфигураций, построенных из этих компонентов, достаточно велико. Система выполняет следующие функции: определяет, не содержит ли заказ пользователя несовместимых компонентов, и выявляет недостающие; выдает конфигурацию ЭВМ VAX 11/780, которая используется при установке системы, заказчику; учитывает обусловленные заказчиком ограничения. До создания системы решением этих задач на фирме занимались квалифицированные специалисты, тем не менее, часто допускающие ошибки. Система достигла коммерческой стадии существования, объём ее БЗ 3000 правил языка OPS-5. Система работает в интерактивном режиме. Средства объяснения реализованы в виде заранее записанных текстов. Эффективность решения задач вызвана тем, что каждый шаг выполняется тогда, когда для этого имеется достаточно информации, чтобы его можно было сделать точно и в дальнейшем никогда не пересматривать. Поэтому процесс проектирования сводится к постоянному расширению частичной конфигурации. Усовершенствованная со временем система R1 получила название XCON.

К отечественным ЭС на ПЭВМ относится МОДИС-2, предназначенная для диагностики различных форм симптоматической гипертонии. Гипертонией страдают 10 % населения Земли. Причины повышения артериального давления очень разнообразны – более 30 основных заболеваний. Сложность диагностики этих заболеваний состоит в том, что они могут относиться к компетенции специалистов из различных областей медицины: нефрологии, ангиологии, урологии и т.п.

ЭС МОДИС-2 имеет важную особенность. Ее использование предполагается как в поликлиниках общего профиля, так и в специализированных учреждениях. Уровень доступной информации о больном в этих заведениях может быть разным. В поликлинике доступна информация общего характера: жалобы пациента, данные внешнего осмотра, история болезни и результаты общих анализов. В этом случае ЭС должна дать рекомендации, к каким специалистам следует обратиться, направить на специальные исследования. Таким образом, на основе имеющейся информации общего характера ЭС должна сузить круг подозреваемых заболеваний, выбрать наиболее вероятные. При использовании ЭС в специализированном учреждении может быть доступна более детальная информация о больном – данные специальных исследований. В этом случае ЭС должна ставить по возможности точный диагноз.

1.5. Теоретические аспекты извлечения знаний

Можно выделить три основных аспекта извлечения знаний: психологический, лингвистический и гносеологический.

Из перечисленных аспектов извлечения знаний психологический аспект является ведущим, так как он определяет эффективность взаимодействия инженера по знаниям и эксперта. Общение или коммуникация (лат. communicatio – связь) является междисциплинарным понятием, обозначающим все формы непосредственных контактов между людьми – от дружеских до деловых. Указанное понятие широко исследуется в психологии, философии, социологии, лингвистике и других науках [1].

Установлено, что общение не сводится к однонаправленному процессу передачи сообщений или двухтактному обмену порциями сведений. Скорее, общение можно охарактеризовать в виде нерасчлененного процесса циркуляции информации, целью которого является совместный поиск истины.

Таким образом, в результате общения вырабатывается новая информация, общая для всех участвующих в общении людей. Следует отметить, что культурой и наукой общения на профессиональном уровне владеют единицы.

Выделяются четыре основных уровня общения:

  1. Уровень манипулирования, когда один субъект рассматривает другого как средство или помеху по отношению к проекту своей деятельности.
  2. Уровень “рефлексивной игры”, когда человек учитывает контрпроект другого субъекта, но не признает его ценность и стремится к реализации своего проекта.
  3. Уровень правового общения, когда субъекты признают право на существование проектов деятельности друг друга и пытаются согласовать их хотя бы внешне.
  4. Уровень нравственного общения, когда субъекты внутренне принимают общий проект взаимной деятельности.

Для достижения поставленной цели инженер по знаниям должен уметь общаться с экспертами на высшем четвертом уровне.

Как известно, потери информации при разговорном общении велики (рис. 1.2) [1]. В связи с этим представляет интерес увеличение информативности общения аналитика и эксперта за счет применения психологических знаний.

 Рис. 1.2. Потери информации при разговорном общении Психологи-3

Рис. 1.2. Потери информации при разговорном общении

Психологи отмечают, что на коллективный процесс влияет атмосфера, возникающая в группе участников. Результаты экспериментов показывают, что зачастую дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные особенности участников. При этом важным является то, чтобы в коллективе складывались кооперативные, а не конкурентные отношения. Кооперация характеризуется атмосферой сотрудничества и взаимопомощи, что соответствует уровню нравственного общения. Отношения конкурентного типа характеризуются атмосферой индивидуализма и соперничества.

Можно выделить ряд особенностей личности, оказывающих влияние на эффективность процесса извлечения знаний. Под личностью обычно понимается система психологических черт, характеризующая индивидуальность человека. Рекомендуемыми компонентами личности инженера по знаниям являются: доброжелательность, хорошая память, внимание, наблюдательность, воображение, собранность, настойчивость, общительность, находчивость.

Как известно, флегматики и меланхолики медленнее усваивают информацию. Поэтому для обеспечения психологического контакта с ними не нужно задавать беседе быстрый темп и торопить их с ответом.

На эффективность коллективного решения задач влияет мотивация (стремление к успеху). Если некоторые эксперты охотно делятся своим опытом, то другие неохотно открывают свои профессиональные секреты. Поэтому инженер по знаниям должен изыскивать стимулы для экспертов. В некоторых случаях бывает полезно вызвать у эксперта стремление к соперничеству и конкуренции. При этом, конечно, нужно постараться не нарушить обстановку сотрудничества и взаимопомощи в коллективе.

Беседу с экспертом лучше проводить наедине, поскольку посторонние нарушают доверительность беседы. Атмосфера замкнутости пространства и уединенности способствует эффективности беседы. Считается, что для делового общения наиболее благоприятной является дистанция от 1,2 до 3 метров. Минимальное комфортное расстояние составляет 0,7 метра. Продолжительность сеанса не должна превышать 2 часов. Через 2025 минут беседы обычно происходит взаимная утомляемость партнеров. Поэтому в сеансе извлечения знаний необходимо предусмотреть паузы [1].

Для увеличения эффективности процесса извлечения знаний применяется наглядный материал. Людей, занимающихся интеллектуальной деятельностью, можно отнести к художественному или мыслительному типу. Индивидуумы, относящиеся к первому типу, лучше воспринимают зрительную информацию в форме рисунков и графиков. Дело в том, что эта информация воспринимается через первую сигнальную систему. Эксперты мыслительного типа лучше понимают язык формул и текстовую информацию. Существенным является то, что большую часть информации человек получает от зрения. Поэтому в процедуре извлечения знаний целесообразно активно использовать наглядный материал.

Наиболее распространенным способом протоколирования результатов является их запись на бумагу аналитиком в ходе беседы с экспертом. Однако здесь существует опасность потери знаний, так как запись ответа по сути уже является интерпретацией. Интерпретация зависит от степени понимания предмета аналитиком.

Аналитику необходимо учитывать индивидуальный темп и стиль участия в беседе эксперта. Отрицательный результат дает навязывание аналитиком собственного темпа и стиля.

На успех беседы влияет длина фраз. Установлено, что человек лучше всего воспринимает предложения длиной слова (число Ингве–Миллера). Опытные лекторы, используя короткие фразы в лекции, сводят потерю информации до 3 %. Несоблюдение этого принципа может приводить к потере до 20–30 % информации [1].

Лингвистический аспект извлечения знаний относится к исследованиям возникающих при этом языковых проблем. Различие языков, на которых говорят эксперт и аналитик, обусловливает возникновение языкового барьера между ними. Эти два языка являются отражением “внутренней речи” эксперта и аналитика. Психологи и эксперты полагают, что язык является основным средством мышления.

Можно предположить, что бытовой язык у эксперта и аналитика приблизительно совпадает. Наиболее существенное отличие заключается в знании общенаучной и специальной терминологии, принятой в предметной области. Поэтому перед партнерами появляется задача в выработке общего языка, который необходим для успешного взаимодействия.

Гносеологический аспект извлечения знаний связан с теорией отражения действительности в сознании человека. При этом вначале действительность отображается в сознании эксперта. Затем опыт эксперта интерпретируется сознанием инженера по знаниям. Далее происходит построение третьей интерпретации в виде поля знаний экспертной системы [1].

Классификация методов извлечения знаний. Ранее нами предполагалось, что взаимодействие инженера по знаниям и эксперта осуществляется в форме непосредственного живого общения. Однако это далеко не единственная форма извлечения знаний. На рис. 1.3 приведена классификация методов извлечения знаний [1].

Коммуникативные методы извлечения знаний охватывают методы и процедуры контактов инженера по знаниям с непосредственным источником знаний – экспертом, а текстологические включают методы извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников).

1.6. Коммуникативные методы извлечения знаний

Коммуникативные методы извлечения знаний можно разделить на активные и пассивные.

Пассивные методы подразумевают, что ведущую роль в процедуре извлечения знаний играет эксперт, а инженер по знаниям только протоколирует высказывания эксперта во время его работы. В активных методах инициативой владеет инженер по знаниям, который контактирует с экспертом различными способами: в играх, диалогах, беседах за круглым столом. Следует отметить, что активные и пассивные методы могут чередоваться даже в рамках одного сеанса извлечения знаний.

 Рис. 1.3. Классификация методов извлечения знаний Активные методы -5

Рис. 1.3. Классификация методов извлечения знаний

Активные методы можно разделить на две группы, в зависимости от числа экспертов, отдающих свои знания. Если их число больше одного, то целесообразно, кроме индивидуальных контактов с каждым, применять и методы групповых обсуждений предметной области. Групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять различные аспекты их знаний. И тем не менее индивидуальные методы извлечения знаний являются наиболее продуктивными, поскольку деликатная процедура передачи знаний не терпит лишних свидетелей.

Игровые методы широко используются в социологии, экономике, менеджменте и педагогике для подготовки руководителей, учителей, врачей и других специалистов. В игре человек раскрепощается и чувствует себя намного свободнее, чем в обычной трудовой деятельности.

На выбор метода извлечения знаний влияют три фактора:

  • личностные особенности инженера по знаниям;
  • личностные особенности эксперта;
  • характеристика предметной области.

Существуют три типа классификации людей по психологическим характеристикам [1]:

  • мыслитель (познавательный тип);
  • собеседник (эмоционально-коммуникативный тип);
  • практик (практический тип).

Мыслители ориентированы на интеллектуальную работу, теоретические обобщения. Собеседники – это общительные, открытые люди, готовые к сотрудничеству. Практики предпочитают действия разговорам, хорошо реализуют замыслы других.

Предметные области можно классифицировать следующим образом:

  • хорошо документированные;
  • средне документированные,
  • слабо документированные.

Остановимся подробнее на пассивных методах извлечения знаний. В пассивных методах ведущая роль при извлечении знаний передается эксперту, а инженер по знаниям только фиксирует рассуждения эксперта во время принятия решений [1].

Пассивные методы извлечения знаний реализуются в виде:

  • наблюдений;
  • анализа протоколов “мыслей вслух”;
  • лекций.

Во время наблюдений инженер по знаниям находится рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности и фиксирует все действия эксперта, его реплики и объяснения. Полезна видеозапись всего процесса в реальном масштабе времени. Следует отметить, что именно этот метод извлечения знаний является наиболее “чистым” методом, исключающим навязывание инженером по знаниям своих представлений эксперту.

В случае протоколирования “мыслей вслух” эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, представить всю цепочку своих рассуждений. Во время рассуждений эксперта все его слова, паузы и междометия протоколируются инженером по знаниям. Использование магнитофона не всегда возможно, так как его применение в некоторых случаях негативно действует на эксперта и разрушает атмосферу доверительности. Основной проблемой в этом методе является принципиальная сложность для любого человека объяснить, как он думает. Существует экспериментальное психологическое доказательство того, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Автор теории фреймов М. Минский считает, что “только как исключение, а не как правило, человек может объяснить то, что он знает” [1].

Лекция является самым испытанным способом передачи знаний. Необходимо сформулировать эксперту тему и задачу лекции. Искусство ведения конспекта заключается в выделении главного, фиксировании фрагментов, записи только осмысленных предложений и помехоустойчивости инженера по знаниям. Рекомендуемая стандартная продолжительность лекции – 40–50 минут, и после перерыва (5–10 минут) вновь проводится лекция такой же продолжительности. Курс обычно содержит от 2 до 5 лекций [1].

Активные индивидуальные методы извлечения знаний являются самыми распространенными. К ним относятся:

  • анкетирование;
  • интервью;
  • свободный диалог;
  • игры с экспертом.

В активных методах инженер по знаниям пишет сценарий и режиссирует сеансы извлечения знаний.

Анкетирование является наиболее стандартизованным методом. В этом случае инженер по знаниям составляет анкету, размножает ее и использует для опроса нескольких экспертов. Это основное преимущество анкетирования. На основе опыта работы с анкетами, накопленного в социологии и психологии, выработаны следующие рекомендации для составителей анкет:

  • анкета не должна быть монотонной и однообразной, чтобы не вызывать скуку и усталость; необходимо варьировать формы вопросов, менять тематику вопросов, вставлять вопросы-шутки и игровые вопросы;
  • анкета должна быть приспособлена к языку экспертов;
  • следует учитывать, что вопросы влияют друг на друга и поэтому последовательность вопросов должна быть хорошо продумана;
  • должен соблюдаться принцип оптимальной избыточности; как правило, в анкете необходимыми являются лишь часть вопросов, называемых контрольными, остальные должны быть минимизированы.

Под интервью понимается специфическая форма общения инженера по знаниям и эксперта. При этом инженер по знаниям задает эксперту серию заранее подготовленных вопросов с целью извлечения знаний о предметной области. Основное отличие интервью от анкетирования состоит в том, что оно позволяет аналитику опускать ряд вопросов в зависимости от ситуации, генерировать новые вопросы, изменять темп и разнообразить ситуацию общения.

Полезно включать в интервью следующие вопросы [1]:

  • контактные (ломающие лед между аналитиком и экспертом);
  • буферные (для разграничения различных тем интервью);
  • оживляющие память экспертов ( для реконструкции отдельных случаев из практики);
  • “провоцирующие” (для получения спонтанных, неподготовленных ответов).

Основные характеристики вопроса, от которых зависит качество интервью, заключаются в следующем:

  • язык вопроса (понятность, лаконичность, терминология);
  • порядок вопросов (логическая последовательность и немонотонность);
  • уместность вопросов (этика, вежливость).

Вопрос в интервью – это не только средство общения, но и способ передачи мысли и позиции инженера по знаниям.

“Вопрос представляет собой форму движения мысли, в нем ярко выражен момент перехода от незнания к знанию, от неполного, неточного знания к более полному и более точному” [1]. Поэтому необходимо фиксировать в протоколах не только ответы, но и вопросы.

Свободный диалог – это метод извлечения знаний в форме беседы инженера по знаниям и эксперта, в котором нет жестко регламентированного плана и вопросника. Квалифицированная подготовка к диалогу помогает инженеру по знаниям стать сценаристом будущих сеансов и запланировать плавную процедуру извлечения знаний: от приятного впечатления в начале беседы переходят к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта. Чтобы разговорить эксперта, желательно вначале рассказать ему о себе, о своей работе.

Следует отметить, что для определения профессиональной пригодности инженера по знаниям необходимо проведение предварительного психологического тестирования. Образец портрета инженера по знаниям перед серией свободных диалогов выглядит так [1]: “Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым и ухоженным”.

Важно правильно выбрать ритм беседы: без больших пауз, чтобы эксперт не отвлекался, но и без гонки, чтобы оба участника не утомлялись. Умение чередовать темп беседы, напряжение и разрядку в беседе существенно влияет на результат.

К активным групповым методам извлечения знаний относятся ролевые игры, дискуссии за “круглым столом” с участием нескольких экспертов и “мозговые штурмы”. Преимущество групповых методов состоит в одновременном извлечении знаний от нескольких экспертов и возможности генерации экспертами новых идей в процессе взаимодействия друг с другом.

Метод круглого стола предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Как правило, участники высказываются в определенном порядке, а затем переходят к живой свободной дискуссии. Число участников дискуссии составляет 3–7 человек.

Следует отметить, что поведение человека в группе иное, чем наедине с инженером по знаниям. Желание произвести впечатление на коллег будет приводить к изменению высказываний экспертов. Так, зачастую члены ученого совета на защите диссертации спрашивают не то, что им действительно интересно, а то, что демонстрирует их собственную компетентность.

Перед началом дискуссии ведущему необходимо:

  • убедиться, что все правильно понимают задачу (сеанс извлечения знаний);
  • установить регламент;
  • четко сформулировать тему.

Дискуссии полезны и для самих экспертов, особенно для тех, кто знает меньше. Это отмечалось еще Эпикуром: “При философской дискуссии больше выигрывает побежденный – в том отношении, что он умножает знания” [1].

Активные групповые методы обычно применяют как дополнительные к традиционным индивидуальным методам для активизации мышления и поведения экспертов.

“Мозговой штурм” является одним из наиболее распространенных методов активизации творческого мышления. Впервые этот метод был использован в 1939 г. в США А. Осборном как способ получения новых идей в условиях запрещения критики. Установлено, что критика мешает творческому мышлению, поэтому основная идея штурма – это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей [1].

Как правило, процесс штурма длится около 40 минут. Участникам (до 10 человек) предлагается высказывать любые идеи на заданную тему, при этом критика запрещена. Обычно высказывается более 50 идей. Регламент составляет до 2 минут на выступление. Самым интересным моментом штурма является достижение максимума числа гипотез, непроизвольно генерируемых участниками. Этот пик имеет теоретическое обоснование в работе швейцарского ученого З. Фрейда о бессознательном. При дальнейшем анализе всего лишь 10–15 % идей оказываются разумными и среди них встречаются оригинальные. Оценивает результаты обычно группа экспертов, не участвовавших в генерации гипотез.

Ведущий мозгового штурма (инженер по знаниям) должен свободно владеть аудиторией, не зажимать плохие идеи, так как они могут быть катализаторами хороших идей. Основной девиз штурма – “чем больше идей, тем лучше”. Ход сеанса протоколируется или записывается на магнитофон.

Представляет интерес остановиться еще на одном методе извлечения знаний – экспертных играх. Игрой называется такой вид человеческой деятельности, который отражает (воссоздает) другие ее виды [1]. Понятие экспертной игры, или игры с экспертами в целях извлечения знаний, формировалось на основе трех разновидностей игр:

  • деловых игр, широко используемых при подготовке специалистов и моделировании;
  • диагностических игр;
  • компьютерных игр, применяемых в обучении.

Под деловой игрой понимается эксперимент, где участникам предлагается производственная ситуация и они на основании своего жизненного опыта и специальных знаний и представлений принимают решения. На основе анализа решений вскрываются закономерности мышления участников эксперимента, что является полезным для получения знаний. Деловая игра превращается в экспертную игру, если ее участниками становятся эксперты.

Диагностическая игра – это деловая игра, применяемая для диагностики методов принятия решения в медицине. Эта игра возникла при исследовании способов передачи знаний от опытных врачей новичкам. Таким образом, в диагностических играх до сих пор исследовалась лишь одна предметная область – медицина [1].

Компьютерные игры классифицируются следующим образом:

  • Action/Arcade games. Игры-действия. Требуют хорошего глазомера и быстрой реакции;
  • 3D Action games, то же, что и предыдущее, но с активным использованием трехмерной графики;
  • Simulation games. Базируются на моделировании реальной действительности и отработке практических навыков в вождении автомобиля, самолета, поезда, в выполнении функций авиадиспетчера и т.д.;
  • Strategy games. Стратегические игры требуют стратегического планирования и ответственности при принятии решений, например: развитие цивилизации, экономическая борьба. Особым классом стратегических игр являются военные игры (wargemes);
  • Puzzles. Компьютерные реализации различных логических игр;
  • Adventure/Quest. Приключенческие игры обладают разветвленным сценарием, красивой графикой и звуком. Управляя одним или несколькими персонажами, игрок должен правильно вести диалоги, разгадывать множество загадок и головоломок;
  • Role-playing games (RPG). Ролевые игры являются распространенным жанром, берущим начало в английских настольных играх. Существует один или несколько персонажей, обладающих индивидуальными способностями и характеристиками. Им приходится сражаться с врагами, решать загадки. По мере выполнения этих задач у героев накапливается опыт и их способности и характеристики улучшаются.

Плодотворность моделирования реальных ситуаций в играх подтверждается сегодня практически во всех областях науки и техники. Они развивают логическое мышление, умение быстро принимать решение и вызывают интерес у экспертов.

1.7. Текстологические методы извлечения знаний

Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний. Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста.

При извлечении знаний аналитику, интерпретирующему текст, приходится решать задачу декомпозиции этого текста на компоненты для выделения истинно значимых для реализации базы знаний фрагментов. К компонентам можно отнести: наблюдения; научные понятия; субъективные взгляды; общие места; заимствования.

Сложность интерпретации научных и специальных текстов заключается еще и в том, что любой текст приобретает смысл только в контексте, где под контекстом понимается окружение, в которое “погружен” текст. Различают микроконтекст и макроконтекст. Микроконтекст – это ближайшее окружение текста. Так, предложение получает смысл в контексте абзаца, абзац – в контексте главы и т.д. Макроконтекст – это вся система знаний, связанная с предметной областью (т.е. знания об особенностях и свойствах, явно не указанных в тексте).

На языке современного языкознания понимание – это формирование второго текста, т.е. семантической структуры.

Основными моментами процесса понимания текста являются:

  • выдвижение предварительной гипотезы о смысле всего текста;
  • определение значений непонятных слов (т.е. специальной терминологии);
  • возникновение общей гипотезы о содержании текста;
  • уточнение значения терминов и интерпретация отдельных фрагментов текста под влиянием общей гипотезы (от целого к частям);
  • формирование смысловой структуры текста за счет установления внутренних связей между отдельными ключевыми словами и фрагментами, а также за счет образования абстрактных понятий, обобщающих конкретные фрагменты знаний;
  • корректировка общей гипотезы относительно содержащихся в тексте фрагментов знаний (от частей к целому);
  • принятие основной гипотезы.

При этом существенным является наличие как дедуктивной (от целого к частям), так и индуктивной (от частей к целому) составляющей процесса понимания. Благодаря этому удается при понимании текста учесть основные признаки текста: связность, цельность и законченность.

Центральным моментом процесса понимания является выделение “опорных”, ключевых слов или “смысловых вех” в тексте, и дальнейшее их связывание в единую семантическую структуру [1].

При анализе текста выделяют два вида связей – эксплицитные (явные связи) и имплицитные (скрытые связи). Эксплицитные связи выражаются во внешнем дроблении текста, они делят текст на параграфы с помощью перечисления компонентов, вводных слов типа “во-первых…, во-вторых…, однако и т. д.”. Имплицитные связи между “смысловыми вехами” вызывают основное затруднение при понимании.

Семантическая структура текста образуется в сознании познающего субъекта с помощью знаний о языке, о мире, общих знаний о предметной области, которой посвящен текст. Таким образом, для адекватного понимания текста необходима предварительная подготовка.

Подготовкой к прочтению специальных текстов является выбор совместно с экспертами базового списка литературы, который постепенно введет аналитика в предметную область. В этом списке, как правило, содержатся учебники, фрагменты из монографий, популярные издания. После ознакомления с указанным списком целесообразно приступать к чтению специальных текстов.

Следует подчеркнуть, что процедура разбивки текста на части (“смысловые группы”), а затем сгущение, сжатие содержимого каждого смыслового блока в “смысловую веху” является основой для любого процесса понимания. Представление текста в виде набора ключевых слов, передающих основное содержание текста, является методологической основой для проведения текстологических процедур извлечения знаний.

В качестве ключевого слова может служить любая часть речи (существительное, глагол, прилагательное и т. д.) или их сочетание. Набор ключевых слов – это набор опорных точек, по которым развертывается текст при кодировании в память и осознается при декодировании.

Алгоритм извлечения знаний из текста можно представить в следующем виде:

1. Составление базового списка литературы для ознакомления с предметной областью и чтение по списку.

2. Выбор текста для извлечения знаний.

3. Первое знакомство с текстом (беглое прочтение); для определения значения незнакомых слов – консультации со специалистами или привлечение справочной литературы.

4. Формирование первой гипотезы о макроструктуре текста.

5. Внимательное прочтение текста с выписыванием ключевых слов и выражений, т.е. выделение “смысловых вех” (компрессия текста).

6. Определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или сжатого текста (реферата).

7. Формирование поля знаний на основании макроструктуры текста.

Глава 2
МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

2.1. Представление знаний и выводы в экспертных системах

Характерная особенность ЭС, отличающая их от традиционных систем обработки информации, заключается в оперировании знаниями. Формализм описания такого рода информации определяется как представление знаний. Компонент, который использует для решения проблем знания экспертов, описанные в заранее выбранной для них форме представления, является механизмом вывода. В системах с базами знаний, в том числе и экспертных системах, представление знаний является фундаментальным понятием. Решение о выборе способа представления знаний оказывает существенное влияние на любую их составную часть.

Можно сказать, что представлением знаний определяются возможности системы базы знаний. И наоборот, чтобы система обработки знаний отвечала определенным прикладным потребностям, должно быть создано соответствующее представление знаний. Поскольку представление знаний является средством описания знаний человека, то желательно, чтобы его описательные возможности были как можно выше. С другой стороны, если форма представления становится излишне сложной, то усложняется и механизм выводов, при этом не только затрудняется проектирование ЭС, но и возникает опасность потери достоверности выполняемых ею действий. В конечном итоге проектирование представления знаний предусматривает выработку всех этих условий, а затем и выбор решения на основе некоторого компромисса между ними.

Наиболее распространенными моделями представления знаний в экспертных системах являются [1–14]:

  • модель представления знаний средствами логики предикатов первого порядка;
  • продукционная модель;
  • фреймовая модель;
  • модель представления знаний в виде семантической сети;
  • модель представления знаний в виде доски объявлений;
  • модель представления знаний в виде сценария;
  • модель представления знаний на основе нечеткой логики;
  • нейросетевая модель представления знаний.

Первые шесть моделей представления знаний будут рассмотрены в данной главе. Модель представления знаний на основе нечеткой логики излагается в четвертой главе.

В настоящее время для настройки и обучения искусственных нейронных сетей все чаще применяются генетические алгоритмы. С их помощью создаются искусственные нейронные сети, адаптированные для решения конкретных задач. В пятой главе рассматривается генетический алгоритм, и даются рекомендации для его программной реализации [20–33]. Нейросетевой модели посвящена шестая глава. Знания в нейросетевой модели представляются неявным образом посредством задаваемой топологии сети, весов связей и типов функции активации [14–19].

2.2. Модель представления знаний средствами

логики предикатов первого порядка

Одним из наиболее важных способов представления знаний является представление знаний средствами логики предикатов первого порядка. Этот способ является основой языка Пролог [4, 7, 8].

В основе такого представления лежит язык математической логики, позволяющий формально описывать понятия математической логики и связи между ними. В естественном языке существуют грамматические правила, которые задают его синтаксис. Эти правила не связаны со значением слов, т.е. с семантикой языка. Основными компонентами естественного языка являются слова (существительные, глаголы, предлоги, наречия, прилагательные), предложения и контексты. Правила языка задают порядок следования слов в предложениях.

Язык, предназначенный для формализации знаний, должен иметь собственный синтаксис и располагать средствами для выражения связей между объектами реального мира. Указанному требованию удовлетворяет язык исчисления предикатов или логики первого порядка. Логика предикатов рассматривает отношения между утверждениями и объектами.

Предикатом называется функция, принимающая только два значения – истина и ложь – и предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием. Константы служат для именования объектов предметной области. Логические предложения или высказывания образуют атомарные формулы.

Логический вывод осуществляется с помощью силлогизма (если из A следует B, а из B следует C, то из A следует C).

Логика предикатов является основой языка программирования Пролог, разработанного Алэном Колмероэ из Марсельского университета (Франция) в 1973 г. [7, 8].

Представляет интерес более детально остановиться на основных понятиях и определениях, применяемых в логике предикатов первого порядка [3].

Определение формальной системы

Формальной системой называют множество абстракт­ных объектов, в котором определены правила манипулирова­ния множеством символов, обработанных синтаксическим об­разом, т.е. без учета смысла (семантики). Формальную систему составляют [3]:

  1. конечный алфавит (конечное множество симво­лов);
  2. процедура образования формул (или слов) фор­мальной системы;
  3. множество формул, называемых аксиомами;
  4. конечное множество правил вывода, позволяю­щих получать конечное множество формул.

Эти правила могут быть представлены в виде и и... и и и... и . Здесь и – формулы формальной системы, а стрелка читается как "влечет" или "следует".

Формальную систему иногда называют аксиоматиче­ской, формальной теорией или просто множеством формул. Алфавит предполагается конечным и его иногда назы­вают словарем. Он содержит константы, переменные и опера­торы.

Процедура образования формул определяет синтаксиче­ское и грамматическое построение символов из уже сформу­лированных символов. Она отличается от правил вывода.

Формальное доказательство (или просто доказательст­во) определяется как конечное множество формул , таких, что каждая формула либо является аксиомой, либо выводится с помощью правил вывода из предшествующих формул.

Формула t называется теоремой, если существует дока­зательство, в котором она является последней, т.е. . В частности, всякая аксиома является теоремой. Тот факт, что формула является теоремой, обозначается как t. Правила вывода позво­ляют определить, является ли данная формула теоремой дан­ной формальной системы. Различают два типа правил вывода. Правила первого типа применяются к формулам, рассчиты­ваемым как единое целое (в этом случае их называют продук­циями, правилами продукции, или продукционными правила­ми). Правила второго типа могут применяться к любой отдель­ной части формулы, причем сами эти части являются форму­лами. Такие правила назы­вают правилами переписывания.

Так, в математике правило вывода « и влечет » применяется к формуле как к целому. Это продукция с двумя посылками. Слово "влечет" часто заменяется стрелкой . В отличие от предыдущего правила, истинно при любом подвыражении х. Оно является правилом переписывания, и в этом случае для обозначения слова "влечет" используется спе­циальная стрелка .

Пример

  1. Алфавит: T, S, A.
  2. Формула: любая последовательность символов алфавита.
  3. Аксиома: TA.
  4. Правила вывода:

a) (продукция),

b) (продукция),

c) (переписывание),

d) (переписывание).

Правило a является продукцией и применяется только тогда, когда последняя буква теоремы есть A. Таким образом, из теоремы “TASTA” можно вывести “TASTAS”. Следует отметить, что символ t не принадлежит формальной системе и играет роль некоторого слова. Так, правило b позволяет из теоремы “TSA” вывести теорему “TSASA”. Правило c позволяет переход, например, от “TSAAAST” к “TSSST”. Правило d заменяет в “TASSSSV” каждые два S пробелом и в результате получаем “TAV”.

Формальные системы предназначены для получения умозаключений без рассмотрения смысла обрабатываемых заключений. То есть элементы, на основании которых делаете умозаключение, могут быть произвольным образом заменены другими по смыслу элементами.

Например, в абстрактной модели:

“Любой X есть Y.

Если Z есть X,

то Z есть Y.”

используются переменные X, Y, Z. Слова-связи: “если”, “то”, “или” и др. называются операторами.

Синтаксис языка предикатов первого порядка

Предикатом, или логической функцией, называется функция от любого числа аргументов, принимающая истинностные значения: И (истина – 1) и Л (ложь – 0). Аргументы принимают значения из произвольного, конечного или бесконечного множества D, называемого предметной областью. Предикат от п аргументов называют п-местным предикатом [3].

Предикат F(x), определенный на предметной области D, задает определенное свойство элементам множества D и интерпретируется как высказывание “х обладает свойством F”, причем F принимает значение И, если это высказывание истинно, и значение Л, если оно ложно. Предикат задает отношение между элементами и интерпретируется как высказывание “ находятся между собой в отношении F”. Пусть, например, D – множество натуральных чисел. Тогда предикат F(x) может обозначать, что “х – четное число" или “х – нечетное число”, а предикат G(x,y) – “х больше у” или “х делится на y” и т.д.

Алфавит языка предикатов первого порядка включает множество следующих символов:

  • разделители: запятая, открывающая и закрывающая скобки;
  • константы, обозначаемые строчными буквами или соединением таких букв, например “друг”;
  • переменные, обозначаемые прописными буквами, например: X, АДРЕС;
  • предикаты, обозначаемые прописными буквами, например: Р, Q, БОЛЬШЕ;
  • функции, устанавливающие зависимость и отображающие значения одной предметной области в значения другой (или той же), n-местные функции могут служить аргументами предиката. Функции будем обозначать строчными буквами f, g;

• логические операции:

  1. ” (отрицание или дополнение). Высказывание “A” читается “не A”. Оно истинно (И), если высказывание А – ложно (Л);
  2. ” (конъюнкция). Высказывание "АВ" читается “А и B”. Оно истинно в том случае, когда истинно как A, так и B;
  3. ” (дизъюнкция). Высказывание "АВ" читается “А или B”. Оно истинно, если истинно хотя бы одно из высказываний;
  4. ” (импликация). Высказывание “AB” читает­ся "если A, то B". Оно ложно в том и только в том случае, если A истинно, а B ложно;
  5. ” (эквивалентность). Высказывание “АВ” читается “A тогда и только тогда, когда B”. Оно истинно тогда и только тогда, когда A и B имеют одно и то же истинностное значение;

• кванторы:

  1. ” (квантор существования). Высказывание A читается “существует A”;
  2. ” (квантор общности). Высказывание A чита­ется “для любого A”.

Пропозициональной формой, или формулой алгебры ло­гики, называют всякое высказывание, составленное из некото­рых исходных высказываний посредством логических опера­ций. Другими словами, если F и G – пропозициональные фор­мы, то F, (FG), (FG), (FG) и (FG) – пропозициональ­ные формы.

Определение формулы как основного объекта в логике предикатов включает понятие "терм".

Терм – выражение, включающее константы, перемен­ные или n-местные функции , где ­– термы. Нап­ример, вес(b) – термы.

Атом, или элементарная (атомная) формула, – это вы­ражение, включающее константы, переменные, функции и предикаты. Таким образом, если Р – N-местный предикат, а – термы, то – атом. Например, выражения P(X, зеленый), ABC являются атома­ми.

Формула, или правильно построенная формула, определяется следующим образом:

всякий атом есть ППФ;

если G и Н – ППФ, а Х – переменная, тогда

(H), (GH), (GH), (X)G, (X)H – ППФ.

Примерами ППФ являются:

Выражение "первого порядка" во фразе "исчисление предикатов первого порядка" связано с определением ППФ, в которых запрещается квантифицировать символы предикатов и функций. Например, не является ППФ логики предикатов первого порядка.

На практике ППФ используется для представления знаний. Например, ППФ может выражать "все матери есть женщины", условившись, что M(Х) означает: “X есть мать” и что F(X) означает: “Х – есть женщина”.

Правилом вывода называют процедуру, которая из одной или нескольких ППФ производит другие ППФ. Например, правило вывода: G и производит одну ППФ Н; из ППФ и любой константы “а” получают ППФ , при этом значения X в G заменяются на “а”. Исходные ППФ называют аксиомами, а ППФ, полученные из правил вывода, называют теоремами.

Семантика языка предикатов первого порядка

Интерпретация формул. Формула имеет определен­ный смысл, т.е. обозначает некоторое высказывание, если су­ществует какая-либо интерпретация. Интерпретировать фор­мулу – это значит связать с ней определенное непустое множе­ство D, т.е. конкретизировать предметную область, называе­мую также областью интерпретации [3] и указать:

  • для каждой константы в формуле – конкретный элемент из D;
  • для каждой n-местной функциональной буквы в формуле – конкретную n-местную функцию на D;
  • для каждой n-местной предикатной буквы в формуле – конкретное отношение между п эле­ментами из D.

Пример

Рассмотрим атом: и следующую ин­терпретацию:

– множество действительных чисел;

– функция сложения

– функция умножения

– отношение “не меньше”.

При такой интерпретации приведенная ниже формула обозначает высказывание “сумма 2+3 не меньше произведения 2*3”. Это утверждение неверно и поэтому . Если видоизменить интерпретацию, приняв b=1 или b=2, то .

Свойства правильно построенных формул. При за­данной интерпретации значения истинности ППФ можно вычислить по правилам, объединенным в таблице истинности.

Если F и G – любые две ППФ, то значения истинности составного выражения, построенного из этих ППФ, даются таблицей истинности [3] (табл. 3.1).

Т а б л и ц а 2.1

Таблица истинности

F G
И И Л И И И И
Л И И И Л И Л
И Л Л И Л Л Л
Л Л И Л Л И И


Pages:     || 2 | 3 | 4 | 5 |
 




<
 
2013 www.disus.ru - «Бесплатная научная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.