WWW.DISUS.RU

БЕСПЛАТНАЯ НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 

Pages:     | 1 || 3 | 4 |   ...   | 14 |

« А. П. Частиков Т. А. Гаврилова Д. Л.Белов РАЗРАБОТКА ЭКСПЕРТНЫХ СИСТЕМ. СРЕДА CLIPS Санкт-Петербург «БХВ-Петербург» 2003 ...»

-- [ Страница 2 ] --

Последовательность этапов дана только с целью получения общего пред­ставления о процессе создания идеального проекта, т. к. последовательность эта не вполне фиксирована. В действительности каждый последующий этап разработки может принести новые идеи, которые могут повлиять на преды­дущие решения и даже привести к их переработке. Именно поэтому многие специалисты по информатике весьма критично относятся к методологии экспертных систем. Они считают, что расходы на разработку таких систем очень большие, время разработки слишком велико, а полученные в резуль­тате программы накладывают тяжелое бремя на вычислительные ресурсы.

В целом за разработку экспертных систем целесообразно браться организации, где накоплен опыт по автоматизации рутинных процедур обработки информации, таких как:

  • формирование корпоративных информационных систем;
  • организация сложных расчетов;
  • работа с компьютерной графикой;
  • обработка текстов и автоматизированный документооборот.

Решение таких задач, во-первых, подготавливает высококвалифицированных специалистов по информатике, необходимых для создания интеллектуальных систем, во-вторых, позволяет отделить от экспертных систем неэкспертные задачи.

1.7.1. Выбор подходящей проблемы

Этот этап определяет деятельность, предшествующую решению начать разрабатывать конкретную ЭС. Он включает [Николов и др., 1990]:

  • определение проблемной области и задачи;
  • нахождение эксперта, желающего сотрудничать при решении проблемы, и назначение коллектива разработчиков;
  • определение предварительного подхода к решению проблемы;
  • анализ расходов и прибылей от разработки;
  • подготовку подробного плана разработки.

Правильный выбор проблемы представляет самую критическую часть разработки в целом. Если выбрать неподходящую проблему, можно очень быстро увязнуть в "болоте" проектирования задач, которые никто не знает, как решать. Неподходящая проблема может также привести к созданию эксперт­ной системы, затраты на которую выше приносимой ею экономии. Дело будет обстоять еще хуже, если разработать систему, которая работает, но неприемлема для пользователей. Даже если разработка выполняется самой организацией для собственных целей, эта фаза является подходящим мо­ментом для получения рекомендаций извне, чтобы гарантировать удачно выбранный и осуществимый с технической точки зрения первоначальный проект.

При выборе области применения следует учитывать, что если знание, необ­ходимое для решения задач, постоянное, четко формулируемое, и связано с вычислительной обработкой, то обычные алгоритмические программы, по всей вероятности, будут самым целесообразным способом решения проблем в этой области.

Экспертная система ни в коем случае не устранит потребность в реляцион­ных базах данных, статистическом программном обеспечении, электронных таблицах и системах текстовой обработки. Но если результативность задачи зависит от знания, которое является субъективным, изменяющимся, сим­вольным или вытекающим частично из соображений здравого смысла, тогда область может обоснованно выступать претендентом на экспертную систему.

Обычно экспертные системы разрабатываются путем получения специфиче­ских знаний от эксперта и ввода их в систему. Некоторые системы могут содержать стратегии одного индивида. Следовательно, найти подходящего эксперта — это ключевой шаг в создании экспертных систем.

В процессе разработки и последующего расширения системы инженер по знаниям и эксперт обычно работают вместе. Инженер по знаниям помогает эксперту структурировать знания, определять и формализовать понятия и правила, необходимые для решения проблемы.

Во время первоначальных бесед они должны решить, будет ли их сотрудни­чество успешным. Это немаловажно, поскольку обе стороны будут работать совместно, по меньшей мере, в течение одного года. Кроме них в коллектив разработчиков целесообразно включить потенциальных пользователей и профессиональных программистов. Подробно функции каждого члена кол­лектива описаны в следующем разделе.

Предварительный подход к программной реализации задачи определяется, исходя из характеристик задачи и ресурсов, выделенных на ее решение. Инженер по знаниям выдвигает обычно несколько вариантов, связанных с использованием имеющихся на рынке программных средств. Окончатель­ный выбор возможен лишь на этапе разработки прототипа.

После того как задача определена, необходимо подсчитать расходы и прибыль от разработки экспертной системы. В расходы включаются затраты на оплату труда коллектива разработчиков. В дополнительные расходы будет включена стоимость приобретаемого программного инструментария, с по­мощью которого будет разработана экспертная система.

Прибыль может быть получена за счет снижения цены продукции, повыше­ния производительности труда, расширения номенклатуры продукции или услуг или даже разработки новых видов продукции или услуг в области, в которой будет использоваться ЭС. Соответствующие расходы и прибыль от системы определяются относительно времени, в течение которого воз­вращаются средства, вложенные в разработку. На современном этапе боль­шая часть фирм, развивающих крупные экспертные системы, предпочли разрабатывать дорогостоящие проекты, приносящие значительную прибыль.

Можно ожидать развития тенденции разработки менее дорогостоящих сис­тем, хотя и с более длительным сроком окупаемости вложенных в них средств, т. к. программные средства разработки экспертных систем непре­рывно совершенствуются.



После того как инженер по знаниям убедился, что:

  • данная задача может быть решена с помощью экспертной системы;
  • экспертную систему можно создать предлагаемыми на рынке средствами;
  • имеется подходящий эксперт;
  • предложенные критерии производительности являются разумными;
  • затраты и срок их окупаемости приемлемы для заказчика,

он составляет план разработки. План определяет шаги процесса разработки и необходимые затраты, а также ожидаемые результаты.

1.7.2. Разработка прототипа

Прототипная система является усеченной версией экспертной системы, спроектированной для проверки правильности кодирования фактов, связей и стратегий рассуждения эксперта. Она также дает возможность инженеру по знаниям привлечь эксперта к активному участию в процессе разработки экспертной системы, и, следовательно, к принятию им обязательства при­ложить все усилия к созданию системы в полном объеме.

Объем прототипа — несколько десятков правил, фреймов или примеров. На рис. 1.15 изображены шесть стадий разработки прототипа и минимальный коллектив разработчиков, занятых на каждой из стадий (пять стадий заим­ствованы из [Хейес-Рот и др., 1987]). Приведем краткую характеристику всех стадий, хотя эта схема представляет собой грубое приближение к слож­ному, итеративному процессу.

Несмотря на то, что любое теоретическое разделение бывает часто услов­ным, осознание коллективом разработчиков четких задач каждой стадии представляется целесообразным. Роли разработчиков (эксперт, програм­мист, пользователь и аналитик) являются постоянными на протяжении всей разработки. Совмещение ролей нежелательно.

Сроки приведены условно, т. к, зависят от квалификации специалистов и особенностей задачи.

Идентификация проблемы

Уточняется формулировка (спецификация) задачи, планируется ход разра­ботки прототипа экспертной системы, определяются:

  • необходимые ресурсы (время, люди, компьютеры, деньги и т. д.);
  • источники знаний (книги, дополнительные эксперты, методики);
  • имеющиеся аналогичные экспертные системы;
  • цели (распространение опыта, автоматизация рутинных действий и др.);
  • классы решаемых задач и т. д.

 Рис. 1.15. Стадии разработки прототипа ЭС: Э — эксперт;-22

Рис. 1.15. Стадии разработки прототипа ЭС: Э — эксперт; А — аналитик (инженер по знаниям); П — программист; Ч — пользователь ("чайник")

Определение 1.10

Идентификация проблемы — знакомство и обучение членов коллектива раз­работчиков, а также создание неформальной спецификации задачи.

Средняя продолжительность 1—2 недели.

Извлечение знаний

На этой стадии происходит перенос компетентности от эксперта к инженеру по знаниям с использованием различных методов (см. гл. 2):

  • анализ текстов;
  • диалоги;
  • экспертные игры;
  • лекции;
  • дискуссии;
  • интервью;
  • наблюдение и др.

Определение 1.11

Извлечение знаний— получение инженером по знаниям наиболее полного из возможных представлений о предметной области и способах принятия решения в ней.

Средняя продолжительность 1—3 месяца.

Структурирование или концептуализация знаний

Через выявление структуры полученных знаний о предметной области определяются:

  • терминология;
  • список основных понятий и их атрибутов;
  • отношения между понятиями;
  • структура входной и выходной информации;
  • стратегия принятия решений;
  • ограничения стратегий и т. д.

Определение 1.12

Структурирование (или концептуализация) знаний — разработка неформального наглядного описания знаний о предметной области в виде графа, таблицы, диаграммы или текста, которое отражает основные концепции и взаимосвязи между понятиями предметной области.

Такое описание называется полем знаний.

Средняя продолжительность этапа 2—4 недели. Подробно стадия структурирования описана в разд. 2.6.

Формализация знаний

Строится формализованное представление концепций предметной области на основе выбранного языка представления знаний (ЯПЗ). Традиционно на этом этапе используются:

  • логические методы (исчисления предикатов 1-го порядка и др.);
  • продукционные модели (с прямым и обратным выводом);
  • семантические сети;
  • фреймы;
  • объектно-ориентированные языки, основанные на иерархии классов, объектов.

Определение 1.13

Формализация знаний — разработка базы знаний на языке представления знаний, который, с одной стороны, соответствует структуре поля знаний, а с другой — позволяет реализовать прототип системы на следующей стадии про­граммной реализации.

Все чаще на этой стадии используется симбиоз языков представления зна­ний, например, в системе ОМЕГА [Справочник по ИИ, 1990] — фрей­мы + семантические сети + полный набор возможностей языка исчисления предикатов. Средняя продолжительность 1—2 месяца. Подробнее — далее в книге.

Программная реализация

Создается прототип экспертной системы, включающий базу знаний и ос­тальные блоки, при помощи одного из следующих способов:

  • программирование на традиционных языках типа Pascal, C++ и др.;
  • программирование на специализированных языках, применяемых в зада­чах искусственного интеллекта: LISP [Хювянен, Сеппянен, 1991], FRL [Байдун, Бунин, 1990], SMALLTALK [Справочник по ИИ, 1990] и др.;
  • использование инструментальных средств разработки ЭС PIES [Хоро­шевский, 1993]; G2 [Попов, Фоминых, Кисель, 1996];
  • использование "пустых" ЭС или "оболочек" типа ЭКСПЕРТ [Кирсанов, Попов, 1990], ФИАКР [Соловьев, Соловьева, 1989] и др.

Определение 1.14

Программная реализация— разработка программного комплекса, демонстри­рующего жизнеспособность подхода в целом.

Чаще всего первый прототип отбрасывается на этапе реализации действую­щей ЭС.

Средняя продолжительность 1—2 месяца. Более подробно эти вопросы рас­сматриваются в следующих главах.

Тестирование

Оценивается и проверяется работа программ прототипа с целью приведения в соответствие с реальными запросами пользователей. Прототип проверяется:

  • на удобство и адекватность интерфейсов ввода/вывода (характер вопро­сов в диалоге, связность выводимого текста результата и др.);
  • на эффективность стратегии управления (порядок перебора, использова­ние нечеткого вывода и др.);
  • на качество проверочных примеров;
  • на корректность базы знаний (полнота и непротиворечивость правил).

Определение 1.15

Тестирование — выявление ошибок в подходе и реализации прототипа и вы­работка рекомендаций по доводке системы до промышленного варианта.

Средняя продолжительность 1—2 недели.

1.7.3. Развитие прототипа до промышленной ЭС

При неудовлетворительном функционировании прототипа эксперт и инже­нер по знаниям имеют возможность оценить, что именно будет включено в разработку окончательного варианта системы.

Если первоначально выбранные объекты или свойства оказываются непод­ходящими, их необходимо изменить. Можно сделать оценку общего числа эвристических правил, необходимых для создания окончательного варианта экспертной системы. Иногда [Хювянен, Сеппянен, 1991] при разработке промышленной и/или коммерческой системы выделяют следующие дополнительные этапы для перехода (табл. 1.2):

  • демонстрационный прототип;
  • исследовательский прототип;
  • действующий прототип;
  • промышленная система;
  • коммерческая система.

Однако чаще реализуется плавный переход от демонстрационного прототипа к промышленной системе, при этом, если программный инструментарий был выбран удачно, не обязательно даже переписывать окончательный ва­риант другими программными средствами.

Понятие же коммерческой системы в нашей стране входит в понятие "про­мышленный программный продукт", или "промышленная ЭС" (в этой работе).

Таблица 1.2. Переход от прототипа к промышленной экспертной системе

Этапы развития прототипа Функциональность прототипа
Демонстрационный прототип ЭС Система решает часть задач, демонстрируя жизнеспособность подхода (несколько десятков правил или понятий)
Исследовательский прототип ЭС Система решает большинство задач, но неустойчива в работе и не полностью проверена (несколько сотен правил или понятий)
Действующий прототип ЭС Система надежно решает все задачи на реальных примерах, но для сложной задачи требует много времени и памяти
Промышленная система Система обеспечивает высокое качество решений при минимизации требуемого времени и памяти; переписывается с использованием более эффективных средств представления знаний
Коммерческая система Промышленная система, пригодная к продаже, хорошо документирована и снабжена сервисом

Основная работа на данном этапе заключается в существенном расширении базы знаний, т. е. в добавлении большого числа дополнительных правил, фреймов, узлов семантической сети или других элементов знаний. Эти элементы знаний обычно увеличивают глубину системы, обеспечивая большее число правил для трудноуловимых аспектов отдельных случаев. В то же время эксперт и инженер по знаниям могут увеличить базу знаний системы, включая правила, управляющие дополнительными подзадачами или допол­нительными аспектами экспертной задачи (метазнания).

После установления основной структуры ЭС знаний инженер по знаниям приступает к разработке и адаптации интерфейсов, с помощью которых система будет общаться с пользователем и экспертом. Необходимо обратить особое внимание на языковые возможности интерфейсов, их простоту и удобство для управления работой ЭС. Система должна обеспечивать поль­зователю возможность легким и естественным образом уточнять непонят­ные моменты, приостанавливать работу и т. д. В частности, могут оказаться полезными графические представления.

На этом этапе разработки большинство экспертов узнают достаточно о вво­де правил и могут сами вводить в систему новые правила. Таким образом, начинается процесс, во время которого инженер по знаниям передает право собственности и контроля системы эксперту для уточнения, детальной раз­работки и обслуживания.

1.7.4. Оценка системы

После завершения этапа разработки промышленной экспертной системы необходимо провести ее тестирование в отношении критериев эффективно­сти. К тестированию широко привлекаются другие эксперты с целью апро­бирования работоспособности системы на различных примерах. Экспертные системы оцениваются главным образом для того, чтобы проверить точность работы программы и ее полезность. Оценку можно проводить, исходя из различных критериев, которые сгруппируем следующим образом:

  • критерии пользователей (понятность и "прозрачность" работы системы, удобство интерфейсов и др.);
  • критерии приглашенных экспертов (оценка советов-решений, предлагае­мых системой, сравнение ее с собственными решениями, оценка подсис­темы объяснений и др.);
  • критерии коллектива разработчиков (эффективность реализации, произ­водительность, время отклика, дизайн, широта охвата предметной облас­ти, непротиворечивость БЗ, количество тупиковых ситуаций, когда сис­тема не может принять решение, анализ чувствительности программы к незначительным изменениям в представлении знаний, весовых коэф­фициентах, применяемых в механизмах логического вывода, данных и т. п.).

1.7.5. Стыковка системы

На этом этапе осуществляется стыковка экспертной системы с другими программными средствами в среде, в которой она будет работать, и обуче­ние людей, которых она будет обслуживать. Иногда это означает внесение существенных изменений. Такие изменения требуют непременного вмеша­тельства инженера по знаниям или какого-либо другого специалиста, кото­рый сможет модифицировать систему. Под стыковкой подразумевается так­же разработка связей между экспертной системой и средой, в которой она действует.

Когда экспертная система уже готова, инженер по знаниям должен убедиться в том, что эксперты, пользователи и персонал знают, как эксплуатиро­вать и обслуживать ее. После передачи им своего опыта в области инфор­мационной технологии инженер по знаниям может полностью предоставить ее в распоряжение пользователей.

Для подтверждения полезности системы важно предоставить каждому из пользователей возможность поставить перед ЭС реальные задачи, а затем проследить, как она выполняет эти задачи. Для того чтобы система была одобрена, необходимо представить ее как помощника, освобождающего пользователей от обременительных задач, а не как средство их замещения.

Стыковка включает обеспечение связи ЭС с существующими базами данных и другими системами на предприятии, а также улучшение системных фак­торов, зависящих от времени, чтобы можно было обеспечить ее более эф­фективную работу и улучшить характеристики ее технических средств, если система работает в необычной среде (например, связь с измерительными устройствами).

Так успешно была состыкована со своим окружением система PUFF — экспертная система для диагностики заболеваний легких [Хейес-Рот и др., 1987]. После того как PUFF была закончена и все были удовлетворены ее работой, систему перекодировали с LISP на Бейсик. Затем систему перене­сли на ПЭВМ, которая уже работала в больнице. В свою очередь, эта ПЭВМ была связана с измерительными приборами. Данные с измеритель­ных приборов сразу поступают в ПЭВМ. PUFF обрабатывает эти данные и печатает рекомендации для врача. Врач в принципе не взаимодействует с PUFF. Система полностью интегрирована со своим окружением — она представляет собой интеллектуальное расширение аппарата исследования легких, который врачи давно используют.





Другой системой, которая хорошо функционирует в своем окружении, являлась САТ-1 [Уотермен, 1990] — экспертная система для диагностики не­исправностей дизелей локомотивов.

Эта система была разработана также на языке LISP, а затем была переведе­на на FORTH с тем, чтобы ее можно было более эффективно использовать в различных локомотивных цехах. Мастер по ремонту запрашивает систему о возможных причинах неисправности дизеля. Система связана с видеодис­ком, с помощью которого мастеру показывают визуальные объяснения и подсказки, касающиеся более подробных проверок, которые он должен сделать.

Кроме того, если оператор не уверен в том, как устранить неисправность, система предоставляет ему обучающие материалы, которые фирма подгото­вила предварительно, и показывает ему их на видеотерминале. Таким обра­зом, мастер по ремонту может с помощью экспертной системы диагности­ровать проблему, найти тестовую процедуру, которую он должен использо­вать, получить на дисплее объяснение, как провести тест, или получить инструкции о том, как справиться с возникшей проблемой.

1.7.6. Поддержка системы

При перекодировании системы на язык, подобный Си, повышается ее бы­стродействие и увеличивается переносимость, однако гибкость при этом уменьшается. Это приемлемо лишь в том случае, если система сохраняет все знания проблемной области, и это знание не будет изменяться в ближай­шем будущем. Однако если экспертная система создана именно из-за того, что проблемная область изменяется, то необходимо поддерживать систему в ее инструментальной среде разработки.

Удачным и ставшим уже хрестоматийным примером ЭС, внедренной таким образом, является XCON (R1) — ЭС, которую фирма DEC использовала для комплектации ЭВМ семейства VAX. Одной из ключевых проблем, с ко­торой столкнулась фирма DEC, являлась необходимость постоянного вне­сения изменений для новых версий оборудования, новых спецификаций и т. д. Для этой цели XCON поддерживается в программной среде OPS5.

1.8. Человеческий фактор при разработке ЭС

При разработке ЭС наиболее критическим фактором является человече­ский, поскольку разработка таких систем требует высочайшей квалифика­ции от коллектива разработчиков.

Под коллективом разработчиков (КР) будем понимать группу специалистов, ответственных за создание ЭС.

Как видно из рис. 1.12, в состав КР входят, по крайней мере, три челове­ка — пользователь, эксперт и инженер по знаниям. В действительности, безусловно, нужен как минимум один программист, и обязательно надо привлекать к работе заказчика, хотя бы на ранних стадиях. Таким образом, минимальный состав КР включает пять человек; реально же он разрастается до 8—10 человек. Численное увеличение коллектива разработчиков проис­ходит по следующим причинам:

  • необходимость учета мнения нескольких пользователей;
  • привлечение к экспертизе нескольких экспертов;
  • потребность как в прикладных, так и системных программистах.

На Западе в этот коллектив дополнительно традиционно включают менед­жера и одного технического помощника.

Если использовать аналогии из близких областей, то КР более всего схож с группой администратора базы данных при построении интегрированных информационных систем или бригадой программистов, разрабатывающих сложный программный комплекс. При отсутствии профессионального ме­неджера руководителем КР, участвующим во всех стадиях разработки, явля­ется инженер по знаниям, поэтому к его квалификации предъявляются са­мые высокие требования. В целом уровень и численность группы зависят от характеристик поставленной задачи.

Практически все психологи отмечают, что на любой коллективный процесс влияет атмосфера, возникающая в группе. Существуют эксперименты, ре­зультаты которых неоспоримо говорят, что часто дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности отдельных членов группы [Немов, 1984]. Особенно важно, чтобы в коллек­тиве разработчиков складывались кооперативные, а не конкурентные отно­шения. Для кооперации характерна атмосфера сотрудничества, взаимопо­мощи, заинтересованности в успехах друг друга, т. е. уровень нравственного общения, а для отношений конкурентного типа — атмосфера индивидуа­лизма и межличностного соперничества (более низкий уровень общения).

В настоящее время, прогнозировать совместимость в общении со 100%-ной гарантией невозможно. Однако можно выделить ряд факторов и черт лич­ности, характера и других особенностей участников общения, несомненно, оказывающих влияние на эффективность процедуры, что в том числе обу­словлено и психологической совместимостью членов группы. Следователь­но, при формировании КР желательно учитывать психологические свойства участников.

В настоящий момент в психологии существуют несколько десятков методик по определению свойств личности, широко используемых в вопросах про­фессиональной ориентации. Эти психодиагностические методики, часть из которых уже автоматизирована, различаются направленностью, глуби­ной, временем опроса и способами интерпретации. В частности, система АВАНТЕСТ (Автоматический Анализ тестов) [Гаврилова, 1984] позволяет моделировать рассуждения психолога при анализе результатов тестирования по 16-факторному опроснику Р. Кэттела и выдает связное психологическое заключение на естественном русском языке, характеризующее такие свойства личности, как общительность, аналитичность, добросовестность, само­контроль и т. п.

Рассмотрим минимальные требования. Ниже приведены два аспекта харак­теристик членов КР: А — психофизиологический, Б — профессиональный.

1.8.1. Пользователь

А. К пользователю практически профессиональных требований не предъяв­ляют, поскольку его не выбирают. Он является в некотором роде заказчи­ком системы. Желательные качества:

а) дружелюбие;

б) умение объяснить, что же он хочет от системы;

в) отсутствие психологического барьера к применению вычислительной техники;

г) интерес к новому.

От пользователя зависит, будет ли применяться разработанная ЭС. Замечено, что наиболее ярко качества в) и г) проявляются в молодом возрасте, поэто­му иногда такие пользователи охотнее используют ЭС, не испытывая при этом комплекса неполноценности оттого, что ЭВМ им что-то подсказывает.

Б. Необходимо, чтобы пользователь имел некоторый базовый уровень ква­лификации, который позволит ему правильно истолковать рекомендации ЭС. Кроме того, должна быть полная совместимость в терминологии ин­терфейса к ЭС с той, которая привычна и удобна для пользователя. Обычно требования к квалификации пользователя не очень велики, иначе он переходит в разряд экспертов и совершенно не нуждается в ЭС.

1.8.2. Эксперт

А. Эксперт — чрезвычайно важная фигура в группе КР. В конечном счете, его подготовка определяет уровень компетенции базы знаний. Желательные качества:

а) доброжелательность;

б) готовность поделиться своим опытом;

в) умение объяснить (педагогические навыки);

г) заинтересованность (моральная, а лучше еще и материальная) в успешности разработки.

Возраст эксперта обычно зрелый, что необходимо учитывать всем членам группы. Часто встает вопрос о количестве экспертов. Поскольку проблема совмещения подчас противоречивых знаний остается открытой, обычно с каждым из экспертов работают индивидуально, иногда создавая альтернативные базы.

Другие определения эксперта из "околонаучного" фольклора: "Человек, ко­торый перестал думать на том основании, что он знает", "Такой же специа­лист как у нас есть, но из другого города", "Человек, который знает, что бу­дет завтра, а послезавтра может объяснить, почему этого не случилось".

Б. Помимо, безусловно, высокого профессионализма в выбранной предмет­ной области, желательно знакомство эксперта с популярной литературой по искусственному интеллекту и экспертным системам для того, чтобы эффек­тивнее прошел этап извлечения знаний.

1.8.3.Программист

А. Известно, что программисты обладают самой низкой потребностью в общении среди представителей разных профессий. Однако при разработке ЭС необходим тесный контакт членов группы, поэтому желательны сле­дующие его качества:

а) общительность;

б) способность отказаться от традиционных навыков и освоить новые методы;

в) интерес к разработке.

Б. Поскольку современные ЭС — сложнейшие и дорогостоящие программ­ные комплексы, программисты в КР должны иметь опыт и навыки разра­ботки программ. Обязательно знакомство с основными структурами пред­ставления знаний и механизмами вывода, состоянием отечественного и ми­рового рынка программных продуктов для разработки ЭС и диалоговых интерфейсов.

1.8.4.Инженер по знаниям

А. Существуют такие профессии и виды деятельности, для которых природ­ные качества личности (направленность, способности, темперамент) могут иметь характер абсолютного показания или противопоказания к занятиям. По-видимому, инженерия знаний принадлежит к таким профессиям. По различным оценкам это одна из самых малочисленных, высокооплачивае­мых и дефицитных в мире специальностей. Попытаемся дать наброски к портрету инженера по знаниям (без претензии на полноту и точность определений).

Пол. Психологи утверждают, что мужчины более склонны к широкому охва­ту явлений и в среднем у них выше аналитичность, чрезвычайно полезная инженеру по знаниям, которому надо иметь развитое логическое мышление и умение оперировать сложными формальными структурами. Кроме того, при общении с экспертами, которые в большинстве своем настроены скеп­тически по отношению к будущей ЭС, инженер по знаниям - мужчина вызывает более высокое доверие со стороны эксперта. С другой стороны, извест­но, что у женщин в среднем выше коммуникабельность, наблюдательность к отдельным деталям объектов. Так что пол не является окончательным показанием или противопоказанием к данной профессии.

Интеллект. Это понятие вызывает самые бурные споры психологов; суще­ствует до 50 определений интеллекта, но с прагматической точки зрения очевидно, что специалист в области искусственного интеллекта должен стремиться к максимальным оценкам по тестам как вербального, так и не­вербального интеллекта.

Стиль общения. Инженер по знаниям "задает тон" в общении с экспертом, он ведет диалог, и от него, в конечном счете, зависит его продуктивность. Можно выделить два стиля общения: деловой (или жесткий) и дружеский (или мягкий, деликатный). Нам кажется, что дружеский будет заведомо бо­лее успешным, т. к. снижает "эффект фасада" у эксперта, раскрепощает его. Деликатность, внимательность, интеллигентность, ненавязчивость, скром­ность, умение слушать и задавать вопросы, хорошая коммуникабельность и в то же время уверенность в себе — вот рекомендуемый стиль общения. Безусловно, что это дар и искусство одновременно, однако занятия по пси­хологическому тренингу могут дать полезные навыки.

Портрет инженера по знаниям можно было бы дополнить другими характе­ристиками — широтой взглядов и интересов, артистичностью, чувством юмора, обаянием и т. д.

Интересные результаты были получены в [Воинов, Долныкова, Чудова, 1988] при исследовании психологических особенностей аналитиков. Выяс­нилось, что одним из отличительных свойств хорошего аналитика является ожидание высокой позитивной оценки при общении, т. е. установка на успех.

Как писал Э. Берн [Берн, 1988], существует 4 типа людей:

  1. I am OK, you are OK (я хороший, ты хороший).
  2. I am OK, you are not OK (я хороший, ты нехороший).
  3. I am not OK, you are ОК(я нехороший, ты хороший).
  4. I am not OK, you are not ОК(я нехороший, ты нехороший).
    Очевидно, что успешным является только первый тип.

Несомненным становится вопрос об определении профессиональной при­годности инженеров по знаниям и необходимости предварительного психо­логического тестирования при подготовке инженеров по знаниям. Здесь только приведем каталог свойств идеального интервьюера [Ноэль, 1978]. На наш взгляд, это вполне подходящий образец портрета инженера по знаниям перед серией свободных диалогов: "Он должен выглядеть здоровым, спо­койным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным". Хороший аналитик может личным обаянием и умением скрыть изъяны подготовки. Блестящая краткая характеристика интервьюера приведена в той же работе — "общительный педант ".

Б. При определении профессиональных требований к аналитику следует учитывать, что ему необходимы различные навыки и умения для грамотного и эффективного проведения процессов извлечения, концептуализации и формализации знаний.

Инженер по знаниям имеет дело со всеми формами знаний (см. разд. 1.1):

Z1 (знания в памяти) => Z2 (знания в книгах) => Z3 (поле знаний) => Z4 (модель знаний) => Z5 (база знаний).

Работа на уровне Z1 требует от инженера по знаниям знакомства с элемен­тами когнитивной психологии и способами репрезентации понятий и про­цессов в памяти человека, с двумя основными механизмами мышления — логическим и ассоциативным, с такими способами активизации мышления, как игры, мозговой штурм и др., с различными моделями рассуждений.

Изучение и анализ текстов на уровне Z2 подразумевает широкую общена­учную подготовку инженера; знакомство с методами реферирования и ан­нотирования текстов; владение навыками быстрого чтения, а также тексто­логическими методами извлечения знаний.

Разработка поля знаний на уровне Z3 требует квалифицированного знаком­ства с методологией представления знаний, системным анализом, теорией познания, аппаратом многомерного шкалирования, кластерным и фактор­ным анализом.

Разработка формализованного описания Z4 предусматривает предваритель­ное изучение аппарата математической логики и современных языков пред­ставления знаний. Модель знаний разрабатывается на основании результа­тов глубокого анализа инструментальных средств разработки ЭС и имею­щихся "оболочек". Кроме того, инженеру по знаниям необходимо владеть методологией разработки ЭС, включая методы быстрого прототипирования.

И наконец, реализация базы знаний Z5, в которой инженер по знаниям участвует вместе с программистом, подразумевает овладение практическими навыками работы на ЭВМ и, возможно, одним из языков программиро­вания.

Так как инженеров по знаниям "выращивают" из программистов, уровень Z5 обычно не вызывает затруднения, особенно если разработка ведется на традиционных языках типа Си или Паскаль. Специализированные языки искусственного интеллекта LISP и Пролог требуют некоторой перестройки архаично-алгоритмического мышления.

Следует констатировать, что поскольку профессиональных аналитиков не готовит ни один вуз, необходима специальная подготовка этих специали­стов. Подробную информацию см. в разд. 2.4.

Успешность выбора и подготовки коллектива разработчиков ЭС определяет эффективность и продолжительность всего процесса разработки.

ГЛАВА 2 Введение в инженерию знаний

2.1. Определение и структура инженерии знаний

Основные трудности в разработке экспертных систем связаны с проблемой извлечения и структурирования знаний. Именно эти вопросы исследует наука под названием — инженерия знаний (knowledge engineering). Это доста­точно молодое направление искусственного интеллекта, появившееся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности "добычи" и формализации знаний. В первых книгах по искусственному интеллекту (ИИ) эти факты обычно только постулиро­вались, в дальнейшем начались серьезные исследования по выявлению оп­тимальных стратегий выявления знаний [Boose, 1990; Wielinga, Schreiber, Breuker, 1992; Tuthill, 1994; Adeli, 1994; Leondes, 2000].

Определение 2.1

Инженерия знаний — направление исследований и разработок в области ин­теллектуальных систем, ставящее целью разработку моделей, методов и сис­тем для получения, структурирования и формализации знаний специалистов с целью проектирования баз знаний.

Основные направления исследований инженерии знаний представлены на рис. 2.1.

2.1.1. Поле знаний

Данная глава целиком посвящена теоретическим проблемам инженерии знаний, другими словами — проектированию баз знаний. Центральным по­нятием на стадиях получения и структурирования является так называемое поле знаний, уже упоминавшееся в разд. 1.1

 Рис. 2.1. Структура инженерии знаний Определение 2.2 Поле -23

Рис. 2.1. Структура инженерии знаний

Определение 2.2

Поле знаний— это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста.

Поле знаний pz формируется на третьей стадии разработки ЭС (см. разд. 1.7.2) — стадии структурирования.

Поле знаний, как первый шаг от структурирования к формализации, пред­ставляет модель знаний о предметной области в том виде, в каком ее сумел выразить аналитик на некотором "своем" языке.

Обобщенно синтаксическую структуру поля знаний можно представить как

Pz = (I, О, М),

где I — структура исходных данных, подлежащих обработке и интерпрета­ции в экспертной системе; О — структура выходных данных, т. е. результата работы системы; М— операциональная модель предметной области, на ос­новании которой происходит модификация I в О.

Включение компонентов I и О в Pz обусловлено тем, что составляющие и структура этих интерфейсных компонентов неявно присутствуют в модели репрезентации в памяти эксперта. Операциональная модель М может быть представлена как совокупность концептуальной структуры Sk, отражающей понятийную структуру предметной области, и функциональной структуры Sf, моделирующей схему рассуждений эксперта.

M=(Sk,Sf).

sk выступает как статическая, неизменная составляющая pz, в то время как Sf представляет динамическую, изменяемую составляющую.

Формирование Sk основано на выявлении понятийной структуры предмет­ной области. Далее описан достаточно универсальный алгоритм проведения концептуального анализа на основе модификации парадигмы структурного анализа [Yourdon, 1989] и построения иерархии понятий (так называемая "пирамида знаний"). Пример Sk и Sf представлен на рис. 2.2 и 2.3.

В последние годы концептуальную структуру называют онтологией предмет­ной области [Gruber, 1993], она включает упорядоченные понятия предмет­ной области (ПО) А и моделирует основные функциональные связи RA или отношения между понятиями, образующими Sk. Помимо онтологии пони­мание задачи отражает модель или стратегия принятия решения Sf в выбранной ПО. Таким образом, Sf образует стратегическую составляющую М, часто она имеет форму простой таблицы решений, как на рис. 2.4.

Схему, отображающую отношения между реальной действительностью и полем знаний, можно представить так, как показано на рис. 2.4.

 Рис. 2.4.

Рис. 2.4. "Испорченный телефон" при формировании поля знаний

Как следует из рисунка, поле Pzgij — это результат, полученный "после 4-й трансляции" (если говорить на языке информатики).

1-я трансляция (Ii) — это восприятие и интерпретация действительности О предметной области g i-м экспертом. В результате Ii в памяти эксперта образуется модель Mgi как семантическая репрезентация действительности и его личного опыта по работе с ней.

2-я трансляция (Vi,} — это вербализация опыта i-го эксперта, когда он пытается объяснить свои рассуждения Si и передать свои знания Zi, инженеру по знаниям. В результате Vi, образуется либо текст Ti, либо речевое сообщение Сi

3-я трансляция (Ij) — это восприятие и интерпретация сообщений Ti или Сi j-м инженером по знаниям. В результате в памяти инженера по знаниям образуется модель мира Mgj.

4-я трансляция (Kj) — это кодирование и вербализация модели Mgj в форме поля знаний Pzgij.

Более всего эта схема напоминает детскую игру в "испорченный телефон"; перед инженером по знаниям стоит труднейшая задача — добиться максимального соответствия Mgi и Pzgij К сожалению, Pzg не является отражением действительности Og, т. к. знания — вещь сугубо авторизованная, субъек­тивная. Так следовало бы на каждой ЭС ставить четкий ярлык i — j, т. е. "база знаний эксперта i в понимании инженера по знаниям j". Стоит заменить, например, инженера по знаниям Петрова на Сидорова, и получится совсем другая картина.

Приведем пример влияния субъективных взглядов эксперта на Mgi и Vi. Реальность (Og): два человека прибегают на вокзал за 2 минуты до отхода поезда. В кассы — очередь. В автоматических кассах свободно, но ни у того, ни у другого нет мелочи. Следующий поезд через 40 минут. Оба опаздывают на важную встречу.

  • Интерпретация 1-го эксперта (I1): нельзя приходить на вокзал менее чем за 10 минут.
  • Интерпретация 2-го эксперта (I2): надо всегда иметь мелочь в кармане.
  • Вербализация 1-го эксперта (V1): опоздал к нужному поезду, т. к. не рассчитал время.
  • Вербализация 2-го эксперта (V2): опоздал, т. к. на вокзале неразбериха, в кассах толпа.

Последующие трансляции еще больше будут искажать и видоизменять модель, но теперь уже с учетом субъективного восприятия инженеров по знаниям.

Таким образом, если считать поле знаний смысловой (семантической) моделью предметной области, то эта модель дважды субъективна. И если модель Mgi (см. рис. 2.4) — это усеченное отображение Og, то само pz — лишь отблеск Mgi через призму Vi и Mgj.

2.1.2. "Пирамида" знаний

Иерархичность понятийной структуры сознания подчеркивается в работах многих психологов [Брунер, 1971; Веккер, 1976]. Поле знаний можно стра­тифицировать, т. е. рассматривать на различных уровнях абстракции поня­тий. В "пирамиде знаний" каждый следующий уровень служит для восхож­дения на новую ступень обобщения и углубления знаний в предметной об­ласти. Таким образом, возможно наличие нескольких уровней понятийной структуры Sk

Представляется целесообразным связать это с глубиной профессионального опыта (например, как в системе АВТАНТЕСТ [Гаврилова, Червинская,1992]) или с уровнем иерархии в структурной лестнице организации (рис. 2.5).

Рис. 2.5. Пирамиды знаний

Естественно, что и стратегии принятия решений, т. е. функциональные структуры Sf на различных уровнях, будут существенно отличаться.

2.2. Стратегии получения знаний

При формировании поля знаний ключевым вопросом является сам процесс получения знаний, когда происходит перенос компетентности экспертов на инженеров по знаниям. Для названия этого процесса в литературе по ЭС получили распространение несколько терминов: приобретение, добыча, из­влечение, получение, выявление, формирование знаний. В англоязычной специальной литературе в основном используются два термина: acquisition (приобретение) и elicitation (выявление, извлечение, установление).

Термин "приобретение" трактуется либо очень широко — тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний зара­нее закладывается в программу). В обоих случаях термин "приобретение" не касается самого таинства экстрагирования структуры знаний из потока ин­формации о предметной области. Этот процесс описывается понятием "из­влечение ".

Авторы склонны использовать этот термин как более емкий и более точно выражающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний ЭС.

Определение 2.3

Извлечение знаний (knowledge elicitation) — это процесс взаимодействия ана­литика с источником знаний, в результате которого становится явным процесс рассуждений специалиста при принятии решения и структура его представле­ний о предметной области.

Во все времена большинство разработчиков ЭС отмечало, что процесс извлечения знаний остается самым "узким" местом при построении промыш­ленных ЭС. При этом им приходится практически самостоятельно разраба­тывать методы извлечения, сталкиваясь со следующими трудностями [Gaines, 1989]:

  • организационные неувязки;
  • неудачный метод извлечения, не совпадающий со структурой знаний в данной области;
  • неадекватная модель (язык) для представления знаний.

Можно добавить к этому [Гаврилова, Червинская, 1992]:

  • неумение наладить контакт с экспертом;
  • терминологический разнобой;
  • отсутствие целостной системы знаний в результате извлечения только "фрагментов";
  • упрощение "картины мира" эксперта и др.

Процесс извлечения знаний — это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии, системному анализу, математической логике и пр., необходимо воссоздать модель предметной области, которой пользуют­ся эксперты для принятия решения. Часто начинающие разработчики ЭС, желая упростить эту процедуру, пытаются подменить инженера по знаниям самим экспертом. По многим причинам это нежелательно.

Во-первых, большая часть знаний эксперта — это результат многочислен­ных наслоений, ступеней опыта. И часто зная, что из А следует В, эксперт не отдает себе отчета, что цепочка его рассуждений была гораздо длиннее, например А -> D -> С -> В, или А -> Q -> R -> В.

Во-вторых, как было известно еще Платону, мышление диалогично. И по­этому диалог инженера по знаниям и эксперта — наиболее естественная форма изучения лабиринтов памяти эксперта, в которых хранятся знания, частью носящие невербальный характер, т. е. выраженные не в форме слов, а в форме наглядных образов, например. И именно в процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные образы на­девает четкие словесные ярлыки, т. е. вербализует знания.

В-третьих, эксперту труднее создать модель предметной области вследствие глубины и объема информации, которой он владеет. Еще в ситуационном управлении [Поспелов, 1986] было выявлено, что объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно-следственные, типа "часть-целое" и др.). Эти отношения и связи предметной области образуют сложную систему, из которой выделить "скелет" или главную структуру иногда доступнее аналитику, владеющему к то­му же системной методологией.

Термин "приобретение" в рамках данной книги оставлен за автоматизиро­ванными системами прямого общения с экспертом. Они действительно не­посредственно приобретают уже готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления зна­ний, т. е. не являются универсальными.

Определение 2.4

Приобретение знаний (knowledge acquisition) — процесс заполнения базы зна­ний экспертом с использованием специализированных программных средств.

Например, система TEIRESIAS [Davis, 1982], ставшая прародительницей всех инструментариев для приобретения знаний, предназначена для попол­нения базы знаний системы MYCIN или ее дочерних ветвей, построенных на "оболочке" EMYCIN [Shortliffe et al, 1979] в области медицинской диаг­ностики с использованием продукционной модели представления знаний.

Термин формирование знаний (machine learning) традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инжене­рии знаний, которая занимается разработкой моделей, методов и алгорит­мов обучения. Она включает индуктивные модели формирования знаний и автоматического порождения гипотез, например ДСМ-метод [Финн, 2000], на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависи­мости в базах данных с неполной информацией, содержащих структуриро­ванные числовые и символьные объекты (часто в условиях неполноты ин­формации).

Определение 2.5

Формирование знаний (machine learning) — процесс анализа данных и выявле­ния скрытых закономерностей с использованием специального математическо­го аппарата и программных средств.

Традиционно к задачам формирования знаний или машинного обучения относятся задачи прогнозирования, идентификации (синтеза) функций, расшифровки языков, индуктивного вывода и синтеза с дополнительной информацией [Епифанов, 1984]. В широком смысле к обучению по приме­рам можно отнести и методы обучения распознаванию образов [Аткинсон, 1989; Schwartz, 1988].

Для того чтобы эти методы стали элементами технологии интеллектуальных систем, необходимо решить ряд задач [Осипов, 1997]:

  • обеспечить механизм сопряжения независимо созданных баз данных, имеющих различные схемы, с базами знаний интеллектуальных систем;
  • установить соответствие между набором полей базы данных и множест­вом элементов декларативного компонента базы знаний;
  • выполнить преобразование результата работы алгоритма обучения в спо­соб представления, поддерживаемый программными средствами интел­лектуальной системы.

Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), когда источник знаний — это множество примеров предметной области [Осипов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе при­меров (прецедентов) включает настройку алгоритма распознавания на зада­чу посредством предъявления примеров, классификация которых известна.

Обучение на примерах тесно связано с машинным обучением. Различие за­ключается в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и закономерности предметной области, и преобразо­ван в способ представления, который допускает использование результата обучения в базе знаний, для моделирования рассуждений, для работы меха­низма объяснения и т. д., т. е. делает результат обучения элементом соот­ветствующей технологии.

Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое описание некоторого класса объектов по множествам примеров и контрпримеров данного класса. В качестве языка представления использу­ется язык переменно-значной логики первого порядка (вариант языка многозначной логики первого порядка).

В последнее время широкое распространение получили термины data mining и knowledge discovery, означающие, по сути, тот же процесс формирования знаний и поиск закономерностей, осуществляемый на больших выборках данных, обычно находящихся в хранилищах данных (data warehouse).

Таким образом, можно выделить три основных стратегии проведения ста­дии получения знаний при разработке ЭС (рис. 2.6):

  • с использованием ЭВМ при наличии подходящего программного инст­рументария — приобретение знаний',
  • с использованием программ обучения при наличии репрезентативной (т. е. достаточно представительной) выборки примеров принятия реше­ний в предметной области и соответствующих пакетов прикладных программ —- формирование знаний;
  • без использования вычислительной техники путем непосредственного контакта инженера по знаниям и источника знаний (будь то эксперт, специальная литература или другие источники) — извлечение знаний.

 Рис. 2.6. Стратегии получения знаний Далее в этой -30

Рис. 2.6. Стратегии получения знаний

Далее в этой главе подробно будут рассматриваться процессы извлечения знаний, т. к. на современном этапе разработки ЭС эти стратегии являются наиболее эффективными и перспективными. Формирование знаний, тяго­теющее в большей степени к области machine learning, т. е. индуктивному обучению, основываясь на хорошо исследованном аппарате распознавания образов [Гаек, Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выходит за рамки данной книги. Также за рамками книги ос­тались вопросы приобретения знаний [Осипов, 1997] и формирования зна­ний из данных (data mining, knowledge discovery) и др.

2.3. Теоретико-методические аспекты извлечения и структурирования знаний

Рассмотрим подробнее ключевую проблему основной стратегии получения знаний — непосредственного извлечения знаний "из" памяти эксперта. Можно выделить три основных аспекта этого процесса (рис. 2.7).

  • психологический;
  • лингвистический;
  • гносеологический.

2.3.1. Психологический аспект

Ведущим аспектом извлечения знаний является психологический, посколь­ку он определяет успешность и эффективность взаимодействия инженера по знаниям (аналитика) с основным источником знаний — экспертом-профес­сионалом. Психологический аспект выделяется еще и потому, что извлече­ние знаний происходит чаще всего в процессе непосредственного общения

 Рис. 2.7. Теоретико-методические аспекты инженерии знаний -31

Рис. 2.7. Теоретико-методические аспекты инженерии знаний

разработчиков системы и экспертов, и психологические особенности могут полностью свести на нет высокий интеллектуальный потенциал разработки.

К сожалению, все члены коллектива разработчиков зачастую имеют техническое образование и не владеют даже зачатками профессиональных приемов общения. Общение, или коммуникация (от лат. communication — связь) — это междисциплинарное понятие, обозначающее все формы непосредственных контактов между людьми — от дружеских до деловых.

Существует несколько десятков теорий общения, и единственное, в чем сходятся все авторы, — это сложность и многоплановость процедуры общения. Подчеркивается, что общение — не просто однонаправленный процесс передачи сообщений и но двухтактный обмен порциями сведений, а нерасчлененный процесс циркуляции информации, т. е. совместный поиск истины [Каган, 1988] (рис. 2.8).

 Рис. 2.8.. Структура процесса общения. Итак, общение -32

Рис. 2.8.. Структура процесса общения.

Итак, общение есть процесс выработки новой информации, общей для общающихся людей и рождающей их Общность, И хотя общение первый вид деятельности, которым овладевает Человек в своем развитии, 110-настоящему владеют Культурой и наукой общения единицы.

Выделяют четыре основных уровня общения [Сагатовский, 1980]:

  • уровень манипулирования, котла один субъект рассматривает другого как средство или помеху по отношению к проекту своей деятельности;
  • уровень «рефлексивной игры», когда в процессе своей деятельности человек учитывает «контрпроект» другого субъекта, но не признает за ним самоценность и стремится к «выигрышу», к реализации своего проекта;
  • уровень правового общения, когда субъекты признают право на существование проектов деятельности друг друга и пытаются согласовать их хотя бы внешне;
  • уровень нравственного общения, когда субъекты внутренне принимают общий проект взаимной деятельности.

Стремление и умение общаться на высшем, четвертом, уровне может характеризовать степень профессионализма инженера по знаниям.

Известно, что потери информации при разговорном общении велики [Мицич, 1987] (рис. 2.9).

 Рис. 2.9. Потери информации при разговорном общении. -33

Рис. 2.9. Потери информации при разговорном общении.

В связи с этим рассмотрим проблему увеличения информативности общения аналитика и эксперта за счет использования психологических знаний.

Можно выделить такие структурные компоненты модели общения при извлечении знаний:

  • участники общения (партнеры);
  • средства общения (процедура);
  • предмет общения (знания).

В соответствии с этой структурой выделим три «слоя» психологических проблем возникающих при извлечении знаний (рис. 2.10):

  • контактный;
  • процедурный;
  • когнитивный.

 Рис. 2.10. Психологический аспект извлечения знаний -34

Рис. 2.10. Психологический аспект извлечения знаний

Контактный слой

Разработка проблематики контактного слоя позволила выявить следующие параметры партнеров, влияющие на результаты процедуры извлечения знаний:

  • пол и возраст;
  • личность;
  • темперамент;
  • мотивация и др.

Пол и возраст

Значения параметров пола и возраста хотя и влияют на эффективность контакта, но не являются критическими. В литературе [Иванов, 1986] отмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщина), т. к. повышается мотивация.

Что касается возраста, то рабочая формула имеет вид

20 > (Вэ - Ba) > 5,

где Bэ — возраст эксперта; Ba — возраст аналитика.

Личность

Под личностью обычно понимается устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые компоненты личностного портрета аналитика исследованы в работе [Гаврилова,1990] и дополнены качествами из руководства для журналистов в [schouk-smith G., 1978]: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, большая собранность, настойчивость, общительность, находчивость.

Подробную информацию см. в разд. 1. 7.

.

Темперамент

Со времен Гачена и Гиппократа, выделивших четыре классических типа темперамента, вошли в научную терминологию понятия — холерик, сангви­ник, меланхолик, флегматик.

Известно, что флегматики и меланхолики медленнее усваивают информа­цию [Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с ними не следует задавать беседе слишком быстрый темп, торопить их с ответом. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации. Последних следует специально наводить на размышление и рефлексию. У меланхоликов часто занижена самооценка, они застенчивы и в беседе их надо подбадривать. Таким образом, наиболее успешными в рамках контактного слоя являются сангвиники и холерики.

Мотивация

На эффективность коллективного решения задач влияет также и мотивация, т. е. стремление к успеху. Инженер по знаниям в зависимости от условий разработки должен изыскивать разнообразные стимулы для экспертов (включая, разумеется, и материальные). Эксперт передает аналитику один из самых дорогих в мире продуктов — знания. И если одни люди делятся опытом добровольно и с удовольствием, то другие весьма неохотно приоткрывают свои профессиональные тайны. Иногда полезно, оказывается, воз­будить в эксперте дух соперничества, конкуренции (не нарушая, естествен­но, обстановки кооперативности в коллективе).

Процедурный слой

Параметры процедурного слоя описывают непосредственно процесс прове­дения процедуры извлечения знаний. Фактически это профессиональные параметры:

  • ситуация общения (место, время и продолжительность);
  • оборудование (вспомогательные средства, освещенность, мебель);
  • профессиональные приемы (темп, стиль, учет невербальных компонентов общения, методы и др.).

Инженер по знаниям, успешно овладевший наукой установления атмосфе­ры доверия и взаимопонимания с экспертом (контактный слой), должен еще суметь воспользоваться благоприятным воздействием этой атмосферы. Проблема процедурного слоя касается проведения самой процедуры извлечения знаний. Здесь мало проницательности и обаяния, полезных для решения проблемы контакта, тут необходимы профессиональные знания.

Остановимся на общих закономерностях проведения процедуры.

Ситуация общения

Она определяется следующими компонентами:

  • место проведения сеансов;
  • продолжительность и время проведения сеансов.

Место. Беседу с экспертом лучше всего проводить в небольшом помещении наедине, поскольку посторонние люди нарушают доверительность беседы и могут породить эффект "фасада". Рабочее место эксперта является не самым оптимальным вариантом, т. к. его могут отвлекать телефонные звонки, со­трудники и пр. Атмосфера замкнутого пространства и уединенности поло­жительно влияют на эффективность.

Американский психолог И. Атватер считает, что для делового общения наи­более благоприятная дистанция от 1,2 до 3 м [Schouksmith, 1978]. Мини­мальным "комфортным" расстоянием можно считать 0,7—0,8 м.

Продолжительность и время. Реконструкция собственных рассуждений — трудоемкий процесс, и поэтому длительность одного сеанса обычно не пре­вышает 1,5—2 часа.

Эти два часа лучше выбрать в первой половине дня, например с 10 до 12 часов, если эксперт типа "жаворонок", и в районе 16—17 часов, если он "сова". Эти два пика активности (11 и 16 часов) установлены исследовате­лями 24-часового ритмоцикла человеческой активности.

Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20—25 минут [Ноэль, 1978], поэтому в сеансе нужны паузы.

Оборудование

Обычно включает:

  • вспомогательные средства;
  • освещенность и мебель.

Вспомогательные средства представляют собой средства для увеличения эффективности самого процесса извлечения знаний и средства для протоколи­рования результатов.

К средствам для увеличения эффективности процесса извлечения знаний, прежде всего, относится наглядный материал. Независимо от метода извлечения (см. разд. 2.4), выбранного в конкретной ситуации, его реализация возможна разными способами.

Например, широко известно, что людей, занимающихся интеллектуальной деятельностью, можно отнести к художественному либо мыслительному типу. Термины тут условны и не имеют отношения к той деятельности, кото­рую традиционно называют художественной или мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может плодотворнее исполь­зовать любой из методов извлечения, зная, что люди художественного типа легче воспринимают зрительную информацию в форме рисунков, графиков, диаграмм, т. к. эта информация воспринимается через первую сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают язык формул и текстовую информацию. При этом учитывается факт, что боль­шую часть информации человек получает от зрения. Совет пользоваться активнее наглядным материалом из [Хейес-Рот, Уотермена, Ленат, 1987] можно считать универсальным. Такие методы, как свободный диалог и игры, предоставляют богатые возможности использовать слайды, чертежи, рисунки.

Для протоколирования результатов в настоящее время используются следующие способы:

  • запись на бумагу непосредственно по ходу беседы (недостатки — это часто мешает беседе, кроме того, трудно успеть записать все, даже при на­личии навыков стенографии);
  • магнитофонная запись (диктофон), помогающая аналитику проанализировать весь ход сеанса и свои ошибки (недостаток — может сковывать эксперта);
  • запоминание с последующей записью после беседы (недостаток — годит­ся только для аналитиков с блестящей памятью).

Наиболее распространенным способом на сегодня является первый. При этом наибольшая опасность тут — потеря знаний, поскольку любая запись ответов — это уже интерпретация, т. е. привнесение субъективного понима­ния предмета.

Естественным является требование отключать мобильный телефон во время сеанса (хотя бы со стороны аналитика).

Освещенность и мебель. Значения параметров освещенности и мебели также влияют на эффективность процедуры извлечения знаний. Посадите экспер­та на неудобную табуретку, направьте ему свет в глаза и посмотрите, сколь­ко минут он выдержит...

Профессиональные приемы аналитика

Они включают, в частности:

  • темп и стиль;
  • учет невербальных компонентов общения;
  • методы.

Темп и стиль. Учет индивидуального темпа и стиля эксперта позволяет ана­литику снизить напряженность процедуры извлечения знаний. Типичной ошибкой является навязывание собственного темпа и стиля. Необходимо умение перенимать темп и стиль общения эксперта (эффект зеркала).

На успешность также влияет длина фраз, которые произносит инженер по знаниям. Этот факт был установлен американскими учеными — лингвистом Ингве и психологом Миллером при проведении исследования причин низ­кого усвоения команд на Военно-морском флоте США [Gammack, Young, J985].

Причина была в длине команд. Оказалось, что человек лучше всего воспри­нимает предложения глубиной (или длиной) 7+2(—2) слова. Это число (7+2) получило название "число Ингве—Миллера". Можно считать его мерой "разговорности" речи. Опытные лекторы используют в лекции в основном короткие фразы, уменьшая потерю информации с 20—30% (у плохих лекто­ров) до 3-4% [Горелов, 1987].

Учет невербальных компонентов общения. Большая часть информации по­ступает к инженеру по знаниям в форме предложений на естественном язы­ке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи (мышления), которая гораздо богаче и многообразнее. При этом для передачи этой внутренней речи эксперт использует и невербальные средст­ва, такие как: интонация, мимика, жесты. Опытный инженер по знаниям старается записывать по возможности в протоколы (в форме ремарок) эту дополнительную интонацию.

В целом, невербальный компонент стиля общения важен и для проблем контактного слоя при установлении контакта, когда по отдельным жестам и выражению лица эксперта инженер по знаниям может установить границу возможной "дружественности" общения.

Методы. Конкретные методы подробно рассмотрены в следующем разделе, исходя из позиции, что метод должен подходить к эксперту как "ключ к замку".

Когнитивный слой

Когнитивные (от англ, cognition — познание) науки исследуют познаватель­ные процессы человека с позиций возможности их моделирования (психо­логия, нейрофизиология, эргономика, инженерия знаний). Наименее ис­следованы на сегодняшний день проблемы когнитивного слоя, связанные с изучением семантического пространства памяти эксперта и реконструкци­ей его понятийной структуры и модели рассуждений.

Основными факторами, влияющими на когнитивную адекватность поля знаний, будут:

  • когнитивный стиль;
  • семантическая репрезентативность поля знаний и концептуальной модели.

Когнитивный стиль

Под когнитивным стилем человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека. Когнитивный стиль определяет не столько эффектив­ность деятельности, сколько способ достижения результата [Алахвердов, 1986]. Это способ познания, который позволяет людям с разными способ­ностями добиваться одинаковых результатов в деятельности. Это система средств и индивидуальных приемов, к которым прибегает человек для орга­низации своей деятельности.

Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный стиль, а также стиль эксперта. Особенно важны такие характеристики ког­нитивного стиля, как:

  • полезависимость — поленезависимость;
  • импульсивность — рефлективность (рефлексивность);
  • ригидность — гибкость;
  • диапазон когнитивной эквивалентности.

Поленезависимость. Это свойство позволяет человеку акцентировать внима­ние лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и умение отбрасывать все лишнее, т. е. не зависеть от фона или окружающего задачу шумового поля. Эта характеристика корре­лирует с такими чертами личности, как невербальный интеллект, аналитич­ность мышления, способность к пониманию сути. Очевидно, что помимо того, что самому аналитику необходимо иметь высокое значение параметра, поленезависимый эксперт — это тоже желательный фактор. Однако прихо­дится учитывать, что больше нуждаются в общении полезависимые люди, а потому они и более контактны [Орехов, 1985].

Особенно полезны для общения гетерогенные (смешанные) пары, например "полезависимый — поленезависимый" [Иванов, 1986]. В литературе описаны различные эксперименты, моделирующие общение, требующее понимания и совместной деятельности. Наиболее успешным в понимании оказались поленезависимые испытуемые (92% успеха), для сравнения полезависимые давали 56% успеха [Кулюткин, Сухобская, 1971].

Для совместной профессиональной деятельности важна также гибкость когнитивной организации, которая связана с поленезависимостью. Итак, большую способность к адекватному пониманию партнера демонстрируют субъекты с высокой психологической дифференциацией, т. е. поленезависимостью.

Поленезависимость является одной из характерных профессиональных черт когнитивного стиля наиболее квалифицированных инженеров по знаниям. По некоторым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем женщины.

Импульсивность. Под импульсивностью понимается быстрое принятие реше­ния (часто без его достаточного обоснования), а под рефлексивностью — склонность к рассудительности. Рефлексивность по экспериментальным данным коррелирует со способностью к формированию понятий и про­дуктивностью стратегий решения логических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль изменяется лишь частично и с большим напряжением.

Ригидность. "Ригидность — гибкость" характеризует способность человека к изменению установок и точек зрения в соответствии с изменяющейся ситуацией. Ригидные люди не склонны менять свои представления и струк­туру восприятия, напротив, гибкие легко приспосабливаются к новой об­становке. Очевидно, что если эксперт еще может себе позволить ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), то для инженера по знаниям эта характери­стика когнитивного стиля явно противопоказана. Увеличение ригидности с возрастом отмечается многими психологами [Кулюткин, Сухобская, 1971; Орехов, 1985].

Диапазон когнитивной эквивалентности. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен провести индивид, тем большее ко­личество признаков понятий он может выделить. Обычно у женщин диапа­зон когнитивной эквивалентности уже, чем более широкий диапазон у мужчин.

Семантическая репрезентативность

Эта проблема подразумевает подход, исключающий традиционное навязы­вание эксперту некой модели представлений (например, продукционной или фреймовой), и, напротив, заставляет инженера по знаниям последова­тельно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например многомерное шкалирова­ние [Петренко, 1988; Воинов, Гаврилова, 1996]. Проблема семантической репрезентативности ориентирована на достижение когнитивной адекватно­сти поля знаний и концептуальной модели. В настоящий момент она может быть сформулирована как проблема "испорченного телефона" [Гаврилова, Червинская, 1992] (см. разд. 2.1, рис. 2.4) — возможные трансформации и потери в цепи передачи информации.

2.3.2. Лингвистический аспект

Лингвистический аспект касается исследований языковых проблем, т. к. язык — это основное средство общения в процессе извлечения знаний.

Сразу же следует оговорить, что поскольку книга посвящена проблемам разработки ЭС, то область разработки естественно-языковых интерфейсов и весь спектр проблем, связанных с ней — лексических, синтаксических, семантических, прагматических и т. д. [Мальковский, 1985; Попов, 1982], не рассматривается.

В инженерии знаний можно выделить три слоя лингвистических проблем (рис. 2.11):

  • "общий код";
  • понятийная структура;
  • cловарь пользователя.

 Рис. 2.11. Лингвистический аспект извлечения знаний

Рис. 2.11. Лингвистический аспект извлечения знаний

"Общий код"

"Общий код" решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты:

  • общенаучная терминология;
  • специальные понятия из профессиональной литературы;
  • элементы бытового языка;
  • неологизмы, сформированные за время совместной работы;
  • профессиональный жаргон и др.

Детализируя схему общения (см. рис. 2.8), можно представить средства об­щения как два потока [Горелов, 1987], состоящих из компонентов V1 и V2 — соответственно языки, на которых говорят аналитик и эксперт (V1’ и V2’ — невербальные компоненты). Различия языков V1 и V2 и обуславливает "языковый барьер" или "языковые ножницы" в общении инженера по знаниям и эксперта.

Эти два языка являются отражением "внутренней речи" эксперта и аналити­ка, поскольку большинство психологов и лингвистов считают, что язык — это основное средство мышления, наряду с другими знаковыми система­ми "внутреннего пользования" (универсальный семантический код — УСК [Мартынов. 1977], языки "смысла" [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).

Язык аналитика V1 состоит из трех компонентов:

  • общенаучной терминологии из его "теоретического багажа";
  • терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;
  • бытового разговорного языка, которым пользуется аналитик.

Язык эксперта V2 включает:

  • общенаучную терминологию;
  • специальную терминологию, принятую в предметной области;
  • бытовой язык;
  • неологизмы, созданные экспертом за время работы, т. е. его профессиональный жаргон.

Если считать, что бытовой и общенаучный язык у двух участников общения примерно совпадает (хотя реально объем второго компонента у эксперта существенно больше), то некоторый общий язык или код, который необходимо выработать партнерам для успешного взаимодействия, будет склады­ваться из потоков, представленных на рис. 2.12.

В дальнейшем этот общий код преобразуется в некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех тер­минов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование тер­минов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной об­ласти с предварительной группировкой их по смыслу, т. е. по понятийной близости (это уже первый шаг структурирования знаний).

На этом этапе аналитик должен с большим вниманием отнестись ко всем специальным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной облас­ти — первый рубеж на подступах к созданию адекватной базы знаний.

 Рис. 2.12. Структура общего кода Рис. 2.13 дает -36

Рис. 2.12. Структура общего кода

Рис. 2.13 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает "знак" и "означаемый предмет". Только в интерпретации знак по­лучает смысл. Так, на рис. 2.13 слова "прибор X" для эксперта означают не­которую конкретную схему, которая соответствует схеме оригинала прибо­ра, а в голове начинающего аналитика слова "прибор X" вызывают пустой образ или некоторый черный ящик с ручками

 Рис. 2.13. Неоднозначность интерпретации Внимание -37

Рис. 2.13. Неоднозначность интерпретации

Внимание к лингвистическому аспекту проблемы извлечения знаний спо­собствует сближению образа 1 с образом 2 и интерпретации I1 с интерпре­тацией I2, а слова "прибор X" перейдут в действительно "общий" код.

Понятийная структура

Особенности формирования понятийной структуры обусловлены установ­ленным постулатом когнитивной психологии о взаимосвязи понятий в па­мяти человека и наличии семантической сети, объединяющей отдельные термины во фрагменты, фрагменты в сценарии и т. д. Построение иерархической сети понятий, так называемой "пирамиды знаний" (см. разд. 2.1), — важнейшее звено в проектировании интеллектуальных систем.

Большинство специалистов по искусственному интеллекту и когнитивной психологии считают, что основная особенность естественного интеллекта и памяти в частности — это связанность всех понятий в некоторую сеть. По­этому для разработки базы знаний и нужен не словарь, а "энциклопедия" [Шенк, Бирнбаум, Мей, 1989], в которой все термины объяснены в словар­ных статьях со ссылками на другие термины.

Таким образом, лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении таких связанных фрагментов с по­мощью "сшивания" терминов. Фактически эта работа является подготовкой к этапу концептуализации, где это "шитье" (по Шенку — КОП, концептуальная организация памяти [Шенк, Хантер, 1987]) приобретает некоторый законченный вид.

При тщательной работе аналитика и эксперта в понятийных структурах на­чинает просматриваться иерархия понятий. Такие структуры имеют важ­нейшее гносеологическое и дидактическое значение и в последнее время для них используется специальный термин — онтология [Gruber, 1989; Гав-рилова, Хорошевский, 2001]. Следует заметить, что эта иерархическая орга­низация хорошо согласуется с теорией универсального предметного кода (УПК) [Горелов, 1987; Жинкин, 1982], согласно которой при мышлении используются не языковые конструкции, а их коды в форме некоторых абстракций, что в общем согласуется с результатами когнитивной психологии [Величковский, 1982].



Pages:     | 1 || 3 | 4 |   ...   | 14 |
 





<
 
2013 www.disus.ru - «Бесплатная научная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.