WWW.DISUS.RU

БЕСПЛАТНАЯ НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 8 |

« А.А. Красилов ИНФОРМАТИКА В СЕМИ ТОМАХ Том 1. Основы информатики (Введение в информатику) ...»

-- [ Страница 4 ] --

Игры на ВМ еще крайне мало изучены, не все возможности машины использованы, не все способности человека проверяются; игры не исследованы психологами, преподавателями и информатиками, они еще не оценены с точки зрения конечного (положительного или отрицательного) влияния на человека-игрока. Для информатики здесь проблем не меньше, чем для психолога или преподавателя. Игры, наконец, не в полной мере используются для познания реального мира. Ведь игры используются главным образом для простейшего развлечения и выработки у игрока навыков и умения общения с ВМ, работы с клавиатурой, внимания и реакции на ситуации, возникающие на экране дисплея.


Правильный путь таков: усвой то,

что сделали твои предшественники, и иди дальше.

Л. Толстой

Глава 3. Определение информатики

Поскольку определение информатики уже дано во введении, ограничимся в этой главе комментариями по отношению к этому определению. Определение науки имеет большое число атрибутов. Относительно информатики как науки раскрыто только часть атрибутов. Уделим здесь внимание еще некоторым атрибутам определения науки информатики. Основная задача данного рассмотрения состоит в проведении сравнительного анализа этого определения с имеющимися определениями в литературе и в более полном раскрытии нового определения. Например, имеющееся перечисление в новом определении необходимо пояснить и обосновать. Итак, предмет главы - новое определение понятия информатики.

В каждой науке столько потенциала познания нового, сколько в ней информатики

3.1. Имеющиеся определения

Одно из первых упоминаний о понятии «информатика» появилось в середине нашего столетия. Интуитивное понимание этого термина постепенно приобретало законченные формы. Далее рассмотрим некоторые примеры (появившиеся последовательно по времени) определения и сопоставим их с нашим определением.

История развития определения информатики характеризуется следующими примерами. Одно из первых определений информатики дано в [Михайлов68]: «Информатика - это научная дисциплина, изучающая структуру и общие свойства научной информации, а также закономерности всех процессов научной коммуникации и реферирование научных статей». Это определение по своему существу трактует информатику как технологию поиска нового знания в научных публикациях через реферирование. Такой взгляд существенно обедняет всю научную деятельность, связанную с обработкой текстов (и знания вообще). В связи с этим определением возникает несколько вопросов:

  • Что такое научная информация и научная коммуникация?
  • А всякая ли публикация является научной?
  • Какова цель изучения свойств научной информации и коммуникации?
  • Что получается при обработке ненаучной информации?
  • Следует ли ее обрабатывать?

Имеются и другие вопросы. Монография [Михайлов68] не дает ответов на такие вопросы. Данное определение развивается так. Пожалуй, главное отличие данного определения информатики по сравнению с новым определением состоит в том, что оно охватывает только один вид знания, который именуется научной информацией. Но, как говорится, сказано «А», должно последовать «Б».

Позднее в [Советский89] понятие информатики определено так: «Информатика - это отрасль науки, изучающая структуру и общие свойства научной информации, а также вопросы, связанные с ее сбором, хранением, поиском, переработкой, распространением и использованием в различных сферах человеческой деятельности». Это определение ставит вопрос приобретения знаний шире по области применения ВМ, но сужает предмет исследования. К перечисленным вопросам, которые возникают при анализе таких определений, необходимо добавить следующий вопрос: Каким образом выбрана для определения информатики последовательность слов сбора, хранения и т.д. данных или информации? Оба определения не указывают границ между кибернетикой и информатикой. Поставленные выше вопросы будут вполне уместны и для многих определений. Правда понятие научной информации заменено более широким понятием, кроме этого в определении предопределяется цель отрасли науки. Положительным моментом такого определения является то, что научная дисциплина становится отраслью науки. Этот факт отражает существо бурного развития наших представлений о новой технике для обработки информации. Развитие определения новой науки вполне оправдано малым сроком применения ВМ, по мере расширения сферы использования ВМ развивается и представление о новой науке. Сегодня можно сказать, что ВМ нашла применение во всех сферах деятельности человека, поэтому возникла необходимость переосмысления определения понятия информатика.

К только что рассмотренному определению информатики можно сформулировать и другие вопросы. В определении перечисленные понятия, которые взаимозависимы:

  • чем сбор информации существенно отличается от поиска информации,
  • чем переработка информации отличается от ее преобразования,
  • так ли уж существенны различия между словами распространение и использование?

Перечисление слов в определении должно содержать ортогональные понятия для более полного описания сферы применения определения. И последняя претензия к данному определению. Современное определение кибернетики и приведенное здесь определение информатики почти совпадают. Возможно, что эти определения и породили споры ученых относительно сфер работы двух наук.

Академик А.П. Ершов дает глубокий анализ смысла термина «информатика», играющего роль связующего звена между понятиями вычислительная техника и автоматизация. Он пишет, что информатика обозначает «название науки, связывающей нас знанием о применении вычислительной техники для нужд автоматизации». А.П. Ершов анализирует историю введения слова «информатика» в русский язык.



  • Первое введение - «как неологизм, построенный по законам латинского словообразования для обозначения научной дисциплины, связанной, прежде всего с научно-технической информацией, а через нее - с другими системами накопления информации из печатных источников и документов». Первое использование термина связано с первым определением информатики, данным в книге [Михайлов68].
  • Второе введение - «как калька с французского informatique, которая служит для обозначения науки об ЭВМ и их применении, и очень скоро превратившееся в синоним английского Computer Science - наука о вычислительной технике (или наука о вычислительном деле)». Второе использование термина связано с появлением многих областей применения бурно развивающейся вычислительной техникой.
  • Третье введение - «как название фундаментальной естественной науки, изучающей процессы передачи и обработки информации». Здесь рассматриваются и обосновываются несколько другое толкование термина «информатика». Новое определение укладывается в колею приведенных определений, не противореча им и завершая цепь определений. Информатика породила кластер наук - информатические науки. Именно это дает основание тому, что информатика становится действительно фундаментальной наукой.

Еще раз обратимся к фразе А.П. Ершова: «Сознавая некоторую относительность деления наук на естественные и общественные, мы все же относим информатику к естественнонаучным дисциплинам в соответствии с принципом вторичности сознания и его атрибутов и с представлением о единстве законов обработки информации в искусственных, биологических и общественных системах. Отнесение информатики к фундаментальным наукам отражает общенаучный характер понятия информации (знания - А.К.) и процессов ее обработки». Рассмотренная выше классификация наук и отнесение информатики в особый разряд наук несколько отличается от предложенных А.П. Ершовым. Фундаментальность информатики состоит в том, что она используется в недрах всех наук. Можно перефразировать известное высказывание о том, что в каждой науке столько науки, сколько в ней математики, в высказывание: в каждой науке столько потенциала познания нового, сколько в ней информатики.

Имеются достаточное число и других определений информатики, которые занимают промежуточное положение между данными выше определениями. Их рассмотрение потребовало бы значительные объемы текстов. Оставим проблему анализа определений историкам. Выделим из множества определений только те, которые обобщают их с различных точек зрения, и произведем сопоставление с новым определением.

Окончательное впечатление о результате сравнения кибернетики и информатики может сложиться после сравнения понятий знание и информация. До этого сравнения можно сделать вывод о том, что новое определение информатики разрешает вопросы, возникающие при анализе данных выше определений. Явно сформулирована цель информатики - технология поиска нового знания на основе имеющегося; в новом определении не выделяется понятие научной информации (любые сообщения любого сорта являются материалом для представления знаний и их обработки); результатом обработки знания является знание; перечень слов в новом определении уже обоснован с исторической точки зрения развития технологии приобретения знаний человеком. Использование в новом определении понятия знание может вызвать вопросы и нарекания в связи с тем, что оно присуще, мол, только человеку. Проблеме обоснования использования этого понятия будет посвящено достаточное число страниц.

Из всех поставленных вопросов ограничимся двумя главными. Первый вопрос находит ответ в том, что информатика (или информатики) рассматривает только ту информацию, которая выходит из-под пера ученого. Не очень понятно в этом свете как рассматривать работы студента или результаты измерений. А ведь сведения об открытой звезде является научной информацией, и замеры некоторого предмета могут быть научной информацией и т.п. По-видимому, сегодня на ВМ обрабатывают произвольные сведения, имеющие хотя бы малый смысл или не имеющие смысла. Более того, подчас осуществляется обработка случайных сведений, а в результате обработки получается научная информация. Этот пример явно находится в противоречии с рецензируемыми определениями информатики. Позитивно можно рассуждать таким образом. Слово информатика внедрилось в области деятельности, связанной с обработкой научно-технической документации. Обработка информации другого сорта (расчет или моделирование) осуществлялась в математике и в технике. Со временем область использования слова информатика расширялась и обогащалась новым содержанием. Первое, приведенное выше, определение имело революционный характер, несмотря на возникающие в связи с ним вопросы. Наступило время коренного переосмысливания области применения слова информатика. Поиск нового слова для обозначения науки о применении ВМ не оправдано никоим образом. Еще раз напомним, что первое определение зародилось на базе обработки научной информации с помощью алгоритмического знания. Распространим определение информатики на семь видов представлений знания. Это распространение и послужило основанием для обобщения определения информатики.

По второму вопросу нужно заметить, что в определении подразумевается цель поиска нового знания. Но эта цель свойственна любой науке. Кроме общей цели каждая научная дисциплина должна иметь собственную цель. Если рассматриваемое определение предполагает цель составление рефератов, то едва ли надо было бы использовать слово информатика (авторы первого определения имели дело с информационными системами). Все дальнейшее развитие вычислительной техники и технологии ее применения показывает, что данное толкование термина информатика весьма неудовлетворительно. Все высказанные вопросы ведут к новому осмыслению информатики как науки.

Для завершения краткого анализа имеющихся определений (к тому же не всех, а только выборочных, дающих историю развития) необходимо сформулировать в общих чертах требования к новому определению информатики, учитывающему современной состояние работ по применению ВМ во всех областях деятельности человека. Определение должно учитывать обработку любой информации (включая околонаучную или случайную), поступающую в память ВМ. Например, ввод информации с ошибками повсеместен в связи с обучением, сбоем средств формирования сообщений, искажением при наборе последовательностей символов, неправильным толкованием назначения или смысла толкования сообщений. Эта и другая информация должна перерабатываться так, чтобы в результате получилась научная информация, но может быть и ненаучная информация, но дающая новое знание. Определение должно обобщать накопленные знания о применении ВМ, оно должно быть независимым от области применения ВМ. Определение информатики должно отражать общие законы и закономерности обработки любых сообщений.

3.2. Анкета информатики

Сделаем перерыв в серьезной работе по осмыслению нового определения информатики и посмотрим с юмором на уже изученные свойства понятия. Каждый человек представляется с помощью анкеты, содержащей общие характеристики самого человека или его деятельности. Представим себе, что информатика - некоторое существо, имеющее свои характеристики и свою область деятельности. Что может отметить информатика в своей анкете?

В лучших традициях студенчества, в особенности студентов МФТИ, имеется игра в анкеты в шутливой или полушутливой форме. По аналогии с такими играми предложим анкету об обстоятельствах жизни информатики. Кроме вопроса и ответа на вопрос в анкете дается комментарий к ответу.

Пункт Вопрос Ответ Комментарий
1 Имя Информатика Выше указывалось на историю понятия
2 Мать Кибернетика В недрах кибернетики развилась информатика
3 Отец Готфрид Вильгельм Лейбниц Это обстоятельство будет пояснено ниже
4 Сестра Математика Теоретические основы базируются на математических исчисленьях
5 Подруга Ада Аугуста графиня Лавлейс, дочь Байрона Первая программистка в мире составила первую программу для машины Бэббиджа
6 Прародители Знак, язык, понятие, книга, наука, алгоритм, система Основные вехи развития познания человеком связаны этими предметами
7 Дата рождения Конец XVII века В этом веке напечатаны труды Лейбница с главными положениями о применении ВМ
8 Место рождения Г.В. Лейбниц: «Новые опыты о человеческом разумении автора предустановленной гармонии Здесь указан главный труд Лейбница по информатике
9 Национальность Международная Трудно отметить точку на Земле, где появилась информатика
10 Язык Естественный, формальный и профессиональный Такие классы языков используются в информатике
11 Образование 40 лет школы интенсивного применения ВМ Именно за последние годы информатика оформилась в самостоятельную науку
12 Ученая степень Кандидат в науку для всех наук Информатика образовала кластер наук
13 Ученое звание Наука Теперь можно с уверенностью говорить о таком ее назначении
14 Социальное положение Участник второй научно-технической революции Информатика обеспечивает усилители умственных способностей человека
15 Предмет изучения Знание Самое важное место в определении информатики
16 Объект изучения Система человек-ВМ От взаимодействия человека с ВМ родилась информатика
17 Методы работы Более 60 методов и приемов изобретания, проектирования, разработки и сопровождения объектов Наиболее важное место для практики применения ВМ
18 Средства СВТ и программы для ВМ Техническая и программная основа информатики
19 Цель жизни Описание, осмысление, определение, представление, обобщение и применение знаний для формирования нового знания Таково определение информатики
20 Жизненное назначение Усиление умственных способностей человека Самое главное назначение информатики
21 Участие в выборных Отделение информатики, вычислительной техники и автоматизации РАН Ныне порождены многочисленные фирмы по созданию программных продуктов
22 Место работы РАН, Академия информатизации, школа, вуз и др. Ныне - различные акционерные общества
23 Должность Знаниевед Это не прозаика, а новое важное дело
24 Зарплата От 0.3 до 3 процентов национального дохода каждой страны Рост обязателен для всех стран
25 Темпы роста 12-17% программ ежегодно Таковы объективные обстоятельства
26 Родственники США – Computer Science, Англия – Informatics, Франция – Informatique, Италия и Испания – Informatica, Германия – Informatik, Голландия – informatika, Польша – informatyka, Россия – информатика.
27 Любимый цвет Радуга Все 7 цветов




В каждой шутке имеется доля правды. Этот принцип послужил основанием для формирования анкеты.

3.3. Г.В. Лейбниц - отец информатики

История информатики как наука открыта для начального исследования. В ней написаны только первые строчки. Она также богата как история любой другой науки. Она заслуживает самого пристального внимания, поскольку касается всех без исключения наук и прямых пользователей ВМ.

Г.В. Лейбниц является изобретателем трех фундаментальных вещей, полезных для формулировки и изучения информатики:

1. Осуществление в 1694 году проекта аналитической ВМ логических вычислений. Лейбниц говорил, что придет время, когда люди станут решать все спорные вопросы путем вычислений. Аналитическая машина была сделана для управления государством, что исторически тогда было не оправдано.

2. Создание основ математической вычислительной логики (определение равенства, введение логических операций и др.). Это изобретение можно оспаривать в части чисто логических исследований, вспоминая о фундаментальных логических трудах Аристотеля, который занимался рассудительной логикой.

3. Установление того, что с символами можно и надо оперировать также как с числами. Это подтверждается следующей цитатой из трудов Лейбница [Лейбниц]: «Ведь подобно тому, как в буквенной алгебре мы производим вычисления с числами вообще, выражениями в буквах, которые обозначают любые специальные числа, известные или неизвестные, так и здесь, применяя буквенные обозначения вместо этих чисел, мы докажем замечательные теоремы науки логики.

...Этим путем, если не во всем, то по крайней мере в бесчисленном множестве вещей, мы откроем и уже доказанное другими, и то, что другие когда-нибудь смогут доказать из уже известных определений и аксиом, а также экспериментов. И вот в чем наше преимущество: с помощью чисел мы сможет тотчас судить доказаны они или нет; и то, и другое смогли сделать с величайшим напряжением ума или случайно, мы достигаем с помощью лишь символов и точного, истинного аналитического метода; поэтому то, на что в ином случае потребовалось бы многие тысячелетия, мы сможем совершить за столетие».

Лейбниц - философ и математик - сумел подняться в своих работах по логическому моделированию интеллекта до понимания единства логических и арифметических операций и операций с символами - вот главнейший вывод, который можно сделать по прочтении его научных трудов [Лейбниц]. А три указанные выше кита заложили основу современной информатики.

В историю информатики должны войти даты жизни Лейбница, некоторые из них даны представительно ниже:

Дата Событие
01 июля 1646 Рождение
1661..1666 студент Лейбцигского университета
1663 учеба в Йенском университете
1666 работа «Об искусстве комбинаторики», защита докторской диссертации
1668..1672 служба у барона Бойнебурга
1671 сочинение «Новая физическая гипотеза»
1672..1676 служба по дипломатическим поручениям в Париже
1673 член Лондонского королевского общества
1676 начало службы у ганноверских герцогов
1675 открытие дифференциального исчисления
1682 вывод признака сходимости ряда
1684 создание основ математического анализа и методов максимума и минимума
1684 изобретение знака дифференциала
1686 создание основ физики и механики, изобретение знака интеграла
1689..1690 поездка в Италию, сбор исторического материала
1691 изучение тяжелой нити, происхождения и эволюции Земли
1693 создание начала теории определений
1692..1694 выдвижение идеи геометрических вычислений
1694 создание логической машины
1695 обобщение понятия дифференциала
1696 решение задачи о бахистрохроне
1697 знакомство с Петром Первым
1700 член Парижской академии наук, президент Бранденбургского научного общества, член Берлинской академии наук
1702..1703 решение задачи интегрирования рациональных дробей
1704 сочинение «Новые опыты с человеческим разумением
1710 работа «Теодицея»
1711, 1712, 1716 встречи с Петром Первым
1712..1714 проживание в Вене
1714 работа «Монадология»
1714..1716 разработка основных философских проблем
14 ноября 1716 умер в Ганновере

Надо надеяться на то, что труды Лейбница еще предстоит изучать с различных точек зрения, но главным образом с точки зрения основания информатики. Мы назвали внутренний язык (формальное описание универсальной СеГ - семантической грамматики ЕЯ) представления знаний словом Лейбниц, отдавая должное его выдающимся результатам исследований в логике и информатике.

3.4. Историческое введение

История сохраняет памятники культуры. Надо думать, что она сохранила и памятники информатической культуры. Еще египетские жрецы изобретали средства автоматического преобразования информации. Нет нужды подробно рассматривать способы передачи сигналов кострами или звуками. Здесь кратко рассмотрим лишь некоторые исторические вехи развития информатики, начиная со времен Г.В. Лейбница и Б. Паскаля.

Значительным был вклад Б. Паскаля в информатику. Он проводил мысль, что арифметическая машина производит действия, которые приближаются к мысли больше, чем все, что делают животные. Им была построена машина в виде экспериментального образца. Имя Паскаля зафиксировано за весьма широко распространенным языком программирования.

Следующая историческая веха отмечена для информатики первой в мире программисткой, дочерью Байрона Адой Аугустой графиней Лавлейс, она составила первую в мире программу (в 1840 году) для ВМ Чарльза Беббиджа (26.12.1792 - 18.10.1871). Весьма важной оказалась мысль об именовании одного из языков программирования по имени - Ада [Джехани88].

Р. Хемминг так определил роль информатики:

- цель машинной обработки - понимание, а не числа;

- прежде чем решать задачу, подумай, что делать с ее решением.

Удивительные слова, они во многом повлияли на формирование нового определения информатики. В них содержится главная мысль - зачем и как применять ВМ. Новое определение информатики, используя эту мысль, выражает всю совокупность знаний о применении СВТ в деятельности человека.

В наше время русский логик и создатель теории алгоритмов А.А. Марков обосновал возможность и целесообразность применения конструктивной логики [Марков84] к программированию, им построена теория нормальных алгорифмов, что для информатики означает введение понятия алгоритмического знания. Первое время (да и поныне) под информатикой понимают сумму знаний, которая может быть выражена формулой: информатика = СВТ + алгоритм + программирование. Из нее следует, что информатика охватывает уже два вида знаний - научные публикации, алгоритмы и программы.

Андрей Петрович Ершов рассказывает: «Роль Алексея Андреевича Ляпунова в науке можно охарактеризовать очень просто. Он один из основателей советской школы информатики и кибернетики. Я горжусь тем, что мне довелось быть докладчиком на заседании первого в Советском Союзе семинара по кибернетике, на котором я рассказал о машинном моделировании условных рефлексов. Надо сказать, что тематика доклада очень выразительным способом сфокусировала в себе совокупность разнообразных интересов Алексея Андреевича. Он был создателем советской школы теоретического программирования, через которую прошли, по существу, все ученые, заложившие основы этой науки. Влияние Ляпунова на науку и ученых связано с его широкими интересами и глубокими познаниями во многих науках, оно объяснялось также и его личными качествами. При этом я имею в виду не только его гражданскую позицию как ученого, очень горячего, принципиального патриота и просто мужественного человека, но и его очень высокую демократичность, интеллигентность, не говоря уже о личном обаянии. Мне припоминается, с каким вниманием Алексей Андреевич относился к выбору правильного научного направления. Помню, однажды я написал техническую статью, и она у меня, как это сказать, получилась. Алексей Андреевич ощутил это мое упоение успехом, и хотя он эту статью одобрил и поддержал ее публикацию, тем не менее сказал: «Знаете, Андрей, Вы написали хорошую работу, но я Вам советую продвижение в этой области отложить до того времени, когда вам будет где-то ближе к 40 годам. А сейчас Вам нужно сосредоточить свое внимание на новых проблемах, на тех вещах, где путь к успеху не так очевиден и не так близок»». Мне также повезло быть докладчиком на семинаре Алексея Андреевича с темой о псевдослучайных числах и алгоритмах их программной генерации, быть его учеником на специальных курсах по программированию («О выработке псевдослучайных чисел на ЭВМ») и испытать шутливую критику по выбранному направлению в программировании. Многие программисты и ученые старшего поколения могут гордиться аналогичными высказываниями относительно гения советской кибернетики и информатики. И действительно, испытываешь огромное вдохновение от общения с Алексеем Андреевичем Ляпуновым при обсуждении темы доклада, от возможности сделать первый в жизни доклад на его первом в СССР семинаре по программированию в МГУ, от представившейся возможности учиться программированию на его первых в СССР лекциях в Москве в военной Академии.

Какое замечательное творение подарил для СССР академик Сергей Алексеевич Лебедев - первую ВМ, созданную подпольно. Информатика пробивала дорогу в жизнь с весьма большими трудностями. Мало кто верил в то, что наступает информационная революция в обществе людей. Здесь уместно вспомнить совсем анекдотичный случай. После конструирования первой ЭВМ в США была создана экспертная группа различных специалистов, которая должна была ответить на вопрос относительно того, сколько ЭВМ потребуется для США за 20 последующих лет. Эксперты пришли к заключению, что их потребуется 20 штук. Реально через 20 лет их было 20000.

Много знаний об информатике добыто в недрах кибернетики, она там и зародилась как наука. Поэтому исторические исследования должны быть тесно связаны с историей кибернетики за последние полвека. С точки зрения самостоятельности информатики, она имеет свою многовековую историю, которая является еще не вспаханным полем.

3.5. Применение поколений ЭВМ

Первая ЭВМ сразу же стала приносить огромную пользу в решении вычислительных задач. Ни у кого не вызвало сомнений в важности использования ЭВМ в промышленности и науке. Но мало кто тогда мог предвидеть такое широкое применение ЭВМ во всех отраслях деятельности человека. Развитие СВТ шло параллельно с расширением области применения ЭВМ. Рассмотрим кратко историю развития СВТ техники и параллельное расширение области применения ЭВМ. К настоящему времени по статистическим данным насчитывается уже 2300 областей применения ЭВМ.

Первое поколение ЭВМ, построенных на ламповых схемах с цифровыми устройствами печати и устройствами ввода с перфокарт и перфолент. Они применялось главным образом для математического моделирования физических предметов, явлений и процессов. ЭВМ стимулировала развитие численных методов, представлений функций и численных таблиц. Основная характеристика этого периода применения ЭВМ - разработка программ преобразования численных данных во внутренние представления и наоборот. Надо заметить, что в это же время реализовывались проекты релейных ВМ (США). Именно в это время родился анекдот: Выдайте мне 500 грамм спирта для промывки оптических осей.

Второе поколение ЭВМ было построено на полупроводниковой технике. В это время появляются устройства символьного ввода и вывода сообщений. Рост памяти по объему, в особенности внешней памяти на магнитных носителях, позволил решать с помощью ЭВМ новые классы задач - ведение учета документации и сопутствующей ей информации. Вместе с этими задачами решались задачи использования больших объемов памяти для хранения и быстрой выборки сообщений. Развивались методы сортировки и редактирования данных. Конечно, для каждого поколения имеются характерные области применения ЭВМ. Кроме этого, одновременно развивались и другие методы обработки сообщений. Всегда были пионерские работы по освоению новых областей применения ЭВМ. Именно в это время родились лозунги: «Перекуем магнитные барабаны на диски!» и «В каждой программе имеется хотя бы одна ошибка!».

Третье поколение ЭВМ было связано с появлением интегральных схем. К этому времени работа с текстами приобрела массовый характер. Практически воплотилась мечта В.Г. Лейбница об использовании ВМ для манипулирования символами точно так же, как они могут манипулировать с числами. Работа с текстами в частности была связана с преобразованиями формул и записей программ. ЭВМ стала применяться для формирования программ, которые должны выполняться на ЭВМ. Характерно для этого времени появление программ производства аналитических выкладок с формулами, синтеза текстов для изготовления разнообразных документов. Заметим также, что в это же время появились ВМ, построенных на других принципах (пневматические ВМ, например).

Четвертой поколение ЭВМ было связано с появлением больших интегральных схем, мини и микроЭВМ на их основе. К этому времени мини-ЭВМ применяются для решения кибернетических проблем управления станками, производствами и процессами. Учет параллелизма работы устройств, реального времени и внутренних часов стал основной проблемой программирования. Здесь можно усмотреть частичное воплощение другой мечты В.Г. Лейбница об использовании ВМ для управления государством.

Пятое поколение ЭВМ связано с появлением сверхбольших интегральных схем и микропроцессорных элементов. А в связи с этим в практику выполнения вычислительных работ стали проникать профессиональные или персональные ВМ. Они позволили внедрить ВМ во все сферы деятельности человека. Для больших ЭВМ жизнь поставила новые проблемы по построению систем моделирования естественного интеллекта (построение искусственного интеллекта), программирования интеллектуальных способностей человека, способностей человека мыслить. С математической точки зрения главным звеном проблем была проблема автоматического доказательства теорем. Это в свою очередь породило проблему ввода в память ЭВМ информации об исчисленьях, теориях и формулах. Теперь ЭВМ становится не простым решателем вычислительных проблем, а интеллектуальным средством для постановки и решения самых разнообразных задач. Персональным ВМ суждено следовать за большими ВМ по классам решаемых задач. В это время строятся глобальные проекты больших и интеллектуализированных ВМ. ПЭВМ становятся домашними, в то время достаточно неожиданно разрабатываются игровые программы различного стиля, назначения и интеллекта.

К шестому поколению ВМ можно отнести сети ВМ и многопроцессорные ВМ, призванные решать емкие по данным и программам задачи прогнозирования и моделирования явлений и процессов, происходящих в природе, экспериментах и в обществе. Сети развиваются быстрыми темпами: от локальных сетей до глобальных сетей на предприятии, в стране и между странами. Идет быстрое накопление текстовой и графической информации. Программы стали тиражироваться, образовался доступный рынок программ, который постепенно перерастает в рынок знаний для ВМ.

Этим не завершается развитием поколений ЭВМ, появление однокристальных процессоров приведет к разработкам вычислительных систем большого быстродействия и огромного параллелизма в выполнении операций. Данные перечисления приводят к следующим выводам:

  • любое применение ЭВМ связано с получением нового знания, ценность которого может быть различной и зависеть от типа решаемой проблемы;
  • историческое развитие применения ЭВМ связано с расширением областей применения и с выявлением новых сфер их использования;
  • вряд ли будут исчерпаны сферы применения ЭВМ, новые классы проблем будут возникать непрерывно;
  • поколения ЭВМ постепенно расширяют количественные и логические возможности ЭВМ для решения новых классов проблем;
  • общее стремление в развитии ВМ обрисовывается словами: информатизация и интеллектуализация любых производственных и научных процессов.

3.6. Значение информатики

Жизнь каждой информатической науки (или внедрение информатики в ту или иную науку) отражает использование информатики для конкретного применения СВТ. Поэтому тему применения информатики можно считать исчерпанной, учитывая также экспоненциальный спрос на ВМ и программы. Однако такой вывод является весьма поспешным. Применять информатику - это не значит зафиксировать факты использования ВМ для решения проблем конкретной науки. Каждая информатическая наука нуждается в знании методологии информатики и в преломлении ее для данной информатической науки. Значение информатики вытекает из ее смысла - обеспечить автоматизацию поиска нового знания. В этом нуждается каждая наука, не лишенная стремления к развитию.

Проблемы программирования, как и в любой другой науке, возникают в связи с обнаружением противоречий внутри процессов программирования и при взаимодействии его с другими средствами применения ВМ. По-видимому, некоторые различия понятий задача и проблема уже сформировались. Информатика находится в тех же условиях, что и любая другая наука. Но прежде чем рассматривать ее проблемы дадим толкование проблемы и задачи информатики.

Проблема информатики - это формулировка противоречия внутри информатики, разрешение противоречия открывает новые возможности информатики. Проделанный анализ процедурного программирования выявил дюжину недостатков, которые и выявили противоречия внутри информатики. На основе анализа противоречий появилась теория интеллектуальных систем. Задача информатики - это проблемы вне информатики, но требующие разрешения средствами или методами информатики. Внешние проблемы выражаются в стремлениях пользователей решать свои задачи с помощью ВМ. Проблемы информатики требуют специального рассмотрения. Задачи информатики разрешаются по мере развития СВТ и методов их применения.

Проиллюстрируем сказанное на двух примерах. Проблемой информатики является защита информации или сообщений от поломок, сбоев устройств ВМ или от несанкционированного доступа. Здесь можно выделить противоречие между точностью записи программы и данных и ошибочностью передачи информации в ВМ между различными устройствами памяти.

Информатика призвана, в частности, изучать и разрабатывать средства автоматизации в системах «наука - техника - производство - распространение - потребление». Это основная прикладная задача информатики и ее назначение не зависит от того, где применяется автоматизация: в материальном, энергетическом или информационном производстве. Заметим, что формулировка целей науки чаще всего указывает и на формулировку задач этой науки. Информатика в этом смысле не является исключением.

Значение информатики велико. Оно поясняется хотя бы тем обстоятельством, что число ВМ в год увеличивается в мире на почти сто миллионов единиц. Оно поясняется и тем, что рынок программ является равновеликим с рынком вещей. Оно поясняется тем, что информатика стала необходимой школьной и институтской дисциплиной. Оно косвенно поясняется количеством ВМ в быту. В настоящее время переоценить значение информатики невозможно.

3.7. О классификации (представления) знаний

Разнообразие форм и способов представления и передачи знания почти не поддаются формализованной классификации (по четко выделенному и единственному признаку). К этому надо заметить, что одни формы или способы представления знаний могут переводиться в другие формы или способы представления. Однако дадим подходящие классификации для некоторого упорядочивания знаний о знаниях. Это делается для исследования проблемы охвата имеющихся у человека средств передачи и хранения знаний, в частности, в память ВМ. ИП получит положительную оценку, если все или большинство способов применимы для решения задач с помощью Интеллсист.

Каждая классификация должна иметь признак, по которому каждое конкретное знание относится к той или иной категории или к тому или иному способу представления. Конечно, в первую очередь знания подразделяются по наукам, специализациям, направлениям исследований и т.п. Каждая наука характеризуется своим багажом знаний, отличающимся от совокупности знаний другой науки. Эта классификация фундаментальна и широко известна. Если информатика применяется в некоторой науке, то ее способы представления знаний реализованы. Также хорошо известна разнообразная классификация знаний по назначению. В учебном процессе известна классификация знаний по действенности или воздействию на учащегося или по усвояемости знаний учащимся.

В вычислительном деле различают три средства для представления знаний: символьное, графическое и предметное. Это или аналогичные средства подразделения также могут представить классификацию в представлениях знаний. В соответствии с предварительной договоренностью здесь рассматривается только символьное представление знаний. Признак классификации по средствам представления знаний важен для выбора СВТ взаимодействия в системе человек-ВМ.

В программировании важен признак сорта используемого языка представления знаний. Классификация языков является в то же время и классификацией способов представления знаний. Здесь используется, например такая классификация:

  • ЯПП как средство представления профессиональных знаний, которое не обязательно согласуются с подразделением знаний по наукам;
  • языки спецификаций или языки заданий в некотором смысле созвучны с языками профессиональной прозы по «внешним» признакам, но необходимо учитывать сущности знаний об объектах и знаний о том, что делать с объектами;
  • концептуальные языки связаны с определениями понятий, которые также могут классифицироваться по областям знаний и по форме формулировок;
  • формальные языки классифицируются по сложности, количеству охватываемых языков, областям применения и другим признакам;
  • языки логических исчислений подразделяются по составам операций, способам задания меры истинности и структурам самих исчислений (набором правил логического вывода или языкам правильно построенных формул);
  • алгоритмические языки (их классификация важна в информатике), количество которых оценивается числом 3000, имеют свою обширную классификацию;
  • системные языки для управления хорошо согласуются в смысле классификации с языками программирования, но, тем не менее, имеют свои признаки для подразделения на классы.

В деятельности человека по применению СВТ важна классификация знаний по спецификации разработки: реклама, описания разработок, пособия по применению, меню работ пользователя, спецификации элементов разработки, программы, комплекс самой разработки. Еще один метод классификации из большого числа важен - это классификация по форме представления данных в широком смысле этого слова, она имеет такую структуру. Здесь под данными подразумеваются знания или средства для представления знаний: тексты из символов, семантические сети, фреймы из слотов, отношения или таблицы, алгебраические формулы или утверждения для передачи фактов и аксиом, правила вывода нового знания или продукции, система управления базами данных или знаний.

Можно провести классификацию знание по степени противоречивости, независимости или полноты. Конечно, знания могут быть противоречивыми или нет, только две подобные характеристики важны, знания могут быть зависимыми или нет, такая классификация может оказаться полезной для некоторых целей оценки знания, знания могут быть полны или недостаточными, что может и не составить критерий классификации знаний. Полнота необходима для получения окончательного ответа на запрос, но и неполнота может дать положительные результаты при получении зависимостей понятий. Указанная классификация полезна в качестве рабочего момента в работе со знаниями.

Наконец, классификация по видам знаний является информатической, поэтому ее рассматриваем главным образом: лингвосемиотические знания, семантические знания, концептуальные знания, фактографические знания, теоретические знания, алгоритмические знания и кибернетические знания. Эта классификация уже представлена ранее как способ подразделения, не зависящий от области знаний напрямую.

Даже указанные классификации не исчерпывают всех возможных подразделений способов и форм представлений знания. ИП использует ЯПП, массивы, записи, файлы и таблицы, которые достаточны для представления всего многообразия представлений. Другие способы и формы представления потребуют некоторых усилий для преобразования (или формализации) в имеющиеся в ИП способы и формы. Расширение словаря терминов в связи с преобразованиями несложное дело. Проблему формализации упрощает применение меню инструментария Интеллсист и справочная подсистема.


Глава 4. Представление данных и знаний

За время существования ВМ практика выработала многочисленные приемы, методы и средства представления данных в памяти ВМ [Агафонов82, Берзтисс74, Грей89, Данные75, Джадд75, Касаткин79, Козлов59, Кондрашина79, Коэн75, Лозовский82, Мартин80, Мейер87, Минский79, Орлов70, Предстинт80, Предстсис89, Райан89, Роджерс80, Рыбина79, Сепилов80, Цикритзис85]. В указанных работах изложены все аспекты представления данных и сделаны заявки на методы представления знаний. Там рассмотрены только некоторые вопросы представления данных и знаний с позиций Интеллсист и классификации знаний. Общее положение таково: любой текст является либо данным для обработки (или ее результатом), либо записью знаний. Некоторые общие обзорные аспекты представления данных и знаний рассматриваются в данной главе.

4.1. Представление данных

Относительно представлений данных сделаем следующие предположения. Данные всегда выражают смысл некоторого понятия (обоснование этого положения дано в томе 2), в связи с которыми рассматриваются эти данные. Но данные также могут быть понятиями, этот факт может показаться неожиданным, но он важен и полезен. Практика человека выработала огромное число методов и приемов представления данных. Главная цель информатики состоит в сохранении всех этих методов и приемов для работы с ВМ. Трудность заключается в том, что практика человека является весьма разносторонней. В различных областях знания один и тот же смысл (некоторого или одного и того же понятия) может передаваться различными способами. Например, число 7 может быть представлено и словом семь. Все это порождает трудности, устранение которых возможно только при унификации средств и методов представления данных и в процессе разработки системы трансляции представлений во внутренний код.

Для представления простейших данных используются лексемы - исходные кирпичики, понимаемые и определяемые рекурсивно (числа, символы, строки, тексты и различные структуры из лексем). Для представления сложных данных используются конструкции выражений (например, дата и время, агрегаты и подпрограммы и файлы). Имеется достаточно средств и методов для представления смыслов различных понятий. Если понятие является чрезвычайно сложным, например - человек, то его смысл передается ВМ приближенно (с абстрагированием от некоторых свойств и признаков) в зависимости от требований конкретной области знания и решаемых задач. Всегда найдется композиция простейших или сложных методов для представления смысла понятий.

ФЯ обычно ориентированы на представления данных конкретных областей знания. В большинстве случаев они ориентированы на программирование различных задач. В информатике рассматривается СеГ, которая содержит компромисс областей знаний в отношении представления данных. Компромисс выражается в том, что СеГ ориентирован на ЕЯ, охватывая тем самым большинство областей знания. Более того, инструментарий ИП предусматривает средства для пополнения методов представления пользовательскими представлениями. Представление данных в ИП целиком ориентировано на используемый в ЕЯ арсенал представлений и на возможность творчества пользователя в представлениях его данных.

Существенным является вопрос представления конкретных данных в каждой области знания. Рассмотрим несколько примеров, по которым можно судить о проблеме представления в каждом конкретном случае. Числовые данные представляются традиционно с использованием точки вместо запятой для разделения целой и дробной частей числа, латинская буква «e» или «E» разделяет десятичное число (мантиссу) и порядок числа. Стандартная плоская геометрическая фигура представляется с помощью процедур или функций, например треугольник по трем точкам представляется как треугольник(х1, у1, х2, у2, х3, у3). Это более сложное данное по сравнению с числами. Дифференцирование функции F(x) представляется с помощью преобразования типа: diff(F(x)) для дифференциала или diff(F(x))/diff(x) для производной. Сведения о человеке представляются записью с многочисленными полями (паспорт, рост, вес и др.), причем перечни полей для различных целей будут различными.

Данные используются всюду. Первичными данными являются лексемы. Они используются для обозначения значений понятий, для заполнения массивов, таблиц и записей измерениями или результатами наблюдений. Они используются во фразах и утверждениях, как скрытые факты, распознаваемые по контексту. Они могут использоваться как части терминов для некоторых понятий. Они, наконец, используются в качестве констант в БЗ. Все допустимые лексемы определены в томе 2. Для начального знакомства с лексемами достаточно сослаться на тот факт, что числа, символы и строки используются повсеместно, они сохранили свой привычный облик в ЯПП. Возможно, что имеются минимальные различия, которые будут обнаружены при вводе знаний и запросов в Интеллсист. Например, 45 - известное представление целого числа, но вещественное число 4.5 отличается от традиционного представления 4,5. Это различие можно обосновать только одним желанием использовать запятую для разделения объектов в списках чисел.

Фундаментальные сорта данных, такие как графические или предметные для современных Интеллсист представляются с помощью последовательностей символов или файлом с кодами.

Обособленно целесообразно рассматривать такие данные как языки, а точнее надо сказать - грамматики, определяющие языки. Грамматики могут относиться и к новым данным, и к сложным объектам типа программы. Их используют во многих случаях: оформление результата, распознавание принадлежности к языку, трансляция текстов и др. О грамматиках приведены сведения подробнее в томе 2. Имеются такие данные, которые требуют не только новых структурных решений, но и изобретательского подхода. Конечно, в большинстве случаев надо действовать по аналогии. Достаточный материал о способах представления данных можно найти в томе 4. Там на большом числе примеров рассматриваются практически полезные аналоги для представления сложных данных.

4.2. Представление знаний

Практика построения систем ИИ выработала много методов представления знаний. Теория и опыт представления знаний для ИИ важен и должен полностью использоваться [Бенерджи71, Братко90, Восилюс80, Ефимов77, Искусс88, Искусс91, Левин91, Логический90, Логический98, Лорьер90, Нильсон85, ПоспеловГ85, Предстинт80, Справочник90, Тыугу77, Уинстон80, Хант78]. Среди них наиболее популярные методы именуются семантическими сетями, сетями Петри и фреймами. Основная причина слабой эффективности сетей и фреймов зиждется на том основании, что при их изобретении и применении используется СиГ с привлечением понятия связи объектов и их характеристик. Смысл результатов построения сетей и фреймов содержится в связях понятий (чаще всего слов) или частей речи грамматики ЕЯ. Попытка находить смысл текстов на основе СиГ малоэффективна и не приводит к повсеместному использованию этих методов. Связи понятий могут быть самые разнообразные и динамически возникать в процессах логического вывода или просто анализа текстов. Создается впечатление, что конкретные методы не могут распространяться широко из-за огромного разнообразия представления знаний в современных областях знаний.

Поменяем исходные положения, на которых основаны современные методы представления (например, семантические сети и фреймы) знаний. Основных положений только четыре. Первое положение: в основе всякого знания используется понятие, которое представляется в соответствии с теорией Фреге парой: <имя, значение>, которая для понятия выражает <наименование понятия, смысл понятия>. Имя служит идентификатором понятия, а значение - его смыслом. Значение может быть вполне определенным, не вполне определенным и вовсе неопределенным. Понятие является исходным кирпичиком для всякого построения знаний, выражаемых текстами или формулами. Все тексты составляются только из цепочек понятий. Второе положение: имя изображается термином и не обязательно только словами, а значение простыми и составными (структурными) лексемами. Термин может представляться словом (как принято в большинстве методов ИИ), числом, знаком, строкой или комбинацией указанных элементов. Третье положение: понятия в текстах «линейно» связаны друг с другом так, что некоторые понятия отображают объекты (предметы, явления или процессы), а некоторые - действия (связи понятий между собой). Некоторые объекты могут выступать действиями, а действия - объектами. Четвертое положение завершает перечень основ представления знаний. Оно состоит в том, что для каждого понятия ставится в соответствие множество значений, которые могут образовать пару из имени понятия и одного из значений. Эти и только эти положения определяют метод построения представлений знания. При этом не выделяются ни сети, ни фреймы (в явном виде). Такие и более сложные объекты могут быть представлены по выбору пользователя по широким правилам, имеющими возможности представления сетей и фреймов. Средства представления знаний разнообразны. Можно представить семантические сети, в узлах которых используются фреймы, а они могут содержать вновь семантические сети следующего уровня. Например, понятие «человек» настолько является сложным, что рекурсивное использование сетей и фреймов будет оправданным. Остальные положения и их применения будут изучены в следующем томе.

Пара <имя, значение>, или более обще <понятие, смысл>, интерпретируется по разному, в зависимости от изучаемого объекта. Вот некоторые примеры:

в СеГ (см. т.2) пара приобретает вид <термин, лексический элемент>,

в СиГ (см. т.4) - <текст, граф>,

в графической информатике (см. также т.4) - <изображение, текст>,

в биологических исследованиях - <человек, система>,

в лингвистических исследованиях - <язык, грамматика>.

Можно представить и другие варианты интерпретации пары. Важно то, что пара отражает общее понятие некоторой области знания, которое имеет две главные компоненты: наименование понятия и его смысл. Причем, тот или иной компонент пары может быть неопределенным. Кроме этой пары каждое понятие имеет еще многие сопровождающие его атрибуты, которые играют меньшую роль или реже используются. Примерами атрибутов понятия являются дата появления понятия, характеристика области смысла понятия и др. Здесь ограничимся только такой формой представления знаний. Заметим, что можно привлечь методы моделирования для перехода от одной формы пары к другой. Например, изображение моделируется понятием файла, граф, система и грамматика – структурными данными.

Итак, каждое понятие обладает свойством принимать значение (иметь смысл) из определенного и заданного (или неопределенного вовсе) множества значений. Такие множества (если хотите - наборы) называются типами данных (термин взят из ФЯ). Для них заведомо определены или определяются пользователем действия - операции с такими данными. Семантическая сеть и фрейм в указанных предположениях представляется как запись с полями так, что некоторые из полей являются ссылками на такой же структуры записи. В семантических сетях может использоваться несколько типов записей, тогда они будут содержать поля со ссылками на одну или несколько типов записей. С таким подходом к формализации знаний о понятиях пользователь получает широкое поле для поиска средств и методов представления знаний, как отдельных фактов, так и утверждений о фактах и правил вывода новых утверждений.

Особое место занимают представления фактов, которые являются «исходными данными» любого знания. Например, наборы фактов могут представляться таблицами, массивами или записями. Любой табличный документ является фактическим материалом для понятия с именем идентичным или совпадающим с наименованием таблицы. Любая последовательность экспериментальных данных также является массивом из фактов для некоторой величины. Любая совокупность конкретных характеристик (атрибутов) объекта является записью с полями, представляющими его характеристики. Все разнообразие представлений знания содержится в языке Лейбниц, как внутреннем представлении знания. Он охватывает не только известные в различных областях знаний способы представления, но потенциально содержит новые способы. Тексты на ЯПП должны соответствовать формализму языка Лейбниц.

Важным обстоятельством всякого представления знаний является наличие или отсутствие методов представления пользовательского знания. В языках представления знаний должны изображаться фиксированные (или известные) знания и способы формирования новых представлений. Условно можно сказать так: знания должны представляться известными и производными способами, которые позволяют создавать новые формы представлений. Для этого в грамматике языка должны содержаться правила для формирования новых способов. Их называют обычно пользовательскими. Пользователь сам вправе изобретать новые значения (смыслы) для своих понятий в широком диапазоне структур (если имеется в этом необходимость).

4.3. Сопоставление данных и знаний

Данные представляет каждый, если они заданы числами, строками или текстами. Знания можно представить, если пользователь знаком с представлениями знаний в ЯПП. Данные и знания представляются текстами в соответствии с правилами СиГ и СеГ (см. т.2). Это значит, что внешне данные и знания представляются одинаково, но различными последовательностями символов. Действительно, число - текст из цифр, термин - текст из букв, знаков и цифр, подпрограмма - текст из всего набора символов клавиатуры. Конечно, грамматики представлений данных и знаний различны для чисел, строк и подпрограмм. Все допустимые конструкции определяются в ЯПП. В этом кроется главное отличие и схожесть в представлениях данных и знаний, программ или текстов.

Ситуация представлений данных существенно усложняется при рассмотрении структурных данных (массивы, таблицы и записи). Сложность вытекает из практических запросов пользователей к хранению и манипулированию структурными данными (векторы, матрицы, записи, организация доступа, защита, контроль и др.). Запросы пользователя формируются в требования, которым обычно удовлетворяют СУБД [Информ75, Калиниченко90, Когаловский92, Крамм89, Лозовский82, Макаровский80, Мартин80, Мейер87, Минский79, Тиори85, Ульман90]. Здесь указан достаточно полный список литературы, в которой можно найти много полезного для представления данных сложной структуры. Этим вопросам здесь не уделяется специального внимания.

Еще более усложняется ситуация при рассмотрении знаний, отличных от фактов. Если проследить историю методов обработки знаний, то можно найти аналогию в развитии средств и методов представления знаний, методов представления данных. Даже не касаясь такой истории, сразу отметим, что знания всегда сложны по своей структуре, поэтому родилась идея построения СУБЗ (по аналогии с СУБД). Часто бытует мнение, что изобретение СУБЗ является лишней роскошью, поскольку можно воспользоваться средствами СУБД. Это действительно так, если проблема памяти и времени не возникает при построении и использовании Интеллсист. Точно так же можно сказать и о СУБД. Весь поток данных можно представить массивами, тогда проблема хранения данных решается без какой-либо СУБД. Но это не так, если иметь в виду объем знаний для практически полезных применений Интеллсист. Это не так, если стремиться к уменьшению затрат человеческих ресурсов, если игнорировать накопленный опыт построения СУБД.

Вот цепь рассуждений, приводящих к необходимости построения СУБЗ. Заметим, что каждое понятие - это точка на плоскости представлений в любой области знаний. Понятие может относиться либо к объекту, либо к действию. Понятие, представляющее действие, должно (по тексту записи знаний) ссылаться на ноль, одну или две точки (может быть несколько точек) в рассматриваемой области, в которую присоединяется точка, представляющее действие. Если по своей сути действие должно ссылаться на большее число точек, то все ссылки можно условно и для простоты выстроить в цепочку так, чтобы получилось двоичное дерево. Теперь сделаем скачок. Вся совокупность знаний - это лес двоичных деревьев. Такой лес и каждое дерево надо построить, достроить или обработать. Причем, в лесе не должно быть повторяющихся деревьев или частей дерева. Это важное обстоятельство, которое усложняет операции с деревьями. Среди операций СУБД имеются такие: внести данное, взять данное, упорядочить все данные по какому-то признаку, сравнить данные или применить арифметическую операцию к данным. Уже на этом материале можно увидеть различие в обработке данных и знаний. Поэтому моделирование представлений и обработку знаний средствами СУБД будет неэффективным на два-три порядка. Остановимся пока на такой аргументации в пользу создания СУБЗ и не использования СУБД для хранения и обработки знаний. СУБД не сбрасывается со счетов. СУБД является составной частью инструментария ИП для эффективного выполнения операций хранения, поиска и обработки фактического материала. Можно говорить о том, что СУБЗ в совокупности с СУБД определяют машину обработки знаний. В завершение обсуждения можно воспользоваться известным изречением, но чуть-чуть изменив его: СУБДу - СУБДово, СУБЗу - СУБЗово.

Сопоставление данных и знаний можно завершить указанием их главные признаки:

  • данные - это фиксированная или зафиксированная структура из символов,
  • знания - это динамическая структура связей понятий с другими понятиями и с данными любого сорта.

Данные могут меняться в каком-либо процессе, но их структура будет сохраняться неизменной. Каждое число состоит из некоторых цифр, которые записываются по фиксированной грамматике, определяющей структуру числа. Массив остается массивом, даже при вводе новых данных. Знания же непрерывно изменяются по структуре в процессе их ввода или обработки. Каждая сеть связей между понятиями (структура некоторого знания) может измениться с вводом дополнительного или нового знания, например при появлении внутренних противоречий. Информатика включает методы моделирования данных и процессов. Поэтому знания можно моделировать данными, но с потенциально возможными большими потерями по памяти или быстродействию, так как изменение одного лишь действия в записи знания может привести к пересмотру всех взаимосвязанных данных в СУБД.

С формальной точки зрения отличий в представлении данных и знаний нет никаких. Но формальная точка зрения не годиться в практических реализациях. Поэтому для Интеллсист пригодными являются СУБД для хранения данных и доступа к ним и СУБЗ для хранения знаний и быстрого доступа к ним. Необходимо различать внешние и внутренние представления, первые должны учитывать весь человеческий опыт, вторые - способы оптимального кодирования.

4.4. Средства общения в системе человек-ВМ

Первыми средствами общения на первых ВМ были двоичные и восьмеричные коды для данных и команд. Эффективность такого общения была минимальной. Затем появились алфавитно-цифровые устройства ввода и вывода, которые поддерживали общение с ВМ на мнемоническом языке, в основе которого использовался буквенно-цифровой идентификатор. В связи с этим стали возможными языки ассемблера в качестве средства общения. Перенос клавиатуры пишущей машинки в СВТ позволил вводить и печатать данные и программы на формальных языках. Клавиатура непрерывно совершенствовалась. Такова вкратце история развития средств общения в информатике.

С внедрением клавиатуры стали развиваться языки общения. Вначале грамматика ФЯ была описательной (как в ассемблерных языках, так и в Фортране). Затем появился формализм Бэкуса-Наура (конец 50-х годов), который привел к изучению и развитию порождающих грамматик. В 70-х годах появились распознающие грамматики [Красилов73г], охватывающие большие классы ФЯ, включая форматные языки типа Фортран. Общение на языках, поддержанными формальными грамматиками, стало контролируемым алгоритмически. Семантика и прагматика в описаниях грамматик ФЯ оставались описательными. Но это уже обеспечило автоматический контроль над правильностью текстов данных и программ. Сегодня в информатике характерно внедрение ЯПП в качестве средства общения пользователя с ВМ. Внедрение ЯПП и СеГ позволяет автоматизировать контроль смысловой стороны текстов (см. т.2).

Выше представлены методы общения, которые более всего удовлетворяли только программистов. Расширение круга прямых пользователей поставило задачи такого развития СВТ, которое обеспечило бы их не только языковыми средствами общения. Световое перо, мышь и джойстик позволили уменьшить общее число нажатий клавиш, так как переход курсора по экрану дисплея с их помощью осуществляется за одно нажатие клавиши (исполнения или фиксации). На этом развитие средств общения с ВМ не остановилось. Огромную роль сыграли пиктограммы на экране дисплея, которые выполняют функциональную роль. Подвод курсора к пиктограмме и одно нажатие клавиши (например, на мышке) приводит к выполнению определенной (картинкой пиктограммы) функции или процесса. Дальнейшим развитием этого метода общения стал сенсорный ввод команд на исполнение функций, обозначенной пиктограммой. Вместо подвода курсора осуществляется прикосновение пальцем на экране требуемой пиктограммы с последующим выполнением функции. На этом развитие средств общения не останавливается. Есть еще в запасе органы чувств человека, которые могут использоваться для повышения эффективности общения с ВМ.

Конечно, человек записывает знания текстами или рисунками, что сохраняет необходимость общения с ВМ на ЕЯ или ЯПП. Набор текстов с данными или высказываниями неосуществим только набором слов или терминов по словарям с применением курсора и сенсорных свойств экрана дисплея. В частном случае такой метод пригоден, он должен использоваться наилучшим образом, устранение его недопустимо. Клавиатура интенсивно используется во многих случаях (кассы, телетайпы, факсы). Она способствует вводу данных или высказываний в память ВМ. Для повышения эффективности текстового ввода (и вывода) необходим звуковой метод. Ввод с голоса станет всеобщим явлением, когда СВТ будут оснащены микрофонами и надежными, настраиваемыми анализаторами звука.

Приведен только показательный перечень методов ввода данных, высказываний и программ. Их применение зависит от обстоятельств, при которых применяется ВМ, и области знаний. Средства ввода целиком зависят от состояния и развития СВТ. Для человека звуковой ввод и звуковой вывод являются самыми распространенными. Для информатики этот путь является весьма перспективным. Именно здесь надо искать поле деятельности инженеров СВТ.

4.5. Общее представление о порядке решения проблем

Информатические науки - это раздел любой науки или самостоятельная наука, в которой используются СВТ для решения проблем, вопросов или задач этой науки. Традиционный современный метод состоит в подготовке задания и передаче его на вычислительный центр (или программистам) для реализации. В большинстве случаев программисты не являются специалистами в науке, поставляющей задания, но вынуждены заниматься формализацией знания и представлением их программами для ввода их в память машины вместе с исходными данными. Затем осуществляется совместная со специалистом работа по осмыслению результатов решения проблемы, вопроса или задачи. Все погрешности и избыточные затраты подхода «специалист - программист - специалист» известны. Эра такого подхода завершается: специалисты должны сами использовать СВТ, программисты должны решать только свои программистские проблемы. Следствием рождения нового периода использования информатики прямыми пользователями (без программистов) явилось формирование новых информатических наук.

Применение информатики в данной науке возможно, необходимо и крайне целесообразно. Практика использования ПЭВМ убедительно показала это. Широко известная технология применения ВМ через науки о программах и программировании становится малопригодной для нового периода информатики - периода расцвета информатических наук. Вступает в силу новая технология использования ВМ прямым пользователем, который обязан познать и использовать ИП.

Имеются естественные варианты новой технологии или применения ИП. Они вызваны различными состояниями программного обеспечения инструментария Интеллсист и условий его применения. Например, порядок работ со знаниями отличается, хотя и незначительно, от порядка работ с запросами, работа по разрешению запросов отличается от работы с синтезированной программой (запуск готовой программы связан со сменой исходных данных). Меню работ инструментария учитывает особенности каждой частной технологии. Однако можно выделить общие части технологии решения конкретных проблем.

Обобщенная технология решения заданий (от альфы до омега) состоит из следующих работ.

1. Сбор знания состоит в подборе учебника или пособия, вспоминании или сочинении концепций, соотношений и зависимостей. Кроме этого важен сбор текстов, графики (рисунков и др.), числового материала или комбинации их. Знания собираются методом постепенного накопления в БЗ. Совокупность записей, графиков или чисел образует текст на ЯПП. Если такая работа уже проделана, то работа по сбору знания считается выполненной. Работа по сбору сделана заведомо или знания закуплены готовыми в форме БЗ.

2. Ввод знаний в память ВМ с помощью клавиатуры, в результате чтения файла или по информационным каналам или сканером (и др. имеющихся средств кодирования или непосредственно из некоторой физической среды) – второй шаг. Возможно, что знания уже хранятся в таблицах, поддержанных СУБД, или в машинной библиотеке. Тогда работа по вводу знаний считается выполненной.

3. Анализ знания для выбора терминов и создание лексикона специальности на основе введенного знания или терминологического словаря (если не применяется БЗ) – третий шаг. Терминологический словарь должен содержать не только термины, но и его характеристики, тогда он будет именоваться лексиконом. Предварительное составление словарей из слов автоматизировано. Если лексикон создан и хранится в машинной библиотеке, то работа по третьему шагу можно считать выполненной.

4. Прогон записей знания через языковый процессор реализуется для контроля правильности записей и соответствия терминов записей лексикону ЯПП. Обычно такая работа называется орфографическим анализом (правильность использования терминов) или грамматическим анализом (правильность использования выражений из терминов). В инструментарии Интеллсист совокупность этих работ именуется правописанием или терминографией.

5. Прогон записей знания через подсистему заполнения БЗ (или дополнений для имеющейся БЗ) и проведение отладки знания образуют пятый шаг. Эта работа называется условно программированием классов проблем и экологией или отладкой знания. Работа по отладке знаний может производиться заведомо как работа над знаниями. БЗ может и просто пополняться при использовании ВМ для решения данной проблемы.

6. Формирование или выбор форм запросов используется для передачи конкретных проблемы, вопроса или задачи. Формы запросов (можно говорить о форме задания для ВМ) также могут быть заданы заведомо для подготовки условий решения классов проблем. Этому служат шаблоны или анкеты (аналог ЭС).

7. Главная работа заключается во вводе конкретного запроса (задания) в память ВМ для логического вывода ответа-решения. Запрос должен быть отлаженным, а процедура отладки запроса аналогична процедуре отладки знаний. Когда отладка знаний и запроса завершена, то прогон запроса завершается выдачей ответов или программы.

8. Анализ результатов решения проблемы осуществляется либо для перехода к новой проблеме, либо для исправления ошибок в знании или в запросе (информационная обратная связь) и повтора процесса решения данной проблемы, либо выход из цикла решения проблем для создания документации по полученным результатам. Анализ окончательных результатов обычно делается вручную. Не исключается случай применения Интеллсист для этих целей. Тогда создается новый запрос по обработке полученных результатов.

Необходимо учитывать следующих два основных обстоятельств. Выше представлены восемь шагов технологического процесса, которые кратко отражают только сущность работ по решению заданий (или фазы технологического процесса). Реальная работа состоит из множества технологических операций (см. том 6), из которых составляется реальный технологический процесс. Второе обстоятельство, о котором здесь уже упоминалось, состоит рассмотрении технологии решения проблем и задач как кибернетический процесс обработки знаний с обратными информационными связями, вызванными необходимостью исправления обнаруживаемых ошибок.

4.6. Процедуры применения информатики

Информатика опирается на алгоритмику. Любое взаимодействие в системе человек-ВМ характеризуется некоторым процедурой или алгоритмом, что обеспечивает точность и надежность пошагового применения ВМ. Каждая процедура состоит из конечного числа действий (или шагов). Насколько продуманными являются действия и их последовательность, настолько гарантирован успех работы системы человек-ВМ. Информатика (технология поиска нового знания) и ее методы сами подчиняются шагам общей технологии. Общие черты применения информатики рассматриваются здесь с целью привлечь внимание читателя к относительной простоте технологии, которая базируется на знакомых любому человеку (хотя бы интуитивно) шагах познания предметов, явлений и процессов реального мира. Технология познания является «ручной», она воплощается вручную. Каждый в отдельности шаг автоматизируем или является автоматическим. Но выбор каждого шага и переходы от одного шага к другому выполняется вручную. Общим для всех шагов является применение Интеллсист, если имеется БЗ, соответствующая данному шагу.

Среди процедур применения информатики можно отметить следующие действия. Они поддержаны инструментарием Интеллсист и охватывают широкую область применения ВМ:

- корреляционный анализ текстов по смыслу для построения предварительных или оценочных терминологических словарей;

- статистический анализ текстов для построения распределений слов и терминов, которые позволяют выделять существенное и малосущественное;

- решение проблем и задач по семи главным разделам, определяемым автоматически по запросам пользователя:

- построение новых Интеллсист (в особенности для решения задач, возникающих на стыках наук) как композиции имеющихся систем;

- формирование новых понятий по контексту БЗ и запросов или методов решения новых логических (и других) задач;

- автоматическое построение программ или их синтез по результатам логического вывода решений.



Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 8 |
 





<
 
2013 www.disus.ru - «Бесплатная научная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.