« Санкт-Петербургский государственный университет На правах рукописи ...»
* Приходится использовать термины в двух смыслах – в широком и узком (см. во Введении о терминах-гиперонимах).
В противоположность упорядочиванию, систематизация имеет дело как с мерономическими, так и с таксономическими процедурами. Именно в этой сфере действует принцип двойственности (за исключением особой ситуации с фрагментацией).
Формально (на основании оперирования и с таксонами, и с меронами) к систематизации нужно отнести фрагментацию – сферу исследования операций разделения (разбиений и членений) понятий (разделительных и собирательных) и операций над ними (Чебанов, 1977, 1996; Мартыненко, Чебанов, 1988, 1996). При этом будут различаться разные виды фрагментации – иерархическая, комбинативная (фасетная), параметрическая (в соответствии с каким-то параметром – например, перенумеровывание фрагментов). Некоторые виды фрагментации удается определить формально через операции над разбиениями и расчленениями (например, разделения в комбинативных структурах коммутируют, а в иерархических – нет), но в общем виде результат пока получить не удается.
Остальные три вида систематизации – морфологизация, периодизация и группирование – поддаются ясному формальному описанию.
Морфологизация занимается обобщенным строением представителей некоторой группы с использованием собирательных категорий. Особенности самой группы как экстенсионала, вообще говоря, при этом могут не обсуждаться, хотя определенность архетипа однозначно задает группу.
Хотя морфологизация принципиально сходна с упорядочиванием, она отличается от последнего тем, что при морфологизации архетип представляется не как некая константа, а как то, что существует в виде совокупности вариантов. Кроме того, морфологизация призвана решать и задачу мереологии в понимании Ст.Лесневского – выделение исходных единиц, индивидов (Рахилина, 1990). При этом приходится решать, к примеру, вопросы выделения начала и конца текста, разделения конгломерата фрагментов текста на составляющие и т.д. (как, например, трактовка "Войны и мира" Л.Н.Толстого как совокупности нескольких текстов по характеру распределения лексических единиц – Орлов, 1970). В этом случае оказывается, что выделяется не один индивид, а сразу их класс. Выделение индивидов – один из наиболее сложных компонентов предклассификационной деятельности.
Задачей индукции по неполному основанию в морфологии является реконструкция – на основании данных в наблюдении деталей и фрагментов исследователь должен восстановить целое, в том числе, по конкретным экземплярам, данным в наблюдении, воссоздать общее строение (архетип) класса объектов. Таковыми являются и дешифровочные алгоритмы, извлекающие грамматику из корпуса текстов (Сухотин, 1963, Тимофеева, 1983).
Формы морфологизации многообразны. Наиболее популярна ныне структурализация, при которой строение передается через количественные параметры или иные константы (в терминах грамматики составляющих или грамматики зависимостей). Более богатое и мягкое описание строения (как в традиционном синтаксисе) позволяет говорить о мерономии (в понимании Мейена – Шрейдера), а отношение к форме как к “ловушке” смысла (Чебанов, 1984) вводит в сферу морфологии в понимании Гете (напр., в контексте грамматических учений античных философов, современной морфемики). Общая (Пригожин, Стингерс, 1986; Haken, 1999) и лингвистическая (Пиотровский, 1996; Koehler, 1986; Koehler, Altmann, 1986) синергетика дают возможность говорить и о синергетических образцах морфологизации.
Особым видом морфологизации, при которой речь идет о морфологизации объекта в реальном или фазовом пространстве, является районирование. Примером такой задачи является выделение ареалов в лингвогеографии (Кузнецова, 1981), ареальной типологии (Герд, 1982) или дистрибутивно-статистический метод, с помощью которого, привлекая дискриминантный или кластерный анализ, выделяются районы, интерпретируемые как группы (Шайкевич, 1976).
Специальным способом представления результатов районирования являются карты (например, изоглосс). Использование анаморфоидов или изображений, без первичной основы (картоидов – Родоман, 1990) удобно для изображения ментальных (когнитивных) пространств (например, картоиды предметных областей, наук).
Как особый вид морфологизации (мерономизации) или районирования во времени может рассматриваться периодизация (Клейн, 2000). Точная параметрически заданная периодизация дает датировку.
Задачей индукции по неполному основанию являются исторические реконструкции. В зависимости от времени, к которому относится реконструируемое состояние, это будут ретрогнозы (исторические реконструкции в узком понимании) и прогнозы. При решении этих задач существенную роль играют временные факторы – время порождения речи (ср. предложение о прогнозировании акта высказывания на основе теоремы Байеса – Налимов, 1974), или историческое время развития языка.
Последний вид систематизации – группирование. В этом случае исследователя интересует разнесение сходных экземпляров по группам, обладающих достаточно богатым архетипом. Основной задачей индукции по неполному основанию является экстраполяция – перенос результатов исследования части группы на всю группу.
По характеру мерономии, а отчасти и таксономии, различимы разные виды группирования.
При параметризации класс выделяется по значению какого-то параметра или их набору (по числу графем, длине слов, предложений и т.д.), так что его архетип весьма беден. Совокупность классов при этом составляет разбиение множества на подмножества (классы эквивалентности).
В классификации таксон выделяется на основании обладания всеми экземплярами существенными признаками. При этом целесообразно при классифицировании следовать закону единства основания деления понятия (как в перечислительных иерархических классификациях документов). Оперирование с существенными признаками обогащает архетип, но уменьшает эффективность диагностики, так что часто некоторые экземпляры оказываются нерасклассифицированными.
Типологии задаются обычно многоаспектным представлением данного вида организации – типом (в интенсиональном понимании; семантическим инвариантом в понимании Р.Якобсона – Якобсон, 1975). Тип реализуется в экземплярах непосредственно или через варианты типа. Экземпляры, презентирующие данный вид организации, слагают тип в экстенсиональном понимании. При этом не все экземпляры могут быть однозначно отнесены к тому или иному типу (т.е. типы как экстенсионалы могут пересекаться) ввиду наличия переходных форм и форм, в которых сочетаются черты нескольких типов (полирадикальные формы, сложные типы). Часть экземпляров образует единичные совокупности (не соотносимые ни с одним типом) и остается нераспределенным по экстенсиональным совокупностям. Так, в стилистической типологии большая часть литературных произведений образует совокупность многоэлементных групп (некоторые из которых могут пересекаться), а некоторые оригинальные тексты остаются изолированными (Мартыненко, 1983).
Для лингвистики и филологии наиболее характерны именно типологии.
Для некоторых задач используются и другие формы группирования, такие, как ординация (при которой интенсионал задается как композиция нескольких типов, реализующихся в одних и тех же референтах) и наречение (при котором варианты интенсионала являются эманациями одной сущности), применимые, например, в герменевтике (Чебанов, 1983 а, б, 1996, 1998; Чебанов, Мартыненко, 1990 а, б, Chebanov, 1993, 1998). Эти построения далее рассматриваться не будут.
Проведенное различение видов упорядочивающе-систематизирующей деятельности позволяет сделать несколько важных выводов.
– Часто как в лингвистике, так и в других сферах деятельности, различные виды упорядочивающе-систематизирующей деятельности квалифицируются неадекватно их природе. При этом практически все виды упорядочивающе-систематизирующей деятельности могут обозначаться как классификации или типологии.
– Указанные недоразумения касаются не только терминологии (да и не столько – поскольку устоявшейся терминологии нет), но и сути дела. Здесь прежде всего речь идет о библиотечных классификациях, или, шире, классификациях предметных областей. Тем не менее, это типичные районирования концептуальных пространств, для них справедливо прямое соотношение объема и содержания понятий – более широкие области это не родовые понятия, а более крупные фрагменты. Точно так же, в информационном поиске часто рассматриваются только родовидовые отношения, а в них (порою без всяких оговорок) включается отношение целое-часть.
– Несмотря на все сказанное, многие виды упорядочивающе-систематизирующей деятельности могут быть трансформированы друг в друга (полностью или частично). Так, интенсионалы любой формы группирования дают номинальную шкалу, а интенсионалы параметризации могут дать и количественную шкалу. Разные виды группирования могут быть получены как районирование в пространстве признаков (см. использование для этого дистрибутивно-статистического метода – Шайкевич, 1976). Периодизация является временной формой районирования, а на ее основе можно получить исторические группировки и т.д. Такие трансформации не противопоказаны, если в дискурсе рефлексируется смена логики, поскольку переход в другую логику требует смены задачи индукции по неполному основанию (экстраполяций – на реконструкции, экстраполяций – на прогноз), которые имеют разные граничные условия для того, чтобы быть корректными (Чебанов, 1980, 1983, 1996).
– Осуществление деятельности, связанной с каждым видом группирования, морфологизации и периодизации предполагает использование одного из видов других форм упорядочивающе-систематизирующей деятельности. Так, классификация требует соответствующей мерономии, процедура идентификации (соотнесения экземпляра с архетипом) требует применения диагностики, а называние классов предполагает именование, которым занимается определенная концепция номенклатуры. Некоторые компоненты таких сочетаний предпочтительны (например, типология, морфологизация и номинальное шкалирование; параметризация, структурализация и количественное шкалирование), другие встречаются реже (сочетание типологии с разбиением на классы эквивалентности и именованием – Чебанов, 1983, 1996).
Далее будут рассматриваться преимущественно проблемы группирования и других форм упорядочивающе-систематизирующей деятельности, используемых как схемы порождения тех или иных видов группирования в лингвистике. При этом по мере необходимости все указанные термины будут использоваться без кавычек, а там, где речь будет идти о неидентифицированных построениях – о “классификациях”.
1.3. Общая схема
упорядочивающе-систематизирующей деятельности.
Совокупность собственных исследований (опубликованных и неопубликованных – Чебанов, 1998, 1999; Чебанов, Сопиков, Ковалева, 1992) и литературных данных из разных областей знания позволяет очертить следующую схему формирования упорядочивающе-систематизирующей деятельности.
В ее основе лежат индивидуальные, групповые и, видимо, универсальные (свойственные виду Homo sapiens) черты психофизиологии, проявляющиеся еще в перинотальный период развития плода (Crain, Thornton, 1998). В соответствии с ними у ребенка на 2-3 месяце жизни фиксируется способность к простейшим различениям, по-видимому, сначала мерономического типа (различение фигура-фон). Освоение языка обеспечивает формирование в течение второго года жизни практически всех различений, используемых в языке. Далее начинается формирование особенностей различений, диктуемых языком и культурой (что изучается этнолингвистикой). Во второй половине первого десятилетия жизни удается зафиксировать индивидуальные особенности различения (преобладание мерономических или таксономических различений, парадигматики или синтагматики), детерминация которых связывается с особенностями психофизиологии или культурной средой. При этом раньше развиваются фреймово-синтагматические представления, а позже – сетчато-парадигматические (Леонтьев, Леонтьев, 1997).
С конца первого десятилетия жизни начинается целенаправленное (но не осознаваемое) формирование различений системой образования и знакомством с элементами профессиональных знаний. В итоге отрок уже владеет всеми основными общекультурными различениями (основными моделями выделения экземпляров, представлениями их устройства и тривиальными таксономиями).
Погружение в профессиональную среду включает в себя знакомство с профессиональными различениями. Только овладев ими как частью профессиональных навыков, человек оказывается в позиции исследователя, занимающегося “классификацией”.
При этом он обладает: 1) общекультурными и профессиональными образцами выделения экземпляров (тривиальной и профессиональной мереологией) и 2) тривиальными и профессиональными моделями выделения архетипов и таксонов, причем и то, и другое может быть модифицировано особенностями его психофизиологии.
Далее начинается “переклассификация”, которая и понимается как профессиональная деятельность по “классификации”. При этом для индивида характерно такое видение особенностей архетипа, которое позволяет перестраивать таксоны, либо же экспликация эйдетически воспринимаемого сходства (различия) требует пересмотра мерономии. В некоторых редких случаях может пересматриваться и мереология – принципы и практика выделения экземпляров. Вся подобная деятельность носит итеративный характер.
В зависимости от характера такой деятельности и уровня ее авторефлексии, она может получать квалификацию (адекватную или нет) одного из видов упорядочивающе-систематизирующей деятельности, каждый из которых характеризуется своими задачами, методами и образцами деятельности.
В лингвистике обычны “классификации”, свойственные всякому идеографическому знанию – они относятся к популятивным (Щедровицкий, 1975) объектам (а не объектам, описываемым инвариантами – как в физике), обычно открыты путем наблюдения (а не выведены теоретически), описываются на естественных национальных языках и имеют национальную номенклатуру (а не латинскую – как в биологии). На основании сформулированных положений можно перейти к детальному рассмотрению этих “классификаций”.
Глава 2. Критическое описание “классификаций” в лингвистике:
к созданию методологии анализа “классификаций” в лингвистике
2.1. Общие особенности “классификаций” в лингвистике.
“Классификации” в лингвистике многочисленны (они даются почти в каждой работе) и разнообразны (по единицам, с которыми оперируют – звукам, фонемам, слогам, словам, интонациям, морфемам, синтаксическим конструкциям, падежам, залогам, вопросам, текстам, языкам, языковым союзам, техникам понимания текста, знакам и т.д., по числу различений – от единиц до миллионов, по фундаментальности – от предполагающих единичное использование до являющихся предметом профессиональной рефлексии многих поколений исследователей, по языку описания – от естественного и поэтического до математического и т.д.).
Существует значительное число работ, достаточно целенаправленно затрагивающих общие проблемы “классификации” в лингвистике (Алексеев, 1975, 1977; Арыкин, 1989; Арутюнова, 1980, 1988; Бектаев, 1978; Бенвенист, 1963; Березин, Головин, 1979; Богданов, 1990, 1993; Богин, 1991, 1992 а,б, 1993, 1994 а,б, 1995, 1996 а,б, 1998; Ванников, 1985; Виноградов, 1947; Володин, Храковский, 1978, 1981, 1983, 1990, 1991; Гамкрелидзе, 1974; Гамкрелидзе, Иванов, 1984; Гвоздев, 1958; Гинзбург, 1968; Городецкий, 1969; Гринберг, 1963; Ейгер, Юхт, 1974; Жирмунский, 1976; Зиндер, 1964; Иванов, 1958; Исследования по структурной типологии, 1963; Кацнельсон, 1972; Кожина, 1983; Колесов, 1996; Косериу, 1963; Климов, 1977, 1981, 1983; Кубрякова, 1978; Лабов, 1983; Лакофф, 1988; Лейчик, 1979; Лекомцев, 1967, 1983; Лингвистическая типология и восточные языки, 1965; Мельников, 1969; Мельчук, 1975, 1995; Морфологическая типология и проблема классификации языков, 1965; Новое в зарубежной лингвистике. Вып. ХХУ, 1989; Общее языкознание. Внутренняя структура языка, 1972; Общее языкознание. Методы лингвистических исследований, 1973; Панфилов, 1969; Пашковский, Пиотровская, Пиотровский 1994; Пешковский, 1935; Пиотровский, 1999; Принципы типологического анализа, 1972; Проблемы грамматического моделирования, 1973; Рождественский, 1969; Роменская, 1978; Севбо, 1981; Сепир, 1993; Скаличка, 1966; Степанов Г.В., 1976; Степанов Ю.С., 1975, 1981, 1985; Степанова, Хельбиг, 1978; Структурная типология языков, 1966; Тезисы дискуссии "Типология как раздел языкознания", 1976; Теоретические основы классификации языков мира. Проблема родства, 1980, 1982; Типология. Грамматика. Семантика. 1998; Типология грамматических категорий, 1973, 1975, 1991; Типология лингвистических категорий, 1987; Типология языковых систем, 1966; Типы в культуре, 1979; Толстой, 1963; Трубецкой, 1960; Тулдава, 1981, 1983, 1987; Универсалии и типологические исследования, 1974; Успенский, 1962, 1965, 1970; Уфимцева, 1974; Федоров, 1997; Фрумкина, 1984; Холодович, 1960; Храковский 1999; Шайкевич, 1979, 1980; Шведова, 1967; Языковые универсалии и лингвистическая типология, 1969; Якобсон, 1963, 1975; Якубайтис, 1981; Altmann, 1995; Areal and Genetic…, 1999; Best, 1997; Bichakjian, 1988; Carpenter, 1999; Crain, Hubey, 1999; Lafont, 2000; Thornton, 1998; Dobree, 1964; Greenberg, 1957; Haspelmath, 1997; Helmbrecht, 1999; Hoffmeyer, 1996; Sebeok, 1973 и мн. др.).
Можно отметить некоторые отличительные черты лингвистических “классификаций”.
– “Классификации” возникают как результат интерференции двух схем различения – категоризаций языка (лексико-грамматические классы слов, категории числа, времени и т.д.) и вводимых исследователем для их описания средств системно-структурного представления. При этом сама схема различений исследователя формируется под воздействием языков (и, прежде всего, родного) как универсальных “классификационных” инструментов.
– “Классифицируется” то, что имеет процессуальную природу или является следом процесса, фрагменты которого порождены в разное время.
– Несмотря на то, что в лингвистической литературе обсуждается вопрос о том, как соотносятся “классификация”, “типология”, “типологическая классификация” и т.д., эти различения нельзя признать логически корректными, достаточно эксплицитными, охватывающими весь цикл “классификационной” деятельности, учитывающими разнообразные ее формы, содержащими условия применимости вариантов формального аппарата к конкретному материалу и конкретным задачам. Поэтому обычно логико-семиотический статус “классификации” не прояснен, а характер их представления крайне затрудняет их адекватную квалификацию.
– Анализ положения дел показывает, что среди лингвистических “классификаций” иногда встречаются классификации, порою обнаруживаются другие формы (отличные от группирования) представления материала – районирование в пространстве признаков, задание шкал и т.д. Обычно же речь идет о типологиях, причем (что вполне понятно для типологий) без явного указания экстенсионала. При этом сами типологии достаточно разнообразны (Гак, 1983, Гл.1).
– Обычно исследователей интересуют не собственно таксоно-мерономические построения (что опять же понятно для типологий), а схемы категориальных различений (СКР), которые дают принципиальную возможность при необходимости построить мерономию и таксономию, отвечающие требуемой детальности.
– По характеру СКР можно выделить несколько их групп.
а – 2-10-(15)-членные СКР. Мерономический аспект при этом явно представлен, а таксономический – нет, приводится лишь небольшой список примеров, даже без попытки эксплицитно представить экстенсионал.
Таковы
а1 – Основные парадигмы словообразования и словоизменения, лексико-грамматические классы, оппозиции в парадигмах словоизменения (во флективных языках). Они могут иметь и формальные показатели (рода, именного класса). Число членов при этом не очень значительно отклоняется от миллеровского магического числа, связанного со свойствами оперативной памяти. Именно в этих СКР наиболее сильно проявилась первая особенность – интерференция двух схем различения.
а2 – Большинство рутинных “классификаций”, создаваемых почти в каждом лингвистическом исследовании без претензии на то, чтобы стать узловым пунктом для работ позднейших исследователей.
а3 – Морфологические строи языка, части речи, оппозиция “аппелятив – онима”, виды синтаксической связи, которые являются предметом специальной рефлексии лингвистами и передаются от поколения к поколению.
б – СКР, содержащие от полутора до нескольких десятков членов. В принципе они сходны с предыдущими, не всегда соотносятся с языковым сознанием носителя языка, но, как можно судить, обеспечивают функционирование языка и являются предметом преемственной работы сравнительно небольших специализированных сообществ лингвистов. Таковы “классификации” фонем, филморовские падежи, модели предложений и словообразования.
в – СКР, содержащие сотни членов. В этом случае вводится несколько уровней иерархии таксономии и подробная мерономическая характеристика дается только некоторым уровням иерархии и некоторым представителям таксона самого низкого ранга. Для каждого ранга значимо списочное задание состава группы. Таковы классификации авторов по литературным школам. При этом актуальна проблема номенклатуры.
г – СКР, содержащие тысячи членов. Задается несколько уровней иерархии и практически каждый из них подробно описывается мерономически и по составу. Примером являются языки и диалекты мира. Для них также актуальна проблема номенклатуры.
д – СКР, содержащие десятки и сотни тысяч членов. Подробно дается мерономическая и, при необходимости, таксономическая характеристика низших рангов, при том что высшие ранги либо явно не указаны, либо даются без характеристик, либо и то, и другое приводится факультативно. Таковы словники и дробные словарные гнезда больших словарей.
е – СКР, содержащие сотни тысяч и миллионы членов. Таковы выполненные на естественном языке классификации в других дисциплинах (промышленные стандарты, описания веществ и лекарств, живых организмов). Их логика диктуется логикой данной отрасли специализированной деятельности.
СКР, содержащие многие десятки и более членов, могут представляться через набор менее многочисленных (например, за счет введения иерархии – ср. защищаемое положение 5).
– Значительная часть лингвистических “классификаций” не отличается высокой операциональностью – различения недоопределены (Нариньяни, 1980, 1982), построены на латентных и несамостоятельных признаках. В частности,
– – Специально не обсуждаются проблемы номенклатуры выделяемых групп и процедуры идентификации – правила отнесения конкретного экземпляра к одной из выделенных групп (чаще всего оно осуществляется экспертно).
Описанное положение дел с “классификациями” в лингвистике делает необходимым их весьма изощренный категориальный анализ.
2.2. Общая схема анализа “классификаций” в лингвистике.
При описании лингвистических “классификаций” соискателем предложено учитывать разнообразные особенности их организации (Гринбаум, Мартыненко, Чебанов, 1989, Мартыненко, Чебанов, 1988, 1990 а, б, 1996, 1998, Чебанов, 1977, 1980, 1983 а, б, в, г, 1984, 1986 а, б, 1988, 1995, 1996, в т.ч. Прилож. 2, 1998 а, б, 1999 а, б, в, г, Чебанов, Мартыненко, 1999, 2000, Chebanov, 1993, 1995, 1997, 1998, 1999, Chebanov, Martynenko, 1999, Chebanov, Martynenko, Sherstinova, 1998, Martynenko, Chebanov, 1997, 1998). Их можно объединить в несколько групп.
Общие основания
Подавляющее большинство “классификаций” создается лингвистами почти спонтанно, по образцу, без достаточного обсуждения их методологической корректности. Поэтому обычно трудно составить представление о философских и методологических основаниях соответствующих построений, а делать это приходится косвенно (по принадлежности к школе, попутным замечаниям и т.д.).
Можно отметить ряд обстоятельств.
– Только некоторые построения носят ныне явный отпечаток философских установок (прагматизма и инструментализма у американских дескриптивистов, неопозитивизма у неогумбольдтианцев и т.д. – ср. Козлова, 1972). При этом они касаются скорее методов создания “классификаций”, а не интерпретации статуса их реальности. Традиционная для классификационной проблематики философская триада “реализм – номинализм – концептуализм” если и обсуждается в контексте лингвистических “классификаций”, то в маргинальных для лингвистики работах (Флоренский, 1971, 1973, Шрейдер, 1983, Шрейдер, Шаров, 1982). Подавляющая же доля современных лингвистических “классификаций” создана на базе реализма в современном, а не в упомянутом традиционном смысле.
– Как правило, не обсуждаются и такие методологические вопросы, как соответствие выбранного варианта “классификации” и формы его представления (формы таксономии) природе языка, природе выделяемых типов (ср. анализ этой проблемы в языкознании с позиции дихотомии “искусственное – естественное” у Г.П.Щедровицкого – Лефевр, Щедровицкий, Юдин, 1965, 1967, Щедровицкий, 1966 а, б, 1969, 1991), концепция существенности признаков (развивающая взгляды Аристотеля или альтернативная им), другие методологические проблемы “классификации”.
– В частности, почти не обсуждается вопрос о функциях “классификации” (упорядочивание, объяснение, предсказание нового – ср. Аракин, 1989 об использовании классификаций для дидактического прогнозирования), обоснованных ограничениях решения задачи индукции по неполному основанию, критериях качества “классификации” и т.п.
– Обычно отсутствуют эксплицированные программные заявления, касающиеся того, претендует ли “классификация” на охват всего исследуемого универсума или только известной его части, обладает ли она возможностями самоперестройки и самоисправления, роли конвенции, языка “классификации” (здравого смысла, предметного, логического, классиологического и т.п.), используемых логических и математических структур, различения таксономических и мерономических конструктов.
Мереология
К этой группе относятся вопросы, связанные с тем, откуда берутся и что собой представляют единицы, подлежащие “классифицированию”. Это важнейшая составляющая упорядочивающе-систематизирующей деятельности, которая является частью предклассификационной деятельности. Как показывает опыт работы и консультирования именно с этим этапом работы связаны основные затруднения “классифицирования”.
Выделением единиц занимается тот раздел мереологии Ст.Лесневского, которым практически не занимается мерономия Мейена–Шрейдера. Как отдельный предмет лингвистического анализа эта область осознается редко (Рахилина, 1990).
По самому характеру природы языка онтологический статус языковых реалий весьма сложен. Так, в наблюдении даны только речевые произведения, причем устные – как процессы, а письменные более приближены к объекту в классическом понимании. Язык является результатом реконструкции и фигурирует в качестве объекта “классифицирования” как идеальный образ. Письменный текст, в свою очередь, интерпретируется как результат, след процесса письма. Фрагменты и структуры текста или языка появляются как результат членения речи, текста или реконструкций языка.
Уже на этой стадии происходит довольно сложная трансформация исследуемого материала и операций их исследования. Так или иначе, процессуально организованный материал должен подвергаться периодизации. Формально это могут быть разные операции. При анализе конкретного фрагмента речи имеет место периодизация в диахронии; в том случае, если речь идет о фонемной или слоговой организации той или иной лексемы, происходит периодизация в панхронии (строится процессуальный архетип). Но и та, и другая операции переводятся (без исследования логических преобразований при этом) в пространственные отношения и заменяются районированием. При этом принимается одномерность времени, которая презентируется одномерностью речи. Именно на этом этапе работы периодизация процесса (темпоральная одномерность которого еще может быть предметом обсуждения) полностью замещается геометрией квазиодномерных пространств (синтагматическая одномерность – определяется правилами одномерной синтактики). Квазиодномерность (а не одномерность) определяется наличием дистантных отношений между единицами (см. следующий раздел).
Другим аспектом неодномерности речи является неточечность ее источника (звука, пишущего инструмента), трехмерное распространение звука и двумерное расположение текста, которые будучи пренебрежимыми для малых отрезков речи, оказываются принципиальными в больших формах (театральная, музыкальная речи, литературные формы, фигурные стихи и т.п.). Возможно допущение о дробной размерности лингвистических единиц (что подтверждается допустимостью их фрактальных моделей).
Далее, и устные, и письменные произведения, и язык (т.е. три сущности, обладающие весьма разными модусами реальности – Любищев, 1971, Шрейдер, 1983), и их фрагменты для того, чтобы стать объектом “классифицирования” более или менее формализовано описываются и полученные описания или ментальные образы в сознании исследователя оказываются подвергаемыми “классифицированию”. При этом при формировании группировок (в первую очередь низшего уровня) используются и экспертные, целостные суждения исследователя “похоже – не похоже”.
Таким образом, предметом “классифицирования” являются образы и описания лингвистических единиц, которые замещают исходный эмпирический речевой материал, при оперировании с которым, тем не менее, привлекается и личное знакомство исследователя с ним.
Именно в отношении вопросов данного раздела очень существенны как указанная интерференция обыденной (“членораздельная речь”) и профессиональной систем различения, так и общекультурные установки об экземплярной членимости мира.
Вопрос о выделении единиц именно в близком к приводимому смысле рассматривается у Л.Ельмслева (определения класса, сегмента, иерархии, цепи, части, члена – Ельмслев, 1960). Катализ предусматривается для облегчения выделения единиц. Специальным методом выделения единиц является дистрибутивный анализ (Л.Блумфилд, Г.Глисон, З.Харрис). Примечательно, что этот метод появился примерно одновременно с рекомбинантным анализом, который решает сходные задачи в биологической генетике. Неслучайно поэтому появление лингвистической генетики (Маковский, 1992; ср. также Карпов, 1992, Ратнер, 1975, 1983). В итоге можно говорить о дистрибутивном анализе как методе всех семиотических дисциплин – от биологии до лингвистики (ср. Hoffmeyer, 1996, Semiotica, 1999). При этом, однако, генетика имеет действительно дело с пространственным квазилинейным членением, а лингвистика – с членением опространствленной временной неоднородности процесса. Аналогичные дистрибутивному анализу задачи решает и метод разложения минимальных значимых кортежей на “предельные компоненты” (Jakobson, Halle, 1956).
Характерным для языка является множественность членения одного и того же материала. Наиболее фундаментальным является наличие двойного (для планов выражения и плана содержания) членения (Мартине, 1963). Но возможны и другие аспекты множественности членения (акустическая и артикуляционная неоднородность качества звука, соответствующего одной фонеме, выделение основы слова наряду с морфемами и т.д.).
Говоря о множестве особенностей выделения единиц, следует подчеркнуть, что все они правомочны, если после выделения используются в соответствии с правилами, следующими из способа их вычленения. Пороком является последующее использование единиц (интерпретация, применение в других исследованиях) с нарушением правил, по которым они были выделены (Чебанов, 1980).
Все такие категориальные системы выделения единиц являются недоопределенными (в понимании Нариньяни, 1980, 1982) и требуют специальных методов формализации. Ю.К.Лекомцев (1983) делает это через построение различий, минуя стадию мерономических операций. В итоге сразу строятся СКР, а категоризация таких построений (например, парадигм) вызывает затруднения. Аналогично недоопределен логический статус архифонемы (Трубецкой, 1960).
При всей недоопреленности указанных различений нужно заметить, что для единиц высокого уровня операциональные процедуры даже такой степени нестрогости отсутствуют.
Так, если в морфемике принцип дистрибутивного анализа и представление о парадигмах как-то еще “работают” (Герд, 1983, 1987, 1988), то при определении слова над исследователем довлеет интуитивное понимание слова. В известной мере, все конструктивные процедуры строятся так, чтобы согласовать операциональное и интуитивное понимание слова.
Последовательное осуществление такого подхода предполагает привлечение компетенции носителя языка как эксперта. В отечественной традиции такой подход получил наименование “лингвистического эксперимента” (Щерба, 1974), что порождает даже разговор об экспериментальном методе в лингвистике (Фрумкина, 1981). Однако, такое понимание совершенно не соответствует пониманию эксперимента Г.Галилеем, который вводит его в оборот (что соответствует более позднему понятию “мысленный эксперимент” – Чебанов, Мартыненко, 1999). Таким образом понимаемый “эксперимент” объединяет то, что можно квалифицировать как экспертное суждение носителя языка и экспериенциальные модели, которые вошли в употребление у американских лингвистов и методологов с 1970–ых годов (Лабов, 1983). Подобный подход используется и при выделении языков, и при отличении их от диалектов.
Тем не менее методы дистрибуций и представление о парадигмах переносятся и на более высокие уровни языка (например, предложение – Структурный синтаксис английского языка, 1972, Шведова, 1965), что используется для выделения единиц высоких уровней.
Проблема индивида для гиперсинтаксического уровня не разработана. В известной мере она развивается в теории дискурса и прагмалингвистике. Для индивидуализации здесь используются мерономические конструкции фреймов и сценариев (Бенвенист, 1974, ван Дейк, 1989, Греймас, Курте, 1983, Fillmor, 1974, Weinrich, 1976 и др.).
Весьма разработанный категориальный аппарат существует в текстологии при определении понятия “текст” (текст, произведение, список, автограф и т.д. – Лихачев, 1983). Уже то, что при этом фигурируют такие категории, как “гипархетип”, “прототип” свидетельствует о том, что речь идет о мерономических категориях, хотя формальный анализ категорий при этом и не дается. Интересными сторонами проблема текста поворачивается при статистическом изучении типографских копий, когда наличие типографских дефектов или тиражность издания может учитываться при оценке статистической активности лексических единиц.
При определенной трактовке текст может пониматься как беловик в совокупности со своими черновиками. Мерономически это довольно нетривиальная единица, которая может трактоваться как результат интерференции аналитических единиц (Шаров, 1979). Подобная трактовка по логическому статусу может быть сопоставлена с архифонемой Н.С.Трубецкого.
Примечателен пример выделения текста сказки как композиционно законченной комбинации стандартных блоков (Пропп, 1928).
Понимание текста как целостности определяет привлечение в качестве ее критерия соответствия распределения числа структурных единиц текста распределению Ципфа (Арапов, Ефимова, Шрейдер, 1975 а, б, Арапов, Шрейдер, 1977, 1978, Орлов, 1970, 1976, 2000). Однако правомерность такого подхода иногда подвергают сомнению (Мартыненко, 1978, 1982, 1988).
В некоторых случаях для выделения соседствующих единиц оказывается эффективным изучение границ – пауз, пробелов, слоговых границ (Бондарко, 1996), морфемных швов и т.д. Однако, при всей привлекательности использования границ для выделения экземплифицированных единиц анализа это путь трудоемкий и чреватый появлением парадокса границ (Каганский, 1982, 1987).
Ввиду недоопределенности рассмотренных операций и того, что на практике используются не только артикулированные формализмы, в набор единиц, представляющих данный объект, могут попасть единицы не только предусмотренные использованными формализмами (например, супрасегментные особенности речи наряду с сегментными).
Полученные единицы (образы, описания) образуют некоторые совокупности. В отличие от совокупностей, модельных для формирования логики классификации, в лингвистике не существует ситуации “разборного ящика” как начала классифицирования. Он может появиться только после того, как первичные совокупности превращены в множества – совокупности, о любых двух элементах которых можно сказать тождественны они или нет, поскольку среди исходных совокупностей могут быть классы (для которых отношения любой пары элементов не определены). После этого возможна работа в логике “разборного ящика” описаний.
В зависимости от объекта формируются предположения о характере полученных множеств, например, они конечны и не очень многочисленны для падежей, многочисленны, но конечны для языков, практически не ограничены для словоупотреблений и т.д. (ср. Шайкевич, 1980).
Характеристики совокупностей могут меняться при их переструктурировании. Так, эмпирически данный класс звуков, который хотя и не может быть охарактеризован численно, но предполагает большое разнообразие, может быть превращен в сравнительно малочисленное множество фонем. Формально это будет являться факторизацией класса звуков по множеству фонем (которое выступает как фактор-множество).
Итак, выделение “классифицируемых” единиц базируется на допустимости множества способов вычленения единиц (среди которых следует отметить относящиеся к означаемому и означающему, эмические и этические), интерпретируемых как продукт некоторого процесса, связываемого с одномерным временем. На основание этого вводится множество способов районирования одномерных пространств, итогом чего является выделение регулярных сегментных единиц. Другие способы дают супрасегментные единицы. Формально-логический статус таких единиц и операций их вычленения до конца не эксплицирован.
Мерономия
Мерономия описывает обобщенную организацию экземпляров, относимых к группе через детали их строения как собирательного множества, исследуемого с помощью членений и их композиций.
Мерономические конструкции в лингвистике могут быть охарактеризованы в нескольких аспектах.
– Бросающаяся в глаза линейная организация языковых единиц как следствие процесса порождения речи во времени заменяется схемой псевдолинейного расположения единиц. Отклонение от линейности определяется взаимодействием дистантно расположенных элементов (непроективные конструкции в широком смысле, например, циркумфиксы, рамочные конструкции) и детерминированностью ранее стоящих элементов далее следующими. Такими схемами представляются типы слогов, морфологические типы слов, схемы синтаксических структур (деревья зависимостей), композиционные схемы произведений и диалогов и т.д. Это наиболее характерный способ представления архетипов в лингвистике. Он может быть сопоставлен только с другими квазилинейными образованиями (линейные структуры полимеров, в том числе, органического происхождения, кристаллов). При этом становится невозможен стандартный комбинативный (фасетный) способ представления архетипа, а возможно только комбинирование нескольких членений с несовпадающими границами. Результаты таких членений могут быть изоморфными комбинаторной структуре.
– Мерономические конструкции односторонних и двусторонних единиц. Односторонние так или иначе изучаются на грани лингвистических и нелингвистических дисциплин (внешняя лингвистика по Ф. де Соссюру). К ним относятся несколько типов единиц.
– – Звучащая речь как предмет акустической фонетики. Принципы описания единиц формируются на основании категорий акустики, физиологии и фонетики. Мерономия строится на основе анализа однородности / неоднородности потока речи в реальном времени говорения. Таким образом может описываться поведение звукопорождающих органов, выделяться однородные и переходные периоды звучания, происходит выделение слогов, слов и синтагм.
– – Письменная и печатная речь, рассматриваемые в лингвистическом аспекте грамматологии (Волков, 1982). Принципы описания формируются на основании представлений фонетики, психологии, физиологии зрения, лингвополиграфического подхода и т.д. Мерономия строится на основании выделения геометрических (пространственных), цветовых, фактурных особенностей букв, буквосочетаний и знаков препинания, характер которых может отражать и особенности процесса порождения текста.
– – Семантические поля, как они понимаются в психологии и когнитологии, а также, отчасти, и семантические примитивы (напр., у А.Вежбицкой – Вежбицкая, 1996). Мерономия строится крайне расплывчато, представляется с помощью схем, рисунков, неоднозначно интерпретируемых текстов и т.д. Это ахронически-алокативное, но многомерное представление семантики.
Несмотря на своеобразие каждого из указанных типов мерономий, они не только строятся на грани лингвистических и не лингвистических представлений, но и имеют аналоги за пределами филолого-лингвистического куста знаний.
– Принципиальное своеобразие лингвистических мерономий составляет мерономия двусторонних единиц. Можно отметить ряд их особенностей.
– – Достойным подражания в других дисциплинах является различение в лингвистике единиц этического и эмического рядов (Pike, 1954, Swadesh, 1934).
Соотношение эмических и этических единиц является одним из способов реализации отношения тип-вариант, причем эмические единицы выступают как смыслоразличающие (включая и фонемы как минимальные единицы смыслоразличения).
Эмические и этические единицы обладают разным модусом реальности (в понимании Любищева – Шрейдера), а поэтому и характеризуются принципиально разными признаками. Эмические единицы алокативны и ахроничны, определяются системами оппозиций, принадлежат сфере языка, этические – имеют субстратное воплощение в конкретных речи и тексте. Эмические единицы задаются системами оппозиций, этические – дифференциальными признаками (так, фонемы определяются системами оппозиций, а акустическое качество реализующих их звуков – дифференциальными признаками). Характеристика эмических единиц через дифференциальные признаки некорректна (порождает логические противоречия) и может приниматься только как профессиональный жаргонизм.
Неразличение характера двух типов единиц и их отношений порождает парадоксы иерархий. Так, можно говорить о том, что слово состоит из морфов, а морф из аллофонов, но отношения слова и морфемы, морфемы и фонемы не определены – это результат разных анализов одного фрагмента речи (Степанов, 1975, ср. Кордонский, 1985, показывающий неосмысленность использования отношения “состоять из”).
– – Языковые категории (не категоризация в понимании Э.Рош!) выделяются либо на основании традиционных представлений, либо соответствуют основаниям деления понятий в логике, причем строгое понимание категории при дистрибутивном анализе предполагает разбиение (в строго логическом понимании) класса языковых единиц на небольшое число подклассов, либо категории определяются формально как класс синтагм, играющих одну и ту же роль в более сложных синтагмах. Совокупности членов категории и являются СКР. В частности,
– – Парадигмы являются категориями грамматических значений.
Традиционное и дистрибутивное выделение категорий могут давать разный результат (так, обнаруживается, что в глаголе ряда языков существует единая категория числа-лица – Володин, Храковский, 1975, 1977).
На основе традиционно выделяемых категорий, как правило, можно построить типологии; дистрибутивный анализ, если бы он был доопределен, давал бы классификации. Количественное представление категорий дистрибутивного анализа обеспечивает параметризацию (например, у Дж.Гринберга – Гринберг, 1963).
Подобные приемы работы с двусторонними единицами эффективно применимы в мерономии фонем (минимальных единиц смыслоразличения) и морфем, а также лексем, синтаксических конструкций и предложений. Практически они не применимы в мерономии гиперсинтаксического и более высокого уровней.
Двусторонние единицы могут группироваться на основании преимущественно одной стороны своей организации. Так, паронимия устанавливается на основании особенностей плана выражения, антонимия и синонимия – на основе плана содержания. На этом основании могут формироваться семантические поля (например, поля Й.Трира – Trier, 1968). При этом последние отличаются от структуры семантических полей когнитологов тем, что границы между ними “размечены” планами выражения.
Таким образом, дистрибутивный анализ является плодотворным методом мерономизации языкового материала низких и средних уровней организации. Однако, ввиду того, что методами дистрибутивного анализа удается обработать не весь материал, системно-структурное представление категорий конкретного языка меняется со временем, а отдельные единицы языка могут иметь варьирующее значение, не все СКР задаются через регулярные процедуры, а наряду с последними используется и традиционное выражение категорий.
Обычно такие нерегулярные мерономии возникают по отношению к этическим единицам. При этом, с одной стороны, оказываются значимыми варианты плана выражения, а с другой – коннотации, которые не укладываются в систему жестких оппозиций.
Высокие уровни организации текста, конгломераты текстов как части литературного процесса, речевые акты и язык в целом (т.е. опять же тяготеющие к внешней лингвистке, в том числе, к прагмалингвистике – Сусов, 1983) также не описываются методами дистрибуции, а представляются через мерономические построения, не отражающие непосредственно природу языка (двусторонность, квазилинейность и т.д.). Для этого привлекаются стилистические, эстетические, социологические, когнитологические и прочие принципы мерономизации. При этом вводятся мерономические построения, касающиеся только отдельных сторон языка, что является основой фрагментарной (Гак, 1983) типологии, либо строится цельносистемная типология, в которой каждый из языков описывается с помощью нескольких или многих типологических радикалов, каждый из которых представляет разные стороны языка.
Некоторым своеобразием обладают историко-генетические “классификации”, поскольку в них отображаются свойства линейных многократно тиражируемых единиц.
Рассматривая описанные черты мерономий в лингвистике с классиологической точки зрения, можно отметить следующие их особенности.
В идеале внутренняя (по Ф. де Соссюру) лингвистическая мерономия ориентирована на эмические представления. Они имеют нетривиальную природу когнитивных конструктов, которые могут квалифицироваться как семантические инварианты (Р.Якобсон) или лингвистические переменные (Заде, 1976, 1980), но не могут быть подведены под какой-либо стандартный тип логических конструкций. При этом выделение эмических единиц – регулярный случай построения меронов не как усредненных форм, а как конструктов, создаваемых в собственном пространстве процедур различения – дистрибутивного анализа или перцепции речи лицом, владеющим языком. В последнем случае речь идет об эйдетическом распознавании.
В языке обнаруживаются многочисленные запреты на свободное комбинирование единиц разных уровней и типов (звуков за счет ассимиляции и диссимиляции, семантические и узуально-идеоматические запреты сочетаемости морфем и лексем, стилистические – лексем и синтаксических конструкций и т.д.). Это указывает на высокую степень номотетичности языка, которая и постигается структуралистскими исследованиями. Прежде всего, указанные явления вскрываются при исследовании универсалий, в особенности сложных (условных, коррелятивных).
В лингвистике существуют разные модели выявления сопоставимости структурных элементов – гомологизации (Чебанов, 1984). Так, гомологичны все этические единицы, презентирующие одну эмическую; способами гомологизации являются выявление частей слова и членов предложения, компонентов гиперсинтаксического членения и композиции литературных произведений. Гомологии часто задаются через совпадение набора категорий. Специальными средствами гомологизации являются выявление нулевых морфем, выявление морфемных швов, квалификация синтаксических конструкций как эллиптических.
Подобные конструкции свидетельствуют о том, что лингвистическая мерономия – не просто членение линейной структуры. В последнем случае нужно было бы признать отсутствие эмержентных свойств и полную разложимость текста на линейные единицы, к которым следует причислить и семантические множители. В такой логике задачи реконструкции фрагментов архетипов могут осуществляться на основе детерминаций и интердепенденций в понимании Л.Ельмслева. Вместе с тем очевидно, что семантика композиции полнозначных двусторонних единиц языка не складывается из семантики таких единиц (Чебанов, 1995).
В лингвистической синергетике (Koehler, 1986) рассматривают принципиально неаддитивные факты языка, учитывая которые нужно было бы использовать “антисинергитические” (а не просто разрезание линейной последовательности) методы членения речи (Чебанов, 1983, 1996). Но реализация таких приемов еще впереди. Попыткой использования таких подходов является модель семантики, предложенная на основе теоремы Байеса (Налимов, 1978, 1989).
Практическая мерономия основывается на работе с признаками как средствами представления меронов. Традиционная, менталистская лингвистика не решает вопрос о том, какие операционально определимые симптомы свидетельствуют о наличии того или иного признака, но подобная проблема актуальна для дескриптивистов. Вопросы же о номенклатуре признаков, использования специальных формализованных дескрипторов для их описания лишь изредка обсуждается при решении конкретных задач компьютерной лингвистики.
Тем не менее, в лингвистике существует богатая практика различения признаков, из которых можно отметить наиболее интересные с классиологической точки зрения:
– Признаки резко противопоставляются как лингвистически релевантные и лингвистически не релевантные, причем в зависимости от раздела знания о языке и этапа развития представлений о нем граница между этими признаками меняется. Так, признаки, характеризующие особенности фонации конкретного диктора или особенности начертания букв, для лингвистики и даже филологии нерелевантны, однако в прагмалингвистике они становятся вполне “добротными” (Чебанов, Мартыненко, 1990).
– Крайне значимо выделение дифференциальных признаков, которые являются особой формой представления существенных признаков.
– Показательно различение ингерентных и реляционных признаков. Реляционный признак заведомо мерономический, и только признак обладания/необладания реляционным признаком является классификационным.
– Лингвистика дает редкий пример систематического использования недистинктивных признаков, например, при нейтрализации, на что обращал внимание Н.С.Трубецкой (1960), выделяя недистинктивные оппозиции.
– Представление о дифференциальных признаках соответствует понятию существенного признака при акцентировании внимания на основании деления понятия. В этом аспекте показательным является логика различения синонимии и омонимии.
Классифицируя оппозиции, Р.Якобсон (1963) выделяет бинарные привативные оппозиции, которые в явном виде используются при реконструкциях.
Достоверность используемых признаков определяется полнотой обследования материала и методической корректностью определения их значения. Наиболее операциональными являются при этом диагностика признаков в акустической фонетике или использование физико-химических методов анализа в палеографии. Все признаки двусторонних единиц должны рассматриваться как несамостоятельные и могут верифицироваться на пути использования нейро- и психолингвистических методов (что и определяет такой интерес к работам Э.Рош или Н.П.Бехтеревой).
Важным для лингвистической мерономии типом несамостоятельных признаков являются времясодержащие признаки. Обычно они представлены псевдолинейными порядковыми отношениями (см. выше). Тем не менее, именно в лингвистике (Соссюр, 1977; Косериу, 1963; Мартине, 1963) сложилась полная система различений ситуаций по отношению ко времени – а-, син-, диа- и панхрония, которая плодотворно переносится и за пределы лингвистики.
Ахрония возникает в разных разделах лингвистики при определенных типах аспектуального рассмотрения объекта. Классическая логика группирования ориентирована именно на такое рассмотрение. Диахрония очевидна в большинстве языковых явлений, однако при этом речь идет о разных временах – времени речевого акта, времени порождения и восприятия текста, историческом времени литературного процесса и становления языка. Только физикалистическое понимание времени допускает идею согласования этих времен как системы последовательных вложений. Синхрония возникает как идея моментального среза диахронии и “точность” синхронии будет определяться типом времени в диахронии. Обращение к панхронии является основой научного языкознания, которое может заниматься только повторяющимися явлениями, будь то воспроизведение сходных актов фонации или сходные акты литературного процесса.
Различение указанных типов темпоральных представлений существенно в связи с тем, что в них фигурируют логически несопоставимые представления о времени, так что требуется специальное исследование возможности использования того или иного темпорального признака как основания деления тех или иных понятий. При этом существенно то, что экспликация самого представления о времени обнаруживает его природу как полиарного отношения, что однозначно относит его к сфере мерономии, позволяет говорить о временных меронах. Поэтому времясодержащие характеристики не могут быть классификационными признаками; последними могут быть только признаки наличия/отсутствия времясодержащих характеристик.
Таксономия
Для лингвистики характерна неразработанность категориального аппарата таксономии, которая рассматривается как сугубо служебная и производная от мерономии. При этом базовыми оказываются мерономические по сути СКР, которые используются для распределения объектов по группам. При этом значительная часть категорий заимствована из биологии (в ХIX -середине XX вв.).
Обычно лингвистические таксономии (за исключением классификации языков) являются одноуровневыми, их таксоны соположены друг другу (непосредственные следы организации СКР). Более сложные таксономии возникают как результат совместного использования нескольких СКР и поэтому носят комбинаторный характер.
В силу сказанного в лингвистике не часты априорно-апостериорные исследования относительного статуса реальности таксона и конкретных единиц, не различен таксон как совокупность данных в наблюдении единиц и как совокупность единиц, существование которых допустимо и т.д.
Очень редко обсуждается логико-математический статус рассматриваемых совокупностей (Шайкевич, 1980) – представлены они классами, множествами, армадами, размытыми множествами и т.д. Обычно подразумевается, что рассматриваемая совокупность представлена множеством, что далеко не всегда обосновано. Вместе с тем, именно на лингвистическом материале вводится такая фундаментальная категория, как лингвистическая переменная (Л.Заде), лежащая в основе теории нечетких множеств (Гачечиладзе, Манджапарашвили, 1987). Однако число вариантов практического использования соответствующих моделей очень не велико (например, Лабов, 1983). Редко оказывается определено и то, что значит “принадлежать” к тому или иному таксону (Watanabe, 1969).
Не разработан и вопрос о характере принадлежности к таксону, т.е. принадлежит ли каждый элемент с определенной долей вероятности или детерминестически. Так или иначе, достаточно часто для описания этого используется вероятностная логика, но, скорее всего в этом случае речь идет о том, что необходимо описывать ситуацию, когда неизвестна принадлежность или не принадлежность того или иного элемента таксону, а не его онтологическое свойство статистической принадлежности к нему. В целом это сопряжено с тем, что вообще не исследуется характер отношений индивида и таксона, т.е. не различаются такие разные модусы, как принадлежность к таксону, возможность принадлежности к таксону, статистическая принадлежность к таксону и т.д. (Чебанов, 1996).
Такие проблемы обсуждаются лишь в небольшом числе высоко математизированных исследований, в основном, в американской когнитологии и в некоторых сугубо структуралистских работах (Лабов,1983, Burtin, 1977). Соответственно совершенно не прояснен и для большинства исследователей вообще не встает как таковой, вопрос о том, что таксон является разделительным понятием и, соответственно, представлен разделительным множеством. Как следствие этого не сформулировано, каковы должны быть свойства совокупностей для того, чтобы можно было говорить о классификации.
О классификации таксонов говорится чрезвычайно часто, но нередко рассматриваются в качестве сравниваемых единиц любые результаты систематизирующей деятельности (а не только таксоны). Так нередко даже можно встретить указание на то, что слово разбивается на такие таксономические единицы, как префиксы, корни и суффиксы и т.д., которые в таком контексте представлены чисто собирательными категориями. Только в некоторых специальных математико-лингвистических работах этот вопрос иногда исследуется.
Но даже в этих специальных работах этот вопрос может обходиться каким-то другим путем. Так, в теории реляционных баз данных вводятся два разных отношения – вхождения в некоторую совокупность и принадлежности компонентов более сложной структуре. Соответственно, редко прояснена природа операций над таксонами как разбиений. Тем не менее, можно выделить две большие группы таких разбиений.
- “Естественные” конгрегации, включающие в себя элементы, сходство которых бросается в глаза исследователям, и они их описывают как презентанты одной совокупности. Еще чаще такие группировки уже сделаны предшествующими исследователями и они берутся как данность.
- Разбиения, задаваемые признаками, фигурирующими в СКР (часто на 2-3 класса).
Сложнее вопрос о природе таких классов, как классов эквивалентности или толерантности (Чебанов, 1983). Этот вопрос редко решается в явном виде. Обычно рассуждения о классификациях в лингвистике идут таким образом, что предполагается природа таксонов как классов эквивалентности на множествах. Однако порой возникает впечатление, что фактически оперируют с классами толерантности. Исключением являются семантические поля, часто явно основанные на отношении толерантности.
Отмеченная неопределенность логико-математической природы таксонов затрудняет и ответы на вопросы о соотношении совокупности выделяемых таксонов и таксономического универсума, установления его исчерпанности. Лишь иногда сама логика построения мерономических оснований классификаций позволяет говорить о полном исчерпании универсума (например, трапеция гласных – если не принимать во внимание экзотические примеры существования гласных, произносимых на вдохе). Иногда напротив очевидна неисчерпанность (как в классификации согласных – не эксплицированы правила сочетаемости преград акустического канала).
В лингвистических классификациях таксоны одного ранга перекрываются в комбинативных классификациях, а в иерархической классификации очевидным образом таксоны более высокого иерархического уровня включают в себя (т.е. полностью перекрывают) таксоны более низкого уровня.
Поскольку в лингвистических классификациях часто не выдерживается единство основания деления, в них обычно появление групп непроясненного статуса, которые попадают одновременно в несколько таксонов более высокого ранга. Часто это определяется тем, что исследователь строит классификацию, предполагая, что он строит одну классификацию. Фактически же используется несколько оснований классификаций (а иногда и несколько разных предметов!) и по существу строится несколько классификаций, которые неосознанно соединяются в одну (например, соединение акустической и артикуляционной классификации фонем – так получается трапеция Щербы в координатах первой и второй форманты, но это уже не классификация, а районирование!).
Скорее психологической, чем логической проблемой в лингвистике является выделение одноэлементных таксонов – существует выраженная тенденция к чему-то их присоединить (например, сопоставление баскского языка с картвельскими наряду с традицией противопоставления прямого падежа косвенным).
Потенциальное разнообразие таксономических структур в языкознании велико, хотя на практике используется небольшое их число. Прежде всего, это малотаксонные параметрические таксономические структуры, задаваемые СКР (с числом различений от 3 до 10), которым не придается особого значения. Комбинаторные структуры чаще используются во вспомогательных классификациях и при построении архетипа путем сочетания типологических радикалов, выделенных по разным основаниям деления. Поэтому среди таких классификаций редки претендующие на фундаментальность (как например, артикуляционная классификация согласных).
Наиболее распространены иерархические и древовидные классификации, которые, к сожалению, часто не различаются. В первых таксоны последовательно включены друг в друга, а таксоны одного уровня иерархии не перекрываются (дизъюнктивны). Древовидные классификации представляют отношения архетипов и лишь косвенно через архетипы передают отношения таксонов (языковые семьи). В тех случаях, когда архетипы имеют разные варианты и есть переходные формы, древовидная связь архетипов может не задавать иерархических связей таксонов. Кроме того, древовидные структуры часто используются не для представления сходства, а для представления родства. В этом случае внешне филемма выглядит так же, как кладограмма иерархических структур, хотя она вообще не передает отношения экстенсионалов. Иерархические и древовидные структуры весьма часто не только не различаются, но и перемешиваются (напр., в генеалогической классификации языков).
Редко проясняется вопрос о различении таксонов, которых не может быть, и пустых таксонов (притом, что в лингвистической мерономии подобные различения есть – напр., различение нулевой морфемы и ее отсутствия, представление о запрещенных комбинациях и т.д.). Рассмотрения запрещенных таксонов в известных автору лингвистических классификациях вообще не производится.
Не исследуется и вопрос об отличении запрещенных таксонов от таксонов нереализуемых. Редким исключением является работа Соссюра об исходной структуре индоевропейских гласных, а предсказание глайдов является примером того, как отличён пустой таксон от таксона запрещенного.
Из сказанного ясно, что вопрос об отношении индивида к одному или нескольким минимальным таксонам или другим таксонам одного и того же ранга в лингвистике практически не рассматривается (за исключением комбинативных систем).
Сложнее вопрос об интерпретации таксонов, выделенных в вероятностных моделях – рассматривать ли вероятность принадлежности одного индивида к единственному таксону или же рассматривать альтернативу принадлежности индивида к нескольким таксонам. Подобных работ практически нет. Практически важен вопрос об отношении индивида к одному из небольшого числа близкосходственных таксонов, ответить на который невозможно без различения онтологического и гносеологического понимания вероятности (неопределенности) – невозможно понять возникает ли индетерминистичность как результат технического затруднения или она определяется природой классифицируемых индивидов. Но и этот вопрос находится на далекой периферии реальных лингвистических исследований.
Соотношение таксономии и мерономии
Следующая группа вопросов относится к соотношению таксономии и мерономии, обычно наиболее ярко характеризующему классификации. Однако, в лингвистике яркой картины не получится из-за слишком большого многообразия лингвистических классификаций.
По интенсиональности – экстенсиональности лингвистические классификации значительно различаются. Подавляющая часть ежедневно создаваемых классификаций относится к высоко экстенсиональным. Но в лингвистике есть и высоко интенсиональные классификации, которые задают особые парадигмы для возможных классиологических изысканий даже далеко за пределами лингвистики. К их числу относятся трапеция гласных Щербы или фонологические оппозиции Н.С.Трубецкого (Трубецкой, 1960).
Обычно лингвисты имеют дело с классификациями достаточно высокой интенсиональности (однако, не эксплицируемой) и хорошо работающими тогда, когда с ними обращаются эксперты высокого уровня (классификации частей речи, падежей, залогов и т.д.).
Разнообразны лингвистические классификации и по тому, как в них вводятся архетипы таксонов разных уровней. Так, в классификациях языков архетипы в явном виде часто вводятся для семей и групп, в то время как более мелкие подразделения задаются списком. В типологической классификации языков Э.Сепира (1993) состав групп также задается списком, а промежуточные подразделения характеризуются не регулярно и по разным принципам. Еще чаще так спорадически задаются архетипы для таксонов промежуточных уровней в большинстве классификаций-однодневок.
Разнообразие классификаций определяет и разнообразие способов задания таксонов. Нередки классификации-перечисления, не дающие никакой характеристики выделяемому таксону (это могут быть результаты экспертизы, осуществления формальной процедуры, которая позже забывается, стечения технических обстоятельств и т.д.). Чаще всего таксон задается описанием, что определяет его достаточно высокую интенсиональность.
В психолингвистических опытах нередко группирование идет на основании присвоения имени какому-то лингвистическому явлению, что задает таксон через называние. Но такие классификации редко подвергаются пристальной рефлексии. Предметом специального интереса такие “классификации”, создаваемые наивными носителями языка, оказываются тогда, когда они порождаются при обращении лингвистов к этим носителям, используемым в качестве испытуемых в том, что Л.В.Щерба называл лингвистическим экспериментом, а современные американские психолингвисты называют построением экспериенциальных моделей. При этом происходит взаимодействие языковой рефлексии лингвистов и носителей языка.[5]
Разнообразие лингвистических классификаций связано с разнообразием используемых в них признаков. В самом общем виде целесообразно различать признаки универсумов односторонних (акустических характеристик звуков речи, сем) и двухсторонних (языков, морфем, семантических полей) единиц (ср. раздел о мереологии). Примечательной чертой лингвистических классификаций является использование недистинктивных признаков (которые могут быть в состоянии нейтрализации).
Примечательным признаком являются размеры языковых и речевых единиц (слов, предложений, текстов и т.д.). Однако, эти размеры измеряются в числе линейных единиц (фонем, букв, морфем, слогов и т.д.) или времени звучания (Арапов, 1987; Чебанов С.Г., 1947; Best, 1997; Fucks, 1955; Kцhler, 1995; Tuldava, 1998). При этом выявляются закономерности, интересные для классифицирования и качественно похожие на закономерности размерной структуры вещественных объектов (средние размеры классов не случайны, а находятся в определенной логарифмической последовательности с провалами промежуточных значений – Численко, 1981, Сухонос, 1981, 2000), которые, однако, измеряются в единицах длины. Понять значение установленных закономерностей размеров лингвистических объектов (а соответственно, оценить их таксономическую значимость) не удается из-за того, что нет способа соотнесения линейных размеров вещественных объектов и размеров языковых единиц. Отмеченное обстоятельство отражает высокую специфичность языковых единиц как объектов классифицирования.
Ввиду разнообразия объектов лингвистических классификаций связь характера таксономического универсума с природой объекта весьма разнообразна. Так, представление генеалогической классификации языков в виде дерева (прежде всего в индоевропеистике) интерпретируется как след процесса исторического развития языков, а классификации звуков в языках с фонемной структурой (типа трапеции Щербы или схемы классификации согласных) строятся по типу пространства логических возможностей, отображающего артикуляционные возможности голосового аппарата человека. Если принять существование парадигм на высших уровнях языка (синтаксическом и гиперсинтаксическом), то такие парадигмы и будут пространствами логических возможностей соответствующих единиц.
Очень запутана в лингвистике проблема таксономического статуса переходных форм, по-разному разрешаемая в отношении разных объектов.
Интереснейшим примером этого является проведение границ в фонетике – звук может каким угодно образом варьироваться до тех пор, пока он не приобретает качеств, приводящих к смыслоразличению. Подобная логическая модель до начала ХХ века являлась уникальной для лингвистики. Однако в начале века появился рекомбинантный анализ в генетике, который чрезвычайно похож на методы дистрибутивного анализа. В настоящее время это сходство лежит в основе, по крайней мере, трех научных областей – лингвистической генетики, биосемиотики и теории конвариантной репликации.
Поскольку одноэлементные таксоны не популярны у лингвистов, оказывается актуальной задача различения полирадикальных и переходных форм, которая, тем не менее, как общелингвистическая задача неосознанна. Тем не менее, порою в лингвистике порождаются уникальные модели представления таких объектов. Например, М.В.Арапов и М.М.Херц (1974), анализируя переходные диахронические состояния словарного состава, показывают дискретность смены словарей, которая определяется сменой точки зрения на каждый синхронический срез, который может быть описан только при системном представлении.
Лингвистика дает разные примеры соотношения времени классификационного процесса и времени существования классифицируемых единиц и их таксонов. Так, время существования языков или крупных диалектов несоизмеримо с жизнью исследователя или даже научной школы, так что такие объекты классифицирования не отличаются от объектов классифицирования в других дисциплинах. Литературная же школа или узкий социальный диалект изменяются со скоростями, сопоставимыми со скоростью их классифицирования, так что может оказаться, что классификация будет окончена после исчезновения самих классифицируемых объектов (как и в ряде других историко-социальных дисциплинах). Поэтому для лингвистики важны оперативные -классификации (Шаталкин, 1988). Специфика лингвистических объектов определяется и тем, что классифицируемые единицы одновременно существуют в нескольких линейных масштабах: речевого акта, индивидуального онтогенеза и исторического развития языка (т.е. эти единицы гетерохронны – Щедровицкий, 1975).
В последнем случае используются представления, основанные на совершенно разных логиках (которые недопустимо перемешивать!), что в лингвистике, в отличие от других дисциплин, явно отрефлексировано.
Одна логика – логика реконструкции генезиса ностратических языков, основанная на панхронических законах диахронических изменений языковых явлений (диахронические универсалии). В этом случае классификация отображает логику генетической реконструкции. Другая логика – логика исторических реконструкций, например, романских языков, основанная на большом количестве письменных источников (относящимся к разным синхроническим срезам), ареальных и диалектных данных, так что их классификацию можно рассматривать как след истории. В том случае, если фиксируются не только определенные состояния языков, но и траектории их связывающие, речь идет о генеалогических классификациях. Подобное различение генетических и исторических классификаций четко осуществлено только в лингвистике и отсутствует в естествознании (лишь намечено в почвоведении и геологии – Розова, 1986).
Лингвистика с 1930-ых годов стала областью, сыгравшей особую роль в переоценке правила соизмеримости объема таксонов. В работах Дж.Ципфа (Zipf, 1935, 1938) показана резкая неравночисленность вхождения репертуарных единиц (букв, лексем, словоформ и т.п.) в текст и дано аналитическое описание соответствующего распределения, чему была дана психолингвистическая интерпретация в духе принципа экономии усилий А.Мартине. С этого момента type-taken отношение становится предметом пристальных исследований (напр., Алексеев, Бычков, 1987, 1988; Арапов, 1988; Борода, 1977, 1988; Борода, Поликарпов, 1988; Бычков, 1988; Herdan, 1966 и т.д.). В результате оказывается привычной несоизмеримость объемов соответствующих таксонов. Аналогичные результаты были получены и в других областях (распределения Мандельброта, Лотки, Парето, Виллиса и т.д.). При этом в биологии приближение распределения к идеальному распределению Виллиса с 1920-ых начинает рассматриваться как критерий качества классификации (Willis, 1922).
Новый всплеск интереса к этой проблематике относится к 1970-ым годам. Тогда на основе изучения распределения лексем в “Войне и мире” Ю.К.Орлов (1970, 2000) показывает, что ципфовское распределение выполняется не на выборках больших объемов, а на целостных компонентах крупных структур. С этого момента ципфовость начинает рассматриваться как критерий качества выделения классифицируемых элементов (т.е. решения мереологических задач – Мейен, 1977) и качества классификации (Мейен, Налимов, 1979, Meyen, Nalimov, 1979).
Альтернативная точка зрения была впервые, по-видимому, высказана Г.Херданом (Herdan, 1962). Позже, и независимо от Г.Хердана, подобная идея была высказана К.Ф.Лукьяненковым и развита Р.Г.Пиотровским в представлениях о зонировании частотного словаря. С этой целью предложено описывать три разных зоны частотного словаря тремя распределениями – биномиальным, сложным и простым пуассоновским (Пиотровский, 1979, Лесохин, Лукьяненков, Пиотровский, 1982).
Г.Я.Мартыненко также рассматривает эмпирические распределения данного типа как смесь, но двух, идеальных распределений – ядерных и периферических элементов (Мартыненко, 1978, 1982, 1988; Мартыненко, Фомин, 1989; Мартыненко, Чарская 1987; ср. саранчовая и ноева касты – Кудрин, 1996).
Тем не менее, в последнее десятилетие интенсивно развивается теория распределений данного типа как альтернативы гауссоподобных распределений (Крылов, 1996, Кудрин, 1996, Крылов, Кудрин, 1999), с точки зрения которой резкая неравночисленность классов как критерий качества классификации приобретает фундаментальное значение. Как показала последняя конференция (Москва, январь 2001), ныне исследователи склоняются к составной природе распределения Ципфа – отдельно описываются “голова”, средняя часть и “хвост” (Б.И.Кудрин, С.Д.Хайтун), причем наибольшие затруднения возникают при описании средней части. При этом, тем не менее, оказывается, что удовлетворение распределениям данного типа является необходимым условием выполнения закономерностей Сухоноса – Численко (Чебанов, 1996).
Сходство таксонов и архетипов
Достаточно часто сходство таксонов отождествляется со сходством архетипов. При этом сходство может пониматься как похожесть таксонов и архетипов (сходство в узком смысле) и как их порождение одним преобразованием (родство). Если это преобразование генетическое, то речь идет о генетическом родстве, на основе которого строятся так называемые типологические классификации, если историческое – то об историческом родстве и, соответственно, генеалогических классификациях. Разновидностью исторического родства будет заимствование (лексики, грамматики).
Степень сходства оценивается мерами сходства (см. напр., Иерархические классификационные построения…,1979, Шаталкин,1988). Обычно это меры сходства архетипов, представляемых как набор признаков. В зависимости от избранной математической модели вводятся различные критерии различения и сходства. Часто при различении таксонов придается значение наличию хиатуса, который трактуется по наличию границ или статистически. Набор используемых мер сходства при этом не отличается от используемых за пределами лингвистики.
Но существуют и характерные для лингвистики меры сходства. Так, в глоттохронологии различия таксонов рассчитываются как время, необходимое на расхождение по одному признаку (Арапов, Херц, 1974)[6]. Своеобразно и понятие рангового среднего (Мартыненко, 1988, Мартыненко, Фомин, 1989), введенного на лингвистическом материале, но имеющего потенциально более широкое применение.
Важным при вынесении суждений о сходстве является вопрос об источнике сведений о сходстве. Обычно такими источниками являются наблюдения за конкретным языковым материалом, и логика лингвистических классификаций строится на этом предположение. Однако, это не всегда справедливо – значительное количество лингвистической информации является результатом реконструкций. Последние же даже в случае абсолютной надежности обладают иным онтологическим статусом, чем статус наблюдаемого. В результате создаваемые классификации охватывают как эмпирически данные, так и реконструированные единицы, что затрудняет применение классификационных алгоритмов, а порой и чревато ошибками (Грушин, 1961; Мейен, 1978, 1981).
В указанном контексте весьма сложен вопрос об использовании в качестве источника суждений о сходстве экспертных оценок. Они могут быть результатом как чрезвычайно тонких наблюдений особо изощренных специалистов, так и гениальных прозрений лингвистически одаренных исследователей. При этом обоснование экспертных оценок не может быть дано в логике обычного научного исследования. Поэтому возникает вопрос об отношении к таким заключениям и возможности включения их данных либо в сферу наблюдения, либо в сферу реконструкции. В случае невозможности подобного различения пользоваться такими данными можно, но необходимо зафиксировать экспертный источник соответствующей информации. Другой путь привлечения экспертных оценок – обращение к лингвистическому “эксперименту” или экспериенциальным моделям американских психолингвистов.
С указанным вопросом связан вопрос об обосновании достоверности суждений о сходстве. Обычно предполагается, что источником достоверности является метод, но на деле оказывается, что метод далеко не всегда предъявлен. Еще меньшее количество материала действительно обработано исследователем с помощью заявленного метода, а не заимствовано из результатов предшествующих исследований. В итоге часто источником достоверности суждений о сходстве является профессиональное предание, которое может быть и неверным. В связи с этим возникает проблема того, нужно ли и можно ли подвергать каждую гипотезу о сходстве испытанию на верификацию или фальсификацию.
В том случае, если сходство вводится как отношение эквивалентности, таксоны оказываются изолированными и связанными между собой внешними отношениями (например, родства), представляемыми в виде деревьев. Если сходство задается отношением толерантности, то таксоны представляются в виде град или конгрегации. Таксоны одной конгрегации могут замыкаться в кольцо.