Что такое семантика? Значения термина и примеры. Крылова М.Н. Функционально-семантический анализ как основа системного исследования языковых единиц. Функционально-семантическая категория сравнения Семантические принципы организации включают в себя

Содержание статьи

СЕМАНТИКА, в широком смысле слова – анализ отношения между языковыми выражениями и миром, реальным или воображаемым, а также само это отношение (ср. выражение типа семантика слова ) и совокупность таких отношений (так, можно говорить о семантике некоторого языка). Данное отношение состоит в том, что языковые выражения (слова, словосочетания, предложения, тексты) обозначают то, что есть в мире, – предметы, качества (или свойства), действия, способы совершения действий, отношения, ситуации и их последовательности. Термин «семантика» образован от греческого корня, связанного с идеей «обозначения» (ср. semantikos «обозначающий»). Отношения между выражениями естественного языка и действительным или воображаемым миром исследует лингвистическая семантика, являющаяся разделом лингвистики. Семантикой называется также один из разделов формальной логики, описывающий отношения между выражениями искусственных формальных языков и их интерпретацией в некоторой модели мира. В данной статье речь идет о лингвистической семантике.

Семантика как раздел лингвистики отвечает на вопрос, каким образом человек, зная слова и грамматические правила какого-либо естественного языка, оказывается способным передать с их помощью самую разнообразную информацию о мире (в том числе и о собственном внутреннем мире), даже если он впервые сталкивается с такой задачей, и понимать, какую информацию о мире заключает в себе любое обращенное к нему высказывание, даже если он впервые слышит его.

Семантический компонент уже достаточно давно признается необходимой частью полного описания языка – грамматики. Свой вклад в формирование общих принципов семантического описания вносят разные теории языка. Например, для порождающих грамматик принципы построения семантического компонента заложены американскими лингвистами Дж.Катцем и Дж.Фодором и далее развиты Р.Джэкендоффом, а, скажем, для грамматик (моделей) типа «Смысл – Текст» соответствующий компонент разрабатывался представителями Московской семантической школы: Ю.Д.Апресяном, А.К.Жолковским, И.А.Мельчуком и др. Семантический компонент обязательно включает в себя словарь (лексикон), в котором о каждом слове сообщается, что оно обозначает, т.е. каждому слову сопоставляется его значение в данном языке, и правила комбинирования (взаимодействия) значений слов, по которым из них формируется смысл более сложных конструкций, прежде всего предложений.

Значение слова в словаре описывается с помощью словарной дефиниции, илитолкования, которая представляет собой выражение на том же самом естественном языке или же на специально разрабатываемом с этой целью искусственном семантическом языке, в котором значение толкуемого слова представлено более развернуто (эксплицитно) и, в идеале, строго. Так, значение русского слова холостяк в словаре семантического компонента описания русского языка может быть представлено, как это делается в обычных толковых словарях, в виде обычного русского словосочетания "мужчина, достигший брачного возраста и не состоящий и никогда не состоявший в браке" или в виде записи на специальном семантическом языке, например, (l x ) [ЧЕЛОВЕЧЕСКИЙ (x ) & МУЖСКОЙ (x ) & ВЗРОСЛЫЙ (x ) & (СОСТОИТ-В-БРАКЕ (x )]. Различных искусственных семантических языков существует довольно много, и устроены они весьма по-разному.

Как видно из приведенных примеров, при толковании значений слов и словосочетаний с помощью естественного языка получающиеся выражения, а также их отдельные компоненты, если они упоминаются отдельно, принято на письме записывать в одинарных кавычках; в словарях этого не делают, ибо из самой структуры словарной статьи и так ясно, что справа от слова, являющегося входом в статью толкового словаря, стоит именно толкование этого слова (). Естественноязыковые выражения, толкующие значение предложений, обычно записываются в двойных кавычках. Запись слов естественного языка заглавными буквами и с использованием дефисов на непривычных местах означает, что эти слова в данной записи являются элементами искусственного языка, могущими и не совпадать с естественным языком; так, СОСТОИТ-В-БРАКЕ – это один элемент, а не три слова; переменная x и знак конъюнкции & – тоже элементы искусственного языка. Искусственные языки могут применяться для толкования значений как слов, так и предложений. Независимо от того, естественный или искусственный язык применяется для толкования, он по отношению к языку, выражения которого толкуются, имеет статус метаязыка(от греч. meta "после"), т.е. языка, на котором говорят о языке; естественный язык тем самым может быть метаязыком по отношению к самому себе. Элементами метаязыка также могут быть (и нередко являются, например в иллюстрированных словарях) различного рода графические изображения – схемы, рисунки и т.п.

О том, как создаются словарные дефиниции и какие требования к ним предъявляются, будет рассказано ниже.

Семантический компонент полного описания языка представляет собой модель той части знания языка, которая связана с отношением между словами и миром. В этой модели должны получать объяснение такие эмпирическим путем устанавливаемые явления, как равнозначность (синонимия), неоднозначность (полисемия), семантическая аномальность (в том числе противоречивость и тавтологичность) языковых выражений. Так, легко проверить, что для всех носителей русского языка предложение На нем была широкополая шляпа обозначает то же положение дел, что и предложение Он был в шляпе с широкими полями. Считается, что этот факт адекватно отражен в семантическом компоненте описания языка, если, взяв толкования значений соответствующих слов из словаря и действуя по явно оговоренным правилам комбинирования значений, мы получим одинаковые смысловые записи, называемые «семантическими представлениями» или «семантическими интерпретациями» данных предложений. Точно так же все носители русского языка согласятся, что предложение Посещение родственников может быть утомительным обозначает две разные возможности: возможность утомиться, посещая родственников, и возможность утомиться, принимая родственников, которые посетили вас. Значит, в семантическом компоненте данному предложению должны быть сопоставлены два отличающихся друг от друга семантических представления, иначе оно не будет адекватным отражением семантических знаний о русском языке.

В качестве самостоятельной лингвистической дисциплины семантика выделилась сравнительно недавно, в конце 19 в.; сам термин «семантика» для обозначения раздела науки был впервые введен в 1883 французским лингвистом М.Бреалем, интересовавшимся историческим развитием языковых значений. Вплоть до конца 1950-х годов наряду с ним широко использовался также термин «семасиология», ныне сохранившийся лишь в качестве не слишком употребительного названия одного из разделов семантики. Однако вопросы, относящиеся к ведению семантики, ставились и, так или иначе, решались уже в древнейших из известных нам лингвистических традиций. Ведь одной из главных причин, заставляющих нас обращать внимание на язык, является непонимание того, что обозначает обращенное к нам устное или письменное высказывание (текст) или какая-то его часть. Поэтому в изучении языка толкованию отдельных знаков или целых текстов – одному из важнейших видов деятельности в области семантики – издавна принадлежало важное место. Так, в Китае еще в древности создавались словари, содержавшие толкования иероглифов. В Европе античные и средневековые филологи составляли глоссы, т.е. толкования непонятных слов в памятниках письменности. По-настоящему бурное развитие лингвистической семантики началось с 1960-х годов; в настоящее время она является одним из центральных по своему значению разделов науки о языке.

В европейской научной традиции вопрос об отношении между словами и «вещами», предметами, к которым они относились, был впервые поставлен древнегреческими философами, но и по сей день различные аспекты этого отношения продолжают уточняться. Рассмотрим отношение слова к «вещи» более внимательно.

Слова позволяют нам упоминать вещи как в их присутствии, так и в их отсутствие, – упоминать не только то, что находится «здесь», но и то, что находится «там», не только настоящее, но также прошлое и будущее. Разумеется, слово – это просто шум, который стал использоваться для говорения о чем-то; сам по себе этот шум не имеет значения, но приобретает его благодаря своему употреблению в языке. Выучивая значения слов, мы узнаем не какой-либо факт природы, вроде закона тяготения, а своеобразную договоренность о том, какие шумы с какими вещами обычно соотносятся.

Слова языка, будучи употребленными в речи, приобретают отнесенность, или референцию к объектам того мира, о котором делается высказывание. Иначе говоря, они обладают способностью «отсылать» к объектам, вводя эти объекты (разумеется, в идеальной форме) в сознание адресата. (Разумеется, точнее было бы сказать, что говорящие, используя слова, могут «отсылать» к тому или иному фрагменту мира.) Та сущность в мире, к которой относится слово, называется его референтом. Так, если я, описывая кому-то произошедшее событие, говорю: Вчера я посадил под своим окном дерево , то слово дерево отсылает к единичной индивидуальной сущности – тому самому единственному в своем роде дереву, которое я вчера посадил под своим окном. Мы вполне можем сказать, что слово дерево в данном высказывании обозначает это самое посаженное мною дерево. Можно быть, эта реальная индивидуальная сущность и есть значение слова дерево ?

Представители того относительно молодого направления в семантике, которое принято называть «сильной семантикой» (к нему можно отнести «формальную семантику» и другие разновидности теоретико-модельной семантики, следующие за формальной логикой в решении вопроса о характере отношений между языком и миром), дали бы положительный ответ на этот вопрос. Во всяком случае, с точки зрения «сильной семантики» цель семантического описания языка состоит в том, чтобы каждое языковое выражение получило интерпретацию в той или иной модели мира, т.е. чтобы было установлено, соответствует ли этому выражению какой-либо элемент (или конфигурация элементов) модели мира, и если соответствует, то какой (какая). Поэтому проблемы референции (отнесенности к миру) находятся в центре внимания «сильной семантики».

В отличие от этого более традиционная «слабая семантика» при исследовании отношений между языком и миром обходится без непосредственного обращения к действительному положению дел в этом мире. Она признает предметом своего исследования – значением языкового выражения – не сам элемент (фрагмент) мира, к которому это выражение отсылает, а тот способ, которым оно это делает, – те правила употребления, зная которые носитель языка в конкретной ситуации оказывается в состоянии либо осуществить отсылку к миру с помощью этого выражения, либо понять, к чему оно отсылает. В дальнейшем мы будем рассматривать проблемы семантики именно с этой позиции.

Если кто-нибудь захочет изобрести процедуру применения слов к миру, то ему может сначала показаться, что для каждой реальной сущности должно существовать некоторое слово. Но если бы это было так, то число требуемых для этого слов было бы столь же бесконечным, сколь бесконечно число вещей и отношений в природе. Если бы для каждого дерева в мире требовалось отдельное слово, тогда только для одних деревьев потребовалось бы уже несколько миллионов слов плюс столько же для всех насекомых, для всех травинок и т.д. Если бы от языка потребовалось соблюдение принципа «одно слово – одна вещь», то пользоваться таким языком было бы невозможно.

На самом деле существуют некоторые слова (их сравнительно немного), которые действительно соотносятся с единственной вещью, и называются они именами собственными, например Ханс-Кристиан Андерсен или Пекин . Но большинство слов применяются по отношению не к отдельному лицу или вещи, а к группе, или классу вещей. Родовое наименование дерево используется для каждой из тех многих миллиардов вещей, которые мы именуем деревьями. (Существуют также слова, именующие подклассы деревьев, – клён , берёза , вяз и т.д., – но это имена более мелких классов, а не отдельных деревьев.) Бег есть наименование класса действий, отличимых от других действий, – таких, как ползание или ходьба. Голубой есть наименование класса цветов, плавно переходящих на одном конце в зеленый, а на другом – в синий. Над есть наименование класса отношений, а не собственное имя для отношения между лампой у меня на потолке и моим письменным столом, потому что оно прилагается также к отношению между лампой у вас на потолке и вашим письменным столом, а также к неисчислимому множеству других отношений. Таким образом, языки достигли необходимой экономии благодаря использованию наименований классов. Класс, или множество тех сущностей, по отношению к которым может быть использовано данное языковое выражение (в частности, слово), называется денотатом или экстенсионалом этого выражения (часто, впрочем, термин «денотат» используется и как синоним термина «референт», введенного выше). При одном из существующих подходов к определению значения слова в семантике значением называется именно денотат – множество сущностей, которые могут быть обозначены с помощью данного слова. Но более распространено другое понимание значения, при котором оно отождествляется с условиями его применимости.

То, что позволяет нам использовать относительно небольшое число слов для столь многих вещей, есть сходство. Вещи, достаточно сходные друг с другом, мы называем одним и тем же именем. Деревья отличаются друг от друга размерами, очертаниями, распределением листвы, но они обладают некоторыми сходными чертами, позволяющими называть их все деревьями. Когда мы желаем привлечь внимание к различиям внутри этого гигантского общего класса, мы выискиваем более детальные сходства внутри более дробных групп и таким образом отождествляем конкретные виды деревьев. Наконец, если мы намерены многократно упоминать некоторое конкретное дерево, мы можем приписать ему собственное имя (например, Вяз на Поварской ) подобно тому, как мы именуем ребенка или домашнее животное.

Помимо достигаемой экономии языковых средств существование родовых наименований имеет еще одно преимущество: оно подчеркивает сходства между вещами, которые во многих отношениях различны между собой. Померанские шпицы и русские псовые борзые не слишком похожи друг на друга, однако и те и другие принадлежат к классу собак. Готтентот и американский фабрикант во многих отношениях непохожи друг на друга физически и духовно, но оба они принадлежат к классу людей. Однако существование нарицательных имен несет в себе и возможный недостаток: огульное сваливание в кучу непохожих вещей может заставить нас учитывать лишь сходства между вещами, а не различия и потому думать не об отличительных чертах, характеризующих ту или иную отдельную вещь как индивид, а о ярлыке, стоящем на этой вещи (т.е. о родовом термине, применимом ко всем вещам того же класса). «Очередная пенсионерка», – думает продавщица, мысля исключительно ярлыками и стереотипами.

Эти сходства между вещами, конечно, существуют в природе до и независимо от нашего употребления языка. Но то, какие именно из бесчисленных сходств вещей станут основой для классификации, зависит от людей и их интересов. В качестве основания для зачисления птиц и млекопитающих в определенные виды и подвиды биологи обычно используют структуру скелета: если птица имеет одну костную структуру, то она зачисляется в класс X, а если другую – то в класс Y. Можно было бы расклассифицировать птиц не по строению скелета, а по цвету: тогда все желтые птицы получили бы одно родовое наименование, а все красные – другое, независимо от других характеристик. Биологи пока что не классифицировали животных таким способом, главным образом потому, что потомство регулярно имеет то же строение скелета, что и родители, а не тот же цвет, а биологам хотелось бы иметь возможность применять к потомству такое же название, как и к родителям. Но это – решение, принимаемое людьми, а не природой; природные вещи не предстают перед нами с этикетками, сообщающими, в какие разделы классификаций они попадают. Разные группы людей с различными интересами классифицируют вещи по-разному: некоторое животное может быть биологами занесено в одну классификационную рубрику, производителями пушнины – в другую, а кожевниками – в третью.

Подведение природных объектов под классификационные рубрики зачастую бывает делом несложным. Например, животные, именуемые собаками, обычно имеют длинный нос, лают и машут хвостом, когда они рады или возбуждены. Вещи, изготовленные людьми, тоже нередко довольно легко подводятся под видовые рубрики: это здание относится к классу (жилых) домов, то – к классу гаражей, а вон то – к классу сараев и т.д. Но здесь возникает проблема: если человек, скажем, живет в гараже или сарае, то не является ли данное строение также его домом? Если гараж когда-то использовался для размещения автомобилей, но в последние годы используется для хранения дров, то не является ли он сейчас сараем? Производим ли мы отнесение сооружения к тому или иному классу на основе его внешнего облика, или на основе того предназначения, для которого оно был первоначально создано, или же на основе того, для чего оно используется в настоящий момент? Очевидно, что способ отнесения конкретного объекта к классу зависит от используемого нами критерия, а критерий мы выбираем в зависимости от того, какого рода группировки интересуют нас в наибольшей степени.

СЛОВАРНОЕ ОПРЕДЕЛЕНИЕ

При использовании нарицательных имен сразу же встает очевидный вопрос о том, каковы будут наши критерии использования любого такого слова: какие условия надо задать, чтобы определить, когда мы должны употреблять именно это слово, а не другое? Мы убедились в том, что предметы действительности имеют сходства друг с другом, т.е. общие черты. Сколь бы многие черты ни объединяли данный предмет с другим предметом, определяющими (отличительными) признаками предмета являются только те черты, при отсутствии которых данное слово к данному предмету не приложимо вообще. Мы не назовем геометрическую фигуру треугольником, если она не обладает следующими тремя признаками: это фигура (1) плоская, (2) замкнутая, (3) ограниченная тремя прямыми линиями. Признаки, служащие условием применимости слова, в своей совокупности образуют сигнификат слова (термин введен в употребление средневековым схоластом Иоанном Солсберийским), или, в другой терминологии, его интенсионал.

В отличие от денотата слова, представляющего собой класс именуемых словом предметов или ситуаций, сигнификат – это не сам класс, а те признаки, на основании которых эти предметы/ситуации объединены в данный класс и противопоставлены членам других классов. В традиционной семантике значением слова в языке считается именно его сигнификат, а не денотат. При этом считается, что слово отсылает к «вещи» (денотату) не непосредственно, а опосредованно, через сигнификат, рассматриваемый как понятие о данном классе вещей, имеющееся в сознании человека.

Многие ученые в настоящее время признают необходимым различать языковое значение слова и связанное с этим словом мыслительное содержание – понятие. И языковое значение, и понятие являются категориями мышления. То и другое суть отражения мира в нашем сознании. Но это разные виды отражения. Если понятие – это полное (на данном уровне познания) отражение в сознании признаков некоторой категории объектов или явлений, то языковое значение фиксирует лишь их различительные признаки. Так, в значение слова река входят такие «дифференциальные признаки» понятия о реке, как "водоем", "незамкнутый", "естественного происхождения", "достаточно большого размера", по которым объект, именуемый рекой , отличается от объектов, именуемых канавой , морем , прудом , озером , ручьем . Понятие же о реке включает, помимо данных, и другие признаки, например "питающийся за счет поверхностного и подземного стока своего бассейна". Можно сказать, что значению слова соответствует «наивное», обиходное понятие о предмете (в отличие от научного). Существенно, что признаки предмета, которые входят в значение некоторого слова, могут не совпадать с признаками, составляющими соответствующее научное понятие. Классический пример расхождения между языковым значением, в котором воплощено наивное представление о вещи, и соответствующим ему научным понятием привел русский лингвист Л.В.Щерба: «Научное представление о прямой (линии) фиксируется в ее определении, которое дает геометрия: „Прямая есть кратчайшее расстояние между двумя точками". Но выражение прямая линия в литературном языке имеет значение, не совпадающее с этим научным представлением. Прямой мы называем в быту линию, которая не уклоняется ни вправо, ни влево (а также ни вверх, ни вниз)».

Итак, описать значение некоторого слова в языке, или истолковать его –значит перечислить в той или иной форме все те признаки «вещи», которые по отдельности являются необходимыми, а в совокупности достаточными условиями для обозначения ее с помощью данного слова. Именно такие отличительные (определяющие, характеристические) признаки должны включаться в определение слов в толковых словарях.

Признаки предмета, не входящие в его словарное определение, называются сопутствующими признаками. Если этим признаком обладают все предметы, к которым приложимо данное слово, то такой признак называется универсальным сопутствующим признаком. Так, если химическая формула H 2 O рассматривается как определение воды, то такие признаки, как замерзание при нуле градусов по Цельсию, прозрачность, обладание определенным весом на единицу объема, будут универсальными сопутствующими признаками воды, так как любой экземпляр воды эти свойства имеет. Тест на то, является ли некоторый признак отличительным, таков: если бы этот признак отсутствовал при том, что присутствовали бы все остальные, стали бы мы по-прежнему заносить этот предмет в класс X? Если ответ отрицателен, тогда данный признак является отличительным.

Существует много таких комбинаций признаков, для которых мы не считаем необходимым специально изобретать слово. Например, мы можем дать родовое наименование всем существам, имеющим четыре ноги и перья; но так как мы пока что не находили никакого существа, имеющего это сочетание признаков, то мы не считаем целесообразным иметь для такого существа какое-либо родовое наименование. Изобретая родовое наименование, приписываемое любому предмету, который имеет данное сочетание признаков, мы договариваемся об определении, а когда мы устанавливаем или передаем, какое сочетание признаков уже было названо определенным словом, то мы сообщаем определение. Договорные определения, равно как приказы и предположения, не являются ни истинными, ни ложными; но определения, включенные в сообщение, свойством истинности/ложности обладают, так как утверждение о том, что определенное слово уже употребляется в данном языке для обозначения любого предмета, обладающего определенным набором признаков, является либо истинным, либо ложным.

Такой смысл термина «определение», или «дефиниция», является наиболее общим, и словари стремятся снабдить нас определениями именно в указанном смысле. Поскольку такие определения представляют собой попытку сформулировать именно сигнификат слова, они могут быть названы сигнификативными или десигнативными. Но дать определение значения слова в самом широком возможном смысле – это значит каким-то образом указать, что данное слово обыкновенно означает. Есть несколько способов достичь этой цели. Рассмотрим их по порядку.

Сигнификативные, или десигнативные определения.

Традиционно полагаемый наиболее точным способ определения значения слова – это задание списка признаков, которые должен иметь предмет, чтобы данное слово (или словосочетание) было к нему применимо. Именно это мы сделали выше в примерах с «треугольником» или «рекой». Это называется десигнативным определением; говорится, что слово обозначает те признаки, которые должен иметь предмет, чтобы это слово было к нему приложимо.

Денотативное определение.

Достаточно часто (если не в большинстве случаев) у людей отсутствует четкое понимание того, каковы отличительные признаки чего-либо; они только знают, что слово применимо к тем или иным конкретным индивидам. «Я не знаю, как определить понятие птицы, – может сказать кто-нибудь, – но я точно знаю, что воробей – птица, дрозд – птица, и попугай Полли – тоже птица». Говорящий упоминает некоторые индивиды или подклассы, к которым приложим данный термин; т.е. он упоминает о некоторых денотатах слова, чтобы истолковать его значение.

Очевидно, что как способ истолкования того, что слово обычно значит, такое определение менее удовлетворительно, нежели приведение сигнификата. Если мы знаем сигнификат слова, мы знаем правило его употребления (подобное тому, которое пытаются давать в словарях) – мы знаем, в каких условиях следует прилагать данное слово к данной ситуации. Но когда мы выучиваем один, два или даже сто денотатов слова, мы не знаем, к каким другим вещам оно может прилагаться, поскольку общее правило у нас пока что отсутствует. Если кто-то знает, что воробьи и дрозды суть птицы, то он еще не знает, к каким другим вещам прикладывается слово птица . После сотни случаев, рассмотрев, какие общие черты имеют все обозначенные вещи, можно будет прийти к некоторой мысли; но в лучшем случае это будет обоснованное предположение. После фиксации сотни случаев появления птиц можно заключить, что птица есть нечто летающее. Конечно, этот вывод будет ложным: летучие мыши летают, но не являются птицами, а страусы являются птицами, но не летают. Этого нельзя узнать из денотата, если только не случилось так, что в составе денотата оказались перечислены страусы; но даже и это не означало бы знания правила употребления слова птица ; можно было бы лишь заключить, что, каково бы ни было это правило, оно не включает такого признака, как способность летать.

Более того, существуют и такие слова, которые вообще не обладают денотатами. Насколько известно, эльфы и домовые в природе не существуют; следовательно, эти слова вообще не имеют денотатов в реальном мире. Мы согласны с тем, что они существуют лишь в человеческом воображении, – можно сказать, что денотатами обладают лишь выражения образ эльфа и образ домового . Однако и эти слова имеют значение, и если бы любому читателю ирландских мифов довелось с этими существами повстречаться, он знал бы, как отличить одно от другого. Несмотря на то что данные слова не обладают денотатами, они имеют вполне четкие сигнификативные определения, так что любое существо, обладающее требуемыми отличительными признаками, могло бы быть опознано как эльф или домовой.

Остенсивные определения.

Остенсивное определение подобно денотативному, однако вместо упоминания примеров птиц (что было бы бессмысленно, если слушатель предварительно не знает значений слов воробей и дрозд ) оно показывает или предъявляет эти примеры. Любой ребенок, выучивающий значения слов, делает это с помощью остенсивных определений. Тому, кто вообще не знает заранее значений никаких слов, другие слова не помогут.

Есть некоторые слова, значения которых люди обычно выучивают остенсивно, хотя они могли бы быть выучены и другими способами. Что означает слово шестиугольник , мы можем узнать из его сигнификативного определения: "любая плоская замкнутая фигура, имеющая шесть сторон, являющихся прямыми линиями", – но мы можем узнать это также из показанного нам рисунка, изображающего шестиугольник. Есть, однако, и такие слова, значение которых, по-видимому, можно выучить только остенсивно, например наименования наших простейших чувственных впечатлений. Сможет ли человек, слепой от рождения, узнать, что означает слово красный , если он никогда не мог увидеть ни одного примера красного? Может ли кто-нибудь понять, что такое боль или гнев , если он сам ни разу не испытывал этих чувств? Слова не могут заменить впечатлений, они лишь помогают нам обозначить те впечатления, которые мы уже получили.

С другой стороны, есть и такие слова, значения которых не могут быть показаны или указаны, а должны быть определены вербально, т.е. с помощью других слов или порой с помощью сочетаний слов с жестами: действительность , бытие , понятие , объяснение и большинство терминов, используемых в той или иной абстрактной дисциплине вроде философии.

Информация, которая связана с некоторым словом, не исчерпывается его значением. Слова обладают также коннотациями (иногда их называют также семантическими ассоциациями), которые не входят в значения слов в строгом понимании и тем самым не отражаются в их толкованиях. Коннотации слова – это несущественные, но устойчивые признаки выражаемого понятия, которые в данной культуре приписываются соответствующему предмету или явлению действительности. Примером коннотаций служат признаки "упрямства" и "тупости" у слова осел , признак "монотонности" у слова пилить , признаки "быстроты" и "непостоянства" у слова ветер .

Итак, наиболее точным или, во всяком случае, предпочтительным способом определения значения слова в семантике считается (или, по крайней мере, до недавнего времени считалось, см . КОГНИТИВНАЯ ЛИНГВИСТИКА) задание списка признаков, которые должен иметь предмет, чтобы данное слово (или словосочетание) было к нему применимо. Но каким образом выделяются признаки, составляющие толкование?

СЕМАНТИЧЕСКИЕ ОТНОШЕНИЯ

Выделение используемых при толковании слова признаков осуществляется на основе сопоставления данного слова с другими словами, близкими к нему по значению, т.е. относящимися к той же предметной или понятийной области. Для обозначения группы слов, соотносящихся с одной и той же областью представлений и как бы без остатка расчленяющих ее на части, соответствующие значениям этих слов, немецкий лингвист Й.Трир ввел понятие семантического поля. Примеры семантических полей: поле времени, поле животноводства, поле имен родства, поле цветообозначений, поле глаголов движения, поле направительных предлогов и т.п. Внутри семантического поля слова связаны между собой семантическими отношениями. Установление типов таких отношений и выявление их наличия между словами в рамках конкретных семантических полей традиционно считается одной из главных задач лексической семантики.

В лексике принято выделять следующие типы семантических отношений.

Синонимия.

К этому типу относятся отношения, основанные на полном или частичном совпадении значений. Слова, связываемые отношением синонимии, называются синонимами. В зависимости от того, допускаются ли вообще различия в значении слов и если допускаются, то какие, выделяются разновидности синонимии и синонимов. Отношение полной или точной синонимии связывает между собой слова, которые не обнаруживают никаких семантических различий. Точная синонимия – явление редкое, что обычно объясняют избыточностью кодирования одного и того же содержания разными формальными средствами. Примеры кандидатов в точные синонимы в русском языке: бегемот – гиппопотам ; бросать – кидать ; глядеть – смотреть ; плебисцит – референдум ; везде – всюду ; заснуть – уснуть. Если означаемые двух слов совпадают во всем, кроме экспрессивно-оценочных элементов их значения, то связывающее их отношение называют (экспрессивно-) стилистической синонимией. Примеры экспрессивно-стилистических синонимов: убегать – драпать – улепетывать или англ. policeman – cop "полицейский".

Слова, значения которых достаточно близки, но содержат и различающие их признаки, называются квазисинонимами. Например, квазисинонимичны слова приказывать и требовать : и то и другое обозначает побуждение адресата к действию, которое тот, с точки зрения побуждающего, должен выполнить. Но если приказывать может только тот, кто тем или иным образом контролирует ситуацию (благодаря своему авторитету, социальному положению или просто оружию в руках), то требовать может и тот, кто не является хозяином положения, но считает, что в данном случае на его стороне закон или другая правовая норма. Так, обыватель, у которого милиционер отобрал паспорт, может потребовать , но не приказать последнему вернуть его. Среди разновидностей квазисинонимии особо выделяются гипонимия и несовместимость.

Гипонимия.

Гипонимическое, или родо-видовое отношение связывает слово, обозначающее род сущностей или явлений со словами, обозначающими виды, выделяемые в рамках этого рода. Этим отношением связаны слова в парах дерево – дуб ; родственник – племянник ; цвет – синий ; передвигаться – идти ; сосуд – стакан. Слово, выражающее более общее понятие в этой разновидности семантических отношений, называется гиперонимом, а слово, обозначающее частный случай, вид указанного рода объектов или явлений, называется гипонимом. Слова, имеющие общий гипероним, называются согипонимами (иликогипонимами). Так, слово дерево является гиперонимом по отношению к словам дуб , ясень , береза , пальма , саксаул и т.п., которые являются согипонимами.

Несовместимость

– это отношение между когипонимами. Так, в отношении несовместимости находятся слова мать и отец , идти и бежать , сладкий и соленый и т.п. Эти слова несовместимы в том смысле, что они не могут одновременно характеризовать одно и то же явление, относиться к одному и тому же объекту. Иначе говоря, денотаты (экстенсионалы) слов, связанных отношением несовместимости, не пересекаются, при том что сигнификаты их имеют общую часть – совокупность признаков, составляющих сигнификат их общего гиперонима. В этом отличие несовместимости от простого различия по смыслу. Так, слова юноша и поэт имеют разные значения, но они не связаны отношением несовместимости (множества юношей и поэтов могут пересекаться), тогда как слова юноша и старик несовместимы по значению. Слова могут находиться в отношении несовместимости и в том случае, когда в языке отсутствует слово, выражающее то родовое общее понятие, виды которого обозначают эти слова. Так, например, нет слова, которое выражало бы родовое понятие для находящихся в отношении несовместимости слов отличник , хорошист , троечник и т.д.

Отношение «часть – целое»

связывает имя некоторого объекта с именами его составных частей. Так, слово дерево связано отношением «часть – целое» со словами ветка , лист , ствол , корни. В отличие от представителей некоторого вида, каждый из которых одновременно является и представителем соответствующего рода (напр., дуб / береза / ольха и т.п. суть деревья ), ни одна из частей целого не является сама по себе целым (напр., ни ветка , ни лист , ни ствол , ни корни не есть дерево ).

Антонимия.

Это отношение основано на противоположности выражаемых словами понятий. Три основные разновидности антонимии различаются по характеру противоположности. Отношение дополнительности, или комплементарная антонимия предполагает такую ситуацию, при которой утверждение того, что обозначает один из антонимов, влечет отрицание того, что обозначает второй, например сухой влажный , спать – бодрствовать , с – без. Дополнительность можно рассматривать как особый случай несовместимости, когда некая общая для двух слов содержательная область полностью распределяется между их значениями. Отношениевекторной антонимии связывает слова, обозначающие разнонаправленные действия: влететь – вылететь , здороваться – прощаться , замерзать – оттаивать и т.п. Отношение контрарной антонимии связывает слова, в значение которых входит указание на противоположные зоны шкалы, соответствующей тому или иному измерению или параметру объекта или явления, например такому, как размер, температура, интенсивность, скорость и т.п. Иначе говоря, этот вид антонимии характерен для слов с «параметрическим» значением: большой – маленький , широкий – узкий , жара – мороз , высоко – низко , ползти – лететь (о времени) и т.п. В отличие от комплементарной антонимии слова, связанные этим отношением, не покрывают своими значениями всю шкалу, поскольку ее средняя часть обозначается какими-то другими выражениями.

Конверсивность.

Это семантическое отношение может связывать слова, обозначающие ситуации, число участников которых не меньше двух. Конверсивами называются слова, которые описывают одну и ту же ситуацию, но рассматриваемую с точки зрения разных ее участников: выиграть – проиграть , над – под , иметь – принадлежать , младше – старше и т.п. Так, одно и то же положение дел может быть описано и как Х опережает Y-а на 10 очков , и как Y отстает от Х-а на 10 очков , но в первом случае благодаря использованию глагола опережать главным действующим лицом представлен Х , а во втором глагол отставать ставит в центр внимания другого участника – Y-а .

Разумеется, рассмотренными выше отношениями не исчерпывается множество системных семантических отношений между словами в языке. Многие другие отношения, которые Ю.Д.Апресян назвал отношениями семантической производности, выделены и описаны в модели «смысл – текст» в качестве лексических функций – замен, которые сопоставляют любому слову, к которому они в принципе применимы, другое слово (слова), определенным образом связанное с ним по значению. Например, лексическая функция Sing сопоставляется слову, обозначающему гомогенное целое, слово, обозначающее один элемент, или квант этого целого. Так, Sing (бусы ) = бусина ; Sing (флот ) = корабль ; Sing (целовать ) = поцеловать и т.д., а лексическая функция Able i связывает название ситуации с названием типового свойства i-го участника этой ситуации. Так, Able 1 (плакать ) = слезливый; Able 2 (перевозить )= транспортабельный.

МЕТОДЫ СЕМАНТИЧЕСКОГО ИССЛЕДОВАНИЯ

В семантике используется широкий спектр исследовательских методов – от общенаучных методов наблюдения (включая играющую в семантике важнейшую роль интроспекцию, т.е. наблюдение за своим собственным внутренним миром), моделирования и эксперимента до частных методов, зачастую опирающихся на достижения смежных наук – например, логики (пресуппозиционный анализ) и психологии (различного рода ассоциативные эксперименты). Наибольшую известность из собственно семантических методов получил метод компонентного анализа.

Компонентный анализ значения

в самом широком смысле представляет собой набор процедур, в результате которых слову сопоставляется его определение, представляющее собой тем или иным способом структурированный набор семантических компонентов, задающих условия применимости данного слова.

Чтобы дать некоторое представление о компонентном анализе значения как методе получения словарного определения слова, продемонстрируем один из его вариантов на конкретном примере анализа значения слова журнал . Вначале надо отыскать слово или словосочетание, обозначающее род вещей, видом которого являются журналы. Таким словосочетанием будет периодическое издание. Значение этого родового по отношению к слову журнал наименования (гиперонима) будет первым семантическим компонентом, входящим в дефиницию слова журнал . Этот компонент – "периодическое издание"– отражает признаки, общие у журнала с другими вещами того же рода (эти признаки – "издание" и "периодичность" – получают эксплицитное, т.е. явное выражение в составе словосочетания периодическое издание ). Такие признаки в составе значения слова называются интегральными семантическими признаками . Теперь надо найти все слова, обозначающие другие виды периодических изданий, и, мысленно сравнивая объекты, обозначаемые словом журнал , с объектами, обозначаемыми каждым из них, выявить те признаки, по которым журналы отличаются от других видов периодики. Такие признаки в составе значения слова называются дифференциальными семантическими признаками . Помимо журналов периодическими изданиями являются газеты , бюллетени и каталоги. От газет журналы отличаются тем, что они сброшюрованы. Если печатное издание не сброшюровано, оно не может быть названо журналом. От бюллетеней и каталогов журналы отличаются по другому признаку, относящемуся не к форме издания, а к его содержанию: если в журналах публикуются преимущественно тексты, относящиеся к публицистике, а также к научной или художественной литературе (статьи, очерки, информационные сообщения, фельетоны, интервью, рассказы и даже главы романов), то бюллетени создаются в первую очередь для публикации официальных документов (законов, указов, инструкций и т.п.), создаваемых издающими бюллетени организациями, а также поставляемой этими организациями справочной информации, а каталоги – для публикации данных о товарах или услугах, предлагаемых той или иной фирмой. Таким образом, в толкование слова журнал следует включить два компонента, соответствующих двум дифференциальным признакам обозначаемого класса объектов, характеризующих их со стороны внешнего вида и со стороны содержания.

Одно из направлений в рамках компонентного анализа значений, развиваемое в трудах А.Вежбицкой и ее последователей, исходит из того, что значения всех слов во всех языках могут быть описаны с помощью одного и того же ограниченного набора из нескольких десятков элементов, неразложимых, как атомы в физике, – семантических примитивов, соответствующих значениям слов, предположительно встречающихся в любом языке и составляющих его понятийную основу. К семантическим примитивам относятся "я", "ты", "кто-то", "что-то", "люди", "думать", "говорить", "знать", "чувствовать", "хотеть", "этот", "тот же самый", "другой", "один", "два", "много", "все", "делать", "случаться", "нет", "если", "мочь", "подобно", "потому что", "очень", "когда", "где", "после", "до", "под", "над", "иметь части", "вид (чего-л.)", "хороший", "плохой", "большой", "маленький" и, возможно, некоторые другие. Это направление развивает идеи философов эпохи Просвещения (Декарта, Ньютона, Лейбница), пытавшихся разработать особый язык мысли (lingua mentalis), посредством которого можно было бы истолковать значения всех слов обычного языка.

Компонентный анализ значений слов способствовал проникновению в семантику экспериментальных методов исследования.

Эксперимент в семантике.

Как и в прежние времена, основным методом выявления значения слова в лексической семантике остается интроспекция, т.е. наблюдение лингвиста над теми идеальными сущностями, которые связаны с данным словом в его собственном сознании. Естественно, если объектом семантического исследования является родной язык, то лингвист, будучи его носителем, может полагаться на собственное знание языка и делать выводы о значении слова, опираясь на собственную интуицию, на то, как он сам употребляет и понимает слово. В случае же изучения семантики неродного языка семантический анализ должен обязательно опираться на некоторый корпус употреблений изучаемых слов с их контекстами, извлекаемый из различных текстов устной и письменной речи, признаваемых авторитетными образцами соответствующего литературного языка или какого-либо из его подъязыков. И те правильные употребления слова, которые лингвист порождает сам, и те, которые он извлекает из текстов, образуют, так сказать, «положительный» языковой материал, осмысляя который лингвист формулирует для себя гипотезу о значении изучаемых выражений.

Эксперимент в семантике служит для того, чтобы подтвердить или опровергнуть семантические гипотезы, выдвигаемые на основе наблюдений над употреблениями слов, которые признаются правильными. Экспериментировать лингвист может и с собственным языковым сознанием, если он изучает родной язык, и с сознанием других носителей языка (что необходимо при изучении неродного языка).

Важнейший вид эксперимента в семантике (в отечественной лингвистике впервые предложенный академиком Л.В.Щербой в 1931 в статье О трояком аспекте языковых явлений и об эксперименте в языкознании ) состоит в том, что исследователь для проверки правильности своих предположений о значении того или иного слова должен пробовать употребить это слово в контекстах, отличных от тех, в которых оно уже встретилось. Получаемый в результате такого эксперимента языковой материал будет содержать наряду с правильными, возможными фразами с данным словом также и неправильные, отклоняющиеся от нормы и по этой причине никогда не встречающиеся в текстах, воплощающих языковую норму. Эти неправильные фразы образуют так называемый «отрицательный языковой материал», роль которого в семантическом исследовании громадна, поскольку на его основе можно выявить те элементы значения слова, которые препятствуют его употреблению в данном контексте. (Отрицательный языковой материал встречается в текстах художественных произведений, авторы которых используют нарушение языковой нормы как художественный прием, ср., например, следующие семантически аномальные – что принято отмечать звездочкой перед соответствующим языковым выражением – фразы из произведений Андрея Платонова: *Они присутствовали на этом собрании уже загодя ; *Умрищев взял из-под стола следующую книгу и заинтересовался ею ; звездочка перед языковым выражением показывает его неправильность с точки зрения языковой нормы.) Иными словами, в ходе эксперимента описанного типа лингвист порождает семантически аномальные фразы с данным словом и проверяет, можно ли на основе его предположения о значении некоторого слова объяснить аномальность его употребления в заданном контексте. Если можно, то это подтверждает гипотезу, если нельзя, то первоначальную гипотезу следует уточнить.

Например, если мы предположили, что в значение глагола предлагать (Х предлагает Y-у Р ) входит компонент "Х считает что Y может быть заинтересован в P", на что указывают типовые употребления вроде Он предложил мне сыграть в шахматы / (выпить ) чаю / интересную работу и т.п., то мы будем подставлять это слово в контексты, в которых Х никак не может считать, что предлагаемое действие в интересах Y-а, например в контекст, в котором Х в грубой форме побуждает Y-а покинуть помещение, считая, что по своей воле Y этого не сделает. Фраза *Он предложил мне убраться вон явно аномальна, что естественно объясняется исходной гипотезой и тем самым подтверждает ее. Аналогичным образом аномальная фраза *Заключенный ночью расколол решетку на окне камеры и бежал подтверждает предположение о том, что объект действия расколоть должен быть из хрупкого материала, поскольку именно отсутствием этого свойства у железных тюремных решеток естественно объясняется неправильность употребления глагола в данном контексте.

Другой тип экспериментов предполагает использование самих предметов или физических явлений, входящих в денотат слова. Впрочем, во многих случаях сами предметы можно заменить их изображениями. Обычно такие эксперименты проводятся с привлечением информантов-носителей языка и имеют целью установить, от какого именно параметра предмета или явления зависит возможность употребить для его обозначения конкретное слово. Характерный пример подобного эксперимента описан в работе американского лингвиста У.Лабова Структура денотативных значений (1978, рус. пер. 1983), посвященной исследованию значений слов, обозначающих сосуды в разных языках. Эксперимент состоит в том, что информанту показывают различные изображения сосудов в случайном порядке и просят назвать очередной сосуд. В изображениях варьируют следующие параметры: отношение ширины сосуда к высоте; форма (чашеобразная, цилиндрическая, усеченный конус, призма); наличие / отсутствие ручки; наличие / отсутствие ножки. Кроме самих изображений, варьирует и «контекст», в котором фигурирует предмет: 1) «нейтральный», т.е. вне ситуации; 2) «кофе» – назвать сосуд в ситуации, когда некто, помешивая ложечкой сахар, пьет кофе из этого сосуда; 3) «пища» – сосуд стоит на обеденном столе и наполнен картофельным пюре; 4) «суп»; 5) «цветы» – сосуд с цветами изображен стоящим на полке. Варьирует и материал, о котором информантам сообщалось устно. Анализ ответов информантов позволяет выявить зависимость употребления каждого слова от определенных свойств денотата. Эти свойства, а также их отражение в сознании носителей языка и будут кандидатами в дифференциальные семантические компоненты, составляющие значение данного слова. Среди них при этом выделяются категориальные компоненты, образующие необходимые условия применения данного слова. Например, англ. goblet "бокал" в качестве категориального признака имеет "наличие ножки": если у сосуда нет ножки, то слово goblet для его обозначения никогда не используется. Другой вид компонентов – вероятностные: они отображают такие свойства, которые обычно, но не всегда имеют денотаты, обозначаемые данным словом. Например, сосуд, обозначаемый английским словом cup "чашка", обычно имеет ручку, но, как показал эксперимент, для называния сосуда этим именем наличие данного признака не обязательно.

В рамках компонентного анализа был выработан целый ряд семантических тестов разного типа, которые применяются как для выявления определенных семантических характеристик слова, так и для проверки семантических гипотез. Большой вклад в их разработку внесли Э.Бендикс и Дж.Лич. Например, суть «теста на свободную интерпретацию» состоит в обращении к информанту с просьбой проинтерпретировать (эксплицировать, разъяснить) то или иное выражение или различие между двумя выражениями. Лингвист обращается к информанту с вопросами типа: «Что это значит?» или «Если бы Вы услышали, что кто-то сказал это, то что, по Вашему мнению, он имел бы в виду?»

Если мы хотим выяснить семантическое различие между двумя словами, то мы строим тестовые выражения как минимальные пары, то есть они должны совпадать во всем, кроме одного слова. Так, если нас интересует, в чем разница между значениями слов просить и приказывать , мы обратимся к информанту с вопросом: «В чем разница в значении между Он попросил меня сделать это и Он приказал мне сделать это »? Этот тест может использоваться на этапе формирования семантической гипотезы.

Когда мы уже имеем гипотезу, проверить ее правильность можно с помощью более жестких тестов с несколькими альтернативными ответами, например с помощью «импликативного теста», в ходе которого информанта просят оценить, истинно ли высказывание P, когда истинно высказывание Q. Высказывание Q при этом содержит изучаемое слово, а высказывание Р выражает предполагаемый компонент значения этого слова. Так, если мы предполагаем, что в значение глагола приказывать (Х приказывает Y-у Z ) входит компонент "X cчитает, что Y обязан делать Z", мы спрашиваем информанта: «При условии, что высказывание Он приказал мне остаться истинно, истинно ли следующее высказывание: Он считает , что я должен остаться ?» Если положительный ответ на этот вопрос дают не менее 80% информантов, то это считается свидетельством того, что проверяемый семантический компонент действительно присутствует в составе значения исследуемого глагола.

Осложняющие факторы.

В свете изложенного может показаться, будто каждое слово имеет одно четкое и определенное денотативное значение, которое может быть задано строгим десигнативным правилом, в точности сообщающим нам, при каких условиях слово должно употребляться. Но в действительности дело обстоит вовсе не так просто.

Неоднозначность.

Многие слова (возможно, даже большинство слов) используются в более чем одном смысле. Cлово лук может применяться как для обозначения огородного растения со съедобной луковицей и съедобными трубчатыми листьями, так и для обозначения старинного оружия для метания стрел. Английское слово saw употребляется для обозначения как некоторого инструмента (пилы), так и в качестве формы прошедшего времени глагола see "видеть". Одна и та же последовательность звуков в таких случаях оказывается соотносимой с совершенно различными значениями, причем отсутствие какой-либо связи между этими значениями дает основание усматривать в этих и им подобных случаях не одно слово с разными значениями, а несколько разных слов, случайно совпадающих по форме (возможно, с некоторого момента; например, в слове лук 2 "оружие" исторически имелся носовой звук , совпавший впоследствии с обычным [u] в слове лук 1 "растение"). Такие слова называются омонимами, а соответствующий тип неоднозначности – омонимией. При другом типе неоднозначности, называемом многозначностью или полисемией, значения некоторого слова хотя и различны, но связаны между собой, или, иначе говоря, имеют существенную общую часть. Например, рус. создание и англ. creation может обозначать как сам процесс "созидания", так и его результат – "то, что создано". Слово кино может означать либо "фильм", либо "театр, в котором показывают фильмы", либо "род искусства, произведениями которого являются фильмы". Полисемия не разрушает тождества слова, которое рассматривается как целостная, но многозначная единица языка. Омонимия и полисемия, как правило, не создают путаницы; благодаря достаточному различию значений контекст обычно указывает на подразумеваемый смысл слова. Но в иных случаях значения столь близки друг другу, что говорящий, зная эти значения, может легко «соскальзывать» от одного к другому. Так, про человека, у которого на полках стоят тысячи физически различающихся книг, представляющих собой идентичные нераспроданные экземпляры публикации его рукописи, можно сказать, что у него есть одна книга или что у него есть тысяча книг, в зависимости от того, употребляется ли слово книга в значении типа (издание книги, воплощенное во множестве экземпляров) или в значении экземпляра (сам подразумеваемый физический предмет; это известное из семиотики противопоставление иногда передается без перевода: type – token). Это тот же автобус , который идет от метро мимо парка ? Некоторые скажут «да», некоторые – «нет». Но этот спор будет чисто словесным: если под «тем же автобусом» имеется в виду физически то же самое транспортное средство, то точный ответ, вполне вероятно, окажется отрицательным; если же подразумевается автобус того же маршрута, то ответ имеет полное право быть положительным. Когда встречаются такие случаи неоднозначности, то важно понять, что они могут быть разрешены путем тщательного различения разных смыслов, вкладываемых в употребляемое слово или словосочетание. Словесные споры возникают тогда, когда люди думают, что расходятся во мнении о фактах, тогда как в действительности их разногласия проистекают лишь из-за того, что отдельные ключевые слова имеют для спорщиков разные значения. Конечно, абсолютизировать семантические причины споров и конфликтов, как это делали представители популярной в 1930–1960-е годы в США школы «общей семантики» (основоположником ее был А.Кожибский, а наиболее значительными представителями – С.Хаякава и А.Рапопорт), не стоит, но разобраться, не скрывается ли за непониманием употребление языковых выражений в существенно различных значениях, бывает полезно почти всегда.

Наиболее распространенный тип неоднозначности имеет место при переносном употреблении слова. Острый нож – это такой нож, который хорошо режет, острый сыр реально не режет язык, но возникает такое чувство, как если бы он это делал. Слово лиса в буквальном употреблении обозначает вид млекопитающих, но в переносном употреблении (Он – хитрая лиса ) это слово обозначает коварного человека. Таким образом возникают пары типа англ. dining-room table "обеденный стол" – table of statistics "статистическая таблица"; your shadow "твоя тень" – he is a mere shadow of his former self "от него осталась одна тень"; a cool evening "холодный вечер", a cool reception "холодный прием"; higher in the sky "более высоко в небе" – higher ideals "высшие идеалы" и т. п. В большинстве подобных случаев контекст ясно определяет, является ли употребление буквальным или переносным.

Метафора.

Хотя переносно употребляемое слово приобретает по крайней мере одно добавочное значение и становится в этом смысле неоднозначным, переносные выражения часто позволяют нам говорить о вещах, для которых мы бы иначе не могли подобрать подходящих слов. Кроме того, они, как правило, более живые и сильные, чем буквальные выражения. В особенности это касается метафоры. В этом случае слово, которое словарно соотносится с одним предметом мысли, употребляется для обозначения другого предмета мысли. Говоря о сплетничающих языках пламени (англ. the gossip of flames , букв. "сплетни пламени"; в русском переводе метафор две, однако одна из них, «языки пламени», является привычной и слабо осознаваемой, такие метафоры называют также конвенциональными или «мертвыми» – о них говорится в следующем абзаце), Уолт Уитмен употребляет слово, относящееся к болтовне, разносящей слухи, для обозначения оживленного потрескивания огня. В случае метафорического употребления слова его фигуральное значение определяется сохранением некоторого сходства с буквальным смыслом этого слова и в отрыве от буквального смысла понято быть не может. Переносное значение метафоры Уитмена, описывающей шум, с которым мечутся языки пламени, прошло бы мимо нас, если бы мы не знали или не могли бы подумать о буквальном значении слова gossip "болтовня, слух, сплетня". Парафразы, предложенные здесь, не исчерпывают сложных отношений между буквальными и переносными значениями слов и, конечно, не могут воспроизвести тот психологический эффект видения слова, употребленного таким способом, при котором оно сталкивает нас с нашим предшествующим знанием его буквального значения. Это и есть то умножение семантического потенциала, которое столь характерно для метафоры.

Метафоры, которые начинают вновь и вновь употребляться в повседневной речи, имеют обыкновение терять свои буквальные значения; мы настолько привыкаем к ним, что идем прямо к их переносным значениям. Большинство людей, услышав англ. blockhead "болван, чурбан" (букв. "чурбанная голова"), думают непосредственно о ком-то тупоголовом, вообще не соотнося это слово ни с какой тупостью какого-либо настоящего деревянного чурбана. Так, слово blockhead потеряло творческую, образоформирующую функцию, характерную для метафор, и превратилось в «мертвую метафору». Многие слова столь пропитываются своими метафорическими употреблениями, что словари описывают в качестве буквальных значений то, что когда-то ранее было значениями переносными. Таково англ. hood "капюшон, капор, верх экипажа, хохолок птицы, крышка, чехол, колпак, капот двигателя", превратившееся в обозначение металлической поверхности, прикрывающей механизм автомобиля сверху. Старое значение слова hood "колпак" сохраняется, и его многочисленные переносные значения делают это слово «семантически сложным». Конечно, слово hood имеет также переносное употребление, как, например, в составе сложного слова hoodwink "ввести в заблуждение, обмануть, провести". В 17 в. слово explain "объяснять, толковать" еще сохраняло остатки своего буквального значения в латинском языке (из которого оно было заимствовано) – "раскрывать, развертывать", так что его можно было употреблять в предложении типа The left hand explained into the palm "Левая рука разжалась в ладонь". Сегодня первоначальное буквальное значение слова explain полностью уступило место значению, которое возникло как переносное расширительное употребление. Истории многих слов ярко демонстрируют, сколь значительную роль играет метафора в семантическом изменении.

Расплывчатость.

Наиболее досадные проблемы для семантики создаются таким осложняющим фактором, как расплывчатость (англ. vagueness). «Расплывчатое» – это противоположность «точному». Расплывчатые слова неточны по отношению к миру, который они призваны описывать. Но неточны они могут быть в нескольких различных отношениях.

Простейший тип расплывчатости создается отсутствием четкой границы между применимостью и неприменимостью слова. Один предмет отчетливо окрашен в желтый цвет, другой столь же отчетливо окрашен в оранжевый ; но где провести четкую разграничительную линию между ними? Желтым или оранжевым следует называть то, что лежит посередине? Или, быть может, мы должны ввести новое понятие желто-оранжевого цвета? Но это не разрешит указанную трудность, потому что встанет вопрос, где провести границу между оранжевым и желто-оранжевым и т.д. Когда сама природа дарит нам непрерывность, внутри которой мы хотим провести некоторое разграничение, то любая точка, в которой мы попытаемся это разграничение сделать, будет несколько произвольна. Использование именно «этого», а не «того» слова, по-видимому, предполагает ясную точку перехода, хотя в природе таковой нет. Скалярные (соотносимые с некоторой шкалой) слова – такие, как медленный и быстрый , легкий и трудный , твердый и мягкий , иллюстрируют этот тип расплывчатости.

Бывает так, что условия употребления слова описываются множественными критериями. Это не то же самое, что неоднозначность, при которой слово употребляется в нескольких разных смыслах. Но это также не означает, что для употребления слова должно выполняться некоторое множество условий, так как в нормальном случае это имеет место и без всякой расплывчатости. Выше уже упоминалось о трех условиях употребления слова треугольник , но слово треугольник является не расплывчатым, а точным. Под «множественностью критериев» имеется в виду тот факт, что не существует никакого единого набора условий, которые задавали бы его употребление в том же смысле, в котором три упомянутых выше условия задают употребление слова треугольник ; более того, может статься, что не существует вообще ни одного такого условия, которое обязано выполняться для того, чтобы употребление слова было возможным. Существа, которых мы называем собаками , как правило, бывают покрыты шерстью, способны лаять, виляют хвостами, бегают на четырех лапах и т.д. Но собака о трех лапах все же остается собакой; собака, не умеющая лаять, также может оставаться собакой (такова африканская порода басенджи) и т.д. Признак A может отсутствовать, пока наличествуют признаки B, C и D; признак B может отсутствовать, пока наличествуют признаки A, C и D и т.д. Ни один из них не является необходимым; достаточно комбинации других. Здесь рушится само различие между отличительными и сопроводительными признаками; вместо этого мы имеем некоторое множество, своего рода кворум (необходимое число) характеристик, наличие которых необходимо для того, чтобы данное слово было применимо к данному предмету. Для того чтобы объявить заседание сената открытым, необходим кворум сенаторов, но нет такого сенатора, присутствие которого было бы необходимым при наличии минимального необходимого числа других сенаторов. Это и есть требование кворума.

Картину дополнительно усложняют следующие обстоятельства. (1) Иногда нет никакого определенного числа признаков, образующих этот множество-кворум: все, что мы можем сказать, это то, что чем в большей степени признаки данного предмета обладают свойством «Х-овости», тем более мы склонны использовать для его обозначения слово «X». (2) Нельзя сказать также, чтобы все эти признаки имели одинаковый вес. Говоря, что кто-то умен (intelligent), мы придаем способности к решению новых задач больший вес по сравнению с памятью. (3) Некоторые признаки могут присутствовать в различной степени: так, практически каждый способен как-то справляться с решением задач, однако чем выше степень этой способности, тем выше ум (intelligence). Чем более выражен признак «Х-овости», тем с большей уверенностью мы говорим о применимости слова «X».

Расплывчатым может быть не только то слово, которому мы пытаемся дать определение; слова, посредством которых мы это определение даем, также могут быть расплывчатыми. Англ. слово murder означает "deliberate killing" ("умышленное убийство") в отличие от manslaughter "кровопролитие", при котором убийство является непредумышленным или происходит в результате несчастного случая; но достаточно ли для признания действия произвольным, чтобы оно было намеренным, или надо еще, чтобы оно было продуманным (заранее запланированным)? Да и когда, вообще, можно назвать нечто убийством? Если кто-то допускает смерть другого по халатности или не спасает другого в ситуации, где мог бы спасти, то убил ли он его? Убивает ли мужа жена, доводя его до самоубийства? Впечатление точности, возникающее при построении строго сформулированного определения, может быть иллюзорным, ибо та расплывчатость, которая характеризовала толкуемое слово, может снова проявить себя в значениях слов, с помощью которых мы пытаемся построить определение, так что ни от какой расплывчатости мы на самом деле не избавимся.

Иногда нам, в практическом плане, и не нужно стремиться к большей точности. Когда кто-нибудь говорит: Коридор уходит в глубину здания , то несочетаемость глагола уходить с обозначением стационарного объекта ничуть не мешает пониманию. Иногда нам действительно надо было бы выражаться поточнее, но состояние наших знаний не дает нам возможности что-либо уточнить. Тем не менее расплывчатые описания в большинстве случаев все же лучше, чем полное отсутствие описаний; утверждавший когда-то обратное австрийский философ Л.Витгенштейн (тезис его Логико-философского трактата гласит: «О чем невозможно говорить, о том следует молчать») к концу жизни отказался от своей радикальной позиции.

Значение предложений.

Слова и словосочетания соединяются друг с другом, образуя предложения – семантические единицы, которые мы чаще всего употребляем в обыденной речи. Слова в предложении должны сочетаться по определенным грамматическим правилам, своим для каждого языка. Например, в английском предложении должен присутствовать грамматический минимум, состоящий из подлежащего и сказуемого. Цепочка слов Walking eat sat quiet (возможный букв. перевод «Гуляя кушают сидел спокойный») состоит из слов, но не образует английского предложения, уже хотя бы потому, что в ней нет подлежащего. В добавление к этим минимальным требованиям иметь значение обязаны именно предложения как целостные единицы, а не просто образующие их слова. Saturday is in bed «Суббота находится в постели» состоит из слов, и эти слова образуют грамматически правильное предложение, но это предложение скорее всего будет воспринято как бессмысленное.

Подобно тому как слова именуют вещи (вещи в широком смысле, включая качества, отношения, действия и т.д.), так же и предложения именуют то, что можно назвать положениями вещей. Кошка лежит на коврике именует одно положение вещей, а Собака лежит на коврике именует другое положение вещей. Конечно, существуют и такие предложения, которые не описывают никаких положений вещей: мы знаем, что значит Кошка залаяла , хотя это предложение не описывает никакого существующего (и, насколько нам известно, никакого существовавшего ранее) положения вещей. Предложения обозначают не только реальные положения вещей, но и возможные (или, избегая неоднозначного термина «возможные», можно сказать, «вообразимые положения вещей», хотя термин «вообразимые» несет с собой новые трудности). Предложение не обязано именовать никакого настоящего или прошедшего положения вещей, однако, когда мы употребляем предложение, мы должны знать, какое положение вещей должно было бы именоваться нашим предложением, если бы такое положение вещей существовало. Мы считаем, что предложение Saturday is in bed бессмысленно, потому что не существует такого мыслимого положения вещей, которое могло бы в принципе описываться этим предложением. Будучи не в состоянии помыслить такое положение вещей, мы говорим: «Это не имеет никакого смысла», «Это нелепость» или «Это бессмысленно».

Внутренне противоречивые предложения бессмысленны потому, что нет никакого возможного положения вещей, которое они могли бы описывать. Предложение Он нарисовал квадратный круг внутренне противоречиво потому, что определения слов квадратный и круг несовместимы друг с другом. Я собираюсь изменить прошлое внутренне противоречиво потому, что прошлое относится к тому, что уже произошло, а то, что человек собирается делать, относится к будущему.

Предложения, содержащие так называемые категориальные ошибки, бессмысленны, хотя могут не содержать никакого прямого противоречия. Красное принадлежит к категории цвета, круглое – к категории очертаний. Удары грома принадлежат к категории физических явлений, мысли – к категории ментальных событий. Все это принадлежит к категории временных вещей или сущностей, тогда как числа и философские универсалии принадлежат к категории невременных сущностей. Всякая попытка, при которой свойство, относящееся к одной категории, приписывается предмету, относящемуся к другой категории, ведет к бессмыслице. Если мы скажем Суббота не находится в постели , то это будет категориальной ошибкой. Она заключается не в том, что субботе в большей мере свойственно не находиться в кровати, чем находиться в кровати; она заключается в том, что понятие нахождения в кровати вообще не применимо к дням недели. Подобным же образом бессмысленно предложение Число 7 – зеленое , поскольку прилагательное зеленый приложимо лишь к физическим предметам, а не к числам. Столь же бессмысленны благодаря наличию категориальных ошибок такие предложения, как Квадратичные неравенства пойдут на лошадиные скачки , Теории поедают кислотность , Зеленые идеи яростно спят , Она услышала цвет , Синий есть простое число .

Литература:

Шмелев Д.Н. Проблемы семантического анализа лексики . М., 1973
Новиков Л.А. Семантика русского языка . М., 1982
Бендикс Э. Эмпирическая база семантического описания
Найда Ю.А. Процедуры анализа компонентной структуры референционного значения . – В кн.: Новое в зарубежной лингвистике. Вып. XIV. М., 1983
Катц Дж. Семантическая теория . – В кн.: Новое в зарубежной лингвистике. Вып. Х. М., 1985
Васильев Л.М. Современная лингвистическая семантика . М., 1990
Степанов Ю.С. Семантика . – Лингвистический энциклопедический словарь. М., 1990
Апресян Ю.Д. Избранные труды , т. 1. Лексическая семантика. Синонимические средства языка. М., 1995
Вежбицкая А. Язык. Культура. Познание . М., 1995



Семантика - слово, пришедшее в наш язык из греческого, где его смыслом было «значимый». В филологии оно впервые было применено во Франции М. Бреалем, занимавшимся не только развитием языка, но и историей. О том, что такое семантика, могут рассказать многие языковеды. Под термином принято понимать такую науку, которая посвящена смыслу слова, множеству букв и предложений.

А если попонятнее?

Наиболее общее значение термина (именно его обычно подразумевают) можно уточнить как «лексическая семантика». Она занимается осмысленной нагрузкой отдельно взятых слов. А вот языковеды, исследующие алфавиты, сохранившиеся с древности, знают, какова смысловая нагрузка отдельных букв. Некоторые специалисты занимаются текстами, фразами, законченными предложениями. Такая область - еще одно из полей применения семантического научного подхода.

Разбирая, что такое семантика, нужно обязательно упомянуть о родстве с другими дисциплинами. В частности, тесны связи с:

  • логикой;
  • языковой философией;
  • коммуникационными теориями;
  • антропологией (языка, символов);
  • семиологией.

Рассматривая науку подробнее, необходимо сразу сформулировать объект, который она исследует: семантическое поле. Это такой комплекс терминов, для которых свойственен некий общий фактор.

Объект исследования

Если спросить филолога, что такое семантика, специалист расскажет: термином принято обозначать науку, занимающуюся не только осмысленной нагрузкой слов, но и философскими языковыми аспектами. Кроме того, распространяется дисциплина и на используемые программистами языки, на формальную логику, семиотику. Посредством разработанных в семантике инструментов можно провести результативный анализ текста. Благодаря этой науке можно вычленить соотношения фраз, слов, символов, взаимосвязь со значениями.

Впрочем, описанное значение - лишь общее представление, что такое семантика. На самом деле в настоящее время понятие намного шире. Оно применяется для некоторых специализированных философских течений и даже в рамках одного из подходов, призывающих людей изменить свое отношение в мире, уйти прочь от «культуры потребления». Проблема эта в последние годы стала действительно актуальной, и одно из ее решений получило наименование «общая семантика». Стоит признать, у нее есть немало поклонников.

Понимание сути

Так сложилось, что семантика языка - наука, для которой очень актуальна проблема понимания. Проще говоря, обыватель запросто может сказать, чем занимается математика или физика, но не всякий быстро сориентируется в сфере исследования семантики. Что удивительно, не столько лингвисты, сколько психологи поставили перед собой задачу формулирования понимания сути семантики. В то же время интерпретация символов, знаков - вопрос, свойственный строго лингвистике и никакой иной науке. Значение отыскивают с учетом обстановки, в которой объекты применялись: специфики сообщества, контекста, обстоятельств.

Лингвистическая семантика особенное внимание уделяется мимике, телодвижениям, звукам, как способам передачи информации. Все это формирует значимый контекст. Для письменного языка роль таких структурных факторов играют абзацы и знаки препинания. Общий термин, обозначающий эту область информации - семантический контекст. Аналитическая деятельность в области семантики тесно связана с рядом сопутствующих дисциплин, занимающихся лексикой, этимологией символов и слов, правилами написания и произношения. Наука связана и с прагматикой.

Особенности науки

Семантика языка занимается строго определенными вопросами, ей характерна конкретная область знаний. Свойства этой дисциплины зачастую позволяют характеризовать ее как синтетическую. Рассматриваемая сфера тесно сплетается с языковой философией, имеет связь с филологией, семиотикой. В то же время наблюдается резкий контраст с синтаксическими правилами, комбинаторикой, не обращающей внимание на смысловую нагрузку используемых символов и знаков.

Особенность семантики в наличии значимых связей с репрезентативными смысловыми теориями, в том числе рассматривающими взаимосвязи, соответствия и истинность смысла. Это уже не просто языковая наука, но философская дисциплина, которая фокусируется на реальности и отражении ее через возможности языка.

Лингвистика

Эта наука - одна из дополнительных областей, включенных в общее дерево семантики как дисциплины исследования. Объект внимания этой сферы семантики - лексика. Лингвистика занимается смысловой нагрузкой, характерной словарным уровням, предложениям и фразам. В равной степени лингвистика анализирует и более крупные объекты - тексты, расширенные повествования.

Изучая лингвистику и семантику, необходимо четко представлять тесные взаимосвязи субъектов. Для лингвистики становятся важными перекрестные ссылки и примененные обозначения. Особенность этого направления - исследования взаимоотношений, свойственных единицам лингвистики. Как и семантика предложения, лингвистика особенное внимание уделяет словосочетаниям, правда, в несколько ином ключе. Здесь исследователи фокусируются на омонимах, анонимах, синонимах, паронимах, метрономах. Задача, стоящая перед ними, - осмыслить довольно крупные элементы текста, скомпоновав их из небольших, и расширить смысловую нагрузку, насколько это представляется возможным.

Монтагская грамматика

Автором этой структуры семантики стал Ричард Монтегю. Впервые свои теории он озвучил в 1960-м. Идея заключалась в такой систематизации определений, которая применяла бы терминологию лямбда-исчисления. Продемонстрированные им материалы наглядно доказали, что присущий тексту смысл можно разложить на части, элементы, используя правила сочетания. Внимание обратили и на факт относительной немногочисленности таких правил.

В то время впервые прозвучал термин «смысловой атом». Его понимание, равно как и работа с примитивами, легли в базу семантики вопросов в семидесятые годы. Так начала развиваться мыслительная гипотеза. И сегодня многие признают, что грамматика Монтегю была исключительно стройным, логичным изобретением. К сожалению, ее отличием от семантики речи была выраженная изменчивость, определяемая контекстом. Язык, как считал Монтегю, был не просто системой ярлыков, закрепленных за предметами и явлениями, но инструментальным набором. Он обращал внимание, что значимость каждого из таких инструментов не в привязке к конкретным объектам, а в специфике функционирования.

А на примерах?

Семантика в прочтении Монтегю хорошо иллюстрируется следующим образом. Филологам знакомо понятие «семантическая неопределенность». Это ситуация, когда в отсутствии ряда частей контекста невозможно определить точный смысл объекта (слова, фразы). Более того, нет таких слов, идентификация которых была бы стопроцентно возможной и верной в отсутствии окружения.

Формальная семантика

Эта идея была сформулирована, как усовершенствование постулатов Монтегю. Она принадлежит к теоретическим высоко-формализованным подходам и работает с естественными языками. Таким методом может быть проанализирована и русская семантика. Особенность - в присвоении различным единицам значений: истинности, функциональной зависимости, индивидуальности. Для каждой единицы затем выявляется истинность, соотношение в аспектах логики относительно иных предложений. Все это позволяет получить достаточный объем сведений для анализа текста в целом.

Истинно-условная семантика

Автором этой теории выступил Дональд Дэвидсон. Теория принадлежит к числу формализованных. Основная идея - в определении связей между предложениями. Подход предполагает работу с естественными языками. Семантика слова, предложения, текста обязывает выискивать и описывать такие условия, при которых некоторый объект исследования становится истинным.

Например, только в ситуации, когда снег белого цвета, истинным будет выражение «снег белый». То есть фактически задача филолога - определить, в каких условиях значение фразы становится истиной. В семантике слова заранее задан набор значений, выбранных на базе конкретного объекта, и задается набор правил, позволяющих их объединять. Практическое применение такого метода - формирование абстрактных моделей, в то же время суть подхода - в определении соответствия между выражениями и реальными вещами и событиями, а не абстрактными результатами моделирования.

Искусственная семантика

Под этим термином принято понимать такие фразы, слова, на базе которых формируется полезное содержимое. Задача лингвиста - составить семантическое ядро, которое будет привлекать внимание читателя. Наиболее актуален этот термин в настоящее время в применении к современным технологиям, в частности, интернету. Чтобы повысить посещаемость виртуальной странички, важно таким образом сформировать ее текстовое наполнение, чтобы присутствовали ключи, способные заинтересовать пользователя. Искусственная семантика в настоящее время широко применяется в рекламных целях.

Информатика предлагает трактовать семантику как раздел, занимающийся осмысленностью конструкций, свойственных языку. Это, в некоторой степени, противоположно синтаксису, чья сфера ответственности - форма выражения конструкций. Семантика - набор правил, позволяющих трактовать синтаксис. В то же время значения заданы непрямо, лишь ограничены возможности понимания объявленных слов, символов. Принято говорить о семантике как отношениях, свойствах, дающих формальное представление об объекте. Применяется логический подход, на основании которого строятся модели и теории, базирующиеся на интерпретации полученной информации.

Семантика как метод продвижения проекта

Применяя базовые правила семантики, специалист может разработать такое ядро, которое затем будет базой для формирования СЕО-программы. Семантическое ядро - список запросов, которые аудитория может ввести в виртуальной системе поиска, чтобы ознакомиться с услугами, товарами, в которых нуждается. Чтобы сформировать такое ядро корректно, нужно представлять, в чем клиент нуждается, какие перед ним стоят цели.

Определение потребностей целевой аудитории чаще всего предполагает интервьюирование либо бриф-опрос. Правильно подойдя к этой задаче, можно сформулировать с высокой степенью точности, в чем нуждается пользователь.

Семантическое ядро: особенности

Чтобы правильно сформировать этот базовый для продвижения проекта объект, необходимо сперва разобраться с природой пользовательских запросов. Таковые подразделяются на четыре крупные категории:

  • информация;
  • транзакции;
  • навигация;
  • общие запросы.

Информационные поисковые запросы

Таковые люди спрашивают у поисковой системы, если перед ними стоит какой-то нуждающийся в решении вопрос. Система выдает список сайтов, в большей или меньшей степени соответствующих заданному, после чего клиент начинает поочередно переходить по страничкам из верхнего перечня выдачи, изучая результаты на предмет релевантности. Останавливается человек, когда удается обнаружить необходимые данные.

Чаще всего информационные запросы начинаются с вопросительного слова, хотя нередко прибегают к относительно неочевидному для машинного языка выражению мысли - запрашивают помощь или советы, отзывы или правила (инструкции). Если владелец ресурса знает, какие именно запросы чаще всего приводят к нему пользователя (или могли бы приводить), необходимо формировать семантическое ядро под каждую страницу с учетом этой информации. Если проект некоммерческий, то именно информационные запросы приносят почти весь объем трафика. Чтобы монетизировать сайт, можно прибегнуть к контекстной рекламе или другим сходным возможностям.

Навигация и транзакции

Навигационные - это такие запросы, которые дают четкую характеристику виртуальной странички. Именно благодаря им в будущем будут осуществляться переходы.

Транзакции, по мнению многих специалистов СЕО, являются наиболее любопытной категорией из всех возможных запросов. Через них можно получить представление, для каких целей клиент ищет сайт. Одни нуждаются в материале для ознакомления, другие скачивают файлы, третьи совершают покупки. Зная особенности транзакционных запросов, можно построить собственный бизнес в интернете. Между прочим, некоторое время назад именно через них развивались почти все, предлагающие услуги, сайты, а также виртуальные магазины.

Особенность вопроса

Не все так легко и просто. Запросы, которые может выявить СЕО-специалист, составляя семантическое ядро, применяются всеми конкурентами. С одной стороны, их использование не может быть гарантом успеха программы продвижения - слишком много соперников. В то же время их отсутствие делает программу развития сайта практически невозможной. Применяя конкурентные запросы, можно успешно привлечь аудиторию на продвигаемую страницу. Если предполагается раскрутка на основе именно таких запросов, нужно проконтролировать, что пользователь, оказавшись на страничке, может совершить соответствующую транзакцию.

Не все уверены, стоит ли применять такой тип запросов, если продвигается страница не коммерческого, а информационного характера. Специалисты заверяют, что это абсолютно корректное решение. При этом нужно предусмотреть возможность совершения пользователем действий на страничке. Самый простой вариант - контекстная реклама, соответствующая содержимому, партнерская программа.

Общие запросы

Это такие формулировки, из которых сложно понять, что именно ищет пользователь. Например, это могут быть «двигатель авто» или «кисточка для румян». По какой причине пользователь ищет информацию, только из самого запроса совершенно не ясно. Кто-то заинтересован, как предмет устроен и из чего сделан, другой ищет возможность купить, а третий исследует ассортимент предложения на рынке. Возможно, пользователь хочет найти инструкцию по самостоятельному изготовлению предмета или осуществлению работы, но другой человек заинтересован в том, чтобы заказать услугу - например, поклейку обоев в комнате. Учитывать общие запросы при формировании контекстного ядра нужно, но не стоит делать на них особенный акцент, если проект не посвящен, например, всем возможным типам кисточек для румян или обоям и всему, что с ним связано, от производственных вопросов до правил окрашивания.

Частотность: конкуренция на каждом шагу!

Характеристика частотности - одна из ключевых при выборе подходящего наполнения семантического ядра. В общем случае все запросы делятся на три крупные группы, при этом к низкой частоте относятся попадающие в месяц в поисковую систему менее двух сотен раз, к высокой частоте причисляют запрашиваемые более тысячи раз вопросы, а средний уровень - все, что между указанными границами.

Указанные значения - общие, для каждой конкретной области они будут уникальными, цифры существенно варьируются. Чтобы правильно сформировать семантическое ядро, нужно не просто знать показатели поисковой системы по запросам, которые предполагается включить, но и представлять иерархическую структуру развиваемого сайта, прорабатывать внутреннюю оптимизацию. Одним из самых полезных современных инструментов для формирования семантического ядра специалисты признают «Яндекс.Вордстат». Он помогает выявить частоту запросов, на основании чего можно составить расширенный перечень и избавиться от лишних, пустых запросов. Для создания структуры рекомендуется сделать не менее трех циклов работы с перечнем запросов при применении возможностей «Яндекс.Вордстат».

Иностранные языки, филология и лингвистика

Принцип предметности: предложение должно говорить о предметах обозначаемых входящими в него именами а не о самих этих именах. Предложение Стул - это существительное построено правильно. Принцип взаимозаменимости: при замене имен с одинаковым значением предложение в котором эта замена осуществляется не должно изменять свое истинностное значение истинное предложение должно оставаться истинным а ложное ложным. Пусть дано предложение Земля вращается вокруг Солнца.

Семантические принципы

Принцип однозначности: каждое имя должно иметь только одно значение (экстенсионал). С нарушением этого принципа связана ошибка, которую называют « подмена значения ».

Существование Плутона было доказано астрономами.

Плутон – это бог.

Существование бога было доказано астрономами.

Здесь слово «Плутон» используется в двух значениях: в первой посылке имеется в виду планета Солнечной системы, во второй – божество из древнегреческой мифологии. Когда значения слова различаются столь явно, подмену заметить легко. Но если они хотя бы частично совпадают друг с другом, например одно является обычным, а другое – расширительным (или, наоборот, специализированным), ошибка может остаться незамеченной. Иногда подмена значения производится в несколько шагов, каждый из которых сам по себе не вызывает подозрения.

Принцип предметности: предложение должно говорить о предметах, обозначаемых входящими в него именами (а не о самих этих именах). С нарушением этого принципа связана ошибка, которую называют « автонимное употребление имен ».

Сравните два предложения: 1) Стул – это предмет мебели, 2) Стул – это существительное. В первом слово "стул" употребляется правильно, поскольку речь идет о предмете, а во втором – автонимно, поскольку речь идет о самом этом слове. Чтобы избежать подобных ошибок, надо всегда использовать кавычки в тех случаях, когда требуется сказать что-то о выражениях языка. Предложение « "Стул" – это существительное » построено правильно. Если же пренебречь кавычками, мы рискуем получить довольно нелепый вывод:

Стул – это существительное.

Некоторые стулья имеют четыре ножки

Некоторые существительные имеют четыре ножки.

Принцип взаимозаменимости: при замене имен с одинаковым значением, предложение, в котором эта замена осуществляется, не должно изменять свое истинностное значение (истинное предложение должно оставаться истинным, а ложное – ложным).

Пусть дано предложение «Земля вращается вокруг Солнца». Заменим «Солнце» на «центральное тело Солнечной системы». Очевидно, что значения этих выражений совпадают. В результате такой замены из истинного предложения получаем другое истинное предложение: «Земля вращается вокруг центрального тела Солнечной системы».

Принцип взаимозаменимости кажется самоочевидным, однако существуют языковые контексты, в которых замена равного равным приводит к противоречию. Рассмотрим предложение «Птолемей считал, что Солнце вращается вокруг Земли». Он считал, что это истинно. Проверим это. Заменим слово «Солнце» на выражение «центральное тело солнечной системы», имеющее то же значение. Получим заключение: «Птолемей считал, что центральное тело солнечной системы вращается вокруг Земли», которое является абсурдным.

В логике подобные ситуации известны как « антиномии отношения именования » – они возникают, когда некий объект известен (приятен, доступен и т.д.) субъекту в одном аспекте, и неизвестен (неприятен, недоступен и т.д.) в другом. Отсюда порой проистекает кажущаяся несовместимость двух обозначений одного и того же объекта.

Как же сохранить принцип взаимозаменимости и избежать антиномий? Следует различать два способа употребления языковых выражений. Первый – экстенсиональный , при котором выражения просто выделяют предметы. Второй – интенсиональный : предметы, обозначаемые выражениями, рассматриваются в определенном смысле, аспекте (показателем чего могут служить так называемые эпистемические операторы – слова «знает» «верит», «ищет», «думает» и т.п.). Если выражение употребляется в определенном аспекте, то его можно заменить другим выражением с тем же значением, только если во втором выражении предметы рассматриваются в том же аспекте.


А также другие работы, которые могут Вас заинтересовать

81121. Океаны земли 41.5 KB
Продолжить формировать представление о поверхности земли ее изображении на глобусе и карте; ознакомить с понятием океан названиями океанов; совершенствовать умения работать с картой учебником; развивать умения объяснять сравнивать анализировать понятия ситуации...
81122. «Півник і двоє мишенят» (Українська народна казка) 51 KB
Мета: учити учнів глибоко відчувати казку, її добрих героїв, засуджувати хитрість, ледарство, боротися з ними у повсякденному житті; розвивати вміння читати за особами, переказувати; виховувати бажання допомагати іншим, рости працелюбними. Обладнання: ілюстрації до казки, мультфільм «Колосок».
81123. У царстві рослин 44.5 KB
Мета: ознайомити учнів із розмаїттям рослин; формувати поняття дерева кущі трав’янисті рослини; вчити визначати плоди дерев; розвивати у дітей активне спостереження; виховувати любов до природи бажання охороняти і примножувати її красу.
81124. Погода в рідному краї в різні пори року. Предбачення погоди за народними прикметами 51.5 KB
Мета: продовжувати формувати поняття Твій рідний край; сформувати поняття про погоду в рідному краї; ознайомити учнів із процесом утворення вітру; збагатити уявлення дітей про опади; наголосити на значенні прогнозу погоди для людини; розвивати пізнавальний інтерес, спостережливість...
81125. Лялька мотанка «Дзвіночок» 39 KB
Обладнання: Шматки тканини круглої форми і різного розміру (одна менше другої), резинки для скручування, газета,шматок тканини білого кольору прямокутної форми, шматок тканини трикутної форми різного кольору. Ляльки для демонстрації: обрядові – 3 штуки, інші – 4 штуки.
81126. Шов «вперед голку», його призначення, прийоми виконання. Оброблення швом серветки 43 KB
Мета: навчити виконувати шов вперед голку та оздоблювати ним виріб з тканини розвивати увагу мислення виховувати естетичні смаки культуру праці любов до матері націлювати шанобливе ставлення до професії вишивальниці та швачки. Чи хочете ви так навчитись шити і вишивати?
81127. Українська хата. Обереги 73 KB
Мета: навчити розрізняти давню українську хату від будинків сьогодення; розширити і поглибити знання дітей про особливості українського інтерєру значення оберегів; розвивати мовленнєві уміння збагачувати словниковий запас засвоїти назви предметів українського побуту...
81128. Безопасное поведение дома. Пользование бытовой техникой. Причины возникновения пожаров, аварий. Осторожное отношение к лекарствам 61 KB
Цель: обобщить и систематизировать знания детей о поведении в чрезвычайных ситуациях; научить учащихся действовать в экстремальных ситуациях; работать с памятками безопасного обращения с огнем, электроприборами, лекарствами, газом, поведения в ситуации «Один дома»...
81129. Человеческие добродетели. Добро начинается с тебя 43 KB
Цель: продолжить знакомить учащихся с человеческими добродетелями; учить характеризовать действия и явления как проявление добра и зла; раскрыть моральное содержание доброты; воспитывать чувство доброты сопереживания щедрости.

Аннотация

Статья посвящена проблемам семантического анализа текстов. Рассмотрены различные методы: концептуальные диаграммы зависимостей и семантические сети; подходы, основанные на лексических функциях и тематических классах; фреймовые и онтологические модели; логические модели представления знаний. У каждого из них имеются свои достоинства и недостатки.

Создание новых методов семантического анализа текстов актуально в решении многих задач компьютерной лингвистики, таких как машинный перевод, автореферирование, классификация текстов и других. Не менее важна разработка новых инструментов, позволяющих автоматизировать семантический анализ.

Методы и системы семантического анализа текстов

Семантика – раздел лингвистики, изучающий смысловое значение единиц языка. Помимо знаний о структуре языка, семантика тесно связана с философией, психологией и другими науками, так как неизбежно затрагивает вопросы о происхождении значений слов, их отношении к бытию и мышлению. При семантическом анализе необходимо учитывать социальные и культурные особенности носителя языка. Процесс человеческого мышления, как и язык, который представляет собой инструмент выражения мыслей, является очень гибким и трудно поддается формализации. Поэтому семантический анализ по праву считается самым сложным этапом автоматической обработки текстов.

Создание новых методов семантического анализа текстов откроет новые возможности и позволит
существенно продвинуться в решении многих задач компьютерной лингвистики, таких как машинный перевод, автореферирование, классификация текстов и других. Не менее актуальна разработка новых инструментов, позволяющих автоматизировать семантический анализ.

На данный момент существует несколько методов представления смысла высказываний, однако ни один из них не является универсальным. Над соотнесением смысла тексту работали многие исследователи. Так, И.А. Мельчук ввел понятие лексической функции, развил понятия синтаксических и семантических валентностей и рассмотрел их в контексте толково-комбинаторного словаря, который представляет собой языковую модель. Он показал, что значения слов соотносятся не непосредственно
с окружающей действительностью, а с представлениями носителя языка об этой действительности.

Большая часть исследователей склоняются к мысли, что семантический анализ должен выполняться после синтаксического. В.Ш. Рубашкин и Д.Г. Лахути ввели иерархию синтаксических связей для более эффективной работы семантического анализатора. Самыми важными являются обязательные ролевые связи, далее идут связи кореференции, потом факультативные ролевые связи и только потом предметно-ассоциативные.

Известный лингвист Е.В. Падучева предлагает рассматривать тематические классы слов, в частности глаголов, поскольку они несут основную смысловую нагрузку: глаголы восприятия, глаголы знания, глаголы эмоций, глаголы принятия решения, речевых действий, движения, глаголы звука, бытийные глаголы и др. Существенной в данном подходе является идея разделять понятия языка на некоторые семантические группы с учетом того, что эти понятия имеют некоторый нетривиальный общий смысловой компонент. Элементы таких групп склонны иметь один и тот же набор зависимых понятий. Однако главная проблема такого подхода заключается в том, что выделение тематических классов и составление семантических словарей чрезвычайно трудоемкий процесс, сильно зависящий от индивидуального восприятия и интерпретации понятий конкретным человеком.

Универсальный язык представления знаний должен быть удобным инструментом для вывода новых знаний из уже имеющихся, а значит, необходимо создать аппарат для проверки правильности высказываний. Здесь как раз полезны логические модели представления знаний. Например, семантический язык, предложенный В.А. Тузовым , содержит в себе формализмы логики предикатов, в нем присутствуют «атомарные» понятия, «функции» над этими понятиями и правила вывода, с помощью которых можно описывать новые понятия. Не исключено, что в направлении создания подобных семантических языков будет развиваться научная мысль в будущем.

Несмотря на то, что некоторые научные и технические идеи в области обработки текстов развиваются довольно быстро, многие проблемы семантического анализа остаются нерешенными. Большинство исследователей пришли к выводу, что словарь для поддержки семантического анализа должен оперировать смыслами и, следовательно, описывать свойства и отношения понятий, а не слов. Но возникает вопрос, как правильно структурировать и представлять информацию в подобных словарях, чтобы поиск по ним был удобным и быстрым, к тому же была бы возможность учитывать изменения в естественном языке (исчезновение старых и возникновение новых понятий). В данной статье предпринята попытка систематизировать известные достижения в области семантического анализа и в какой-то мере найти ответ на этот и другие вопросы.

Исследование семантики в рамках теории «Смысл ↔ Текст»

При создании теории «Смысл ↔ Текст» И.А. Мельчук ввел понятие лексической функции.
С формальной точки зрения лексическая функция – есть функция, аргументами которой являются некоторые слова или словосочетания данного языка, а значениями – множества слов и словосочетаний этого же языка. При этом представляют содержательный интерес и рассматриваются только такие лексические функции, у которых имеются фразеологически связанные значения – значения, которые возможны при одних аргументах и невозможны при других.

Иначе говоря, лексическая функция есть определенное смысловое соотношение, например, «равенство по смыслу» (Syn), «противоположность по смыслу» (Anti) и др. Пусть имеется ряд лексических единиц – слов и словосочетаний; тогда данная лексическая функция ставит в соответствие каждой из этих единиц набор лексических единиц, находящихся с исходной единицей в соответствующем смысловом соотношении.

Значения одной лексической функции от разных аргументов могут полностью или частично совпадать; могут совпадать и значения разных функций от одного аргумента. Альтернативные корреляты, входящие в значение данной лексической функции от данного аргумента, вовсе не обязаны быть взаимозаменяемыми всегда и в любом контексте. Они могут различаться по стилистическим характеристикам, по всем типам сочетаемости, по грамматическим условиям употребления и, наконец, даже по смыслу. Последнее особенно важно подчеркнуть: различные корреляты не всегда должны быть полностью синонимичны; достаточно, если у их смыслов есть общая часть, отвечающая данной лексической функции, а различия не выходят за некоторые рамки, то есть не являются «слишком значительными».

В общем случае лексическая функция определяется не для всех слов и словосочетаний. Во-первых, некоторые функции определены лишь для той или иной части речи: так, Ореr, Func и Labor мыслимы лишь для существительных. Во-вторых, та или иная функция может определяться только для слов определенной семантики: Magn – для слов, смысл которых допускает градацию («больше – меньше»); Ореr, Func и Labor определены только для названий ситуаций.

Следует иметь в виду, что и при вполне подходящем (по своим синтаксическим и семантическим свойствам) аргументе лексическая функция может не иметь значения (в данном языке). Например, синонимы, в принципе, возможны для любых слов, а имеются только у некоторых. Это связано с фразеологическим характером лексических функций.

Необходимо еще раз подчеркнуть, что изначально лексические функции были введены специально для описания лексической сочетаемости, а не для представления смысла в общем понимании, поэтому не все из них следует трактовать как семантические единицы. Соотношения лексических функций со смыслом далеко не однозначны. Одни лексические функции могут претендовать на статус смысловых элементов, другие могут вообще не иметь смысла, третьи могут покрывать весьма сложный смысл.

С нашей точки зрения, говорить о лексических функциях как о «многозначных» функциях, не совсем корректно и удобно. Удобнее говорить о лексических предикатах. Далее приведен перечень простых стандартных лексических «функций» (здесь они будут представлены в виде предикатов).

1. Syn (x, y), x, y – синонимы.

2. Conv (x, y), x, y – конверсивы.

3. Anti (x, y), x, y – антонимы.

4. Der (x, y), y – синтаксический дериват x, то есть y совпадает с x по смыслу, но принадлежит к другой части речи:

S0 (x, y), y – существительное, производное от x (x – не существительное);

A0 (x, y), y – прилагательное, производное от x (x – не прилагательное);

Adv0 (x, y), y – наречие, образованное от x (x – не наречие);

V0 (x, y), y – глагол, образованный от x (x – не глагол).

Иначе говоря, "x"y (Der (x, y) « S0 (x, y) Ú A0 (x, y) Ú Adv0 (x, y) Ú V0 (x, y)).

5. Gener (x, y), y – обобщающее понятие по отношению к понятию, обозначенному x (x = клубника, y = ягода). Этот предикат зависит от лексической сочетаемости слов в данном языке: если x и m – совпадающие по смыслу слова двух разных языков, то для Gener (x, y) и Gener (m, n), соответственно, y и n могут не совпадать по смыслу.

Ситуация – определенное лексическое отражение (в данном языке) некоторой части действительности. Ситуации, обозначаемые отдельными лексическими единицами естественных языков (лексемами), имеют, как правило, от одного до четырех смысловых компонентов, или семантических актантов, обозначаемых заглавными латинскими буквами А, В, С, D. В то же время каждой такой лексеме сопоставляются глубинно-синтаксические актанты – ее зависимые, соответствующие подлежащему и сильным дополнениям (в случае, если данная лексема реализуется глаголом-сказуемым). Глубинно-синтаксические актанты нумеруются арабскими цифрами: 1, 2, 3, 4.

6. Si (x, y), i = 1, …, 4, y – типовое название i-го актанта для x.

7. Sc (x, y), y – сирконстанта, то есть типовое название второстепенной компоненты данной ситуации x:

Sloc (x, y), y – типовое название места осуществления данной ситуации x; «то, где…» (x = битва, y = поле (битвы));

Sinstr (x, y), y – типовое название инструмента, используемого в данной ситуации x; «то, чем/посредством чего…» (x = борьба, x = орудие (борьбы));

Smod (x, y), y – типовое название способа (манеры, характера) осуществления данной ситуации x; «то, как…» (x = жизнь, y = образ (жизни));

Sres (x, y), y – типовое название результата данной ситуации; «то, что получается» (x = копировать, y = копия).

Иначе говоря, "x"y (Sc (x, y) « Sloc (x, y) Ú Sinstr (x, y) Ú Smod (x, y) Ú Sres (x, y)).

8. Соотносительные предикаты Sign (x, y), y – типовое название одной «штуки», одного «кванта» некоторого x; Mult (x, y), y – типовое название совокупности, множества.

9. Sigur (x, y), y – метафора для x (x = сон, y = объятия (сна)).

10. Centr (x, y), y – типовое обозначение «центральной» части предмета или процесса.

11. Ai (x, y), i = 1, …, 4, y – типовое определение i-го актанта по его реальной роли; «такой, который…»; «такой, которого…».

12. Ablei (x, y), i = 1, …, 4, y – типовое определение i-го актанта по его потенциальной роли в ситуации; «такой, который может...»; «такой, которого можно...».

13. Magn0 (x, y) и Magni (x, y), i = 1, …, 4, y обозначает «высокую степень», «интенсивность» самой ситуации x (Magn0) или ее i-го актанта (Magni).

14. Ver (x, y), y – «правильный», «соответствующий назначению», «какой следует» применительно к x.

15. Bon (x, y), y – «хороший» применительно к x.

16. Advix (z, y), i = 1, …, 4, x = A, B, C, D, y – имя ситуации в роли определения при глаголе, называющем другую ситуацию:

AdviA (z, y), i = 1, …, 4, y – слово, образованное от z, которое, заменяя z в тексте, требует превратить в вершину (вместо z) первый актант этого z (x = сопровождать, y = вместе с).

AdviB (z, y), i = 1, …, 4, y требует становиться вершиной второй актант z (x = ошибаться, y = ошибочно).

17. Loc (x, y), y – предлог типовой локализации (пространственной, временной или абстрактной):

Locin (x, y), y – «статическая» локализация (x = Москве, y = в);

Locad (x, y), y – предлог направления (x = Москву, y = в);

Locab (x, y), y – предлог удаления (x = Москвы, то y = из).

Иначе говоря, "x"y (Loc (x, y) « Locin (x, y) Ú Locad (x, y) Ú Locab (x, y)).

Иногда Loc (x, y) не удается определить однозначно (x = снег, y = на и y = в).

18. Copul (x, y), y – глагол-связка «быть», «являться» (x = нападал, y = совершал нападение).

19. Oper1 (x, y), Oper2 (x, y), y – глагол, связывающий название первого (соответственно второго) актанта в роли подлежащего с названием ситуации в роли первого дополнения (если x = поддержка, то y = оказывать для Oper1 (x, y), а y = находить или встречать для Oper2 (x, y)).

20. Func0 (x, y), Func1 (x, y), Func2 (x, y), y – глагол, имеющий название ситуации в роли подлежащего x с названиями актантов (если они есть) в роли дополнения (x = дождь, y = идти).

21. Labor12 (x, y), y – глагол, связывающий название первого актанта в роли подлежащего, с названием второго актанта в роли первого дополнения и с названием ситуации в роли второго дополнения (x = орден, y = награждать; x = наказание, y = подвергать).

22. Causij (x, y), y – действие актантов «делать так, чтобы…», «каузировать». В случае без актантных индексов Caus (x, y), x – название неучастника ситуации (x = преступление, y = толкать). Отдельно выступает только при глаголах, в остальных случаях входит в состав сложных параметров.

23. Incep (x, y), y – «начинать». Свойства те же, что и у Causij (x, y).

24. Perf (x, y), y – «перфектив», y несет завершенность действия, достижение им своего естественного предела. Отдельного самостоятельного выражения Perf (x, y) в русском языке не имеет; как правило, этот предикат выдает истинное значение, если y имеет форму совершенного вида (x = читать, y = прочитать).

25. Result (x, y), y – «результатив», то есть y – «состояние в результате…»; используется для форм несовершенного вида (x = ложиться, y = лечь для Perf (x, y), y = лежать для Result (x, y)).

26. Fact j (x, y), y – «реализоваться», «выполниться». Верхний индекс (римские цифры) представляет, если это надо, степень осуществления подразумеваемого требования, причем меньший индекс присваивается более низкой степени (если x = капкан и j = I, то y = срабатывать; если j = II, то y = поймать).

27. Real j1,2(x, y), y – «реализовать», «выполнить требование», содержащееся в x. Индекс j имеет то же значение, что и выше – степень выполнения; нижний индекс обозначает глубинно-синтаксический актант, выполняющий требование (x = долг (денежный), y = признавать для Real I1,2(x, y), y = погашать для Real II1,2(x, y)).

28. Destr (x, y), y – типовое название «агрессивного» действия (x = оса, y = жалит).

29. Cap (x, y), y – «начальник» (x = факультет, y = декан).

30. Equip (x, y), y – «личный состав» (x = население, y = государства).

31. Doc (x, y), y – «документ»:

Docres (x, y), y – «документ, являющийся результатом»; «воплощающий в себе» (x = отчитываться, y = отчет);

Docperm (x, y), y – «документ на право…» (x = поезд, y = (проездной) билет для Docperm Oper2 (x, y));

Doccert (x, y), y – «документ, удостоверяющий…» (x = высшее образование, y = диплом).

Иначе говоря, "x"y (Doc (x, y) « Docres (x, y) Ú Docperm (x, y) Ú Doccert (x, y)).

Помимо перечисленных выше простых лексических предикатов, для описания лексической сочетаемости могут использоваться и их комбинации – составные предикаты:

AntiReal2 (x, y): проваливать экзамен/проваливаться на экзамене;

IncepOper2 (x, y): приобретать популярность, впадать в отчаяние;

IncepOper2 (x, y): поступать в продажу, попадать под обстрел;

CausOper2 (x, y): ставить под контроль, пускать в обращение.

Как уже отмечалось ранее, в общем случае лексическая функция определяется не для всех слов и словосочетаний. Функция может определяться только для слов определенной семантики. Например, Cap и Equip – для слов, смысл которых предполагает наличие «начальника» и «персонала», то есть для названий учреждений и организаций в самом широком понимании; Real – для слов, в смысл которых входит компонент «требовать» («нужно»), и т. д.

Если лексические функции представлять в виде предикатов, не возникает никаких затруднений.
В случаях, когда лексические функции не определены, соответствующие им предикаты будут ложными.

Особую роль при исследовании семантики в подходе И.А. Мельчука играют валентности слов, то есть способности слов вступать в связи с другими словами. Валентностями обладают слова, которые задают ситуацию. Это все глаголы, некоторые существительные (отглагольные), прилагательные (обозначающие сравнение: больше, меньше, выше, ниже), некоторые предлоги и наречия.

Различают два вида валентностей слова: синтаксические и семантические. Хотя это разделение иногда бывает довольно условным. Семантические валентности определяются лексическим анализом ситуации, задаваемой конкретным словом. Приведем пример со словом аренда или арендовать. A арендует C означает, что за какое-то вознаграждение D лицо A приобретает у другого лица B право на эксплуатацию собственности C в течение времени T. Следовательно, существенными для ситуации аренды
являются следующие «участники» или семантические актанты: субъект аренды (тот, кто арендует), первый объект аренды (то, что арендуют), контрагент (тот, у кого арендуют), второй объект (плата) и срок.

Эти актанты необходимы, так как устранение какого-либо из них изменяет смысл ситуации. Например, если убрать срок, то ситуация аренды трансформируется в ситуацию купли-продажи. С другой стороны, эти актанты достаточны, поскольку в ситуации аренды не требуется указание того, по какой причине, где, когда и с какой целью она осуществлялась. Хотя соответствующие словоформы грамматически присоединимы к глаголу арендовать.

Другими словами, семантическая валентность определяется числом семантических актантов. Таким образом, глагол арендовать имеет семантическую валентность 5, так как у него 5 семантических актантов. Формально эту ситуацию можно записать в виде предиката P (x1, x2, x3, x4, x5), где x1 – «кто», x2 – «что», x3 – «у кого», x4 – «плата», x5 – «срок».

В предложении могут быть определены не все семантические актанты, некоторые могут просто не упоминаться или вообще не иметь синтаксического выражения. Синтаксические валентности определяются количеством синтаксических актантов, которые представлены непосредственно в тексте (то есть присоединяемыми к глаголу подлежащими и дополнениями) и зависят от контекста.

Например, семантическая валентность глагола промахнуться равна 4, так как он имеет 4 актанта: кто (деятель), во что/по чему (мишень), из чего (оружие – факультативно) и чем (орган, средство). Но в большинстве контекстов синтаксически выражается лишь одна валентность, например, в предложении «Он долго целился, но промахнулся». Тем не менее не совсем корректной является фраза «Он промахнулся в окно бутылкой».

С формальной точки зрения мы имеем конструкцию, описанную ниже. Чтобы не связывать с каждым глаголом (и другими словами) отдельный предикат, будем рассматривать предикат, размерность которого больше на 1: P val(y, x1, x2, …, xn), при этом y будет само слово, а x1, x2, …, xn – его валентности. Чтобы отличать синтаксические и семантические актанты, можно использовать мультииндексы для указания актантов, заданных в тексте. Запись означает, что заданы актанты i1, i2, …, ik.
В частности, если заданы все актанты, то получаем. Некоторые варианты (наборов мультииндексов) могут быть недопустимы в языке. Если набор i1, i2, …, ik допустим, то имеет место импликация

Более того, если имеются два набора допустимых мультииндексов и , таких, что {i1, i2, …, ik} Ê {i1", i2", …, is"}, то имеет место аналогичная импликация

Толково-комбинаторный словарь – одно из главных теоретических изобретений И.А. Мельчука.
В каком-то смысле языковая модель, предложенная И.А. Мельчуком, представляет язык как совокупность словарных статей с огромным количеством разнообразной информации; грамматические правила при таком словаре играют скорее второстепенную роль. Толково-комбинаторный словарь отражает прежде всего нетривиальную сочетаемость лексем. Можно считать, что язык – это очень большая модель, в которой определены лексические предикаты, действующие описанным выше образом.

Статья толково-комбинаторного словаря несет информацию о валентностях конкретного слова, верную не только в ее рамках, но и в рамках всего языка в целом. Валентности соответствует предикат, где – семантические актанты слова cx, n – валентность слова cx. Например, в предложении Петя читает книгу будет cx = читать, n = 2: y1 = Петя, y2 = книга, то есть условно можно написать P val (cx , y1, y2) = 1.

Набор статей в толково-комбинаторном словаре можно считать некоторой подмоделью исходной модели, являющейся языком. Лексические предикаты, определенные теперь на более узком множестве, будут действовать аналогично.

Обозначим F множество правильно построенных фраз естественного языка L и j Î F – фразу из этого множества; – слово cx входит во фразу j, причем cx Î L. Пусть cx – существительное или прилагательное. Обозначим через Predicate множество предикатов, определенных на L. Одним из элементов этого множества является введенный ранее предикат валентности P val (cx , y1, …, yn).

Аналогично можно предполагать, что имеются другие предикаты:

– предикат рода слова Gender , где Î {g1, g2, g3}, g1 = жен.; g2 = муж.; g3 = ср.;

– предикат предлога Preposition , где Î {pr1, …, prk} – множество предлогов, сочетаемых с данным словом;

– предикат падежа Cases , где – падеж слова cx; для разных языков число падежей различно: например, в русском языке шесть падежей, поэтому Î {case1, case2, case3, case4, case5, case6}, case1 = им.п.; case2 = род.п.; case3 = дат.п.; case4 = вин.п.; case5 = твор.п.; case6 = предл.п.; в немецком – четыре падежа, поэтому Î {case1, case2, case3, case4}, где case1 = Nom; case2 = Gen; case3 = Dat; case4 = Akk.

Словарная статья толково-комбинаторного словаря содержит основное слово, лексические предикаты, связанные с ним, и информацию о валентности данного слова. Информация о валентности включает в себя число, указывающее число актантов, и для каждого актанта – указание, в каких падежах и с какими предлогами используются слова, соответствующие данному актанту. В отдельных случаях может быть указан также род слова.

Сказанное выше может быть представлено посредством набора предикатов вида

где xi – свободная переменная, соответствующая i-му актанту.

Теория «Смысл Û Текст» с самого начала создавалась для применения в прикладной проблематике автоматического перевода. По замыслу И.А. Мельчука, с ее помощью, в отличие от традиционных нестрогих теорий, следовало обеспечить построение «действующей» модели языка. Теория «Смысл Û Текст» действительно была использована в некоторых системах машинного перевода, разработанных в России, – прежде всего в системе англо-русского автоматического перевода ЭТАП, созданной группой под руководством Ю.Д. Апресяна. Все эти системы относятся к числу экспериментальных, то есть их промышленное использование не представляется возможным. Несмотря на то, что они включают много лингвистически полезной информации, в целом ни одна из них пока не обеспечила прорыва в качестве перевода.

На взгляд автора, основная ценная идея этой теории состоит в том, что значения слов соотносятся не непосредственно с окружающей действительностью, а с представлениями носителя языка об этой действительности (иногда называемыми концептами). Природа концептов зависит от конкретной культуры; система концептов каждого языка образует так называемую «наивную картину мира», которая во многих деталях может отличаться от «научной» картины мира, являющейся универсальной. Задача семантического анализа лексики в теории «Смысл Û Текст» состоит как раз в том, чтобы обнаружить «наивную картину мира» и описать ее основные категории. Другими словами, важная роль этой теории состоит в описании не только объективной, но и субъективной картины мира.

Несмотря на то, что интерес к теории И.А. Мельчука угасает, разметка синтаксического корпуса «Национальный корпус русского языка» выполняется лингвистическим процессором ЭТАП-3, основанным на принципах теории «Смысл Û Текст».

Как уже упоминалось выше, в разработке процессора ЭТАП участвовал Ю.Д. Апресян. Его идеи несколько отличаются от идей И.А. Мельчука. Центральное место в исследованиях Ю.Д. Апресяна занимает синонимический словарь нового типа . Для этого словаря была разработана подробная схема описания синонимических рядов, где каждый элемент ряда характеризовался с точки зрения семантики, синтаксиса, сочетаемости и других свойств. В словаре собрано и обобщено максимальное количество информации о языковом поведении русских синонимов.

Концептуальные диаграммы зависимостей

Концептуальный и прецедентный анализ

На этапе морфологического и семантико-синтаксического анализа текстов основными единицами, обозначающими понятия, являются слова. Как правило, считается, что смысл словосочетаний и фраз может быть выражен через смыслы составляющих их слов. В качестве исключений рассматривается лишь ограниченное число устойчивых словосочетаний – идиом. Такой подход опирается на предположение, что словосочетания, встречающиеся в языке, можно разделить на «свободные» и «несвободные».

Другой подход основывается на том, что наиболее устойчивыми (неделимыми) единицами смысла являются категории и понятия, состоящие не из самостоятельных слов, а из словосочетаний. Такие категории и понятия называются концептами. При таком подходе «несвободными» словосочетаниями являются не только идиоматические выражения, но и все устойчивые фразеологические единицы языка и речи (в развитых языках их насчитываются сотни миллионов).

Идея концептуального анализа как неотъемлемой составляющей семантического анализа встречается также в исследованиях В.Ш. Рубашкина и Д.Г. Лахути . В данном разделе кратко излагаются взгляды на вопрос о том, какие задачи должны решаться средствами концептуального семантического анализа.

На вход семантического компонента должен поступить синтаксически размеченный текст. В размеченном тексте должна быть представлена различная информация: идентификаторы понятий, соответствующих слову (термину); указание синтаксического хозяина (всех альтернативных хозяев) и вида синтаксической связи и др.

До передачи в семантический компонент должны быть также опознаны термины-словосочетания, унифицировано представление числовой информации, опознаны собственные имена и т.п. В реальных проектах все эти задачи решаются с той или иной степенью приближения. Можно считать, что профессиональное сообщество пришло к согласию, по крайней мере, в следующих вопросах.

Семантический анализ, с точки зрения используемых методов и средств, должен предусматривать два этапа: а) этап интерпретации грамматически выраженных (синтаксических и анафорических) связей и б) этап распознавания связей, не имеющих грамматического выражения.

Неоднозначности должны разрешаться самим процессом анализа – по критерию степени смысловой удовлетворительности получаемого в каждом варианте результата.

Ключевым пунктом системы семантического анализа является эффективная словарная поддержка.
В этом смысле любая система семантического анализа является тезаурусно ориентированной. Процедуры семантического анализа во всех без исключения случаях опираются на функциональность понятийного словаря. Словарь для поддержки семантического анализа должен оперировать смыслами и, следовательно, описывать свойства и отношения понятий, а не слов. Это концептуальный словарь . В некотором смысле роль концептуального словаря могут выполнять семантические сети, описание которых приведено в следующем разделе.

В семантическом интерпретаторе прежде всего следует специфицировать различаемые типы семантических отношений в тексте: ролевые (связи по валентности предиката), предметно-ассоциативные (отношения между объектами, процессами, значимые в предметной области, – быть частью, иметь местом, быть предназначенным для, быть столицей и т.д.) и др.

Принимаются следующие основные постулаты интерпретации синтаксических связей.

1. Тип устанавливаемого семантического отношения определяется семантическими классами и
в определенных случаях более детальными семантическими характеристиками синтаксического «хозяина» и «слуги».

2. Предлоги рассматриваются не как самостоятельный объект интерпретации, а как дополнительная (семантико-грамматическая) характеристика связи между синтаксическим «хозяином» предлога и управляемым им знаменательным словом.

3. Для разрешения лексической и синтаксической омонимии, фиксируемой синтаксическим анализатором, семантический интерпретатор использует систему эмпирически устанавливаемых предпочтений. Для удобства сравнения предпочтительности вариантов интерпретации им присваиваются числовые ранги. На уровне типов семантических отношений устанавливается следующий порядок предпочтений (порядок перечисления соответствует уменьшению приоритета связи):

– функциональные связи и связи, устанавливающие факт смысловой избыточности;

– ролевые связи, определяемые как обязательные, при наличии семантически согласованного актанта;

– связи кореференции;

– ролевые связи, определяемые как факультативные;

– предметно-ассоциативные связи специфицируемые;

– предметно-ассоциативные связи неспецифицируемые.

Специфицируемые синтаксические связи – это те, которые интерпретатор в состоянии лексикализовать конкретным отношением в предметной области (портовые сооружения ® сооружения, находящиеся в порту); соответственно, неспецифицируемые связи – те, для которых интерпретатору не удается предложить такую конкретизацию и которые интерпретируются общим понятием связан.

В случае обнаружения синтаксической омонимии сочинительных связей предпочтения определяются степенью согласованности семантических характеристик участников синтаксической связи.

Лексические и локальные синтаксические неоднозначности (наличие у слова альтернативных хозяев) обрабатываются в одном переборном механизме. Глобальные варианты синтаксического разбора предложения рассматриваются в переборном механизме следующего уровня. В этом случае сравниваются суммарные веса интерпретации всех связей предложения.

При установлении разных типов отношений интерпретация определяется следующими положениями.

При установлении ролевых отношений значимы и должны учитываться (применительно к русскому языку) следующие грамматические характеристики участников синтаксической связи:

– семантико-синтаксический тип предиката (словарная характеристика);

– грамматическая форма предиката;

– падеж актанта, возможность адъективной формы для актанта по данной валентности;

– возможность предложного управления актантом и способность оформляющего синтаксическую связь предлога выражать отношение по данной валентности; информация о способности предлога служить указателем роли для данной валентности хранится в словарном описании предлога.

Операционально процедура определения возможной роли актанта определяется грамматикой ролевых связей, устанавливающей соответствие вида

(Rf, GFP, TSEMU) ® VAL,

где Rf – имя синтаксической связи; GFP – грамматическая форма предиката; TSEMU – семантико-синтаксический тип предиката; VAL – имя возможной валентности либо отсылка к ролевой функции предлога.

Затем проверяется соответствие семантических характеристик актанта семантическому условию заполнения валентности предиката (соответствующая пара понятий проверяется на объемную совместимость).

Для установления отношения кореференции необходимыми и достаточными являются следующие условия:

– «хозяин» и «слуга» принадлежат семантической категории Объект;

– понятия, соответствующие термам «хозяина» и «слуги», находятся в отношении объемной совместимости;

– в случае предложной связи проверяется способность данного предлога выражать отношение кореференции.

Для установления специфицируемых предметно-ассоциативных отношений необходимыми и достаточными являются следующие условия:

– понятия, соответствующие термам «хозяина» и «слуги», находятся в отношении объемной несовместимости либо (в случае их совместимости) эти термы синтаксически связаны через предлог, не способный выражать отношение кореференции;

– с парой термов «хозяин – слуга» словарно ассоциировано некоторое предметное отношение
(<автомобиль, кузов> ® иметь частью) и/или (если связь предложная) предметное отношение ассоциировано с предлогом и падежом.

Для установления неспецифицируемых предметно-ассоциативных отношений необходимым и достаточным является истинность первого и ложность второго условия.

Анализ «по образцу» (прецедентный анализ) , основанный на использовании корпуса предварительно размеченных текстов, приобретает все большее значение. Разумно построенная система анализа должна обеспечивать не только извлечение знаний из конкретного текста, но и накопление результатов как на синтаксическом, так и на семантическом уровне – для использования их далее в качестве прецедентов.

Одним из наиболее масштабных и значимых проектов, осуществляемых в настоящее время, является создание Национального корпуса русского языка. В нем участвует большая группа лингвистов Москвы, Санкт-Петербурга, Казани, Воронежа, Саратова и других научных центров России.

Национальный корпус русского языка – коллекция электронных текстов, снабженных обширной лингвистической и метатекстовой информацией. Корпус представляет все разнообразие стилей, жанров и вариантов русского языка XIX–XX вв. В Национальном корпусе русского языка в настоящее время используются пять типов разметки: метатекстовая, морфологическая (словоизменительная), синтаксическая, акцентная и семантическая. Не будем подробно рассматривать все имеющиеся виды разметок, остановимся лишь на семантической разметке.

При семантической разметке большинству слов в тексте приписываются один или несколько семантических и словообразовательных признаков, например, «лицо», «вещество», «пространство», «скорость», «движение» и пр. Разметка текстов осуществляется автоматически с помощью программы Semmarkup (автор А.Е. Поляков) в соответствии с семантическим словарем корпуса. Поскольку ручная обработка семантически размеченных текстов очень трудоемка, семантическая омонимия в корпусе не снимается: многозначным словам приписываются несколько альтернативных наборов семантических признаков.

В основу семантической разметки положена система классификации русской лексики, принятая в базе данных «Лексикограф», которая разрабатывалась с 1992 г. в Отделе лингвистических исследований ВИНИТИ РАН под руководством Е.В. Падучевой и Е.В. Рахилиной. Для корпуса был существенно увеличен словник, расширен состав и усовершенствована структура семантических классов, добавлены словообразовательные признаки.

Словник семантического словаря базируется на морфологическом словаре системы «Диалинг» (общим объемом порядка 120 тыс. слов), представляющим собой расширение грамматического словаря русского языка А.А. Зализняка. Текущая версия семантического словаря включает слова знаменательных частей речи: существительные, прилагательные, числительные, местоимения, глаголы и наречия.

Лексико-семантическая информация, приписываемая произвольному слову в тексте, состоит из трех групп помет:

– разряд (например, имя собственное, возвратное местоимение);

– собственно лексико-семантические характеристики (например, тематический класс лексемы, признаки каузативности, оценки);

– деривационные (словообразовательные) характеристики (например, «диминутив», «отадъективное наречие»).

Лексико-семантическая информация имеет различную структуру для разных частей речи. Кроме того, каждый из разрядов существительных – имена предметные, непредметные и собственные – имеет свою структуру помет.

Собственно лексико-семантические пометы сгруппированы по следующим полям:

– таксономия (тематический класс лексемы) – для имен существительных, прилагательных, глаголов и наречий;

– мереология (указание на отношения «часть – целое», «элемент – множество») – для предметных и непредметных имен;

– топология (топологический статус обозначаемого объекта) – для предметных имен;

– каузация – для глаголов;

– служебный статус – для глаголов;

– оценка – для предметных и непредметных имен, прилагательных и наречий.

Тематические классы глаголов

Как особое направление в изучении семантики русского языка рассматриваются также исследования Е.В. Падучевой. Наиболее интересными являются работы относительно тематических классов русских глаголов. Тематический класс объединяет слова с общим семантическим компонентом, который занимает центральное место в их смысловой структуре. Различают, например, фазовые глаголы, глаголы восприятия, глаголы знания, глаголы эмоций, глаголы принятия решения, речевых действий, движения, глаголы звука, бытийные глаголы и др.

Слова одного тематического класса имеют некоторый нетривиальный общий компонент в толковании. Тематический класс важен по нескольким причинам. Во-первых, тематический класс часто имеет характерные проявления в синтаксисе – например, у класса обычно есть характерный участник.
Во-вторых, члены одного тематического класса склонны иметь один и тот же набор семантических дериватов, то есть зависимых от него понятий.

В статье приведен наиболее полный перечень частных видовых значений глаголов несовершенного вида. Различают следующие видовые значения: актуально-длительное (процесс или состояние длится в момент наблюдения); процессное (то есть просто длящееся); постоянно-непрерывное (значение постоянного свойства или соотношения); узуальное (значение узуального, то есть общепринятого, повторяющегося действия или события); потенциальное; многократное (но не узуальное и не потенциальное); общефактическое непредельное (значение прекратившегося состояния или непредельного процесса); общефактическое результативное (действие достигло предела); общефактическое двунаправленное (результат был достигнут, но аннулирован противоположно направленным действием); общефактическое нерезультативное (неизвестно, достигло ли действие своего предела).

В работе анализируются отпредикатные имена, то есть существительные, образованные от глаголов и прилагательных, такие как борьба, приход, отчаяние, скупость. В результате удается различить процессы, события, состояния и свойства.

Например, имена процессов допустимы в контексте глаголов со значением «протекать», «идти», то есть «иметь место» (идет беседа, происходит забастовка, обновление). Частная разновидность процессов – совершающиеся действия, то есть целенаправленные процессы с активным субъектом, такие как борьба, проверка, но не такие, как купание, бегство, восстание, прогулка, сон, курение. Имена действия допустимы в контексте глаголов со значением «производить», «вести»: слежку осуществляла группа агентов; они производят прием (замену, отбор); мы ведем расследование.

Все имена процессов употребляются в контексте фазовых глаголов со значением «начинаться», «кончаться», «продолжаться»: началась борьба (дождь, бой); кончилось преследование инакомыслящих; продолжается посадка (осада). Имена действий допустимы в контексте фазовых глаголов со значением «начинать», «кончать», «продолжать»: вступил в переговоры; закончил проверку тетрадей; прервал чтение; принялся за, приступил к, прекратил (выдачу). Контекст фазового глагола является диагностическим для имен процессов, в противоположность именам событий.

Имена событий употребляются в контексте глаголов со значением «произошло», «случилось»: произошло землетрясение. События отличаются от процессов тем, что имеют ретроспективного наблюдателя. Наблюдатель процесса синхронный, поэтому, если имеем процесс, то глагол несовершенного вида, а если событие, то совершенного.

Мы опустим множество других деталей, касающихся различий между процессами, событиями, состояниями и свойствами, отметив лишь, что прикладной потенциал данных исследований еще предстоит раскрыть.

Ниже приведен список глаголов восприятия, обозначенный Е.В. Падучевой как один из наиболее подробно изученных тематических классов. Казалось бы, чтобы установить принадлежность глагола к тематическому классу восприятий, достаточно убедиться в том, что его семантическая формула включает компонент «восприятие». Однако все не так просто. Дело в том, что перцептивный компонент легко входит в семантику глаголов самых разных классов. Восприятие реальное перетекает в восприятие ментальное.

1. Глаголы движения и состояния, предполагающие наблюдателя:

а) глаголы наблюдаемого движения: мелькать, промелькнуть, проступить, проскользнуть;

б) глаголы наблюдаемого состояния: белеть, торчать, маячить; расстилаться, высовываться, выбиваться, раскинуться, разверзнуться, выступить;

в) глаголы эмиссии света, запаха, звука: блестеть, мерцать, светиться, пахнуть, вонять, звучать.

2. Предполагает наблюдателя глагол раздаться (как в раздался звонок), но и в следующих глаголах тоже есть перцептивный компонент: заглохнуть, заглушить, затмить, смолкнуть, умолкнуть, стихнуть, сливаться (как в гимнастерка и серые штаны почти сливались с землей).

3. Субъект восприятия (или наблюдатель) – обязательный участник ситуаций, выражаемых каузативными глаголами: выразить, выказать (он выказал мне свое расположение); выделить, выявить, оттенить, высветить, запечатлеть, заслонить, обнажить, обозначить (границы), открыть, отметить, отобразить; и их декаузативами (выразиться, выявиться, выделиться, запечатлеться, обнажиться, обозначиться, открыться).

4. Есть много глаголов, описывающих идентификацию, которая требует участия органов чувств: идентифицировать, дифференцировать, опознать, отличить, отождествить, различить (очертания), распознать, разобрать (как в не разбираю второй буквы).

5. Многие глаголы включают перцептивный компонент, но обозначают вполне специфическое действие или деятельность, для которой главное – цель, а не участие восприятия в ее достижении: досмотреть («произвести досмотр»), зарегистрировать, искать, разыскать, отыскать, выискать, исследовать, изобразить, обрисовать, отследить, проследить, выследить, охранять, подкараулить, просвечивать, спрятать(ся), скрыться, шпионить.

6. Любой глагол передачи и получения информации, например, писать или читать, предполагает наличие сигнала, который должен быть воспринят органами чувств.

7. Глаголы показать и скрыть, поскольку в их толкование входит перцептивный компонент, также можно отнести к глаголам восприятия.

8. К глаголам восприятия, помимо прочего, относятся ослепнуть – слепнуть (и ослепить в одном из значений). Они описывают утрату органа зрения, в результате чего способность видеть утрачивается навечно. Однако сюда не относится глагол очнуться, который обозначает временную утрату способности воспринимать с ее последующим возвращением.

9. Некоторые стилистически окрашенные глаголы восприятия: впериться, воззриться, вылупиться, глазеть, пялиться, узреть, застукать, засветиться.

10. Тематическая классификация ориентируется на исходные значения слов. Между тем многие глаголы имеют перцептивное значение в качестве производного; в частности, бдеть, столкнуться (с проблемой), проникнуть (в тайну), выступить. Например, Белые здания внезапно выступили из темноты.

11. Другие аналогичные слова, у которых значение восприятия производное или контекстно обусловленное, как у бросить (взгляд, взор), броситься (в глаза), обратить (взор, внимание), пробежать (глазами), впиться (взглядом), скользить (взглядом).

12. Глаголы маркированных способов действия:

а) начинательные: засквозить, забелеть, зазвучать;

б) финитивные: досмотреть, дослушать и подсмотреть, подслушать;

в) сатуративные: насмотреться, налюбоваться, наслушаться;

г) глаголы полной поглощенности действием: засмотреться – засматриваться, заглядеться – заглядываться;

д) специально-результативные: высмотреть – высматривать, выследить – выслеживать, отследить – отслеживать;

е) прерывисто-смягчительные: поглядывать, послеживать; семельфактивные: глянуть.

Глаголы восприятия, как и другие тематические классы, располагают своими, свойственными именно этому классу моделями семантической деривации.

13. Характерным является семантический переход – от восприятия к ментальному значению. Производное ментальное значение развивается, например, у глаголов видеть, смотреть, замечать, рассматривать (как намек; и мы рассматриваем ваше предложение), чувствовать, казаться, обнаружить, слышать, воображать, столкнуться, следить, показаться; представляться, видеться (та же неоднозначность у существительного взгляд):

а) От прилавка ему хорошо виделось клубное крылечко (зрительное значение);

б) Мне видится это так (ментальное значение).

14. Глагол свидетельствовать этимологически предполагает видение, но в контексте Это свидетельствует о его незаурядном таланте он имеет ментальное значение; пролить свет значит «сделать более понятным», хотя свет нужен для того, чтобы видеть. Глагол предвкушать вообще утратил компонент, связанный с вкусовым восприятием, и стал ментальным.

15. Производное ментальное значение возникает и у каузативных глаголов. Так, показать – глагол восприятия, но может иметь и значение «доказать», ментальное. Интересно, что в числе производных от видеть есть и глаголы знания, и глаголы мнения:

а) я вижу, ты молчишь (знание);

б) он видит в этом препятствие (мнение).

16. Глагол оказаться совмещает перцептивное значение (Его там не оказалось) с ментальным (Оказалось, он здоров).

17. Производное значение речи развивает глагол заметить; оно проявляет себя в сочетаемости с наречиями: это ты верно заметил («верно сказал»).

18. Глаголам послушать, слушать, послушаться, внять свойственна многозначность «воспринять» – «подчиниться».

19. Регулярным, то есть повторяющимся, является также семантический переход смотреть ® относиться: я на это смотрю просто (отношусь просто); смотреть сквозь пальцы (потворствовать); несмотря на (безотносительно к).

20. Многозначность смотреть ® относиться свойственна глаголу коситься: а) (смотреть искоса, сбоку); б) (смотреть косо, относиться с подозрением, выражать взглядом подозрительное отношение).

21. Переход видеть ® иметь представлен примерами найти, потерять.

22. Переход от восприятия к межличностному контакту отмечается у глаголов встречаться, заглянуть (на огонек), увидеться.

23. Смысл видеть может выветриваться до идеи простого контакта с объектом, то есть пребывания в том же месте (Эти стены видели многое; Крым всегда будет рад вас видеть).

24. Глаголам возникнуть и исчезнуть свойственна неоднозначность быть видимым – существовать. Аналогичная неоднозначность у обозначиться – обозначаться; у теряться: например, Тропинка терялась в кустах (переставала быть видимой) и Живость движений понемногу терялась (переставала существовать); у совершенного вида пропасть (хотя несовершенный вид пропадать значит только не быть видимым: где ты пропадал?). В математическом языке найдется X значит существует X.

25. Семантическое понятие восприятия часто соседствует с перемещением: столкнуться, наткнуться, напороться, нарваться; попасться (Мне попался белый гриб).

Следствием перемещения может быть, наоборот, выход из поля зрения, как у скрыться, деться, задеваться.

Интересно, что для глаголов, выражающих основные виды восприятия – зрение, слух, обоняние, осязание, вкус, – можно выявить единую парадигму семантических дериватов исходной лексемы, причем она будет в существенной степени одинаковой для многих языков, что свидетельствует о древности данной лексики и данных конструкций.

Существенной в данном подходе является идея разделять понятия языка на некоторые семантические группы с учетом того, что эти понятия имеют некоторый нетривиальный общий смысловой компонент. Элементы таких групп склонны иметь один и тот же набор зависимых понятий. Словарь для поддержки семантического анализа должен оперировать смыслами и, следовательно, описывать свойства и отношения понятий, а не слов. Остается вопрос, как правильно структурировать и представлять информацию в подобных словарях, чтобы поиск по ним был удобным и быстрым, а кроме того, получалось учитывать изменения в естественном языке (исчезновение старых и возникновение новых понятий).

При обсуждении проблем семантики часто упоминают принцип композициональности. Он утверждает, что смысл сложного выражения определяется смыслами его составных частей и правилами, применяемыми для их объединения. Поскольку предложение состоит из слов, получается, что его смысл можно представить набором значений слов, входящих в него. Но не все так просто. Смысл предложения также опирается на порядок слов, фразирование и отношения между словами в предложении, то есть учитывает синтаксис.

Как видим, концептуальные диаграммы зависимостей позволяют утверждать, что в некоторых случаях принцип композициональности нарушается. Ошибочно утверждать, что смысл словосочетаний и фраз может быть выражен через смыслы составляющих их слов. Это не всегда верно. Однако главная проблема такого подхода заключается в том, что выделение тематических классов и составление семантических словарей чрезвычайно трудоемкий процесс, сильно зависящий от индивидуального восприятия и интерпретации понятий конкретным человеком.

Сетевые модели представления знаний

Тезаурусы, семантические сети, фреймовые и онтологические модели

Тезаурус – разновидность словаря общей или специальной лексики, в котором указаны семантические отношения между лексическими единицами. В отличие от толкового словаря тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

В тезаурусах обычно используются следующие основные семантические отношения: синонимы, антонимы, гипонимы, гиперонимы, меронимы, холонимы и паронимы.

Синонимы – слова одной части речи, различные по звучанию и написанию, но имеющие похожее лексическое значение (смелый – храбрый, бесстрашный).

Антонимы – это слова одной части речи, различные по звучанию и написанию, имеющие прямо противоположные лексические значения (добрый – злой).

Гипоним – понятие, выражающее частную сущность по отношению к другому, более общему понятию (животное – собака – бульдог).

Гипероним – слово с более широким значением, выражающее общее, родовое понятие, название класса предметов, свойств или признаков (бульдог – собака – животное).

Гипероним является результатом логической операции обобщения, тогда как гипоним – ограничения.

Мероним – понятие, которое является составной частью другого (автомобиль – двигатель, колесо, капот).

Холоним – понятие, которое является целым над другими понятиями (двигатель, колесо, капот – автомобиль).

Меронимия и холонимия как семантические отношения являются взаимно обратными друг другу, так же, как гипонимия и гиперонимия.

Паронимы – слова, сходные по форме, но различающиеся по смыслу (индеец – индиец).

Примером тезауруса является WordNet . Базовой словарной единицей WordNet является синонимический ряд (синсет), объединяющий слова со схожим значением. Синсеты состоят из слов, принадлежащих той же самой части речи, что и исходное слово. Каждый синсет сопровождается небольшой формулировкой (дефиницией), разъясняющей его значение. Синсеты связаны между собой различными семантическими отношениями, например, гипонимии, гиперонимии и др. Пример со словом pen (ручка) приведен на рисунке 1. Видно, что в словаре для этого слова имеются пять различных значений, оно относится к разряду письменных принадлежностей и имеет семь родственных слов: карандаш, маркер, мел для доски, восковой мелок и др.

WordNet содержит приблизительно 155 тысяч различных лексем и словосочетаний, организованных в 117 тысяч синсетов. Вся БД разбита на три части: существительные, глаголы и прилагательные/наречия. Слово или словосочетание может находиться более чем в одном синсете и принадлежать более чем одной категории части речи. Более подробная информация о количестве уникальных слов, синсетов и пар «слово-синсет» в базе WordNet дана в таблице 1.

Преимущества WordNet перед остальными похожими ресурсами – его открытость, доступность, наличие большого количества различных семантических связей между синсетами. Доступ к WordNet выполняется непосредственно с помощью браузера (локально или через Интернет) или библиотек на С.

Существуют реализации WordNet для других языков (около 16). Например, для европейских языков создан EuroWordNet, связь между различными языковыми версиями в котором осуществляется через специальный межъязыковой индекс. Ведутся разработки WordNet и для русского языка. Необходимо отметить, что существуют методы предметной классификации синсетов WordNet, то есть определение областей знаний, в которых они употребляются. Подобная информация может служить впоследствии для сокращения количества возможных значений слов, если известна тематика обрабатываемого документа, тем самым позволяя уменьшить значение ошибки при принятии неверного значения слова.

Семантическая сеть – модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (ребра) задают отношения между ними . Объектами могут быть понятия, события, свойства, процессы. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений. Причем в качестве понятий могут быть как экземпляры объектов, так и их множества.

Семантические сети возникли как попытка визуализации математических формул. За визуальным представлением семантической сети в виде графа стоит математическая модель, в которой каждая вершина соответствует элементу предметного множества, а дуга – предикату. На рисунке 2 представлен пример семантической сети, взятый из Википедии .

Терминология, использующаяся в этой области, разнообразна. Чтобы добиться некоторой однородности, узлы, соединенные дугами, принято называть графами, а структуру, где имеется целое гнездо из узлов или где существуют отношения различного порядка между графами, называть сетью. Помимо терминологии, использующейся для пояснения, также различаются способы изображения. Некоторые используют кружки вместо прямоугольников; некоторые пишут типы отношений над или под дугами, заключая или не заключая их в овалы; некоторые используют аббревиатуры вида O или А для обозначения агента или объекта; некоторые используют различные типы стрелок.

Самые первые семантические сети были разработаны в качестве языка-посредника для систем машинного перевода. Последние версии семантических сетей становятся более мощными и гибкими и составляют конкуренцию фреймовым системам, логическому программированию и другим языкам представления знаний.

Несмотря на различную терминологию, разнообразие методов представления кванторов общности и существования и логических операторов, разные способы манипулирования сетями и правила вывода, можно выделить существенные сходства, присущие почти всем семантическим сетям:

– узлы семантических сетей представляют собой концепты предметов, событий, состояний;

– различные узлы одного концепта относятся к различным значениям, если для них не помечено, что они относятся к одному концепту;

– дуги семантических сетей создают отношения между узлами-концептами, пометки над дугами указывают на тип отношения;

– некоторые отношения между концептами представляют собой семантические роли, такие как «агент», «объект», «реципиент» и «инструмент»; другие означают временные, пространственные, логические отношения и отношения между отдельными предложениями;

– концепты организованы по уровням в соответствии со степенью обобщенности, наподобие иерархии гиперонимов в WordNet, например, сущность ® живое существо ® животное ® плотоядное.

Заметим, что среди семантических отношений, используемых для описания сетей, могут быть не только семантические отношения, используемые в тезаурусах, но и другие виды связей: функциональные (определяемые обычно глаголами производит, влияет, …), количественные (больше, меньше, равно, …), пространственные (далеко от, близко от, под, над, …), временные (раньше, позже, в течение, …), атрибутивные (иметь свойство, иметь значение), логические (И, ИЛИ, НЕ) и пр.

Например, семантика предложения У Иванова есть черный BMW может быть представлена в виде семантической сети, приведенной на рисунке 3.

Несмотря не некоторые различия, сети удобны для чтения и обработки компьютером, являются наглядным и достаточно универсальным средством представления семантики естественного языка. Однако их формализация в конкретных моделях представления, использования и модификации знаний оказывается достаточно трудоемкой, особенно при наличии множественных отношений между ее элементами.

Рассмотрим, например, некоторую сеть, описывающую высказывание Настя попросила книгу у Даши. Допустим, можно приписать приведенным объектам свойства: Настя – «старательная», Даша – «любознательная». Между этими объектами есть связь (через книгу). Но, кроме нее, есть много других связей, которые существуют в реальном мире: социальный статус (студентки, подруги – необязательно между собой), родственные отношения (у каждой есть родители и/или другие родственники) и т.д. Получается, что даже для такого простого примера сеть способна разрастись до большого размера и, как следствие, поиск вывода в ней будет слишком сложным.

В сложных семантических сетях, включающих множество понятий, процесс обновления узлов и контроль связей между ними, как видим, усложняют процедуру обработки информации. Стремление устранить эти недостатки послужило причиной появления особых типов семантических сетей, таких как фреймовые модели.

Фреймовые модели представления знаний были предложены М. Минским .

Фреймом называется структура для описания понятия или ситуации, состоящая из характеристик этой ситуации и их значений . Фрейм можно рассматривать как фрагмент семантической сети, предназначенный для описания понятий со всей совокупностью присущих им свойств. Особенность фреймовых моделей представления знаний состоит в том, что все понятия, описываемые в каждом из узлов модели, определяются набором атрибутов и их значениями, которые содержатся в слотах фрейма < имя фрейма, слот 1, слот 2, …, слот N >. Графически это выглядит аналогично семантической сети, но принципиальное отличие заключается в том, что каждый узел во фреймовой модели имеет обобщенную структуру, состоящую из множества слотов, каждый из которых имеет имя, указатель наследования, указатель типа данных и значение.

Слот – это атрибут, связанный с узлом в модели, основанной на фреймах, он является составляющей фрейма. Имя слота должно быть уникальным в пределах фрейма. Указатель наследования показывает, какую информацию об атрибутах слотов во фрейме верхнего уровня наследуют слоты с теми же именами во фрейме более низкого уровня. Указатель типа данных содержит информацию о типе данных, включаемых в слот. Обычно используются следующие типы данных: указатель на имя фрейма верхнего уровня, вещественное число, целое число, текст, список, таблица, присоединенная процедура и др. Значением слота может быть экземпляр атрибута, другой фрейм или фасет, оно должно соответствовать указанному типу данных и условию наследования. Помимо конкретного значения, в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления этого значения. Таким образом, слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одну или несколько продукций, с помощью которых это значение определяется. В слот может входить не одно, а несколько значений. Иногда этот слот включает компонент, называемый фасетом, который задает диапазон или перечень его возможных значений. Фасет указывает также граничные значения заполнителя слота. Чаще всего со слотами связываются процедуры добавления и удаления информации, они могут следить за приписыванием информации к данному узлу и проверять, что при изменении значения производятся соответствующие действия.

Различают фреймы-образцы (прототипы), хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных ситуаций на основе поступающих данных. Фреймовые модели являются достаточно универсальными, поскольку позволяют отразить все многообразие знаний о мире через фреймы-структуры (для обозначения объектов и понятий: заем, залог, вексель), фреймы-роли (менеджер, кассир, клиент), фреймы-сценарии (банкротство, собрание акционеров, празднование именин), фреймы-ситуации (тревога, авария, рабочий режим устройства) и др. Для представления знаний в виде сети фреймов существуют специальные языки и программные средства: FRL (Frame Representation Language), KRL (Knowledge Representation Language), фреймовая оболочка Kappa, PILOT/2 и другие.

Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по ISA. Слот ISA указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то есть переносятся, значения аналогичных слотов.

Основным преимуществом фреймов как модели представления знаний является соответствие современным представлениям об организации долговременной памяти человека, а также ее гибкость и наглядность. Достоинства фреймовых моделей представления знаний проявляются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений.

К недостаткам фреймовых моделей относят их относительно высокую сложность , что проявляется в снижении скорости работы механизма вывода и увеличении трудоемкости внесения изменений в сформированной иерархии. Поэтому при разработке фреймовых систем большое внимание уделяется наглядным способам отображения и эффективным средствам редактирования фреймовых структур.

Можно заметить, что объектно-ориентированный подход является развитием фреймового представления. В этом случае шаблон фрейма можно рассматривать как класс, экземпляр фрейма – как объект. Языки объектно-ориентированного программирования предоставляют средства создания классов и объектов, а также средства для описания процедур обработки объектов (методы). Однако фреймовые модели не позволяют организовать гибкий механизм логического вывода, поэтому фреймовые системы либо представляют собой объектно-ориентированные БД, либо требуют интеграции с другими средствами обработки знаний, например, логическими моделями.

В инженерии знаний под онтологической моделью понимается детальное описание некоторой предметной или проблемной области, которое используется для формулирования утверждений общего характера. Онтологии позволяют представить понятия в таком виде, пригодном для машинной обработки.

В центре большинства онтологий находятся классы, описывающие понятия предметной области. Атрибуты описывают свойства классов и экземпляров. Здесь прослеживаются аналогии с фреймовым подходом к формализации знаний. Многие понятия и принципы реализации, а также графическая форма представления на начальном этапе структуризации являются в онтологиях сходными с семантическими сетями. Основным отличием является ориентация онтологий на использование непосредственно компьютером, то есть структуры данных описаны не на естественном языке (как это принято в семантических сетях и тезаурусах), а на специальном формальном языке. С тезаурусами онтологии тоже имеют много общего. Но в отличие от них для онтологических моделей необходимыми требованиями являются внутренняя полнота, логическая взаимосвязь и непротиворечивость используемых понятий. В тезаурусах эти требования могут не выполняться. Для описания онтологий используются такие формальные языки, как RDF, OWL, KIF, CycL, OCML и другие.

Обычно выделяют следующие основные элементы онтологий:

– экземпляры;

– классы объектов (понятий);

– атрибуты (описывают свойства классов и экземпляров);

– функции (описывают зависимости между классами и экземплярами);

– аксиомы (дополнительные ограничения).

Специализированные (предметно-ориентированные) онтологии – это представление какой-либо области знаний или части реального мира. В такой онтологии содержатся специальные для этой области значения терминов. К примеру, слово поле в сельском хозяйстве означает участок земли, в физике – один из видов материи, в математике – класс алгебраических систем.

Общие онтологии используются для представления понятий, общих для большого числа областей. Такие онтологии содержат базовый набор терминов, глоссарий или тезаурус, используемый для описания терминов предметных областей.

Современные онтологические модели являются модульными, то есть состоят из множества связанных между собой онтологий, каждая из которых описывает отдельную предметную область или задачу. Онтологические модели не являются статичными, они постоянно меняются.

Если использующая специализированные онтологии система развивается, то может потребоваться объединение онтологий. Преимущественным недостатком онтологических моделей является сложность их объединения. Онтологии даже близких областей могут быть несовместимы друг с другом. Разница может появляться из-за особенностей местной культуры, идеологии или вследствие использования другого языка описания. Объединение онтологий выполняют как вручную, так и в полуавтоматическом режиме. В целом это трудоемкий, медленный и дорогостоящий процесс.

Онтологические модели широко применяются в системах, основанных на знаниях: экспертных системах и системах поддержки принятия решений. Интересный способ представления знаний о времени с учетом неопределенности в онтологиях описан в работе А.Ф. Тузовского .

В настоящее время довольно перспективными и широко применяемыми на практике технологиями представления знаний являются технологии Semantic Web. Центральным понятием Semantic Web является онтология – модель предметной области, состоящая из множества понятий, множества экземпляров понятий и множества отношений (свойств). Множество понятий и отношений между ними определяет общую схему хранения данных, представленных как множество утверждений об экземплярах понятий, или аксиом онтологии. Такие простые утверждения, называемые триплетами, имеют вид «субъект-предикат-объект». Набор правил, задаваемых пользователем, загружается в систему логического вывода, которая на основе содержащихся в онтологии утверждений создает согласно этим правилам новые экземпляры понятий и отношений онтологии.

Одной из наиболее существенных проблем как для представления знаний в контексте времени, так и для представления знаний в целом является представление знаний о времени и об изменениях знаний с его течением. Однако большинство применяемых на практике языков описания знаний основываются на логике предикатов первого порядка и используют унарные или бинарные отношения. К таким языкам, например, относятся OWL и RDF. В этом случае для описания бинарных отношений с учетом времени требуется вводить в отношения дополнительный параметр, соответствующий времени. При этом бинарные отношения превращаются в тернарные и выходят за рамки описательных возможностей языка.

Еще одной важной задачей является описание знаний о времени с учетом возможной неполноты этих знаний. Например, описание высказываний вида: «событие A произойдет когда-нибудь в будущем». Эта задача обычно решается в рамках модальных темпоральных логик, например LTL, при помощи определенных модальных операторов. Но, поскольку язык описания знаний OWL основан на дескриптивной логике, воспользоваться таким решением для OWL-онтологий становится невозможно.

В своей работе А.Ф. Тузовский предлагает представить модель описания знаний о времени в следующем виде:

< TU, VU, TP, F, Rul >, где

1) TU – множество моментов времени TU = {T È {tØ}}, где T – линейно упорядоченное множество, имеющее мощность континуума, на котором задана бинарная операция вычитания T ´ T ® R+, а tØ – особый элемент, соответствующий «неопределенному моменту времени»;

2) VU – множество переменных, обозначающих элементы множества TU, а также особая переменная tN, соответствующая текущему моменту времени; значение переменной tN постоянно меняется, отражая ход времени в некоторой системе, для описания временного контекста которой используется предлагаемый подход;

3) TP – множество промежутков времени; промежуток времени соответствует упорядоченной паре t = < ti1, ti2 >, где ti1 и ti2 – такие элементы множества VU, что ((ti1 £ ti2) Ù (ti1 ¹ tØ) Ù (ti2 ¹ tØ)) Ú (ti1 = tØ) Ú
(ti2 = tØ); таким образом, промежуток времени соответствует некоторому участку на временной шкале, причем его границей может быть некоторый момент времени, текущий момент времени (переменная tN) либо неопределенный момент времени tØ, при этом промежуток времени с совпадающими границами (ti1 = ti2) соответствует некоторому моменту времени;

4) F – множество предикатов, описывающих свойства промежутков времени, а также качественные отношения между ними;

5) Rul – множество правил вида (G ® H) и (G « H), описывающих базовые механизмы логического вывода, в том числе ограничения на значения предикатов F, а также определенность границ промежутков времени.

Понятие промежутка времени требуется для описания некоторых интервалов времени, точные границы которых неизвестны до наступления определенного состояния модели. Можно сказать, что каждый промежуток времени описывает некоторый интервал времени, точные границы которого пока неизвестны. При этом может быть доступна информация о том, в каких пределах этот интервал гарантированно расположен на временной шкале, а точные границы интервала, описываемого промежутком времени, могут стать известны в будущем. Поэтому вводятся две разновидности границ промежутка времени: точная и гарантированная . Для определения двух видов границ служат предикаты EL (exactleft), ER (exactright), GL (guaranteedleft) и GR (guaranteedright), определяющие точную левую/правую и гарантированную левую/правую границы промежутка времени, соответственно. Например, предикат EL (ti , ti1) соответствует утверждению «точная левая граница промежутка ti – момент времени ti1». Для простоты вид границы промежутка времени можно обозначать при помощи различных скобок: промежуток полностью определенный (обе его границы являются точными); промежуток .

Агенс – одушевленный инициатор и контролер действия.

Адресат – получатель сообщения (может объединяться с Бенефактивом).

Бенефактив (Реципиент, Посессор) – участник, чьи интересы косвенно затронуты в процессе ситуации (получает пользу или вред).

Инструмент – стимул эмоции или участник, с помощью которого осуществляется действие.

Источник – место, из которого осуществляется движение.

Контрагент – сила или сопротивляющаяся среда, против которой осуществляется действие.

Объект – участник, который передвигается или изменяется в ходе события.

Пациенс – участник, претерпевающий существенные изменения.

Результат – участник, который появляется в результате события.

Стимул – внешняя причина или объект, вызывающие это состояние.

Цель – место, в которое осуществляется движение.

Экспериенцер – участник, испытывающий внутреннее состояние, не приводящее к внешним изменениям (носитель чувств и восприятий).

Эффектор – неодушевленный участник, часто природная сила, вызвавший изменение в состоянии Пациенса.

В соответствии с числом аргументов и их семантическими свойствами множество глагольных лексем можно разбить на классы. Например, рассмотрим следующие ролевые типы глаголов: глаголы физического воздействия (рубить, пилить, резать); глаголы восприятия (видеть, слышать, чувствовать); глаголы способа речи (кричать, шептать, бормотать). Внутри каждого класса существует более точное деление. Среди глаголов физического воздействия похожую семантическую предикатно-аргументную структуру имеют глаголы вида глагол (Агенс, Инструмент, Объект): break – разбить, bend – согнуть, fold – загнуть, shatter – разбить вдребезги, crack – расколоть и др. Другая предикатно-аргументная структура характерна для глаголов вида глагол (Агенс, Инструмент, Цель): hit – ударить, slap – шлепнуть, strike – ударить, bump – ударить (обо что-то), stroke – погладить и др.

Можно заметить, что существуют корреляции между морфологическими падежами, предлогами, синтаксическими ролями, с одной стороны, и семантическими ролями, с другой стороны, например, cut with a knife, work with John, spray with paint. Кроме того, следует учитывать, что у одного предикатного слова не может быть двух актантов с одной и той же семантической ролью. Различия в наборах ролей затрагивают в основном периферийные семантические роли (Контрагент, Стимул, Источник) или сводятся к объединению/фрагментации ядерных ролей (Агенс vs. Агенс и Эффектор; Адресат vs. Адресат, Реципиент и Бенефактив; Пациенс/Тема/Объект vs. Пациенс, Тема и Результат).

В своей работе Ч. Филлмор даже предложил правило опосредованного отображения семантических ролей в синтаксические: если среди аргументов имеется Агенс, он становится подлежащим; в отсутствие Агенса, если есть Инструмент, он становится подлежащим; в отсутствие Агенса и Инструмента подлежащим становится Объект. Отсюда естественным образом возникает иерархия семантических ролей. Наиболее известные иерархии семантических ролей: Агенс > Инструмент > Пациенс; Агенс > Источник > Цель > Инструмент > Тема > Место; Агенс > Бенефактив > Экспериенцер > Инструмент > Тема > Место и некоторые др. Иерархия семантических ролей строится таким образом, чтобы можно было отразить степень тематической принадлежности аргументов (топикальность) так, что на левом конце иерархии располагаются прагматически наиболее важные семантические роли, а на правом – семантические роли, которым не свойственна высокая топикальность.

Первоначально семантические роли предполагалось считать примитивами, не подверженными дальнейшему анализу, который мог бы выявить их внутреннюю структуру. Однако в таком случае возникает ряд проблем. Во-первых, в результате все более тщательного семантического и синтаксического анализа происходит ничем не ограниченное увеличение списка ролей . Во-вторых, неструктурированные списки ролей не позволяют делать предсказания о возможных ролевых типах глаголов и объяснять отсутствие незасвидетельствованных типов. Поэтому в теории семантических ролей было предложено определять роли в терминах различительных признаков или проторолей. Например, Д. Даути предлагает выделить следующие свойства протороли Агенс: волитивно вовлечен в событие или состояние; является сознательным и/или воспринимающим участником; инициирует событие или изменения состояния другого участника; движется (по отношению к точке пространства или другому участнику); существует независимо от события, обозначенного глаголом.

К сожалению, в настоящий момент не удается установить взаимно-однозначное соответствие между семантическими ролями и падежами, то есть с функциональной точки зрения категория падежа является неоднородной. Ситуация осложняется еще и тем, что сами роли нетривиально связаны между собой, а в естественных языках распространены такие генеративные приемы, как метафора и метонимия, которые порождают множество новых смыслов и в принципе не могут быть отражены в статическом лексиконе.

Логические модели представления знаний

Основная идея подхода при построении логических моделей представления знаний состоит в том, что вся информация, необходимая для решения прикладных задач, рассматривается как совокупность фактов и утверждений, которые представляются в виде формул в некоторой логике. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода. В основе логических моделей представления знаний лежит понятие формальной теории, задаваемое кортежем S = < B, F, A, R>, где B – счетное множество базовых символов (алфавит); F – множество, называемое формулами; A – выделенное подмножество априори истинных формул (аксиом); R – конечное множество отношений между формулами, называемое правилами вывода.

Основной подход к представлению смысла в компьютерной лингвистике включает в себя создание представления смысла в формальном виде. Такое представление можно назвать языком представления смысла. Язык представления необходим для того, чтобы ликвидировать разрыв между естественным языком и общесмысловыми знаниями о мире. А поскольку предполагается использовать этот язык для автоматической обработки текстов и при создании систем искусственного интеллекта, необходимо учитывать вычислительные требования семантической обработки, такие как необходимость определять истинность высказываний, поддерживать однозначность представления, представлять высказывания в канонической форме, обеспечивать логический вывод и быть выразительными.

В естественных языках существует большое разнообразие приемов, которые используются для передачи смысла. Среди наиболее важных – способность передавать предикатно-аргументную структуру. Учитывая вышесказанное, получаем, что в качестве инструмента для представления смысла высказываний хорошо подходит логика предикатов первого порядка. С одной стороны, она относительно легко понимается человеком, с другой – хорошо поддается (вычислительной) обработке. При помощи логики первого порядка могут быть описаны важные смысловые классы, включающие события, время и другие категории. Однако следует помнить, что высказывания, соответствующие таким понятиям, как убеждения и желания, требуют выражений, включающих модальные операторы.

Семантические сети и фреймы, которые обсуждались в предыдущем разделе, могут быть рассмотрены в рамках логики предикатов первого порядка. Например, смысл предложения У меня есть книга можно записать четырьмя различными способами, используя четыре различных языка представления смысла (см. рис. 4, нумерация соответствует порядку на рисунке): 1) концептуальная диаграмма зависимостей; 2) представление, основанное на фреймах; 3) семантическая сеть; 4) исчисление предикатов первого порядка.

Несмотря на то, что все эти четыре подхода различны, на абстрактном уровне они представляют собой общепринятое фундаментальное обозначение того, что представление смысла состоит из структур, составленных из множества символов. Эти символьные структуры соответствуют объектам и отношениям между объектами. Все четыре представления состоят из символов, соответствующих «говорящему», «книге» и набору отношений, обозначающих обладание одного другим. Важным здесь является то, что все эти четыре представления позволяют связать, с одной стороны, выразительные особенности естественного языка и, с другой стороны, реальное состояние дел в мире.

Логические модели представления знаний обладают рядом преимуществ. Во-первых, в качестве «фундамента» здесь используется классический аппарат математической логики, методы которой достаточно хорошо изучены и формально обоснованы. Во-вторых, существуют достаточно эффективные процедуры вывода синтаксически правильных высказываний. В-третьих, такой подход позволяет хранить в базах знаний лишь множество аксиом, а все остальные знания (в том числе факты и сведения о людях, предметах, событиях и процессах) получать из этих аксиом по правилам вывода.

Язык представления смысла, как и любой язык, имеет свой синтаксис и се-мантику. На рисунке 5 дано описание контекстно-свободной грамматики для исчисления предикатов первого порядка, предложенное в работе .

Рассмотрим представление смысла категорий, событий, времени, аспектов и убеждений, приведенное в книге .

Представление категорий. Под категорией понимается группа слов, объединенная общим признаком наподобие того, как это организовано в тезаурусах. Слова с предикатно-подобной семантикой часто содержат ограничения выбора, которые обычно выражаются в форме семантических категорий, где каждый представитель категории обладает набором подходящих признаков.

Простейший способ представления категорий – создать одноместный предикат для каждой категории. Однако тогда будет сложно делать утверждения о самих категориях. Рассмотрим следующий пример. Допустим, при помощи языка логики предикатов первого порядка требуется представить смысл высказывания: «Harry Potter» is the most popular children’s book. То есть нужно найти наиболее часто встречающийся объект категории в виде MostPopular (HarryPotter, ChildrensBook). Эта формула не является настоящей формулой логики первого порядка, так как аргументами в предикатах по определению должны быть термы, а не другие предикаты. Чтобы решить эту проблему, все понятия, которые участвуют в высказывании, можно представить в качестве полноценных объектов, то есть категорию ChildrensBook представим как объект наравне с HarryPotter. Принадлежность к такой категории будет обозначена посредством отношения ISA (HarryPotter, ChildrensBook). Отношение ISA (is a) указывает на связь между объектами и категориями, к которым эти объекты принадлежат. Такой прием можно применить для создания иерархий категорий. Например, используем отношение AKO (ChildrensBook, Book). Здесь отношение AKO (a kind of) обозначает включение одной категории в другую. Конечно, для большей достоверности категории должны характеризоваться большим множеством фактов, то есть категории должны быть определены как множества.

Представление событий. Чтобы представить смысл события, достаточно рассмотреть его в виде предиката от множества аргументов, выполняющих определенные роли и необходимых для описания ситуации. Примеры таких предикатов приведены в первом разделе (там они получены из лексических функций, предложенных И.А. Мельчуком). Другой пример: Reservation (Hearer, Today, 8 PM, 2). Здесь аргументами являются такие объекты, как человек, ресторан, день, время и количество мест для резервирования в ресторане. Для глаголов такое представление можно получить, если считать, что аргументы соответствуют синтаксическим актантам. При таком подходе существуют четыре проблемы:

– определение корректного количества ролей для каждого события;

– представление фактов о ролях, ассоциированное с событием;

– необходимость убедиться, что все корректные выводы могут быть получены напрямую из такого представления события;

– необходимость убедиться, что ни один некорректный вывод не может быть получен из представления события.

Например, глагол «есть» может иметь от одного до четырех актантов в зависимости от ситуации, описанной предложением. Поэтому заранее непонятно, какова должна быть местность предиката. Ведь в исчислении предикатов первого порядка количество аргументов должно быть фиксированным.

Одно из решений – предположить, что подобные ситуации обрабатываются на синтаксическом уровне. Можно рассматривать отдельные подкатегории для каждой из конфигураций аргументов. Семантический аналог данного метода – создать как можно больше предикатов, каждый из которых будет соответствовать отдельным ситуациям. Название предиката одно, а количество аргументов разное:
Eating1 (w) – I ate; Eating2 (w, x) – I ate a sandwich; Eating3 (w, x, y) – I ate a sandwich for lunch; Eating4 (w, x, y, z) – I ate a sandwich for lunch at home. Поэтому они считаются разными. Этот подход позволит обойти проблему количества аргументов, но он неэффективный. Кроме предложенных имен предикатов, ничто не объединяет их в одно событие, хотя очевидна их логическая взаимосвязь. Выходит, что некоторые логические связи не могут быть получены на основе предложенных предикатов. Более того, придется искать эти логические связи в базе знаний.

Решить эту проблему можно, воспользовавшись смысловыми постулатами. Они связывают семантику предикатов в явном виде. Например, " w, x, y, z Eating4 (w, x, y, z) Þ Eating3 (w, x, y).

Предикаты могут отражать морфологическую, синтаксическую и семантическую информацию. Примерами таких смысловых постулатов являются формулы, содержащие некоторые лексические предикаты из первого раздела. Смысловые постулаты, содержащие морфологические и синтаксические особенности построения слов и предложений русского языка, приведены в . Примеры смысловых постулатов, несущих семантическую нагрузку, встречаются в предыдущем разделе.

Заметим, что не следует путать семантику высказывания на естественном языке и семантику предиката, который мы вводим для того, чтобы отражать семантику высказывания. Смысловые постулаты отражают семантику предикатов, то есть семантические связи между введенными нами предикатами.

Ясно, что такой подход для обнаружения семантических связей между предикатами годится для небольших областей и имеет проблемы с масштабируемостью. Более удобно было бы сказать, что эти предикаты ссылаются на один предикат с аргументами, отсутствующими на некоторых позициях. В этом случае можно обойтись без смысловых постулатов. Но этот метод также имеет недостаток. Например, если рассмотреть предикат Eating (w, x, y, z) и считать, что в качестве третьего аргумента должно присутствовать одно из слов из множества {Breakfast, Lunch, Dinner}, то квантор существования, навешенный на другую переменную, будет означать существование конкретной пищи, ассоциированной с каждым приемом, что не соответствует действительности.

Рассмотрим подходящий пример. Запишем три высказывания (I ate a lunch, I ate at home и I ate a sandwich for lunch at home), используя логику первого порядка:

$ w, x Eating (Speaker, w, Lunch, x)

$ w, x Eating (Speaker, w, x, Home)

$ w Eating (Speaker, w, Lunch, Home).

Допустим, что необходимо получить из двух первых формул, относящихся к одному событию, третью формулу. Независимые события I ate lunch и I ate at home не позволяют заключить, что I ate lunch at home. Как и в случае с представлением категорий, можно разрешить эту проблему, рассматривая события наравне с объектами так, чтобы на них можно было навешивать кванторы и связывать с другими объектами с помощью наборов заданных отношений. Теперь, согласно такому подходу, будет получено следующее представление.

Для предложения I ate lunch

$ w ISA (w, Eating) Ù Eater (w, Speaker) Ù Eater (w, Lunch).

Для предложения I ate at home

$ w ISA (w, Eating) Ù Eater (w, Speaker) Ù Place (w, Home).

Для предложения I ate a sandwich for lunch at home

$ w ISA (w, Eating) Ù Eater (w, Speaker) Ù Eaten (w, Sandwich) Ù MealEaten (w, Lunch) Ù Place (w, Home)

Изложенный подход позволяет избавиться от необходимости задавать фиксированное количество аргументов в предикате независимо от ролей и других актантов. Другие роли, которые не упоминаются в предложении, отсутствуют, при этом логические связи между семантически связанными предикатами не требуют использования смысловых постулатов.

Представление времени. Для описания последовательностей событий и их взаимосвязи во временной шкале используется темпоральная логика. В естественных языках таким инструментом является время глагола. Можно считать, что одно событие предшествует другому, если поток времени ведет от первого события ко второму. Отсюда возникают привычные нам понятия прошлого, настоящего и будущего.

В темпоральной логике используются два вида операторов: логические и модальные. В качестве логических операторов используются обычные операторы логики исчисления высказываний: конъюнкция, дизъюнкция, отрицание и импликация. Модальные операторы определяются следующим образом .

N j – Next: j должно быть истинным в состоянии, непосредственно следующим за данным.

F j – Future: j должно стать истинным хотя бы в одном состоянии в будущем.

G j – Globally: j должно быть истинно во всех будущих состояниях.

A j – All: j должно выполняться на всех ветвях, начинающихся с данной.

E j – Exists: существует хотя бы одна ветвь, на которой j выполняется.

j U y – Until (strong): y должно выполниться в некотором состоянии в будущем (возможно, в текущем), свойство j обязано выполняться во всех состояниях до обозначенного (невключительно).

j R y – Release: j освобождает y, если y истинно, пока не наступит момент, когда j первый раз станет истинно (или всегда, если такого момента не наступит). Иначе, j должно хотя бы раз стать истинным, пока y не стало истинным первый раз.

Представление аспектов. Для описания действий в естественных языках применяются глаголы. Американский философ З. Вендлер в 1957 году предложил модель разделения глаголов по лексическим аспектам . Он выделил четыре класса:

– стативы (states) – глаголы, описывающие статические состояния, которые не имеют конечной точки (например, «знать», «любить»);

– деятельности (activities) – глаголы, описывающие состояния, которые являются динамическими и не имеют конечной точки (например, «бежать», «ехать»);

– совершения (accomplishments) – глаголы, описывающие события, которые имеют конечную точку и являются постепенными (например, «рисовать картину», «строить дом»);

– достижения (achievements) – глаголы, описывающие события, которые имеют конечную точку и происходят мгновенно (например, «узнавать», «замечать»).

В таблице 2 приведена сравнительная таблица классов Вендлера для английских глаголов, взятая из работы .

Как видно, продолженность действия характерна деятельностям и совершениям и отсутствует у стативов и достижений. Можно сказать It was boiling (деятельность) и I was writing a letter (совершение), но нельзя сказать It was existing (статив) и I was finding a book (достижение). Достижения не сочетаются с обстоятельствами длительности. Можно сказать It existed for two hours (статив), но нельзя I found it for two hours (достижение).

Совершения и достижения описывают целенаправленные действия, они сочетаются с обстоятельствами срока завершения в отличие от стативов и деятельностей. Можно сказать I wrote a letter in two hours (совершение), но нельзя сказать I walked in two hours (деятельность).

Представление убеждений, желаний и намерений. Для выражения отношения говорящего к сообщаемой информации в высказываниях на естественном языке используются такие слова, как верить, хотеть, полагать, представлять и т.д. Такие высказывания описывают не объективную картину мира, а особенности личностного восприятия говорящего, его «внутренние» представления о мире. Рассмотрим высказывание I belive that John read «Harry Potter». Неверно пытаться представить его смысл при помощи логики предикатов: Believing (Speaker, Reading (John, HarryPotter). Здесь второй аргумент должен быть термом, а не формулой. Эта синтаксическая ошибка влечет за собой семантическую. В логике первого порядка предикаты связывают объекты, а не отношения между ними. Стандартный способ преодолеть эту проблему – добавить операторы, которые позволяют делать нужные нам утверждения. Если ввести оператор Believes, имеющий в качестве аргументов формулы, тогда получим следующее представление:

Believes (Speaker, $ x ISA (x, Reading) Ù Reader (x, John) Ù Read (x, HarryPotter)).

Нельзя сказать, что такое представление записано в терминах исчисления предикатов первого порядка, но оно является подтверждением того, что в языке существует группа глаголов, выполняющая особую роль в семантическом анализе. В системах автоматического анализа иногда необходимо отслеживать убеждения и намерения пользователей. Ситуация осложняется тем, что убеждения, желания и намерения могут меняться в процессе диалога.

Введенный оператор называется модальным. Бывают различные модальные операторы. О временной модальности уже упоминалось немного ранее, когда говорилось о представлении времени в высказываниях. Помимо временной, существует пространственная модальность, логика знания («известно, что»), логика доказуемости («можно доказать, что») и другие. Логика, расширенная модальными операторами, называется модальной логикой. В настоящее время в этой области остается множество сложных неизученных вопросов. Как логический вывод работает в присутствии специфических модальных операторов? К каким видам формул могут применяться те или иные операторы? Как модальные операторы взаимодействуют с кванторами и логическими связками? Эти и другие вопросы еще предстоит исследовать. Здесь останавливаться на них не будем.

Вывод синтаксически правильных высказываний в логических моделях представления знаний опирается на правило резолюций, разработанное Дж. Робинсоном в 1965 году. Оно утверждает, что если группа выражений, образующая посылку, является истинной, то применение правила вывода гарантированно обеспечит получение истинного выражения в качестве заключения. Результат применения правила резолюций называют резольвентой.

Метод резолюций (или правило устранения противоречий) позволяет проводить доказательство истинности или ложности выдвинутого предположения методом от противного. В методе резолюций множество предложений обычно рассматривается как составной предикат, который содержит несколько предикатов, соединенных логическими функциями и кванторами существования и всеобщности. Так как одинаковые по смыслу предикаты могут иметь разный вид, предложения сначала необходимо привести к унифицированному виду (дизъюнктивной или конъюнктивной нормальной форме), в которой удалены кванторы существования, всеобщности, символы импликации, эквивалентности и др. Правило резолюций содержит в левой части конъюнкцию дизъюнктов. Поэтому приведение посылок, используемых для доказательства, к виду, представляющему собой конъюнкции дизъюнктов, является необходимым этапом практически любого алгоритма, реализующего логический вывод на базе метода резолюций .
В процессе логического вывода с применением правила резолюций выполняются следующие шаги .

1. Устраняются операции эквивалентности и импликации:

A « B = (A ® B) Ù (B ® A);

A ® B = Ø A Ú B.

2. Операция отрицания продвигается внутрь формул с помощью законов де Моргана:

Ø (A Ù B) = Ø A Ú Ø B;

Ø (A Ú B) = Ø A Ù Ø B.

3. Логические формулы приводятся к дизъюнктивной форме:

A Ú (B Ù C) = (A Ú B) Ù (A Ú C).

В логике предикатов для применения правила резолюций необходимо осуществить более сложное преобразование логических формул для приведения их к системе дизъюнктов. Это связано с наличием дополнительных элементов синтаксиса, в основном кванторов, переменных, предикатов и функций.
Алгоритм унификации предикатных логических формул состоит из следующих шагов .

1. Исключение операций эквивалентности.

2. Исключение операций импликации.

3. Внесение операций отрицания внутрь формул.

4. Исключение кванторов существования. Это может произойти на третьем шаге вследствие применения законов де Моргана, а именно, отрицание $ меняется на ", но при этом может произойти и обратная замена. Тогда для исключения $ поступают следующим образом: все вхождения некоторой переменной, связанной квантором существования, например ($x), заменяются в формуле на новую константу, например a. Эта константа представляет собой некоторое (неизвестное) значение переменной x, для которого утверждение, записанное данной формулой, истинно. При этом важно то, что на все места, где присутствует x, будет подставлено одно и то же значение a, пусть оно и является неизвестным в данный момент.

5. Кванторы общности выносятся на первые места в формулах. Это также не всегда является простой операцией, иногда при этом приходится делать переименование переменных.

6. Раскрытие конъюнкций, попавших внутрь дизъюнкций.

После выполнения всех шагов описанного алгоритма унификации можно применять правило резолюций.

Именно правило резолюций послужило основой для создания языка программирования Prolog.
В языке Prolog факты описываются в форме логических предикатов с конкретными значениями. Правила вывода описываются логическими предикатами с определением правил вывода в виде списка предикатов над базами знаний и процедурами обработки информации. Интерпретатор языка Prolog самостоятельно реализует вывод, подобный вышеописанному. Для того, чтобы инициировать вычисления, выполняется специальный запрос к базе знаний, на который система логического программирования генерирует ответы «истина» и «ложь».

Метод резолюций легко программируется, это одно из важнейших его достоинств, однако он применим только для ограниченного числа случаев, так как для его применения доказательство не должно иметь большую глубину, а число потенциальных резолюций не должно быть большим.

Чтобы инструмент исчисления предикатов первого порядка был более гибким, его можно расширить лямда-исчислением. Лямбда-исчисление – это язык более высокого порядка, чем исчисление предикатов первого порядка. В нем в качестве аргументов лямбда-функция может работать не только с переменными, но и с предикатами. Тем не менее, использование лямбда-выражений формально не увеличивает выразительную мощность логики первого порядка, поскольку любую конструкцию, содержащую лямбда-выражение, можно преобразовать к эквивалентному виду без него .

После того, как язык Prolog приобрел большую популярность, в начале 80-х годов прошлого века появился термин «компьютеры пятого поколения». В то время ожидалось создание следующего поколения компьютеров, ориентированного на распределенные вычисления. Вместе с этим считалось, что пятое поколение станет основой для создания устройств, способных имитировать процесс человеческого мышления. Тогда же возникла идея создания аппаратной поддержки параллельных реляционных БД Grace и Delta и параллельного логического вывода (Parallel Inference Engine, PIE), опирающийся на принципы языка Prolog. Каждый блок логического вывода сигнализировал свою текущую рабочую нагрузку таким образом, чтобы работа могла быть передана в блок логического вывода с наименьшей нагрузкой . Но, как известно, подобные попытки не позволили создать искусственный интеллект, а лишь послужили очередным подтверждением того, что человеческое мышление еще недостаточно изучено.

Логические модели представления знаний позволяют проверить синтаксическую правильность высказывания. Однако с помощью правил, задающих синтаксис языка, нельзя установить истинность или ложность того или иного высказывания. Высказывание может быть построено синтаксически правильно, но оказаться совершенно бессмысленным. Помимо этого, логические модели сложно использовать при доказательстве рассуждений, отражающих специфику конкретной предметной проблемы, из-за высокой степени единообразия.

Системы с компонентами семантического анализа

В рамках проекта Open Cognition разрабатывается анализатор Link Grammar Parser, который отвечает за обработку естественного языка. Link Grammar Parser начал разрабатываться в 1990-е гг. в университете Карнеги–Меллона . Данный подход отличается от классической теории синтаксиса. Система приписывает предложению синтаксическую структуру, которая состоит из множества помеченных связей (коннекторов), соединяющих пары слов. Link Grammar Parser использует информацию о типах связей между словами.

Анализатор имеет словари, включающие около 60 000 словарных форм. Он позволяет разбирать большое число синтаксических конструкций, включая многочисленные редкие выражения и идиомы. Link Grammar Parser довольно устойчив, он может пропустить часть предложения, которая ему непонятна, и определить некоторую структуру оставшейся части предложения. Анализатор способен работать с неизвестной лексикой и делать разумные предположения (на основе контекста и написания) о синтаксической категории неизвестных слов. У него есть данные о собственных именах, числовых выражениях и различных знаках препинания.

Анализ в системе проходит в два этапа.

1. Построение множества синтаксических представлений одного предложения. На этом этапе рассматриваются все варианты связей между словами и выбираются среди них те, которые удовлетворяют критерию проективности (связи не должны пересекаться) и критерию минимальной связности (получившийся граф должен содержать наименьшее число компонент связности; компонента связности графа – некоторое множество вершин графа такое, что для любых двух вершин из этого множества существует путь из одной в другую, и не существует пути из вершины этого множества в вершину не из этого множества).

2. Постобработка. Предназначена для работы с уже построенными альтернативными структурами предложения.

Получаемые диаграммы по сути являются аналогом деревьев подчинения. В деревьях подчинения от главного слова в предложении можно задать вопрос к второстепенному. Таким образом, слова выстраиваются в древовидную структуру. Синтаксический анализатор может выдать две или более схемы разбора одного и того же предложения. Это явление называется синтаксической синонимией.

Главной причиной, по которой анализатор называют семантической системой, можно считать уникальный по полноте набор связей (около 100 основных, причем некоторые из них имеют 3-4 варианта).
В некоторых случаях тщательная работа над разными контекстами привела авторов системы к переходу к почти семантическим классификациям, построенным исключительно на синтаксических принципах. Так, выделяются следующие классы английских наречий: ситуационные наречия, которые относятся ко всему предложению в целом (clausal adverb); наречия времени (time adverbs); вводные наречия, стоящие в начале предложения и отделенные запятой (openers); наречия, модифицирующие прилагательные, и т.д.

Из достоинств системы нужно отметить, что организация самой процедуры нахождения вариантов синтаксического представления очень эффективна. Построение идет не сверху вниз (top-down) и не снизу вверх (bottom-up), а все гипотезы отношений рассматриваются параллельно: сначала строятся все возможные связи по словарным формулам, а потом выделяются возможные подмножества этих связей. Это, во-первых, приводит к алгоритмической непрозрачности системы, поскольку очень трудно проследить за всеми отношениями сразу, а во-вторых – не к линейной зависимости скорости алгоритма от количества слов, а к экспоненциальной, поскольку множество всех вариантов синтаксических структур на предложении из слов в худшем случае равномощно множеству всех основных деревьев полного графа с вершинами.

Последняя особенность алгоритма заставляет разработчиков использовать таймер для того, чтобы вовремя останавливать процедуру, которая работает слишком долго. Однако все эти недостатки с лихвой компенсируются лингвистической прозрачностью системы, в которой с одинаковой легкостью прописываются валентности слова, причем порядок сбора валентностей внутри алгоритма принципиально не задается, связи строятся как бы параллельно, что полностью соответствует нашей языковой интуиции.

Для каждого слова в словаре записывается, какими коннекторами оно может быть связано с другими словами предложения. Коннектор состоит из имени типа связи, в которую может вступать рассматриваемая единица анализа. Только основных, наиболее важных связей имеется более 100. Для обозначения направления связи справа к коннектору присоединяется знак «+», слева – знак «–». Левонаправленный и правонаправленный коннекторы одного типа образуют связь (link). Одному слову может быть приписана формула коннекторов, составленная с помощью определенных связок.

Отметим также недостатки Link Grammar Parser.

1. Практическое тестирование системы показывает, что при анализе сложных предложений, длина которых превышает 25–30 слов, возможен комбинаторный взрыв. В этом случае результатом работы анализатора становится «панический» граф, как правило, случайный вариант синтаксической структуры, с лингвистической точки зрения неадекватной.

2. Применение описанных выше идей затруднено для флективных языков типа русского ввиду значительно возрастающего объема словарей, которые возникают в силу морфологической развитости флективных языков. Каждая морфологическая форма должна описываться отдельной формулой, где нижний индекс входящего в нее коннектора должен обеспечивать процедуру согласования. Это приводит к усложнению набора коннекторов и к увеличению их количества.

Проект Open Cognition, в рамках которого развивается Link Grammar Parser, открытый и бесплатный, что является большим преимуществом для проведения исследований. Довольно подробное описание и исходный код можно найти на сайте . Open Cognition продолжает развиваться в настоящее время, что также важно, поскольку есть возможность взаимодействовать с разработчиками. Наравне с Link Grammar ведется разработка анализатора RelEx , который позволяет извлекать отношения семантической зависимости в высказываниях на естественном языке, и в результате представляются предложения в виде деревьев зависимостей. Он использует несколько наборов правил для перестроения графа с учетом синтаксических связей между словами. После каждого шага, согласно набору правил сопоставления, в полученном графе добавляются теги структурных характеристик и отношений между словами. Однако некоторые правила, наоборот, могут сокращать граф. Таким образом происходит преобразование графа. Этот процесс применения последовательности правил напоминает метод, используемый в ограничительных грамматиках. Главное отличие состоит в том, что RelEx работает с графовым представлением, а не с простыми наборами тегов (обозначающими отношения). Эта особенность позволяет применять более абстрактные преобразования при анализе текстов. Другими словами, основная идея состоит в том, чтобы использовать распознавание образов для преобразования графов. В отличие от других анализаторов, которые полностью опираются на синтаксическую структуру предложения, RelEx больше ориентирован на представление семантики, в частности, это касается сущностей, сравнений, вопросов, разрешения анафор и лексической многозначности слов.

Система «Диалинг»

«Диалинг» – автоматическая система русско-английского перевода, которая разрабатывалась с 1999 по 2002 гг. в рамках проекта «Автоматическая обработка текста» (АОТ). В разное время в работе над системой принимали участие 22 специалиста, большинство из которых – известные ученые-лингвисты.
За основу системы «Диалинг» была взята система французско-русского автоматического перевода (ФРАП), разработанная в ВЦП совместно с МГПИИЯ им. М. Тореза в 1976–1986 гг., и система анализа политических текстов на русском языке «Политекст», разработанная в центре информационных исследований в 1991–1997 гг.

Система «Политекст» была направлена на анализ официальных документов на русском языке и содержала полную цепочку анализаторов текста: графематический, морфологический, синтаксический и частично семантический. В системе «Диалинг» был частично заимствован графематический анализ, но адаптирован под новые стандарты программирования. Программа морфологического анализа была написана заново, поскольку скорость работы была низкой, но сам морфологический аппарат не изменился .

На графематическом уровне константами являются графематические дескрипторы. Например, ЛЕ (лексема) – присваивается последовательностям, состоящим из кириллических символов; ИЛЕ (иностранная лексема) – присваивается последовательностям из латинских символов; ЦК (цифровой комплекс) – присваивается последовательностям, состоящим из цифр; ЦБК (цифробуквенный комплекс) – присваивается последовательностям, состоящим из цифр и букв, и т.д.

На морфологическом уровне для обозначений используются граммемы – грамматические характеристики, относящие словоформу к определенному морфологическому классу. Различные граммемы одной категории исключают друг друга и не могут быть выражены в одном слове. Например, жр – женский род, тв – творительный падеж, мн – множественное число, но – неодушевленность, св – совершенный вид, дст – действительный залог, пе – переходность глагола, пвл – повелительная форма глагола, нст – настоящее время глагола и т. д.

Фрагментационный анализ ставит своей целью деление предложения на неразрывные фрагменты (синтаксические единства), бо́льшие словосочетания или равные ему (синтаксической группе), и установление частичной иерархии на множестве этих единств. Возможные типы фрагментов: главные предложения, придаточные предложения в составе сложного, причастные, деепричастные и другие обособленные обороты. Про каждый фрагмент известно, какие фрагменты в него непосредственно вложены и в какие он непосредственно вложен.

Система ФРАП содержала полную цепочку анализа текста вплоть до семантического, который был реализован только частично. В системе ФРАП был разработан и опробован семантический аппарат, на основе которого в системе «Диалинг» был создан особый метод семантического анализа – метод полных вариантов. ФРАП не содержала механизмов структурных оценок семантического представления, то есть методов не просто одного вхождения текстового элемента, а всей структуры в целом. Идея метода полных вариантов состоит в том, что в анализе должны быть четко разделены варианты анализа, возникающие на разных этапах, и декларативные лингвистические правила (частичные модели), которые строят и оценивают отдельные варианты. Такой подход, ранее применяемый только для предсемантических анализаторов, теперь, ввиду развития компьютерных мощностей, стало возможным перенести на семантику, тем самым повысив уровень разделения процедурной и декларативной частей системы . Процедурная часть семантического анализа в идеальном случае сводится к циклам, перебирающим разные лингвистические варианты. Таким образом, стало возможно упростить лингвистические модели благодаря увеличившейся скорости компьютеров.

Основными составляющими применяемого в «Диалинге» семантического аппарата являются семантические отношения (СО) и семантические характеристики (СХ). Примеры семантических отношений: ИНСТР – «инструмент», ЛОК – «локация, местоположение», ПРИНАДЛ – «принадлежность», РЕЗЛТ – «результат» и пр. Они довольно универсальны и имеют сходства с предикатами, рассмотренными в первом разделе, и семантическими ролями, упоминаемыми в третьем разделе. Семантические характеристики позволяют строить формулы с использованием логических связок «и» и «или». Каждому слову приписывается некоторая формула, составленная из семантических характеристик. В семантическом словаре «Диалинга» содержится около 40 семантических характеристик. Примеры семантических характеристик: АБСТР – абстрактное существительное или прилагательное, ВЕЩВО – название химического вещества или того, что можно отмерять по весу или объему; ГЕОГР – географический объект; ДВИЖ – глаголы движения; ИНТЕЛ – действия, связанные с мыслительной деятельностью; КОММУНИК – глаголы речи; НОСИНФ – носители информации; ОРГ – организация; СОБИР – все, что обозначает множество однотипных объектов; ЭМОЦ – прилагательные, которые выражают эмоции и т.д. Некоторые характеристики являются составными, так как их можно выразить через другие. Есть характеристики, которые являются антонимами. Использование их в одной конъюнкции запрещено. Существуют характеристики, которые являются разновидностями других. Семантические характеристики наравне с грамматическими характеристиками обеспечивают проверку согласования слов при интерпретации связей в тексте.

В данный момент все инструменты, разработанные в рамках проекта АОТ (в том числе система «Диалинг»), являются свободным кроссплатформенным программным обеспечением. Демоверсия и подробная документация доступны на сайте .

Системы извлечения информации и представления знаний

Существуют и другие системы, содержащие компоненты семантического анализа. Однако они имеют существенные недостатки для исследований: сложно найти описания, которые не являются бесплатными и свободно распространяемыми или не работают с текстами на русском языке. К ним относятся OpenCalais (http://www.opencalais.com/opencalais-api/), RCO (http://www.rco.ru/?page_id=3554), Abbyy Compreno (https://www.abbyy.com/ru-ru/isearch/compreno/), SemSin (http://www.dialog-21.ru/media/1394/
kanevsky.pdf), DictaScope (http://dictum.ru/) и др.

Следует упомянуть систему извлечения данных из неструктурированных текстов Pullenti (http://semantick.ru/). Она заняла первое место на дорожках T1, T2, T2-m и второе место на T1-l на конференции Диалог-2016 в соревновании FactRuEval. На сайте разработчиков системы Pullenti есть также демоверсия семантического анализатора, позволяющего по предложению строить семантическую сеть.

Инструментальная среда «ДЕКЛ» (http://ipiranlogos.com/) разработана в конце 90-х годов и использована для построения экспертных систем (ЭС), оболочек для ЭС, логико-аналитических систем (ЛАС), лингвистических процессоров (ЛП), обеспечивающих обработку и автоматическое извлечение знаний из потоков неформализованных документов на естественном языке.

Система машинного перевода «ЭТАП-3» предназначена для анализа и перевода текстов на русском и английском языках. Система использует преобразование текстов на естественном языке в их семантическое представление на языке Universal Networking Language. Как уже говорилось ранее, разметка синтаксического корпуса «Национальный корпус русского языка» выполняется лингвистическим процессором ЭТАП-3, основанным на принципах теории «Смысл Û Текст».

В последнее время появляется все больше систем представления баз знаний в виде графов. Поскольку объемы информации постоянно увеличиваются с невероятной скоростью, такие системы должны поддерживать построение и пополнение баз знаний в автоматическом режиме. Автоматическое построение баз знаний может осуществляться на основе структурированных источников данных.

Примеры таких систем: Yago (http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/), DBpedia (http://wiki.dbpedia.org/), Freebase (https://developers.
google.com/freebase/), Google"s Knowledge Graph (https://developers.google.com/knowledge-graph/), OpenCyc (http://www.opencyc.org/). Другой подход позволяет извлекать информацию из открытых ресурсов в Интернете без участия человека: ReadTheWeb (http://rtw.ml.cmu.edu/rtw/), OpenIE (http://nlp.stanford.edu/
software/openie.html), Google Knowledge Vault (https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf). Подобные системы являются экспериментальными, каждая из них имеет свои особенности. Например, Knowledge Vault пытается учитывать неопределенности, каждому факту ставится в соответствие коэффициент доверия и происхождения информации. Таким образом, все утверждения делятся на те, которые имеют высокую вероятность быть истинными, и те, которые могут быть менее вероятными. Предсказание фактов и их свойств осуществляется методами машинного обучения на основе очень большого количества текстов и уже имеющихся фактов. В данный момент Knowledge Vault содержит 1,6 млрд фактов. Система NELL, разрабатываемая в рамках проекта ReadTheWeb университетом Карнеги–Меллона, содержит более 50 млн утверждений с разными степенями доверия. Около 2 млн 800 тыс. фактов имеют высокую степень доверия. Процесс обучения NELL также еще не завершен.

Сделаем следующие выводы. С развитием компьютерных технологий и постоянным приростом
объемов текстовой информации исследования в области автоматической обработки текстов сфокусировались на прикладном аспекте. Возможности большинства инструментов ограничиваются морфологическим и синтаксическим анализом в сочетании с методами из теории вероятностей и математической статистики. Таким образом, лишь выбранная часть наиболее простых задач оказалась решенной. Остальные проблемы по-прежнему еще предстоит решить.

Как мы убедились, причин этому много. Например, существует мнение, что каждое правило в синтаксисе имеет свой аналог в семантике. Этот постулат называют гипотезой «правило к правилу» (rule-to-rule hypothesis ). На самом деле это соответствие не является взаимно-однозначным, и в этом состоит главная сложность. Действительно, каждому синтаксическому правилу (дереву разбора) можно сопоставить семантическое правило (дерево разбора), но оно не будет единственным. В обратную сторону аналогично семантическому правилу сопоставляется синтаксическое правило, но необязательно единственное. Именно эта неоднозначность приводит к неразрешимым на сегодняшний день проблемам в области автоматической обработки текстов. В связи с этим рассуждением возникает вопрос выбора нужного сопоставления из большого количества возможных вариантов.

Из всего вышесказанного можно сделать еще один очень важный вывод. Не следует рассматривать процессы генерации и интерпретации высказывания по отдельности, они неразрывно связаны между
собой. Выражая свою мысль, человек ориентируется на то, поймет ли его собеседник. В процессе генерации высказывания человек как бы «перепроверяет» себя, моделируя, как собеседник воспримет информацию. Похожий механизм присутствует при интерпретации высказывания. Когда мы осмысливаем услышанное или прочитанное, мы опять же «сверяемся» с нашими знаниями и представлениями о мире. Только благодаря этому нам удается выбрать подходящий смысл.

Современные исследователи склоняются к мысли, что нужный выбор возможно сделать, имея дополнительную базу знаний о мире. Такая база знаний должна содержать общесмысловую информацию о понятиях и отношениях между ними, чтобы при обращении к ней можно было определить подходящий контекст высказывания в автоматическом режиме. Она помогла бы учитывать накопленные знания о мире, которые в явном виде не присутствуют в конкретном высказывании, но непосредственно влияют на его смысл.

Литература

  1. Мельчук И.А. Опыт теории лингвистических моделей «Смысл-Текст». М.: Языки русской культуры, 1999. 346 с.
  2. Лахути Д.Г., Рубашкин В.Ш. Семантический (концептуальный) словарь для информационных технологий // Научно-техническая информация. 2000. № 7. С. 1–9.
  3. Падучева Е.В. Динамические модели в семантике лексики. М.: Языки славянской культуры, 2004. 608 с.
  4. Тузов В.А. Компьютерная семантика русского языка. СПб: Изд-во СПбГУ, 2003. 391 с.
  5. Национальный корпус русского языка. URL: http://www.ruscorpora.ru/ (дата обращения: 22.08.2016).
  6. Апресян В.Ю. и др. Новый объяснительный словарь синонимов русского языка. М.–Вена: Языки славянской культуры–Венский славистический альманах, 2004. 1488 с.
  7. Хорошилов А.А. Методы автоматического установления смысловой близости документов на основе их концептуального анализа // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: тр. XV Всерос. науч. конф. RCDL" 2013. Ярославль: Изд-во ЯрГУ, 2013. С. 369–376.
  8. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989. 189 с.
  9. Лахути Д.Г., Рубашкин В.Ш. Средства и процедура концептуальной интерпретации входных сообщений на естественном языке // Изв. АН СССР. Сер. Технич. киберн. 1987. № 2. С. 49–59.
  10. Рубашкин В.Ш. Семантический компонент в системах понимания текста // КИИ-2006. Тр. 10 национ. конф. по искусствен. интеллекту с междунар. участ. 2006. URL: http://www.raai.org/resurs/papers/kii-2006/#dokladi (дата обращения: 23.08.2016).
  11. Падучева Е.В. Семантика вида и точка отсчета // Изв. АН СССР: Сер. лит. и яз. 1986. Т. 45. № 5. C. 18–25.
  12. Падучева Е.В. Отпредикатные имена в лексикографическом аспекте // Науч.-технич. инф. 1991. Сер. 2. № 5. C. 21–31.
  13. WordNet. A lexical database for English. URL: http://wordnet.princeton.edu/ (дата обращения: 23.08.2016).
  14. Семантическая сеть. URL: https://ru.wikipedia.org/wiki/Семантическая_сеть (дата обращения: 23.08.2016).
  15. Minsky M. Minsky"s frame system theory // Proceedings of the workshop on Theoretical issues in natural language processing (TINLAP "75). 1975, pp. 104–116.
  16. Хабаров С.П. Представление знаний в информационных системах: конспекты лекций. URL: http://www.habarov.spb.ru/bz/bz07.htm (дата обращения: 23.08.2016).
  17. Луценко Е.В. Представление знаний в информационных системах: электр. учеб. пособие для студентов. Краснодар: Изд-во КубГАУ, 2010. 428 с.
  18. Константинова И.С., Митрофанова О.А. Онтологии как системы хранения знаний // Всерос. конкурсн. отбор стат. по приорит. направл. «Информационно-телекоммуникационные системы». 2008. 54 с.
  19. Разин В.В., Тузовский А.Ф. Представление знаний о времени с учетом неопределенности в онтологиях Semantic WEB // Докл. Томского гос. ун-та систем управления и радиоэлектроники. 2013. № 2 (28). С. 157–162.
  20. Patel-Schneider P.F., Horrocks I. et al. SWRL: A Semantic Web Rule Language Combining OWL and RuleML // World Wide Web Consortium (W3C). 2004. URL: http://www.w3.org/Submission/SWRL (дата обращения: 18.08.2016).
  21. Fillmore Ch. The Case for Case. Proc. Texas Symp. on Language Universals, 1967, 134 p.
  22. Филлмор Ч. Дело о падеже // Новое в зарубежной лингвистике. М.: Прогресс, 1981. С. 369–495.
  23. Dowty D. Thematic Proto-Roles and Argument Selection // Language, 1991, vol. 67, no. 3, pp. 547–619.
  24. Норвиг П., Рассел С. Искусственный интеллект: современный подход. М.: Вильямс, 2007. 1408 с.
  25. Jurafsky D., Martin J. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. 2008, 1024 p.
  26. Батура Т.В., Мурзин Ф.А. Машинно-ориентированные логические методы отображения семантики текста на естественном языке: монография. Новосибирск: Изд-во НГТУ, 2008. 248 с.
  27. Темпоральная логика. URL: https://ru.wikipedia.org/wiki/Темпоральная_логика (дата обращения: 23.08.2016).
  28. Vendler Z. Verbs and times. The Philosophical Review, 1957, vol. 66, no. 2, pp. 143–160.
  29. Падучева Е.В. Лексическая аспектуальность и классификация предикатов по Маслову–Вендлеру // Вопросы языкознания. 2009. № 6. С. 3–21.
  30. Вывод в логических моделях. Метод резолюций. URL: http://www.aiportal.ru/articles/knowledge-models/method-resolution.html (дата обращения: 11.08.2016).
  31. Boral H., Redfield S. Database Machine Morphology. Proc. 11th Intern. Conf. Very Large Data Bases, 1985, pp. 59–71.
  32. Fushimi S., Kitsuregawa M., Tanaka H. An overview of the system of a parallel relational database machine GRACE. Proc. 12th Intern. Conf. Very Large Data Bases, 1986, pp. 209–219.
  33. Tanaka H. Parallel Inference Engine. IOS Press Publ., 2000, 296 p.
  34. Open Cognition. URL: http://opencog.org/ (дата обращения: 23.08.2016).
  35. Link Grammar Parser. AbiWord, 2014. URL: http://www.abisource.com/projects/link-grammar/ (дата обращения: 20.08.2016).
  36. The CMU Link Grammar natural language parser. URL: https://github.com/opencog/link-grammar/ (дата обращения: 22.08.2016).
  37. RelEx Dependency Relationship Extractor. OpenCog. URL: http://wiki.opencog.org/wikihome/index.php/Relex (дата обращения: 22.08.2016).
  38. Сокирко А.В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ). Дисс. … канд. тех. наук. М.: МГПИИЯ, 2001. 120 с.
  39. Автоматическая обработка текста. URL: http://www.aot.ruhttp://aot.ru/ (дата обращения: 23.08.2016).
  40. Prószéky G. Machine Translation and the rule-to-rule hypothesis. New Trends in Translation Studies (In Honour of Kinga Klaudy). Budapest: Akadémiai Kiadó, 2005, pp. 207–218.

Почему значение представляет интерес для философов и психологов и почему оно считается спорной «проблемой», понять нетрудно. Рассмотрим невинный на первый взгляд вопрос: «Каково значение слова cow "корова"?». Конечно, это не какое-то конкретное животное. Может быть, тогда это весь класс животных, которому мы даем имя cow "корова"? Все коровы в том или ином отношении различны; и во всяком случае, ни один человек не знает да и не мог бы знать всех членов класса коров, но все же хочется думать, что нам известно значение слова cow, и мы можем правильно использовать его при обозначении конкретных животных, которых раньше никогда не видели. Существует ли какое-то одно или несколько свойств, благодаря которым коровы отличаются от всех других объектов, именуемых нами по-другому? Рассуждая так, мы обнаруживаем, что углубились в философский спор между «номиналистами» и «реалистами», который в той или иной форме продолжается со времен Платона по сей день. Имеют ли вещи, называемые нами одним и тем же именем, какие-то общие «существенные» свойства, по которым их можно идентифицировать (как сказали бы «реалисты»), или они не имеют ничего общего между собой, кроме имени, которое по сложившемуся обычаю мы научились применять по отношению к ним (как мог бы сказать «номиналист»)? И cow не является особенно трудным случаем. Ведь можно считать само собой разумеющимся, что коровы могут быть определены в терминах биологической родо-видовой классификации. А как быть со словом table "стол"? Столы бывают разных форм и размеров, делаются из разнообразных материалов и используются для различных целей. Но столы являются, по крайней мере физически, наблюдаемыми и осязаемыми объектами; и для них можно составить некоторый список определяющих характеристик. А что сказать о таких словах, как truth "истина", beauty "красота", goodness "доброта, хорошее качество" и т. д.? Имеют ли все эти вещи, описываемые нами как «красивые» или «хорошие», некоторое общее свойство? Если да, то как мы идентифицируем и описываем его? Может быть, следует говорить, что значение таких слов, как truth, beauty и goodness, есть «понятие» или «идея», ассоциируемая с ними в «умах» носителей соответствующего языка,^ и вообще, что «значения» суть «понятия» или «идеи»? Сказать это - значит опять углубиться в философские и психологические споры, ибо многие философы и психологи с большим сомнением относятся к возможности существования понятий (или даже «разума»). Но и оставив эти трудности в стороне или отказавшись от их рассмотрения, мы обнаружим, что существуют другие вопросы, связанные со значением и имеющие более или менее философскую природу. Осмысленно ли утверждение, что кто-то употребил некоторое слово со значением, отличным от того, что это слово «действительно» значит? Существует ли вообще «истинное», или «правильное», значение слова?

9.1.4. ЗНАЧЕНИЕ «ЗНАЧЕНИЯ»

До сих пор мы вели разговор только о значениях слов. О предложениях мы также говорили, что они обладают значением. Употребляется ли здесь термин «значение» в том же смысле? Кстати, мы часто говорим, что предложения и сочетания слов являются или не являются «значимыми» (meaningful), но обычно не говорим, что слова не являются «значимыми». Возможно ли тогда указать различие и, быть может, целый ряд различий между понятиями «быть значимым» и «обладать значением»? Эти и многие другие связанные с ними вопросы не один раз обсуждались философами и лингвистами. Уже стало трюизмом при изложении семантической теории привлекать внимание к многочисленным значениям «значения».

Наряду с философскими вопросами существуют и такие, которые непосредственно относятся к компетенции лингвиста. Философы, подобно «первому встречному», обычно считают «слова» и «предложения» само собой разумеющимися фактами. Лингвист так поступать не может. Слова и предложения являются для него прежде всего единицами грамматического описания; наряду с ними признаются и другие грамматические единицы. Лингвист должен рассмотреть общий вопрос о том, как грамматические единицы различных видов связаны с единицами семантического анализа. В частности, он должен исследовать вопрос о том, нужно ли проводить разграничение между «лексическим» и «грамматическим» значением.

Пока еще никто не представил, хотя бы в общем виде, удовлетворительной и разумной теории семантики. И это следует ясно сознавать при любом обсуждении проблем данной дисциплины. Однако отсутствие стройной и полной теории семантики не означает, что до сих пор не было достигнуто совершенно никакого прогресса в области теоретического исследования значения. Ниже будет дан краткий обзор наиболее важных достижений, полученных за последние годы лингвистами и философами.

Мы уже предварительно определили семантику как науку о значении; и это определение - единственное, что сближает всех семантиков. Как только мы начинаем знакомиться с конкретными семантическими работами, мы сталкиваемся с таким разнообразием подходов к определению и установлению значения, что неискушенного читателя оно ставит в тупик. Проводятся разграничения между «эмоциональным» и «понятийным» значением, между «значением» (significance) и «обозначением» (signification), между «перформативным» и «описательным» значением, между «смыслом» и «референцией», между «денотацией» и «коннотацией», между «знаками» и «символами», между «экстенсионалом» и «интенсионалом», между «импликацией», «обязательным следствием» (entailment) и «пресуппозицией», между «аналитическим» и «синтетическим», и т. д. Терминология семантики богата и прямо-таки сбивает с толку, так как употребление терминов у разных авторов отличается отсутствием какой-либо последовательности и единообразия. В силу этого термины, вводимые нами в настоящей главе, не обязательно будут нести тот же смысл, который они имеют в других работах, посвященных семантике.

Мы начнем с краткого критического изложения традиционного подхода к определению значения.

9.2. ТРАДИЦИОННАЯ СЕМАНТИКА

9.2.1. НАЗЫВАНИЕ ВЕЩЕЙ

Традиционная грамматика была основана на предположении, что слово (в смысле «лексемы»; ср. § 5.4.4) является основной единицей синтаксиса и семантики (ср. также § 1.2.7 и § 7.1.2). Слово считалось «знаком», состоящим из двух частей; мы будем называть эти два компонента формой слова и его значением . (Вспомним, что это всего лишь один из смыслов, который термин «форма» имеет в лингвистике; «форму» слова как «знака» или лексической единицы следует отличать от конкретных «акциденциальных», или словоизменительных, «форм», в которых слово выступает в предложениях; ср. § 4.1.5.) Очень рано в истории традиционной грамматики возник вопрос об отношениях между словами и «вещами», к которым они относились или которые они «обозначали». Древнегреческие философы времен Сократа, а вслед за ними и Платон сформулировали этот вопрос в терминах, которые с тех пор обычно и применяются при его обсуждении. Для них семантическое отношение, имеющее место между словами и «вещами», было отношением «наименования» (naming); и затем вставала следующая проблема: имеют ли «имена», которые мы даем «вещам», «природное» или «условное» происхождение (ср. § 1.2.2). По мере развития традиционной грамматики стало обычным различать значение слова и «вещь» или «вещи», которые «именуются», «называются» данным словом. Средневековые грамматики формулировали это различие так: форма слова (та часть dictio, которая характеризуется как vox) обозначает «вещи» посредством «понятия», ассоциируемого с формой в умах говорящих на данном языке; и это понятие является значением слова (его signification Эту концепцию мы и будем считать традиционным взглядом на отношение между словами и «вещами». Как уже говорилось, этот взгляд, в принципе, был положен в основу философского определения «частей речи» в соответствии с характерными для них «способами обозначения» (ср. § 1.2.7). Не вдаваясь в подробное изложение традиционной теории «сигнификации», отметим лишь, что использовавшаяся в этой теории терминология не исключала возможности двусмысленного, или нерасчлененного, применения термина «обозначать» (signify): можно было сказать, что форма слова «обозначает» «понятие», под которое подводятся «вещи» (путем «абстрагирования» от их «случайных» свойств); можно было сказать также, что она «обозначает» сами «вещи». Что касается взаимоотношения между «понятиями» и «вещами», то оно служило, конечно, предметом значительных философских разногласий (особенно бросаются в глаза разногласия между «номиналистами» и «реалистами»; ср. § 9.1.3). Здесь мы можем игнорировать эти философские различия.

9.2.2. РЕФЕРЕНЦИЯ

Здесь полезно ввести современный термин для обозначения «вещей», рассматриваемых с точки зрения «называния», «именования» их словами. Это - термин референт . Мы будем говорить, что отношение, которое имеет место между словами и вещами (их референтами), есть отношение референции (соотнесенности ): слова соотносятся с вещами (а не «обозначают» и не «именуют» их). Если принять разграничение формы, значения и референта, то мы можем дать известное схематическое представление традиционного взгляда на взаимоотношения между ними в виде треугольника (иногда называемого «семиотическим треугольником»), изображенного на рис. 23. Пунктирная линия между формой и референтом указывает на то, что отношение между ними носит непрямой характер; форма связана со своим референтом через опосредствующее (концептуальное) значение, которое ассоциируется с каждым из них независимо. Схема ясно иллюстрирует важное положение, заключающееся в том, что в традиционной грамматике слово является результатом соединения определенной формы с определенным значением.

Мы уже упоминали о философских и психологических спорах относительно статуса «понятий» и «идей» в «разуме» (ср. §9.1.3). Традиционная семантика возводит существование «понятий» в принцип всех теоретических построений и поэтому (почти неизбежно) поощряет субъективизм и интроспекцию при исследовании значения. Как пишет Хаас, «эмпирическая наука не может полностью полагаться на такую методику исследования, которая сводится к тому, что люди производят наблюдения в своих умах, причем каждый в своем собственном». Это критическое замечание предполагает принятие взгляда, согласно которому семантика является, или должна быть, эмпирической наукой, причем этот взгляд желательно, насколько это возможно, не привязывать к таким спорным философским и психологическим проблемам, как разграничение «тела» и «духа» или статус «понятий». Этой точки зрения мы и будем придерживаться при рассмотрении семантики в настоящих главах. Следует подчеркнуть, однако, что методологический отказ от «ментализма» не означает принятия «механицизма», как считают некоторые лингвисты. Блумфилдовское «механистическое» и «позитивистское» определение значения слова как полного «научного» описания его референта является более пагубным для прогресса в области семантики, чем традиционное определение в терминах «понятий», так как в определении Блумфилда предпочтительное внимание уделяется относительно небольшому множеству слов в рамках словарного состава естественных языков, слов, соотносящихся с «вещами», которые поддаются в принципе описанию средствами физических наук. Более того, оно покоится на двух неявных и необоснованных допущениях: (i) что «научное» описание референтов этих слов связано с тем, как эти слова используются говорящими на данном языке (большинство говорящих имеет мало представления о «научном» описании); (ii) что значение всех слов может быть в итоге описано в тех же терминах. Правда, можно считать, что подход Блумфилда (обнаруживаемый также и у других авторов) зависит от «реалистического» взгляда на взаимоотношения между языком и «миром», взгляда, который не очень существенно отличается от точки зрения многих «концептуалистов»; он по меньшей мере подразумевает допущение, согласно которому раз существует, например, слово intelligence "ум, интеллект, умственные способности", то существует также и нечто, с чем оно соотносится (и это "нечто" будет, как предполагается, со временем описано удовлетворительным образом средствами «науки»); поскольку существует слово love "любовь, любить", то существует также и нечто, с чем это слово соотносится, и т. д. Позиция, которой должен придерживаться лингвист, - это позиция, нейтральная по отношению к «ментализму» и «механицизму»; это позиция, которая согласуется с обеими точками зрения, но не предполагает ни одну из них.

9.2.7. «ОСТЕНСИВНОЕ» ОПРЕДЕЛЕНИЕ

В предыдущем параграфе имплицитно содержится еще одно критическое замечание в адрес традиционной семантики (а также в адрес некоторых современных теорий). Мы уже видели, что термин «значение» при его обычном употреблении сам имеет много «значений». Когда мы ставим перед кем-нибудь вопрос - «Каково значение слова х ?» - в ходе повседневного (не философского и не узкоспециального) разговора, мы получаем (и это нас нисколько не удивляет) ответы, разнообразные по форме, в зависимости от обстоятельств и ситуации, в которой мы задаем этот вопрос. Если мы интересуемся значением некоторого слова в языке, отличном от нашего собственного, то ответом на наш вопрос чаще всего является перевод. («Перевод» затрагивает всевозможные проблемы, представляющие семантический интерес, но пока мы не будем их касаться; ср. § 9.4.7.) Для нас сейчас более показательна ситуация, при которой мы спрашиваем о значениях слов нашего собственного языка (или другого языка, который мы «знаем», по крайней мере «частично», - вообще понятие «полного знания языка» является, конечно, фикцией). Предположим, что мы хотим узнать значение слова cow "корова" в неправдоподобной (но удобной для наших целей) ситуации, когда на соседнем лугу находится несколько коров. Нам могли бы сказать: «Вы видите вон тех животных? Это коровы». Этот способ передачи значения слова cow "корова" включает в себя элемент того, что философы называют остенсивным определением . (Остенсивное (наглядное) определение - это такое определение, когда непосредственно «указывается» на соответствующий предмет.) Но остенсивное определение само по себе никогда не является достаточным, поскольку человек, интерпретирующий это «определение», должен прежде всего знать смысл жеста «указания» в данном контексте (а также знать, что намерение говорящего состоит именно в том, чтобы дать «определение») и, что более важно, он должен правильно идентифицировать объект, на который «указывается». В случае нашего гипотетического примера слова those animals "те животные" ограничивают возможность ошибочного понимания. (Они не устраняют ее полностью; но мы будем считать, что «определение» значения слова cow "корова" было интерпретировано удовлетворительным образом.) Теоретическое значение этого чересчур упрощенного и довольно нереалистичного примера имеет два аспекта: во-первых, он показывает трудность объяснения значения любого слова без использования других слов с целью ограничить и сделать более явной «область» «указания» (он подтверждает мысль, что, вероятно, невозможно установить, а может быть, и знать, значение одного слова, не зная также значения других слов, с которыми оно «связано»; например, cow "корова" связано с animal "животное"); во-вторых, остенсивное определение применимо лишь к относительно небольшому множеству слов. Представьте себе, например, тщетность попыток объяснить подобным образом значение слов true "правильный, истинный", beautiful "красивый, прекрасный, великолепный" и т. д.! Значение таких слов, как правило, объясняется, правда, не всегда удачно, с помощью синонимов (значения которых предполагаются уже известными человеку, задающему вопрос) или при помощи довольно длинных определений того типа, какой обычно дается в словарях. И снова здесь ясно проявляется неизбежная кругообразность семантики: в лексике нет какой-то одной точки, которую можно взять за исходную и из которой можно вывести значение всего остального. Эта проблема «кругообразности» будет обсуждаться ниже (ср. § 9.4.7).

9.2.8. КОНТЕКСТ

Другая черта повседневных ситуаций, в которых мы находимся, спрашивая о значении слов, состоит в том, что нам часто говорят: «Это зависит от контекста». («Дайте мне контекст, в котором вы встретили это слово, и я объясню вам его значение».) Часто невозможно определить значение слова, не «поставив его в контекст»; и полезность словарей находится в прямой зависимости от числа и разнообразия «контекстов», которые приводятся в них при словах. Часто (и это, пожалуй, самый распространенный случай) значение слова объясняется так: дается «синоним» с указанием «контекстуальных» ограничений, управляющих употреблением рассматриваемого слова (addled: "испорченный (о яйцах)"; rancid: "испорченный (о масле)" и т. д.). Такие факты, как разнообразие способов, посредством которых мы на практике устанавливаем значение слов, «кругообразность» лексики и существенная роль «контекста», не получают полного теоретического признания в традиционной семантике.

9.2.9. «ЗНАЧЕНИЕ» И «УПОТРЕБЛЕНИЕ»

Здесь можно упомянуть знаменитый и весьма популярный лозунг Витгенштейна: «Не ищите значения слова, ищите его употребление». Термин «употребление» сам по себе нисколько не яснее термина «значение»; но в результате замены одного термина другим семантик отказывается от традиционной тенденции определять «значение» в терминах «сигнификации». Примеры самого Витгенштейна (в его более поздней работе) показывают, что, как он считал, «употребления», в которых слова встречаются в языке, бывают самого разнообразного характера. Он не выдвигал (и не заявлял о своем намерении выдвинуть) теорию «употребления» слов как теорию семантики. Но мы, вероятно, имеем право извлечь из заявления Витгенштейна, носящего программный характер, следующие принципы. Единственным критерием проверки, применимым к исследованию языка, является «употребление» языковых высказываний в разнообразных ситуациях повседневной жизни. Такие выражения, как «значение слова» и «значение предложения (или суждения)», таят в себе опасность заблуждения, связанного с тем, что они склоняют нас к поискам «значений», которые они имеют, и к отождествлению их «значений» с такими сущностями, как физические объекты, «понятия», данные «уму», или «ситуации» (states of affairs) в физическом мире.

Мы не имеем прямых свидетельств относительно понимания высказываний, а располагаем, скорее, данными об их недопонимании (misunderstanding) - когда что-то «нарушается» в процессе коммуникации. Если, например, мы говорим кому-нибудь bring me the red book that is on the table upstairs "принеси мне красную книгу, которая лежит на столе наверху", и он приносит нам книгу другого цвета, или коробку вместо книги, или идет вниз в поисках книги, или делает что-то совершенно неожиданное, то мы вполне резонно можем сказать, что он «недопонял» все или некоторую часть нашего высказывания (возможны, конечно, и другие объяснения). Если он делает то, что от него ожидают (отправляется в нужном направлении и возвращается с нужной книгой), то мы можем сказать, что он правильно понял высказывание. Мы хотим подчеркнуть, что (в случае, подобном этому) имеются факты prima facie «поведенческого» характера, говорящие о том, что недопонимания не произошло. Вполне возможно, что, если бы мы продолжали весьма настойчиво проверять его «понимание» слов bring "приносить", или red "красный", или book "книга", то наступил бы момент, когда что-то из сделанного или сказанного им обнаружило бы, что его «понимание» этих слов несколько отличается от нашего, что он делает из высказываний, содержащих эти слова, выводы, которых мы не делаем (или наоборот, что мы делаем выводы, которых он не делает), или что он употребляет их для обозначения несколько другого класса предметов или действий. Нормальное общение основано на допущении, что все мы «понимаем» слова одинаково; это допущение время от времени нарушается, но если этого не происходит, факт «понимания» считается сам собою разумеющимся. Имеем мы или не имеем в наших «умах» одни и те же «понятия», когда мы разговариваем друг с другом, - это вопрос, на который нельзя ответить иначе, чем в терминах «употребления» слов в высказываниях. Утверждение, что все «понимают» одно и то же слово несколько по-разному, является, вероятно, справедливым, но довольно бессмысленным. Семантика занимается объяснением степени единообразия в «употреблении» языка, которая делает возможным нормальное общение. Как только мы откажемся от точки зрения, согласно которой «значение» слова - это то, что оно «означает» (signifies), мы совершенно естественно признаем, что для объяснения «употребления» должны быть установлены определенные отношения разного рода. Два из тех «факторов», которые подлежат разграничению, суть референция (о которой мы уже говорили выше) и смысл (sense).

9.2.10. НЕДЕТЕРМИНИРОВАННОСТЬ ЗНАЧЕНИЯ

Итак, мы предлагаем отказаться от взгляда, согласно которому «значение» слова - это то, что оно «означает», и в процессе общения это «означаемое» «передается» (в каком-то смысле) говорящим слушающему; мы скорее готовы согласиться с тем, что детерминированность (определенность) значения слов вовсе не является ни необходимой, ни желательной. Как мы видели, употребление языка в нормальных ситуациях может объясняться на основе гораздо более слабого допущения, а именно: между говорящими на данном языке существует согласие относительно «употребления» слов (с чем они соотносятся, что они подразумевают и т. д.), которого достаточно для устранения «недопонимания». Этот вывод нужно иметь в виду при любом анализе «значений» слов и предложений. Мы будем считать его само собой разумеющимся на протяжении последующих разделов данных двух глав, посвященных семантике.

Необходимо сделать еще два замечания о таких социально предписываемых высказываниях, как How do you do? "Здравствуйте!". Они обычно носят характер «готовых» образований, то есть выучиваются носителями языка как неанализируемые целые единства и, совершенно очевидно, не конструируются заново в каждом случае, когда употребляются в обстоятельствах, которые, следуя Фёрсу, мы можем назвать «типичными повторяющимися событиями в цепи социального процесса». Раз они носят такой характер, можно было бы объяснять их в рамках «бихевиористской» концепции: рассматриваемые высказывания вполне могли бы описываться как «условные реакции» на ситуации, в которых они встречаются. Этот факт не должен игнорироваться специалистом по семантике. Значительная часть нашего повседневного пользования языком вполне адекватно описывается в «бихевиористских» терминах и может быть связана с тем, что мы «исполняем» определенные «роли» в процессе осуществления социально предписываемых, «ритуальных» моделей поведения. Будучи рассмотрены с точки зрения этого аспекта использования языка, человеческие индивиды обнаруживают поведение, подобное поведению многих животных, у которых «коммуникативные системы» состоят из множества «готовых высказываний», используемых в определенных ситуациях. Более типичные человеческие аспекты языкового поведения, которые зависят от порождающих свойств языка, а также от семантических понятий обладания значением, референции и смысла, не могут получить правдоподобного объяснения на основе распространения на них «бихевиористских» понятий «стимула» и «реакции». Тем не менее верно, что человеческий язык включает в себя и «поведенческий» компонент. Хотя в дальнейшем мы не будем больше говорить об этом, теоретически мы должны признать здесь эту истину.

9.3.7. «ФАТИЧЕСКОЕ ОБЩЕНИЕ» (PHATIC COMMUNION)

В этой связи необходимо также упомянуть о том аспекте языкового поведения, к которому Б. Малиновский применял термин «фатическое общение». Он обратил внимание на тот факт, что многим нашим высказываниям неверно приписывают в качестве их единственной или главной функции передачу или поиск информации, подачу приказаний, выражение надежд, потребностей и желаний или даже «проявление эмоций» (в том расплывчатом смысле, в каком специалисты по семантике часто употребляют это последнее выражение); на самом деле они служат для установления и поддержания чувства социальной солидарности и социального самосохранения. Многие «готовые» высказывания типа How do you do? "Здравствуйте!", социально предписываемые в определенных контекстах, могут выполнять именно эту функцию «фатиче-ского общения». Однако существует немало и других высказываний, которые более или менее свободно строятся говорящими, но при этом одновременно передают информацию и служат целям «фатического общения». Примером может быть фраза It"s another beautiful day "Опять прекрасный день", произнесенная (по предположению) как первая фраза в беседе между покупателем и лавочником. Совершенно ясно, что главная функция этого высказывания состоит не в том, чтобы «передать» лавочнику какую-то информацию о погоде; это явный пример «фатического» общения». В то же время данное высказывание все-таки обладает значением, отличным от значения бесчисленных других высказываний, которые могли бы встретиться в этом контексте и могли бы также хорошо служить целям «фатического общения»; и следующий «шаг» в беседе обычно связан с данным конкретным высказыванием на базе его значения. Мы должны, следовательно, проводить различие между тем аспектом «употребления» высказываний, который может быть отнесен к осуществлению «фатического общения», и той частью, которая должна вычленяться в качестве их значения (если они обладают значением с точки зрения нашего определения). Но при этом мы признаем, что даже когда высказыванию присущи оба этих аспекта, доминирующую часть «употребления» высказывания может составлять либо первый, либо второй аспект. Малиновский допускал явное преувеличение, когда утверждал, что передача информации является одной из «самых периферийных и узкоспециальных функций» языка.

9.3.8. РАСПРОСТРАНЕНИЕ ПОНЯТИЯ «ОБЛАДАНИЯ ЗНАЧЕНИЕМ» НА ВСЕ ЛИНГВИСТИЧЕСКИЕ ЕДИНИЦЫ

Пока мы проиллюстрировали понятие обладания значением лишь применительно к целым высказываниям, рассматриваемым как неразложимые единицы. Теперь мы продолжим рассмотрение высказываний, а не предложений и по-прежнему будем обращаться к интуитивному понятию «контекста»; но теперь мы обобщим понятие обладания значением с точки зрения следующего принципа: любой языковой элемент, который встречается в высказывании, обладает значением, если только он не является полностью предопределяемым («обязательным») в данном контексте.

Очевидно, понятие обладания значением (как оно здесь определяется) применимо на всех уровнях анализа высказываний, включая фонологический уровень. Например, существует много контекстов, в которых слова lamb "ягненок" и ram "баран" могли бы употребляться с одинаковым успехом, причем соответствующие высказывания могут различаться только этими словами. Так как эти высказывания, видимо, различны по значению (референты слов lamb и ram различны, и различны, вообще говоря, импликации, «содержащиеся» в соответствующих высказываниях), то фонемы /l/ и /r/ не только обладают значением, но обладают различным значением в этих высказываниях. Существуют и другие высказывания, содержащие иные слова, отличные от lamb и ram, в которых различие в значении может выражаться исключительно фонологической оппозицией /l/ - /r/. Как мы видели в одной из предыдущих глав (ср. § 3.1.3), фонологическая структура конкретных языков покоится, в конечном счете, на дифференцирующей способности фонем (более точно - на дифференцирующей способности их «различительных признаков»), ограничиваемой определенными рамками, налагаемыми дополнительным принципом фонетического сходства. Существуют, следовательно, веские причины в пользу применения понятия обладания значением даже на уровне фонологического анализа. Стоит заметить, однако, что в случае фонетически различимых, но «сходных» звуков обладание значением непременно подразумевает обладание различным значением, по крайней мере в некоторых контекстах. На «высших» уровнях это не так. Когда речь идет о языках, в которых звуки [l] и [r] встречаются, но никогда не различают высказываний, мы говорим, что в этих языках указанные звуки находятся в отношении дополнительной дистрибуции или свободного варьирования (другими словами, что они являются альтернативными фонетическими реализациями одной и той же фонологической единицы; ср. § 3.3.4). В тех контекстах, где звуки речи, различающиеся в прочих случаях как отдельные фонологические единицы, имеют одно и то же значение, их можно вполне обоснованно характеризовать как синонимичные. Примерами могут служить начальные гласные при альтернативных произношениях слова economics (противоположный случай - дифференциальное качество тех же гласных в beat /bi:t/ : bet /bet/ и т. д.) или модели ударения controversy: controversy.

Хотя специалист по семантике теоретически должен признавать принцип применимости обладания значением к фонологическому уровню, в своей практической работе он обычно не занимается значением фонологических единиц. Причина состоит в том, что фонологические единицы никогда не имеют предметной соотнесенности и не вступают ни в какие семантические отношения, кроме отношений одинаковости и различия значения. Более того, отношение одинаковости значения, когда оно имеет место между фонологическими единицами (фонологическая «синонимия», как она проиллюстрирована выше), носит спорадический и несистемный характер. Ее приходится описывать в терминах правил альтернативной реализации для конкретных слов; как только эти правила получены, уже ничто более не нужно. Вообще говоря (особо должен быть оговорен случай «звукового символизма» - семантически интересное явление, которое мы не будем рассматривать здесь ввиду ограниченных возможностей; ср. § 1.2.2), «значение» данной фонологической единицы - это просто ее отличимость от всех других фонологических единиц (если таковые имеются), которые могли бы встретиться в том же самом контексте.

9.3.9. ОГРАНИЧЕННЫЕ КОНТЕКСТЫ

Теперь мы можем обратиться к разграничению между высказываниями и предложениями (ср. § 5.1.2). Необходимо иметь в виду два момента. Первый. Когда мы пользуемся языком для общения друг с другом, мы производим не предложения, а высказывания; такие высказывания производятся в определенных контекстах и не могут быть поняты (даже в тех пределах, которые были установлены выше для интерпретации термина «понимание»; ср. § 9.2.9) без знания релевантных контекстуальных признаков. Более того, в ходе беседы (предположим, что мы имеем дело с беседой) контекст постоянно развивается, в том смысле, что он «вбирает в себя» из произносимого и происходящего всё, что релевантно для производства и понимания последующих высказываний. Крайним случаем контекстов, не «развитых» в этом смысле, будут такие, в которых участники беседы не опираются ни на предшествующие знания друг о друге, ни на «информацию», содержащуюся в ранее произнесенных высказываниях, но в которых они используют более общие мнения, обычаи и пресуппозиции, господствующие в данной конкретной «сфере рассуждения» и в данном обществе. Такие контексты - мы будем называть их ограниченными контекстами (restricted contexts) - сравнительно редки, так как понимание большинства высказываний зависит от информации, содержащейся в предшествующих высказываниях. Мы не должны терять из виду отношений между высказываниями и конкретными контекстами.

Второй момент состоит в следующем: поскольку предложения никогда не производятся говорящими (ведь предложения представляют собой теоретические единицы, устанавливаемые лингвистами с целью описания дистрибутивных ограничений на встречаемость классов грамматических элементов), то не может существовать и прямого отношения между предложениями и конкретными контекстами. В то же время высказывания обладают грамматической структурой, которая зависит от их «вывода» из предложений, а грамматическая структура высказываний является или может являться семантически релевантной. Это особенно ясно проявляется в случае синтаксической «неоднозначности» (ср. § 6.1.3). Более того (за исключением таких «готовых» выражений, как How do you do? "Здравствуйте!"), высказывания производятся говорящими и понимаются слушающими на основе регулярностей в построении и в трансформациях, задаваемых для предложений правилами грамматики. В настоящее время ни лингвистика, ни какая-либо другая из наук, занимающихся изучением «механизмов», лежащих в основе производства высказываний, не в состоянии делать никаких определенных утверждений относительно того, как именно знание абстрактных отношений, имеющих место между грамматическими элементами в предложениях, взаимодействует с разнообразными свойствами контекстов, в результате чего происходит образование и понимание высказываний, в которых обнаруживаются «корреляты» этих грамматических элементов. Сам факт, что существует определенное взаимодействие между грамматической структурой языка и релевантными контекстуальными признаками, представляется несомненным, и этот факт должен нами учитываться.

Поскольку, в общем случае, мы не можем идентифицировать ни те действительные элементы, которые говорящий «отбирает» в процессе образования высказываний, ни все релевантные признаки конкретных контекстов, мы можем принять в качестве методологического решения тот принцип, которым лингвисты обычно руководствуются на практике, а именно - рассматривать семантические отношения между высказываниями в терминах семантических отношений, имеющих место между предложениями, на основании которых, как часто считают, «создаются» высказывания, когда они производятся носителями языка в ограниченных контекстах. (Понятие «ограниченного контекста» все же должно быть сохранено, ибо, как мы увидим ниже, нельзя формулировать семантические отношения, имеющие место между предложениями, не учитывая, хотя бы в малой степени, «контекстуализацию»; ср. § 10.1.2.) Тогда свойства конкретных контекстов будут привлекаться (в той форме, какая, по крайней мере сейчас, может быть охарактеризована как описание ad hoc) для объяснения «остаточных» семантически релевантных аспектов высказываний. То, что мы представили здесь в качестве сознательного, методологического решения, не должно, однако, восприниматься так, будто мы хотим подчеркнуть примат грамматического над контекстуальным в психологических процессах производства и понимания высказываний.

9.3.10. ЭЛЕМЕНТЫ ГЛУБИННОЙ СТРУКТУРЫ ОБЛАДАЮТ ЗНАЧЕНИЕМ В ПРЕДЛОЖЕНИЯХ

Теперь мы можем применить понятие «обладание значением» к грамматическим элементам, из которых порождаются предложения посредством правил, определяющих построение и трансформацию их базисов (ср. § 6.6.1). Поскольку обладание значением подразумевает «выбор», то, следовательно, никакие элементы, вводимые в предложения посредством обязательных правил, не могут обладать значением в нашем смысле. (Такие «фиктивные» элементы, как do (вспомогательный глагол) в Do you want to go? "Хотите ли вы пойти?", не обладают значением; ср. § 7.6.3.) Более того, если мы предположим, что все «выборы» осуществляются применительно к отбору элементов в «глубинной» структуре (эти элементы являются либо «категориями», либо «признаками»; ср. § 7.6.9), то станет ясно, что понятие обладание значением не привязано к единицам какого-то конкретного ранга. Во-первых, разграничение в языке таких единиц, как морфемы, слова и группы слов (phrases), основано в определенной степени на «поверхностной» структуре (§ 6.6.1); и, во-вторых, существует много «грамматических категорий» (время, наклонение, вид, род, число и т. д.; ср. § 7.1.5), которые могут или не могут реализоваться в морфемах или в словах, но которые составляют системы «выборов» в предложениях. Вопрос о том, можно или нельзя провести строгое разграничение между «лексическим» и «грамматическим» значением, с учетом того, каким именно значением обладают элементы, будет рассмотрен ниже (ср. § 9.5.2). Здесь достаточно отметить, что понятие обладания значением применимо в одинаковой степени к элементам обоих типов в «глубинной» структуре предложений. Более того, это понятие принимается во внимание, эксплицитно или имплицитно, во всех новейших лингвистических теориях. Классы элементов (обозначаемые либо вспомогательными, либо терминальными символами - ср. § 6.2.2) устанавливаются в каждой точке «выбора» в процессе порождения предложений.

Из сказанного следует, что ни один элемент в предложении не обладает значением, если он не является членом одного из синтаксически задаваемых классов в «глубинной» структуре предложения: и именно этот факт оправдывает допущение, почти повсеместно делаемое лингвистами, логиками и философами, что множество элементов, обладающих значением в некотором конкретном языке, является, по крайней мере в весьма высокой степени, соизмеримым с множествами терминальных «составляющих» и «признаков» этого языка. Однако отсюда не следует, что всякая «составляющая» и всякий «признак» будут обладать значением в каждом предложении, где они встречаются. Этот важный момент иногда игнорируется лингвистами и поэтому заслуживает несколько более обстоятельного рассмотрения.

Вся проблема сводится к разграничению между грамматической и семантической приемлемостью. Как мы видели в одной из предыдущих глав (ср. § 4.2.12 и сл.), грамматичность - это тот аспект приемлемости высказываний, который может быть объяснен в терминах правил построения и трансформации, определяющих допустимые комбинации дистрибутивных классов элементов («категорий» и «признаков») в предложениях. Обычно считается, что грамматика любого языка порождает, в частности, бесконечное число предложений, неприемлемых в различных аспектах; и стало традиционным описывать по крайней мере один тип неприемлемости путем характеристики рассматриваемых предложений как «бессмысленных» или «несодержательных». Пусть следующие предложения порождаются грамматикой английского языка (и поэтому являются грамматически правильными):

(a) John drinks milk (beer, wine, water, etc.) "Джон пьет молоко (пиво, вино, воду и т. д.)"

(b) John eats cheese (fish, meat, bread, etc.) "Джон ест сыр (рыбу, мясо, хлеб и т. д.)"

(c) John drinks cheese (fish, meat, bread, etc.) "Джон пьет сыр (рыбу, мясо, хлеб и т. д.)"

(d) John eats milk (beer, wine, water, etc.) "Джон ест молоко (пиво, вино, воду и т. д.)".

Допустим, далее, что все эти предложения при порождении снабжаются одним и тем же структурным описанием: что глаголы drink "пить" и eat "есть, кушать", а также существительные milk "молоко", beer "пиво", wine "вино", water "вода", cheese "сыр", fish "рыба", meat "мясо", bread "хлеб" и т. д. не различаются в лексиконе посредством каких-либо релевантных синтаксических признаков. Очевидно, что при определенном понимании терминов «приемлемый» и «неприемлемый» высказывания, выводимые из предложений, сгруппированных в классы (а) и (b), являются приемлемыми, тогда как высказывания, выводимые из предложений, входящих в группы (с) и (d), являются неприемлемыми (при «естественных» обстоятельствах). Должны ли мы описывать этот вид приемлемости и неприемлемости, опираясь на критерий «содержательности» (в том смысле этого термина, который мы предлагаем выделять посредством термина «значимость»), - этот вопрос мы рассмотрим несколько ниже. Здесь мы хотим подчеркнуть, что множества элементов, которые могут встречаться и обладать значением глагола и объекта в этих предложениях, представляют собой сильно ограниченные подмножества тех совокупностей элементов, появление которых допускается правилами грамматики. И снова здесь крайним случаем является ситуация, когда появление элемента полностью определяется контекстом, состоящим из других элементов предложения. Примером полной предопределенности на этом уровне может служить появление слова teeth "зубы" в I bit him with my false teeth "Я укусил его своими вставными зубами". Как мы увидим ниже (ср. § 9.5.3), это предложение обнаруживает интересный с семантической точки зрения тип синтагматической «пресуппозиции», которая носит обычно скрытый характер, но которая может быть представлена в явном виде, когда в предложении появляется ее «синтаксическое отражение» в виде «определения» (в данном примере - false "вставные"). Если бы слово teeth "зубы" никогда не встречалось в других предложениях, кроме таких, в которых оно полностью определяется своим контекстом, то оно не обладало бы значением в английском языке, и специалисту по семантике нечего было бы о нем сказать.

Цель нашего рассуждения состояла в том, чтобы показать, как именно понятие обладания значением может и должно быть перенесено с уровня довольно «конкретных» случаев, когда оно касается, с одной стороны, грамматически правильных, не структурированных целых высказываний и, с другой стороны, высказываний, которые минимально различаются по своей фонологической структуре, на более «абстрактный» уровень, на котором оно применимо к более важному и гораздо более обширному классу предложений, порождаемых правилами грамматики. В пользу понятия обладания значением говорит тот факт, что оно отражает интуитивно ясный принцип, согласно которому «значимость подразумевает выбор» в конкретных контекстах. Его перенос на более «абстрактный» уровень основывается на методологическом решении, мотивировка которого имеет два аспекта: во-первых, это решение признает тот факт, что конкретные контекстуальные признаки, влияющие на производство и интерпретацию высказываний, могут описываться только ad hoc; и во-вторых, этот подход удовлетворительным образом связывает семантическую интерпретацию предложений с их синтаксическим описанием. Если установлено, что некоторый конкретный элемент обладает значением в рамках определенного класса предложений, то мы можем задаться вопросом о том, какое значение имеет этот элемент; и на этот вопрос можно ответить по-разному, как мы увидим в следующем разделе.

9.3.11. «ЗНАЧИМОСТЬ»

Теперь мы должны кратко остановиться на понятии «значимости» (ср. § 9.3.1). На первый взгляд, вполне оправдано желание отождествить значимость с полной приемлемостью относительно конкретных контекстов в случае высказываний и относительно более обобщенных ограниченных контекстов в случае предложений. Но мы уже видели, что существует много слоев приемлемости (располагающихся «выше» грамматического слоя), которые, хотя они часто и описываются без уточнения как «семантические», можно, однако, отличить от того, что традиционно называется «содержательностью» или «значимостью» (ср. § 4.2.3). Одни высказывания могут осуждаться как «кощунственные» или «неприличные»; другие могут считаться приемлемыми в определенных случаях употребления языка (молитвы, мифы, сказки, научная фантастика и т. д.), но быть неприемлемыми в повседневном разговоре. Вряд ли целесообразно пытаться дать такое определение «значимости», которое покрывало бы все эти разнообразные «измерения» приемлемости. Возьмем для примера случай из английского языка: хотя глагол die "умирать" свободно употребляется в сочетании с одушевленными существительными, включая названия лиц, в английском существует общепринятое табу, запрещающее его использование в сочетании с my father "мой отец", my mother "моя мать", my brother "мой брат" и my sister "моя сестра" (то есть применительно к ближайшим членам семьи говорящего); таким образом, неприемлемым будет считаться My father died last night "Мой отец умер прошлой ночью", но не His father died last night "Его отец умер прошлой ночью". Тогда, очевидно, правильное объяснение неприемлемости предложения My father died last night должно быть таким, чтобы мы могли сказать, во-первых, что оно «значимо», ибо, будучи употреблено вопреки табу, оно будет понято (в действительности можно было бы утверждать, что само табу зависит от возможности понимания этого предложения), и, во-вторых, что семантическое отношение между My father died last night и His father died last night тождественно отношению между My father came last night "Мой отец приехал прошлой ночью" и His father came last night "Его отец приехал прошлой ночью" и т. д. Традиционно значимость грамматически правильных предложений объясняется в терминах определенных общих принципов совместимости «значений» составляющих их элементов. Можно было бы сказать, например, что предложения John eats milk "Джон ест молоко" и John drinks bread "Джон пьет хлеб" являются бессмысленными, потому что глагол eat "есть, кушать" совместим только с существительными (в функции объекта), обозначающими твердые вещества, годные к употреблению в пищу, а глагол drink "пить" - с существительными, обозначающими жидкие вещества, годные к употреблению в пищу. (Заметим, что с этой точки зрения предложение John eats soup "Джон ест суп" могло бы рассматриваться как семантически аномальное, обладающее «социальной приемлемостью» лишь благодаря специальному соглашению, внешнему по отношению к обобщающим правилам интерпретации английских предложений.) С понятием значимости связаны большие трудности (мы могли бы утверждать, например, что John eats milk является «значимым» предложением, хотя обстоятельства, при которых оно могло бы быть использовано, несколько необычны). Тем не менее традиционная экспликация этого понятия в терминах «совместимости» представляется в основном разумной. Некоторые новейшие формулировки этого понятия мы рассмотрим в следующей главе (ср. § 10.5.4).

9.4.1. РЕФЕРЕНЦИЯ

Термин «референция» («соотнесенность») был введен ранее для того отношения, которое имеет место между словами, с одной стороны, и вещами, событиями, действиями и качествами, которые они «замещают» - с другой (ср. §9.2.2). Выше указывалось, что при известных условиях на вопрос «Каково значение слова х ?» можно ответить при помощи «остенсивного» определения - путем показывания или иного непосредственного указания на референт (или референты) данного слова (ср. § 9.2.7). С точным определением понятия «референции» связаны известные философские трудности, которые здесь можно не рассматривать. Будем считать, что отношение референции (иногда именуемое «денотацией») должно обязательно учитываться при построении любой удовлетворительной теории семантики; иными словами, в определенном смысле можно говорить, что по крайней мере некоторые единицы словаря во всех языках могут быть поставлены в соответствие тем или иным «свойствам» физического мира.

Принятое нами допущение не означает, что мы рассматриваем референцию как семантическое отношение, к которому могут быть сведены все другие отношения; не имеется в виду и то, что все словарные единицы языка обладают референцией. «Референция», как она понимается в настоящей работе, необходимо связана с исходными предположениями о «существовании» (или «реальности»), которые выводятся из нашего непосредственного восприятия объектов физического мира. Когда говорят, что конкретное слово (или другая единица, обладающая значением) «соотносится с некоторым объектом», подразумевают, что референт слова является объектом, который «существует» (является «реальным») в том же самом смысле, в каком мы говорим, что «существуют» конкретные люди, животные и вещи; подразумевается также, что в принципе можно было бы дать описание физических свойств рассматриваемого объекта. Это понятие «физического существования» может считаться фундаментальным для определения семантического отношения референции. Применение терминов «существование» и «референция» может быть тогда расширено несколькими способами. Например, хотя на свете нет таких объектов, как домовые, единороги или кентавры (таково будет наше допущение), было бы вполне разумно приписать им вымышленное или мифическое «существование» в рассуждениях определенного рода; и поэтому мы можем сказать, что слова goblin "домовой", unicorn "единорог" или centaur "кентавр" обладают референцией в английском языке (в рамках соответствующих рассуждений). Аналогичным образом мы можем расширить применение терминов «существование» и «референция», распространив их на такие теоретические конструкты науки, как атомы, гены и т. д., и даже на совершенно абстрактные объекты. Важно отметить, однако, что источник этих «аналогических» расширений понятий «существование» и «референция» следует искать в их фундаментальном, или первичном, применении к физическим объектам в ходе «повседневного» использования языка.

Из этой интерпретации понятия референции следует, что в словаре языка может быть немало единиц, которые не связаны отношением референции ни с какими сущностями за пределами языка. Например, можно считать, что не существует таких вещей, как ум или доброта, с которыми соотносятся слова intelligent "умный" и good "добрый", хотя психолог или философ всегда может постулировать существование таких сущностей в рамках некоторой конкретной теории психологии или этики и может даже утверждать, что их «реальность» можно продемонстрировать при помощи некоторого вида «остенсивного» определения. Тот факт, что на различных уровнях подобных софистических построений между их авторами могут возникать разногласия по поводу «реальности» тех или иных мнимых «объектов», не меняет общего положения о том, что референция предполагает существование. Было бы тщетно настаивать на том, что все лексические единицы должны с чем-то соотноситься, если при этом иметь в виду, что в определенных случаях нельзя выдвинуть никаких других доказательств существования этого «чего-то», кроме самого факта наличия некоторой лексической единицы, «соотносящейся» с этим «что-то».

В связи с понятием референции можно отметить еще два момента. Соглашаясь с тем, что определенные лексические единицы соотносятся с объектами и свойствами объектов, находящимися вне языка, мы не обязаны с логической неизбежностью приходить к выводу о том, что все объекты, обозначаемые некоторым конкретным словом, образуют «естественный класс» (независимо от «соглашения», молчаливо принимаемого членами данного речевого коллектива с целью подведения этих объектов «под» некоторый общий термин); другими словами, позиция, описанная выше, совместима либо с «номинализмом», либо с «реализмом» в философской семантике. Во-вторых, референция некоторой лексической единицы не обязана быть точной и полностью определенной в том смысле, что всегда ясно, попадает или не попадает конкретный объект или свойство в пределы области, охватываемой данной лексической единицей: мы уже видели, что такое допущение не является обязательным для того, чтобы объяснять «понимание» высказываний в процессе нормальной коммуникации (ср. § 9.2.9). Как раз довольно часто «референциальные границы» лексических единиц являются неопределенными. Например, нельзя указать вполне определенную точку, в которой мы должны провести разграничительную линию между референтами слов hill "холм, возвышенность, пригорок" и mountain "гора", chicken "цыпленок; курочка; молодой петушок; курица; курятина" и hen "курица", green "зеленый" и blue "синий; голубой, лазурный; голубоватый" и т. д. Но это не означает, что понятие референции к таким словам не применимо. Характерной чертой языков является то, что они налагают на реальный мир некоторую лексическую «категоризацию» и как бы проводят в различных местах «произвольные» границы. Как мы увидим, в этом заключается одна из причин того, что часто оказывается невозможным установить лексические эквивалентности между разными языками. Тот факт, что «референциальные границы» являются «произвольными» и неопределенными, обычно не приводит к нарушению взаимопонимания, так как «точное» подведение объекта «под» ту или другую лексическую единицу очень редко бывает релевантным; и когда оно оказывается релевантным, мы обращаемся к другим системам идентификации или спецификации. Например, если мы хотим обозначить одно из двух лиц, каждое из которых могло бы быть названо либо словом girl "девочка", либо словом woman "женщина", мы можем отличать их друг от друга по имени, по относительному возрасту, по цвету волос, по тому, как они одеты и т. д. Хотя референты слова girl «пересекаются» с референтами слова woman, эти два слова не являются синонимичными; их относительное расположение на возрастной шкале фиксировано, и существует много случаев, когда подходящим для использования словом является лишь одно из них. Проиллюстрированная нами «неточность» референции, вовсе не являясь дефектом языка (как думают некоторые философы), делает язык более эффективным средством общения. Абсолютная «точность» недостижима, так как не существует предела для числа и природы разграничений, которые можно было бы провести между разными объектами; и вряд ли есть какие-либо достоинства в том, чтобы насильственно проводить большее число разграничений, чем это необходимо для имеющихся на сегодняшний день целей.

9.4.2. СМЫСЛ (SENSE)

Теперь мы должны ввести понятие «смысла». Под смыслом слова имеется в виду его место в системе отношений, в которые оно вступает с другими словами в словарном составе языка. Ясно, что, поскольку смысл должен определяться в терминах отношений, которые имеют место между единицами словаря, то он не несет в себе никаких исходных допущений о существовании объектов или свойств за пределами словаря рассматриваемого языка.

Если два элемента могут встречаться в одном и том же контексте, то они обладают значением в этом контексте; и далее, мы можем задаться вопросом о том, какое значение они имеют. Как мы видели, одна часть, или компонент, значения определенных элементов может описываться в терминах их референции. Независимо от того, обладают ли два элемента референцией или нет, мы можем задаться вопросом о том, обладают ли они в контексте, или контекстах, где оба встречаются, одним и тем же значением или нет. Так как одинаковость значения - синонимия - есть отношение, которое имеет место между двумя (или более) словарными единицами, она связана со смыслом, а не с референцией. По причинам, которые нам нет необходимости здесь рассматривать, иногда может оказаться удобным говорить, что две единицы обладают одинаковой референцией, но различаются по смыслу; и, конечно, естественно говорить, что единицы могут быть синонимичными, даже если они лишены референции. Можно предположить, что (для единиц, обладающих референцией) тождественность референции является необходимым, но не достаточным условием синонимии.

Теоретическое рассмотрение синонимии часто носит неадекватный характер из-за двух неоправданных допущений. Первое из них состоит в том, что два элемента не могут быть «абсолютно синонимичными» в одном контексте, если только они не синонимичны во всех контекстах. Данный вывод иногда обосновывают ссылкой на разграничение между «понятийным» и «эмоциональным» значением. Но это разграничение само нуждается в обосновании. Нельзя отрицать, что выбор конкретным говорящим одной единицы, а не другой обусловливается «эмоциональными ассоциациями». Однако это не значит, что «эмоциональные ассоциации» всегда релевантны (даже если они являются общими для всех членов речевого коллектива). И нельзя просто относить к числу предпосылок утверждение, что слова всегда несут в себе «ассоциации», выводимые из их употребления в других контекстах. Поэтому мы отвергнем допущение о том, что слова не могут быть синонимичными в отдельных контекстах, если они не синонимичны во всех контекстах.

Второе допущение, которое часто делается специалистами по семантике, состоит в том, что синонимия есть отношение тождественности, имеющее место между двумя (или более) независимо определяемыми смыслами. Другими словами, вопрос о том, являются ли два слова - а и b - синонимичными, сводится к вопросу о том, обозначают ли а и b одну и ту же сущность, один и тот же их смысл. В рамках того подхода к семантике, который мы намечаем в настоящей книге, не нужно будет постулировать существование независимо определяемых смыслов. Синонимия будет определяться следующим образом: две (или более) единицы синонимичны, если предложения, получающиеся в результате подстановки одной единицы на место другой, обладают одним и тем же значением. Это определение явным образом основывается на априорном понятии «одинаковости значения» для предложений (и высказываний). Мы еще вернемся к этому вопросу. Здесь мы хотим лишь подчеркнуть ту мысль, что отношение синонимии определяется как отношение, имеющее место между лексическими единицами, а не между их смыслами. Синонимия лексических единиц - это часть их смысла. Ту же идею можно сформулировать в более общей форме: то, что мы называем смыслом лексической единицы, представляет собой все множество смысловых отношений (включая синонимию), в которые она вступает с другими единицами в словарном составе языка.

9.4.3. ПАРАДИГМАТИЧЕСКИЕ И СИНТАГМАТИЧЕСКИЕ СМЫСЛОВЫЕ ОТНОШЕНИЯ

Помимо синонимии, существует много других смысловых отношений. Например, husband "муж" и wife "жена" не синонимичны, но они семантически связаны таким отношением, которое не имеет места между husband и cheese "сыр" или hydrogen "водород"; good "хороший" и bad "плохой" различны по смыслу, но являются более близкими, чем good и red "красный" или round "круглый"; knock "стучать; ударять", bang "ударять, стучать; хлопать; грохотать", tap "легко ударять, стукать" и rap "слегка ударять; стучать, постукивать" связаны отношением, которое не применимо к словам knock и eat "есть, кушать" или admire "восхищаться". Проиллюстрированные здесь отношения являются парадигматическими (все члены множеств семантически связанных терминов могут встретиться в одном и том же контексте). Слова могут быть также связаны друг с другом синтагматически ; ср.: blond "белокурый" и hair "волосы", bark "лаять" и dog "собака", kick "ударять ногой, давать пинок, лягать" и foot "нога" и т. д. (Общие принципы разграничения парадигматических и синтагматических отношений см. в § 2.3.3.) Мы не будем рассматривать здесь вопрос о том, могут ли эти синтагматические и парадигматические отношения (как предлагают некоторые специалисты по семантике) быть определены с точки зрения их «расстояния» от синонимии на шкале одинаковости и различия смысла: подход, альтернативный этому, будет описан в следующей главе. Здесь мы просто делаем допущение, что по крайней мере некоторые области словаря разделяются на лексические системы и что семантическая структура этих систем должна описываться в терминах смысловых отношений, имеющих место между лексическими единицами. Это утверждение рассматривается нами как уточненная формулировка принципа, согласно которому «значение каждой единицы есть функция от места, занимаемого ею в соответствующей системе» (ср. § 2.2.1, где сравниваются русские и английские термины родства).

В последние годы проведена большая работа по исследованию лексических систем в словарном составе различных языков, особенно применительно к таким полям (или областям ), как родство, цвет, флора и фауна, вес и меры, воинские звания, моральные и эстетические оценки, а также различные виды знания, умения и понимания. Полученные результаты еще раз продемонстрировали ценность структурного подхода к семантике и подтвердили предсказания таких ученых, как Гумбольдт, Соссюр и Сепир, относительно того, что словари разных языков (по крайней мере, в определенных полях) не изоморфны , что существуют семантические разграничения, проводимые в одном языке и не проводимые в другом; более того, что категоризация конкретных полей разными языками может проводиться различным образом. Выражая этот факт в соссюровских терминах, говорят, что каждый язык налагает специфическую форму на априорную недифференцированную субстанцию плана содержания (ср. § 2.2.2 и § 2.2.3). Для иллюстрации этого понятия можно взять (в качестве субстанции) поле цвета и посмотреть, как это понятие трактуется, или «оформляется», в английском языке.

Для простоты мы рассмотрим прежде всего только ту часть поля, которая покрывается словами red "красный", orange "оранжевый", yellow "желтый", green "зеленый" и blue "синий; голубой, лазурный; голубоватый". Каждый из этих терминов с референци-альной точки зрения является неточным, но их относительное положение в этой лексической системе фиксировано (и в целом они покрывают большую часть видимого спектра): orange находится между red и yellow, yellow - между orange и green и т. д. Смысл каждого из этих слов включает указание на то, что они принадлежат данной конкретной лексической системе английского языка и что в этой системе они находятся друг с другом в отношениях смежности (или, возможно, более точно, «нахождения между»). Может показаться, что понятие смысла является здесь излишним и что для описания их значения вполне достаточно было бы учесть референцию каждого из цветообозначений. Рассмотрим, однако, условия, при которых человек может узнать (или можно считать, что он знает) референцию этих слов. Ребенок, овладевающий английским языком, не может овладеть сначала референцией слова green, а затем, поочередно, референцией слова blue или yellow, так, чтобы в конкретный момент времени можно было бы сказать, что он знает референцию одного слова, но не знает референцию другого. (Конечно, при помощи остенсивного способа определения он мог бы узнать, что слово green соотносится с цветом травы или листьев какого-то конкретного дерева или с цветом одного из платьев его матери: но ведь референция слова green шире, чем любой конкретный случай его употребления, и знание его референции включает также знание границ этой референции.) Следует предположить, что на протяжении определенного периода времени ребенок постепенно узнает позицию слова green относительно слов blue и yellow, а слова yellow - относительно слов green и orange и т. д. до тех пор, пока он не узнает позиций каждого цветообозначения относительно его соседа в данной лексической системе и приблизительного прохождения границ той области в континууме данного поля, которая покрывается каждым словом. Его знание значения цветовых терминов необходимо включает в себя, таким образом, и знание как их смысла, так и их референции.

Поле, покрываемое рассмотренными выше пятью цветообозначениями, можно представить себе как недифференцированную (перцептуальную или физическую) субстанцию, на которую английский язык налагает некоторую конкретную форму путем проведения в определенных местах границ, а к полученным таким образом пяти областям применяет определенную лексическую классификацию (называя их словами red, orange, yellow, green и blue). Часто отмечается, что другие языки налагают другую форму на эту субстанцию, то есть признают в ней другое число областей и проводят границы в других местах. О приведенном выше примере можно сказать, что русские слова синий и голубой вместе покрывают приблизительно ту же область, что и английское слово blue; обозначая особые, хотя и смежные цвета и занимая в системе равноправное положение со словами зеленый и желтый , они не должны рассматриваться как слова, которые обозначают различные оттенки одного цвета подобно тому, как crimson "малиновый" и scarlet "алый; багровый" вместе с другими словами подразделяют область, покрываемую словом red в английском языке (ср. § 2.2.3).

Отношение между цветовыми терминами и их значением нельзя представлять себе так прямолинейно, как мы это до сих пор делали. Различие в референции слов red, orange, yellow, green и blue может быть описано в терминах варьирования тона (отражения света с разной длиной волны). Физики различают еще две другие переменные при анализе цвета: светлость , или яркость (отражение большего или меньшего количества света), и насыщенность (степень свободы от примеси белого цвета). Цветовые области, обозначаемые в английском языке словами black "черный", grey "серый" и white "белый", различаются главным образом по светлости, но референция некоторых других широко употребительных цветообозначений должна задаваться с учетом всех трех измерений, по которым может варьироваться цвет, например: brown "коричневый" соотносится с цветовым диапазоном, который располагается по тону между red "красный" и yellow "желтый", обладает относительно низкой светлостью и насыщенностью; pink "розовый" соотносится с цветом, который по тону является красноватым, обладает довольно высокой светлостью и весьма низкой насыщенностью. Анализ этих фактов может натолкнуть на мысль, что субстанция тля цвета является трехмерным (физическим или перцептуальным) континуумом.

Но и это утверждение представляется чересчур упрощенным. Дело не только в том, что языки различаются по относительному весу, который они придают измерениям - тону, светлости и насыщенности - в организации своих систем цветообозначений (например, для латинского и греческого языков, видимо, важнее была светлость, чем тон); существуют языки, в которых цветовые разграничения проводятся на основе совершенно иных принципов. В своем классическом исследовании на эту тему Конклин показал, что четыре главных «цветообозначения» языка ханунoо (языка, бытующего на Филиппинах) связаны с освещенностью (включающей обычно белый цвет и легкие оттенки других «английских цветов»), темнотой (включающей английские черный, фиолетовый, синий, темно-зеленый и темные оттенки других цветов), «влажностью» (обычно связанной со светло-зеленым, желтым и светло-коричневым и т. д.) и «сухостью» (обычно связанной с темно-бордовым, красным, оранжевым и т. д.). То, что разграничение между «влажностью» и «сухостью» не сводится просто к тону («зеленый» vs . «красный»: именно это разграничение может броситься в глаза, если основываться на самых частых английских переводах двух рассматриваемых терминов), становится ясным из того факта, что «блестящая, влажная, коричневая часть свежесрезанного бамбука» описывается словом, которое обычно употребляется для светло-зеленого цвета, и т. д. Конклин приходит к выводу, что «цвет, в точном смысле этого слова, для западноевропейских языков не является универсальным понятием»; что противопоставления, в терминах которых определяется субстанция цвета в различных языках, могут зависеть в первую очередь от связи лексических единиц с теми свойствами объектов в естественном окружении человека, которые важны для данной культуры. Что касается языка ханунбо, то система его определений, видимо, отталкивается от типичного вида свежих, молодых («влажных», «сочных») растений. В связи с этим стоит заметить, что словари английского языка часто определяют основные цветообозначения относительно типичных свойств окружающей человека среды (например, в словаре может быть сказано, что blue соотносится с цветом ясного неба, red - с цветом крови и т. д.).

9.4.6. СЕМАНТИЧЕСКАЯ «ОТНОСИТЕЛЬНОСТЬ»

Поле цвета было рассмотрено нами довольно подробно потому, что оно очень часто используется в качестве примера для демонстрации того, как одна и та же субстанция может иметь различную форму, налагаемую на нее различными языками. Теперь мы знаем, что даже в случае цветообозначения у нас есть все основания сомневаться в возможности априорного постулирования тождественности «субстанции содержания». Описанные Конклином категории «цвета» в ханунoо должны, естественно, натолкнуть нас на мысль, что релевантными для языка определениями субстанции цвета вряд ли всегда нужно считать именно те измерения, которые избираются в качестве основных естественными науками. Отсюда следует общий вывод о том, что язык конкретного общества является составной частью его культуры и что лексические разграничения, проводимые каждым языком, обычно отражают важные (с точки зрения этой культуры) свойства объектов, установлений и видов деятельности того общества, в котором функционирует язык. Этот вывод находит подтверждение в целом ряде недавних исследований различных полей в словарном составе разных языков. Ввиду того что природное окружение различных обществ может быть самым разным (не говоря уже об их социальных установлениях и моделях поведения), представляется весьма сомнительной сама возможность плодотворного рассмотрения семантической структуры как результата наложения формы на лежащую в ее основе (перцептуальную, физическую или концептуальную) субстанцию, общую всем языкам. Как сказал Сепир: «Миры, в которых живут разные общества, суть особые миры, а не один и тот же мир с прикрепленными к нему разными ярлыками».

Даже если допустить, что разные общества живут в «особых мирах» (а мы скоро вернемся к этому вопросу), все равно можно утверждать, что каждый язык налагает некоторую конкретную форму на субстанцию того «мира», в котором он функционирует. В определенной степени это верно (как мы видели, например, в случае цветообозначений). Важно, однако, отдавать себе отчет в том, что лексические системы вовсе не обязаны строиться на базе заранее заданной «лежащей в их основе» субстанции. Пусть, например, слова honesty "честность, правдивость, искренность, прямодушие, целомудрие, добродетель, порядочность", sincerity "искренность, чистосердечие, прямота, честность", chastity "целомудрие, девственность, непорочность, чистота, добродетельность, строгость, простота, скромность, сдержанность, воздержание, воздержанность", fidelity "верность, преданность, лояльность, точность, правильность" и т. д. попадают в одну лексическую систему со словом virtue "добродетель, нравственность, целомудрие, хорошее качество, положительная черта, достоинство". Структура этой системы может быть описана в терминах смысловых отношений, имеющих место между ее членами. С этой точки зрения, вопрос о том, наблюдаются ли какие-то «субстанциальные» корреляции между лексическими единицами и поддающимися выделению чертами характера или моделями поведения, является несущественным. Если подобные корреляции наблюдаются, то они будут описываться в терминах референции, а не смысла. Коротко говоря, применимость понятия субстанции в семантике определяется тем же самым постулатом «существования», что и понятие референции (ср. § 9.4.1).

Утверждение о том, что «миры, в которых живут разные общества, суть особые миры», часто трактуют как прокламацию лингвистического «детерминизма». Считал ли Сепир (или Гумбольдт до него и Уорф после него), что наша категоризация мира всецело определяется структурой нашего родного языка, - этот вопрос мы здесь обсуждать не будем. Большинство ученых сходится в том, что лингвистический детерминизм, понимаемый в этом сильном смысле, является несостоятельной гипотезой. Однако принятый выше взгляд, согласно которому языки отражают в своем словаре разграничения, важные с точки зрения культуры тех обществ, в которых они функционируют, отчасти склоняет нас к позиции лингвистической и культурной «относительности». Поэтому мы должны подчеркнуть тот неоспоримый факт, что постижение структуры лексических систем в языках, отличных от нашего родного, необходимо и вполне возможно как при усвоении их с практическими целями, так и при исследовании их словарного состава. Именно от этого зависит, очевидно, возможность перевода с одного языка на другой.

9.4.7. СОВПАДЕНИЕ КУЛЬТУР

Культуры (в том смысле, в каком этот термин используется антропологами и социологами) не находятся во взаимнооднозначном соответствии с языками. Например, многие из установлений, обычаев, предметов одежды, мебели, пищи и т. д., имеющие место во Франции и в Германии, мы наблюдаем также в Англии; другие же оказываются характерными для отдельных стран либо для определенных областей или социальных классов одной страны. (Отношение между языком и культурой является, конечно, гораздо более сложным, чем следует из этого упрощенного изложения: политические границы не совпадают с языковыми границами, даже если мы без доказательства сочтем в какой-то мере правомерным понятие унифицированного речевого коллектива; культурные сходства могут быть обнаружены между различными социальными группами в разных странах и т. д.). В общем же случае можно утверждать, что между любыми двумя обществами будет наблюдаться большая или меньшая степень совпадения культур ; и может оказаться, что определенные черты будут наличествовать в культуре всех обществ. Практический опыт изучения иностранных языков (в тех нормальных условиях, в которых эти языки используются) говорит о том, что мы быстро отождествляем те или иные объекты, ситуации и признаки при совпадении культур и без труда выучиваем применяемые к ним слова и выражения. Значения же других слов и выражений усваиваются с меньшей легкостью, и их правильное употребление приходит, если оно вообще приходит, лишь в результате длительной разговорной практики. Теоретическая интерпретация этих фактов нашего опыта может быть такова: вход в семантическую структуру другого языка открывается из области совпадения культур; и как только мы однажды разорвали этот круг значений, отождествив единицы в этой области (ср. § 9.4.7, о неизбежном «круговом» характере семантики), мы можем постепенно совершенствовать и уточнять наше знание остальной части словаря изнутри, путем усвоения референции лексических единиц и смысловых отношений, связывающих единицы в контекстах их употребления. Истинный билингвизм предполагает усвоение двух культур.

9.4.8. «ПРИМЕНЕНИЕ»

Если единицы разных языков могут быть поставлены в соответствие друг другу на основе отождествления общих признаков и ситуаций двух культур, мы можем сказать, что эти единицы имеют одинаковое применение . Причина использования этого термина вместо термина «референция» связана с двумя соображениями. Прежде всего, предлагаемый термин обозначает отношение, имеющее место между ситуациями и выражениями, которые в этих ситуациях встречаются (например, отношение между Excuse me "Извините меня", Thank you "Спасибо" и т. д. и различными характерными ситуациями, в которых эти высказывания встречаются); это, очевидно, не отношение референции. Во-вторых, необходимо также учесть семантическое отождествление лексических единиц, не имеющих референции; желательно говорить, например, что английское слово sin "грех" и французское слово peche имеют одинаковое применение, хотя установить этот факт с референциальной точки зрения могло бы оказаться весьма затруднительным или даже невозможным делом. Вполне может случиться, что вторая из этих причин для введения понятия «применения» отпадет после построения исчерпывающей и удовлетворительной теории культуры. В настоящее время трактовка применения, подобно процессу перевода, весьма основательно зависит от интуиции двуязычных говорящих. Это не означает, что данное понятие не имеет никакого объективного содержания, ибо двуязычные говорящие обычно соглашаются между собой по поводу применения большинства слов и выражений в языках, которыми они пользуются.

В этом разделе ничего не было сказано о том, как устанавливаются парадигматические и синтагматические смысловые отношения. Прежде чем обратиться к этому вопросу, мы должны рассмотреть возможность распространения понятий референции и смысла также и на грамматические единицы.

9.5. «ЛЕКСИЧЕСКОЕ» ЗНАЧЕНИЕ И «ГРАММАТИЧЕСКОЕ» ЗНАЧЕНИЕ

9.5.1. «СТРУКТУРНЫЕ ЗНАЧЕНИЯ»

Рассматривая вопрос о «грамматических категориях», мы ссылались на традиционную, «аристотелевскую» точку зрения, согласно которой только главные части речи (существительные, глаголы, «прилагательные» и наречия) являются «значимыми» в полном смысле этого термина (они «обозначают» «понятия», которые составляют «содержание» рассуждения («matter» of discourse)), а остальные части речи участвуют в образовании совокупного значения предложений, налагая на «содержание» рассуждения определенную грамматическую «форму» (ср. § 7.1.3). Удивительно похожие взгляды отстаивают и многие оппоненты традиционной грамматики.

Например, Фриз разграничивает «лексические» и «структурные» значения, и это противопоставление точно отражает «аристотелевское» разграничение «материального» и «формального» значений. Главные части речи имеют «лексическое» значение; и оно дается в словаре, который связан с определенной грамматикой. Напротив, различие между субъектом и объектом в предложении, оппозиции по определенности, времени и числу, а также различие между утверждениями, вопросами и просьбами - все эти различия относятся к «структурным значениям». («Совокупное лингвистическое значение любого высказывания состоит из лексических значений отдельных слов плюс такие структурные значения... Грамматику языка составляют средства сигнализации структурных значений».)

Понятие «структурного значения» у Фриза включает по крайней мере три различных вида семантической функции; другие лингвисты в том же самом смысле употребляют термин «грамматическое значение» (противопоставленное «лексическому значению»). Три упомянутых вида «значения» таковы: (1) «значение» грамматических единиц (обычно служебные части речи и вторичные грамматические категории); (2) «значение» таких грамматических «функций», как «субъект», «объект» или «модификатор»; (3) «значение», связанное с такими понятиями, как «повествовательное», «вопросительное» или «повелительное», при классификации различных типов предложений. Эти виды «грамматического значения» важно различать, и мы их поочередно рассмотрим ниже.

9.5.2. ЛЕКСИЧЕСКИЕ И ГРАММАТИЧЕСКИЕ ЕДИНИЦЫ

Для разграничения грамматических и лексических единиц предлагались различные критерии. Наиболее удовлетворительный из них (и единственный, который мы здесь упомянем) был сформулирован Мартине, Холлидеем и другими в терминах парадигматической оппозиции в пределах либо закрытых , либо открытых множеств альтернатив. Закрытое множество единиц - это множество с фиксированным и обычно небольшим числом членов, например множество личных местоимений, времен, родов и т. д. Открытое множество - это множество с неограниченным, неопределенно большим числом членов, например класс существительных или глаголов в языке. Используя это разграничение, мы можем сказать, что грамматические единицы принадлежат к закрытым множествам, а лексические единицы - к открытым множествам. Это определение соответствует традиционному разграничению между знаменательными частями речи, с одной стороны, и служебными частями речи и вторичными грамматическими категориями - с другой. В отличие от некоторых других предлагавшихся определений, оно не привязано к языкам одного морфологического «типа» (например, к «флективным» языкам; ср. § 5.3.6). Будем пока считать, что данное определение является верным и что (на базе разграничения между закрытыми и открытыми множествами) все элементы, вводимые в глубинную структуру предложений, можно классифицировать на «грамматические» и «лексические». Теперь возникает вопрос, существует ли в принципе какое-либо различие между значением грамматических и лексических единиц.

Во-первых, заметим, что лексические единицы, согласно традиционному взгляду, обладают как «лексическим», так и «грамматическим» значением (как «материальным», так и «формальным» значением; ср. §9.5.1). Пользуясь терминологией схоластической, «спекулятивной» грамматики, можно сказать, что конкретная лексическая единица, например cow "корова", не просто «обозначает» некоторое конкретное «понятие» (в этом состоит «материальное», или «лексическое», значение рассматриваемой единицы), но при этом реализует определенный «способ обозначения» явлений в виде, например, «субстанций», «качеств», «действий» и т. д. (ср. § 1.2.7 и § 7.1.1). Хотя теперь лингвисты редко изъясняются с помощью этих терминов, указанная общая концепция различия между «лексическим» и «грамматическим» значением лексических единиц все еще в ходу. Более того, она представляется в определенной степени обоснованной.

Например, у Лермонтова есть широко известное стихотворение, которое начинается словами: Белеет парус одинокий ... Эту фразу трудно (а быть может, и вообще невозможно) перевести на английский язык, потому что ее воздействие зависит от того факта, что в русском языке «обладание свойством белого» может быть «выражено» с помощью «глагола» (то же выражается и словом белый , которое в предложениях, не маркированных по времени, виду и модальности, употребляется обычно без «глагола быть»; ср. § 7.6.3). Сочетание парус одинокий может быть переведено на английский язык как "a lonely sail" (парус - существительное, а одинокий - «прилагательное»). С традиционной точки зрения «глагол» представляет «обладание свойством белого» как «процесс» или «деятельность», «прилагательное» - как «качество» или «состояние». Специфика предпочтительного выбора в данном случае «глагола», а не «прилагательного» может быть показана средствами английского языка лишь с помощью довольно неадекватной парафразы типа "There is a lonely sail which stands out (или даже shines forth) white (against the background of the sea or sky)..." Проблемы такого рода хорошо известны тем, кто занимается переводом с одного языка на другой. Нас здесь интересует теоретический вопрос: можно ли сказать, что существует определенное «грамматическое значение», связанное с каждой из главных частей речи?

Мы уже видели, что различие между «глаголом» и «прилагательным» в общей синтаксической теории представляет собой сложную проблему: в некоторых языках вообще не проводится такого различия; в других языках с этим разграничением связан целый ряд синтаксических признаков, и в определенных случаях они могут противоречить друг другу (ср. § 7.6.4). Но главный критерий, критерий, отражающий традиционное разграничение между «деятельностью» и «качеством», заключается в видовом разграничении между «динамическим» и «статическим» (ср. § 8.4.7). В русском языке это различие в «грамматическом значении» «налагается» на «лексическое значение», которое является общим как для «глагола» белеть , так и для «прилагательного» белый . При таком подходе традиционная теория «способов обозначения» должна быть признана верной: конечно, она должна быть переформулирована в рамках более удовлетворительной теории синтаксической структуры.

В то же время мы не должны терять из виду общий принцип, согласно которому «обладание значением подразумевает выбор». Если описываемый язык дает возможность выбора либо «глагольного», либо «адъективного» выражения (мы ограничиваемся различием, которое иллюстрируется в нашем примере), то употребление того или другого из этих способов уже относится к сфере семантического анализа языка. Мы можем, далее, задаться вопросом, обладают ли данные два «способа» выражения одинаковым значением или нет; и, если они различаются по значению, тогда мы можем спросить, в чем состоит семантическое различие между ними. Если это различие может быть соотнесено с каким-либо грамматическим разграничением в глубинной структуре (например, «динамическое» vs . «статическое»), то термин «грамматическое значение» является вполне подходящим для этого случая. Но это не значит, что выбор «глагола», а не «прилагательного» всегда связан с различием «грамматического значения». Во многих случаях конкретное «лексическое значение» связывается с одной, но не с другой частью речи. Короче говоря, в этом вопросе, так же как и во многих других, лингвистическая теория должна установить равновесие между «понятийной» и «формальной» грамматикой (ср. § 7.6.1). Не следует утверждать, что «обозначение деятельности» есть часть «значения» всякого «глагола» или что «обозначение качества» - это часть «значения» всякого «прилагательного».

Традиционно считается, что лексические единицы обладают как «лексическим» («вещественным»), так и «грамматическим» («формальным») значением. Грамматические же единицы, как обычно считают, обладают только «грамматическим» значением. В предыдущей главе мы видели, что некоторые единицы, выступая в поверхностной структуре предложений как «глаголы», могут интерпретироваться как «лексические реализации» видовых, каузативных и других «грамматических» различий. Мы оставим в стороне вопрос о том, насколько эти гипотезы соответствуют действительности. При нынешнем состоянии синтаксической теории разграничение между грамматическими и лексическими единицами является довольно неопределенным. Причина состоит-в том, что разграничение между открытыми и закрытыми множествами альтернатив может применяться только по отношению к позициям выбора в глубинной структуре предложений; но, как мы видели, возможны весьма различные точки зрения на то, где же все-таки располагаются эти позиции «выбора».

Главная мысль, которую здесь следует подчеркнуть, сводится к следующему: по-видимому, нет существенного различия между «видом значения», ассоциируемого с лексическими единицами, и «видом значения», ассоциируемого с грамматическими единицами в тех случаях, когда эти два класса элементов глубинной структуры могут быть ясно разграничены. Понятия «смысла» и «референции» применимы к обоим видам элементов. Если и существует какое-либо обобщение, которое можно сделать относительно значения грамматических элементов (а некоторые чисто грамматические элементы, как мы помним, вовсе не обладают значением; ср. §8.4.1), то оно, видимо, будет состоять в том, что грамматические «выборы» связаны с общими понятиями пространственной и временной соотнесенности, каузации, процесса, индивидуализации и т. д., - понятиями того типа, который рассматривался в главах 7 и 8. Однако мы не можем утверждать заранее, что в структуре какого-то конкретного языка подобные понятия, даже если их легко выделить, будут обязательно «грамматикализованы», а не «лексикализованы».

9.5.3. «ЗНАЧЕНИЕ» ГРАММАТИЧЕСКИХ «ФУНКЦИЙ»

Второй класс явлений в структуре английского языка, к которому Фриз (и другие) применяли термин «структурное значение» (или «грамматическое значение»), может быть проиллюстрирован при помощи таких понятий, как «субъект», «объект» и «определение». Книга Фриза была написана до создания современной теории трансформационного синтаксиса, и он рассматривал исключительно поверхностную структуру (в рамках довольно ограниченной концепции). Поэтому многое из того, что он говорит об этих «функциональных» понятиях, хотя и является верным, однако вряд ли имеет отношение к семантическому анализу. То же самое можно сказать и о большинстве современных лингвистических теорий.

Совершенно ясно, что некоторые грамматические отношения, имеющие место на уровне глубинной структуры между лексическими единицами и сочетаниями лексических единиц, релевантны для семантического анализа предложений. По Хомскому, именно «функциональные» понятия «субъект», «прямой объект», «предикат» и «главный глагол» составляют основные глубинные отношения между лексическими единицами; Катц, Фодор и Постал попытались недавно формализовать теорию семантики с помощью множества «проекционных правил», оперирующих лексическими единицами, которые связаны этими отношениями в пределах предложений (ср. § 10.5.4). Такие понятия, как «субъект», «предикат» и «объект», рассматривались в предыдущей главе; и мы видели, что их формализация в общей синтаксической теории вовсе не столь очевидна, как это предполагал Хомский. Отсюда следует, что статус «проекционных правил», интерпретирующих предложения на базе этих понятий, тоже представляется сомнительным.

Рассматривая «переходность» и «эргативность», мы указывали, что многие «прямые объекты» английских предложений могли бы быть порождены путем вставления одноместных конструкций в качестве «предикатов» двухместных конструкций и путем введения нового «агентивного» субъекта. Но мы видели также, что существуют другие двухместные переходные конструкции, которые не могут порождаться удовлетворительным образом по данной схеме. Уже один этот факт говорит о том, что отношение «прямой объект» не может получить одну-единственную интерпретацию при семантическом анализе предложений. В традиционной грамматике различалось много разных видов «прямого объекта». Один из них может быть упомянут здесь, так как (независимо от его статуса в теории синтаксиса) он, несомненно, очень важен в семантике. Мы имеем в виду «объект результата» (или «эффекта»).

«Объект результата» можно проиллюстрировать на примере двух следующих предложений:

(1) Не is reading a book "Он читает книгу".

(1) Не is writing a book "Он пишет книгу".

Книга, упомянутая в предложении (1), существует до и независимо от того, что ее читают, но книга, обозначенная в предложении (2), еще не существует - она возникает после завершения деятельности, описываемой в этом предложении. Благодаря этому различию, the book в (1) традиционно рассматривается как «обычный» объект глагола is reading, тогда как the book в (2) описывается как «объект результата». С семантической точки зрения любой глагол, имеющий при себе «объект результата», вполне может быть назван «экзистенциальным каузативом». Самый распространенный «глагол» в английском языке, попадающий в этот класс, - это make "делать", и мы уже указывали, что он является также «каузативным вспомогательным глаголом» (ср. § 8.3.6 и § 8.4.7). Этот же самый «глагол» выступает, как и глагол do "делать", в роли «глагола-заместителя» в вопросительных предложениях. Вопрос типа What are you doing? "Что вы делаете?" несет в себе меньше пресуппозиций о «предикате» того предложения, которое служит ответом на вопрос (глагол может быть переходным или непереходным, но он должен быть глаголом «действия»; ср. § 7.6.4). Вопрос What are you making? "Что вы делаете?", наоборот, предполагает, что соответствующая «деятельность» является «результативной» и имеет в качестве своей цели или предела «экзистенцию» («существование») некоторого «объекта». В ряде европейских языков это различие выступает, правда, не столь явно, как в английском. (Например, во французском языке Qu"est-ce que tu fais? может быть переведено на английский либо как "What are you doing?", либо как "What are you making?"). Но это не значит, что для данных языков различие между «обычными» объектами и «объектами результата» нерелевантно.

Важность понятия «экзистенциального каузатива» обусловлена тем фактом, что в предложениях, содержащих конструкцию с «объектом результата», часто наблюдается высокая степень взаимозависимости между конкретным глаголом или классом глаголов и конкретным существительным или классом существительных. Например, нельзя дать удовлетворительный семантический анализ существительного picture "картина" без выявления его синтагматических связей с такими глаголами, как paint "красить, рисовать, писать" и draw "чертить, рисовать"; и наоборот, тот факт, что эти глаголы могут иметь в качестве своего «объекта результата» существительное picture, должен быть учтен как часть их значения.

Это понятие синтагматической взаимозависимости, или пресуппозиции, играет значительную роль при анализе лексики любого языка (ср. § 9.4.3). Оно имеет гораздо более широкую применимость, чем могут показать наши примеры. Существуют пресуппозиции, имеющие место между конкретными классами существительных и глаголов, когда существительное является субъектом при глаголе (например, bird "птица" : fly "летать", fish "рыба" : swim "плавать"); между «прилагательными» и существительными (blond "белокурый" : hair "волосы", addled "тухлый" : egg "яйцо"); между глаголами и «обычными» объектами (drive "водить" : саг "автомобиль"); между глаголами и существительными, состоящими с ними в «инструментальных» отношениях (bite "кусать" : teeth "зубы", kick "поддать" : foot "нога, ступня") и т. д. Многие из этих отношений между конкретными классами лексических единиц нельзя сформулировать иначе, кроме как с помощью некоторого набора «проекционных правил» (правил ad hoc) в рамках трансформационного синтаксиса, намеченного Хомским.

Ввиду того, что пока еще не существует вполне удовлетворительной синтаксической основы, в рамках которой можно было бы формулировать разнообразные смысловые отношения, служащие средством структурирования словарного состава языков, мы не будем пытаться формулировать наборы «проекционных правил», оперирующих глубинными грамматическими отношениями. В следующей главе мы рассмотрим несколько особенно важных парадигматических отношений между классами лексических единиц; их анализ будет вестись неформальным путем. По нашему допущению эти отношения могли бы быть сформулированы более изящным образом в терминах некоторого более удовлетворительного описания грамматических отношений на уровне глубинной структуры.

9.5.4. «ЗНАЧЕНИЕ» «ТИПОВ ПРЕДЛОЖЕНИЙ»

Третий класс «значений», которые обычно считаются «грамматическими», может быть проиллюстрирован на примере различия между «повествовательными», «вопросительными» и «повелительными» предложениями. В недавних работах по трансформационной теории наблюдается тенденция вводить в глубинные НС-структуры предложений такие грамматические элементы, как «маркер вопросительности» и «маркер повелительности», а затем формулировать правила трансформационного компонента таким образом, что присутствие одного из этих «маркеров» будет «включать» соответствующее трансформационное правило. Мы не рассматриваем здесь синтаксические преимущества этой формулировки разграничения между разными «типами предложений», нас интересует ее семантическая сущность.

Было высказано мнение (Катцем и Посталом), что эти «маркеры» с семантической точки зрения подобны лексическим и грамматическим элементам, которые встречаются в качестве составляющих в ядрах предложений. Например, «маркер повелительности» записывается в словаре и снабжается указанием, «которое характеризует его как имеющий примерно следующий смысл: "говорящий обращается с просьбой (просит, требует, настаивает и т. д.), чтобы"». Но это мнение основано на путанице в употреблении термина «значение». Оно обходит те противоречия, которые возникают в связи с проводимыми в семантике разграничениями между «смыслом», «референцией» и другими видами «значений». Если мы будем продолжать употреблять термин «значение» для всех видов различаемых семантических функций, то можно с полным основанием сказать, что между соответствующими заявлениями, вопросами и командами имеются различия в «значении» (которые не обязательно «выражаются» повествовательными, вопросительными и повелительными предложениями, соответственно, - но для простоты мы игнорируем этот факт). Однако вопрос о том, имеют ли две лексические единицы «одно и то же значение» или нет, обычно интерпретируется относительно понятия синонимии - одинаковости смысла. Это - парадигматическое отношение, то есть отношение, которое либо имеет место, либо не имеет места между единицами, встречающимися в одном и том же контексте, в одном и том же «типе предложения». В следующей главе мы увидим, что понятие «синонимии» между х и у может быть описано с точки зрения множества импликаций, «вытекающих» из двух предложений, которые различаются только тем, что на месте, где в одном случае стоит х , в другом - стоит у . Но эти соображения просто неприменимы к соответствующим повествовательному и вопросительному (повелительному) предложениям (например: You are writing the letter "Вы пишете письмо" vs . Are you writing the letter? "Вы пишете письмо?" или Write the letter! "Пишите письмо!"). Хотя соответствующие члены разных «типов предложений» могут быть охарактеризованы как различные по «значению», нельзя считать, что они различаются по смыслу. Нет нужды пытаться формализовать теорию семантики таким образом, чтобы «значение» «маркера вопросительности» или «маркера повелительности» могло быть описано в тех же самых терминах, что и «значение» лексических единиц,

В продолжение темы:
Электрооборудование

0 4 859 0 УЗИ стало неотъемлемым этапом исследования больного. Оно довольно быстро и наглядно, показывает зоны поражения внутренних органов и их структуру. Кроме того,...

Новые статьи
/
Популярные