МАТЕМАТИ́ЧЕСКАЯ ЛИНГВИ́СТИКА
-
Рубрика: Языкознание
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
МАТЕМАТИ́ЧЕСКАЯ ЛИНГВИ́СТИКА, математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Возникла в 1950-х гг., когда в языкознании назрела потребность уточнения его осн. понятий. В М. л. используются по преимуществу идеи и методы алгебры, алгоритмов теории и автоматов теории. Не являясь частью лингвистики, М. л. развивается в тесном взаимодействии с ней. Иногда термин «М. л.» используют также для обозначения любых лингвистич. исследований, в которых применяется к.-л. математич. аппарат.
Математич. описание языка основано на восходящем к Ф. де Соссюру представлении о языке как о механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» – последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математич. описание. Изучение способов математич. описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л. – теории способов описания синтаксической структуры. Для описания строения (синтаксич. структуры) предложения можно либо выделить в нём составляющие – группы слов, функционирующие как цельные синтаксич. единицы, либо указать для каждого слова те слова, которые от него непосредственно зависят (если такие есть). Так, в предложении «Лошади кушают овёс» при описании по 1-му способу составляющими будут: всё предложение I, каждое отд. слово и словосочетание С = «кушают овёс» (рис. 1; стрелки означают «непосредственное вложение»); описание по 2-му способу даёт схему, показанную на рис. 2. Математич. объекты, возникающие при таком описании структуры предложения, называются деревом составляющих (1-й способ) и деревом синтаксич. подчинения (2-й способ).
Другой раздел М. л., занимающий в ней центр. место, – теория формальных грамматик, возникшая гл. обр. благодаря работам Н. Хомского. Она изучает способы описания закономерностей, которые характеризуют уже не отд. текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются путём построения «формальной грамматики» – абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики – т. н. порождающая грамматика, или грамматика Хомского, – упорядоченная система Г=<V,W,I,R>, где V и W – непересекающиеся конечные множества; I – элемент W; R – конечное множество п р а в и л вида φ→ψ, где φ и ψ – цепочки (конечные последовательности) элементов V и W. Если φ→ψ – правило грамматики Γ и ω1, ω2 – цепочки из элементов V и W, то говорят, что цепочка ω1ψω2 н\:е\:п\:о\:с\:р\:е\:д\:с\:т\:в\:е\:н\:н\:о\:\: в\:ы\:в\:о\:д\:и\:м\:а в Γ из ω_1φω_2. Если ξ_0,ξ_1,…,ξ_n – цепочки и для каждого i=1,...,n цепочка ξ_i, непосредственно выводима из ξ_{i-1}, то говорят, что ξ_n в\:ы\:в\:о\:д\:и\:м\:а из ξ_0 в Γ. Множество цепочек из элементов V, выводимых в Γ из I, называют языком, порождаемым грамматикой Γ. Если все правила грамматики Γ имеют вид A→ψ, где А – элемент W, Γ называется бесконтекстной, или контекстно-свободной. В лингвистич. интерпретации элементы V чаще всего представляют собой слова, элементы W – символы грамматич. категорий, I – символ категории «предложение». В бесконтекстной грамматике вывод предложения даёт для него дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного элемента W, так что для каждой составляющей указывается её грамматич. категория. Так, если грамматика имеет в числе прочих правила I→S_{x,у,им} V_y, V_y→V^t_yS_{x,y,вин}, S_{мyж,ед,вин}→овёс, S_{жен,мн,им}→лошади
V^t_{мн}→кушают, где V_y означает категорию «группа глагола в числе y», V^ty – «переходный глагол в числе y», S_{x,y,z} – «существительное рода x в числе y и падеже z», то приведённое выше предложение имеет вывод, показанный на рис. 3, где стрелки идут из левых частей применяемых правил к элементам соответствующих правых частей. Порождающие грамматики используются для описания не только естественных, но и искусств. языков, в особенности языков программирования. Другой тип формальных грамматик – доминационные грамматики, которые порождают цепочки, интерпретируемые обычно как предложения, вместе с деревьями синтаксич. подчинения.
М. л. изучает также аналитич. модели языка, в которых на основе тех или иных данных о речи, считающихся известными (напр., множества правильных предложений), производятся формальные построения, дающие некоторые сведения о структуре языка. Приложение методов М. л. к конкретным языкам относится к области лингвистики (см. Языкознание).