МАТЕМАТИ́ЧЕСКАЯ ЛИНГВИ́СТИКА
-
Рубрика: Языкознание
-
Скопировать библиографическую ссылку:
МАТЕМАТИ́ЧЕСКАЯ ЛИНГВИ́СТИКА, математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Возникла в 1950-х гг., когда в языкознании назрела потребность уточнения его осн. понятий. В М. л. используются по преимуществу идеи и методы алгебры, алгоритмов теории и автоматов теории. Не являясь частью лингвистики, М. л. развивается в тесном взаимодействии с ней. Иногда термин «М. л.» используют также для обозначения любых лингвистич. исследований, в которых применяется к.-л. математич. аппарат.
Математич. описание языка основано на восходящем к Ф. де Соссюру представлении о языке как о механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» – последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математич. описание. Изучение способов математич. описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л. – теории способов описания синтаксической структуры. Для описания строения (синтаксич. структуры) предложения можно либо выделить в нём составляющие – группы слов, функционирующие как цельные синтаксич. единицы, либо указать для каждого слова те слова, которые от него непосредственно зависят (если такие есть). Так, в предложении «Лошади кушают овёс» при описании по 1-му способу составляющими будут: всё предложение $I$, каждое отд. слово и словосочетание $С$ = «кушают овёс» (рис. 1; стрелки означают «непосредственное вложение»); описание по 2-му способу даёт схему, показанную на рис. 2. Математич. объекты, возникающие при таком описании структуры предложения, называются деревом составляющих (1-й способ) и деревом синтаксич. подчинения (2-й способ).
Другой раздел М. л., занимающий в ней центр. место, – теория формальных грамматик, возникшая гл. обр. благодаря работам Н. Хомского. Она изучает способы описания закономерностей, которые характеризуют уже не отд. текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются путём построения «формальной грамматики» – абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики – т. н. порождающая грамматика, или грамматика Хомского, – упорядоченная система $Г = < V, W, I, R >$, где $V$ и $W$ – непересекающиеся конечные множества; $I$ – элемент $W$; $R$ – конечное множество п р а в и л вида $φ→ψ$, где $φ$ и $ψ$ – цепочки (конечные последовательности) элементов $V$ и $W$. Если $φ→ψ$ – правило грамматики $Γ$ и $ω_1$, $ω_2$ – цепочки из элементов $V$ и $W$, то говорят, что цепочка $ω_1ψω_2$ $н\:е\:п\:о\:с\:р\:е\:д\:с\:т\:в\:е\:н\:н\:о\:\: в\:ы\:в\:о\:д\:и\:м\:а$ в $Γ$ из $ω_1φω_2$. Если $ξ_0,ξ_1,…,ξ_n$ – цепочки и для каждого $i=1,...,n$ цепочка $ξ_i$, непосредственно выводима из $ξ_{i-1}$, то говорят, что $ξ_n$ $в\:ы\:в\:о\:д\:и\:м\:а$ из $ξ_0$ в $Γ$. Множество цепочек из элементов $V$, выводимых в $Γ$ из $I$, называют языком, порождаемым грамматикой $Γ$. Если все правила грамматики $Γ$ имеют вид $A→ψ$, где $А$ – элемент $W$, $Γ$ называется бесконтекстной, или контекстно-свободной. В лингвистич. интерпретации элементы $V$ чаще всего представляют собой слова, элементы $W$ – символы грамматич. категорий, $I$ – символ категории «предложение». В бесконтекстной грамматике вывод предложения даёт для него дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного элемента $W$, так что для каждой составляющей указывается её грамматич. категория. Так, если грамматика имеет в числе прочих правила $I→S_{x,у,им}$ $V_y$, $V_y→V^t_yS_{x,y,вин}$, $S_{мyж,ед,вин}→овёс$, $S_{жен,мн,им}→лошади$
$V^t_{мн}→кушают$, где $V_y$ означает категорию «группа глагола в числе $y$», $V^ty$ – «переходный глагол в числе $y$», $S_{x,y,z}$ – «существительное рода $x$ в числе $y$ и падеже $z$», то приведённое выше предложение имеет вывод, показанный на рис. 3, где стрелки идут из левых частей применяемых правил к элементам соответствующих правых частей. Порождающие грамматики используются для описания не только естественных, но и искусств. языков, в особенности языков программирования. Другой тип формальных грамматик – доминационные грамматики, которые порождают цепочки, интерпретируемые обычно как предложения, вместе с деревьями синтаксич. подчинения.
М. л. изучает также аналитич. модели языка, в которых на основе тех или иных данных о речи, считающихся известными (напр., множества правильных предложений), производятся формальные построения, дающие некоторые сведения о структуре языка. Приложение методов М. л. к конкретным языкам относится к области лингвистики (см. Языкознание).