Подпишитесь на наши новости
Вернуться к началу с статьи up
 

КОМПЬЮ́ТЕРНАЯ ЛИНГВИ́СТИКА

  • рубрика

    Рубрика: Языкознание

  • родственные статьи
  • image description

    В книжной версии

    Том 14. Москва, 2009, стр. 710

  • image description

    Скопировать библиографическую ссылку:




Авторы: А. Н. Баранов

КОМПЬЮ́ТЕРНАЯ ЛИНГВИ́СТИКА (каль­ка с англ. computational linguistics), од­но из на­прав­ле­ний при­клад­ной лин­гвис­ти­ки, в ко­то­ром для ис­сле­до­ва­ния язы­ка и мо­де­ли­ро­ва­ния функ­цио­ни­ро­ва­ния язы­ка в тех или иных ус­ло­ви­ях, си­туа­ци­ях и про­блем­ных сфе­рах раз­ра­ба­ты­ва­ют­ся и ис­поль­зу­ют­ся ком­пь­ю­тер­ные про­грам­мы, ком­пь­ю­тер­ные тех­но­ло­гии ор­га­ни­за­ции и об­ра­бот­ки дан­ных. С др. сто­ро­ны, это об­ласть при­ме­не­ния ком­пь­ю­тер­ных мо­де­лей язы­ка в лин­гвис­ти­ке и смеж­ных с ней дис­ци­п­ли­нах. Как осо­бое на­уч. на­прав­ле­ние К. л. офор­ми­лась в ев­роп. ис­сле­до­ва­ни­ях в 1960-х гг. По­сколь­ку англ. при­ла­га­тель­ное computational мо­жет пе­ре­во­дить­ся и как «вы­чис­ли­тель­ный», в лит-ре встре­ча­ет­ся так­же тер­мин «вы­чис­ли­тель­ная лин­гвис­ти­ка», од­на­ко в отеч. нау­ке он при­об­ре­та­ет бо­лее уз­кое зна­че­ние, при­бли­жаю­щее­ся к по­ня­тию «кван­ти­та­тив­ная лин­гвис­ти­ка».

Час­то к К. л. от­но­сят тер­мин «кван­ти­та­тив­ная лин­гвис­ти­ка», ко­то­рый ха­рак­те­ри­зу­ет меж­дис­ци­п­ли­нар­ное на­прав­ле­ние в при­клад­ных ис­сле­до­ва­ни­ях, где в ка­че­ст­ве осн. ин­ст­ру­мен­та изу­че­ния язы­ка и ре­чи ис­поль­зу­ют­ся ко­ли­че­ст­вен­ные или ста­ти­стич. ме­то­ды ана­ли­за. Ино­гда кван­ти­та­тив­ная (или ко­ли­че­ст­вен­ная) лин­гвис­ти­ка про­ти­во­пос­тав­ля­ет­ся ком­би­на­тор­ной лин­гвис­ти­ке. В по­след­ней до­ми­ни­рую­щую роль за­ни­ма­ет «не­ко­ли­че­ст­вен­ный» ма­те­ма­тич. ап­па­рат – тео­рия мно­жеств, ма­те­ма­тич. ло­ги­ка, тео­рия ал­го­рит­мов и т. д. С тео­ретич. точ­ки зре­ния ис­поль­зо­ва­ние ста­ти­стич. ме­то­дов в язы­ко­зна­нии по­зво­ля­ет до­пол­нить струк­тур­ную мо­дель язы­ка ве­ро­ят­но­ст­ным ком­по­нен­том, т. е. соз­дать тео­ре­тич. струк­тур­но-ве­ро­ят­но­ст­ную мо­дель, об­ла­даю­щую зна­чит. объ­яс­ни­тель­ным по­тен­циа­лом. В при­клад­ной об­лас­ти кван­ти­та­тив­ная лин­гвис­ти­ка пред­став­ле­на пре­ж­де все­го ис­поль­зо­ва­ни­ем фраг­мен­тов этой мо­де­ли, ис­поль­зуе­мых для лин­гвис­тич. мо­ни­то­рин­га функ­цио­ни­ро­ва­ния язы­ка, де­шиф­ров­ки ко­ди­ро­ван­но­го тек­ста, ав­то­ри­за­ции/ат­ри­бу­ции тек­ста и т. п.

Тер­мин «К. л.» и про­бле­ма­ти­ка это­го на­прав­ле­ния час­то свя­зы­ва­ют­ся с мо­де­ли­ро­ва­ни­ем об­ще­ния, и пре­ж­де все­го – с обес­пе­че­ни­ем взаи­мо­дей­ст­вия че­ло­ве­ка с ЭВМ на ес­те­ст­вен­ном или ог­ра­ни­чен­ном ес­те­ст­вен­ном язы­ке (для это­го соз­да­ют­ся спец. сис­те­мы об­ра­бот­ки ес­теств. язы­ка), а так­же с тео­ри­ей и прак­ти­кой ин­фор­ма­ци­он­но-по­ис­ко­вых сис­тем (ИПС). Обес­пе­че­ние об­ще­ния че­ло­ве­ка с ЭВМ на ес­теств. язы­ке ино­гда обо­зна­ча­ет­ся тер­ми­ном «об­ра­бот­ка ес­те­ст­вен­но­го язы­ка» (пе­ре­вод с англ. яз. тер­ми­на Natural Language Processing). Это на­прав­ле­ние К. л. воз­ник­ло в кон. 1960-х гг. за ру­бе­жом и раз­ви­ва­лось в рам­ках на­уч.-тех­но­ло­гич. дис­ци­п­ли­ны, име­нуе­мой ис­кусств. ин­тел­лек­том (ра­бо­ты Р. Шен­ка, М. Ле­бо­ви­ца, Т. Ви­но­гра­да и др.). По сво­ему смыс­лу сло­во­со­че­та­ние «об­ра­бот­ка ес­те­ст­вен­но­го язы­ка» долж­но ох­ва­ты­вать все об­лас­ти, в ко­то­рых ком­пь­ю­те­ры ис­поль­зу­ют­ся для об­ра­бот­ки язы­ко­вых дан­ных. На прак­ти­ке, од­на­ко, за­кре­пи­лось бо­лее уз­кое по­ни­ма­ние тер­ми­на – раз­ра­бот­ка ме­то­дов, тех­но­ло­гий и кон­крет­ных сис­тем, обес­пе­чи­ваю­щих об­ще­ние че­ло­ве­ка с ЭВМ на ес­теств. или ог­ра­ни­чен­ном ес­теств. язы­ке.

К К. л. в оп­ре­де­лён­ной сте­пе­ни мо­гут быть от­не­се­ны ра­бо­ты в об­лас­ти соз­да­ния ги­пер­тек­сто­вых сис­тем, рас­смат­ри­вае­мых как осо­бый спо­соб ор­га­ни­за­ции тек­ста и да­же как прин­ци­пи­аль­но но­вый вид тек­ста, про­ти­во­пос­тав­лен­ный по мн. сво­им свой­ст­вам обыч­но­му тек­сту, сфор­ми­ро­ван­но­му в гу­тен­бер­гов­ской тра­ди­ции кни­го­пе­ча­та­ния (см. Гу­тен­берг).

К ком­пе­тен­ции К. л. от­но­сит­ся и ав­то­ма­ти­че­ский пе­ре­вод.

В рам­ках К. л. воз­ник­ло и срав­ни­тель­но но­вое, ак­тив­но раз­ви­ваю­щее­ся с 1980–90-х гг. на­прав­ле­ние – кор­пус­ная лин­гвис­ти­ка, где раз­ра­ба­ты­ва­ют­ся об­щие прин­ци­пы по­строе­ния лин­гвис­тич. кор­пу­сов дан­ных (в ча­ст­но­сти, кор­пу­сов тек­стов) с ис­поль­зо­ва­ни­ем совр. ком­пь­ю­тер­ных тех­но­ло­гий. Кор­пу­са тек­стов – это кол­лек­ции спе­ци­аль­но по­доб­ран­ных тек­стов книг, жур­на­лов, га­зет и т. д., пе­ре­не­сён­ные на ма­шин­ные но­си­те­ли и пред­на­зна­чен­ные для ав­то­ма­тич. об­ра­бот­ки. Один из пер­вых кор­пу­сов тек­стов был соз­дан для амер. ва­ри­ан­та англ. язы­ка в Брау­нов­ском ун-те (т. н. Брау­нов­ский кор­пус) в 1962–63 под рук. У. Френ­си­са. В Рос­сии с нач. 2000-х гг. в Ин-те рус. язы­ка им. В. В. Ви­но­гра­до­ва РАН раз­ра­ба­ты­ва­ет­ся Нац. кор­пус рус. язы­ка, со­стоя­щий из пред­ста­ви­тель­ной вы­бор­ки рус­скоя­зыч­ных тек­стов объ­ё­мом по­ряд­ка 100 млн. сло­во­упот­реб­ле­ний. Кро­ме соб­ст­вен­но кон­ст­руи­ро­ва­ния кор­пу­сов дан­ных, кор­пус­ная лин­гвис­ти­ка за­ни­ма­ет­ся соз­да­ни­ем ком­пь­ю­тер­ных ин­ст­ру­мен­тов (ком­пь­ю­тер­ных про­грамм), пред­на­зна­чен­ных для из­вле­че­ния раз­но­об­раз­ной ин­фор­ма­ции из тек­сто­вых кор­пу­сов. С точ­ки зре­ния поль­зо­ва­те­ля, к кор­пу­сам тек­стов предъ­яв­ля­ют­ся тре­бо­ва­ния пред­ста­ви­тель­но­сти (ре­пре­зен­та­тив­но­сти), пол­но­ты и эко­но­мич­но­сти.

К. л. ак­тив­но раз­ви­ва­ет­ся и в Рос­сии, и за ру­бе­жом. По­ток пуб­ли­ка­ций в этой об­лас­ти очень ве­лик. Кро­ме те­ма­тич. сб-ков, в США с 1984 еже­квар­таль­но вы­хо­дит ж. «Computational Linguistics» («Ком­пь­ю­тер­ная лин­гвис­ти­ка»). Боль­шую ор­га­ни­зац. и на­уч. ра­бо­ту про­во­дит Ас­со­циа­ция по ком­пь­ю­тер­ной лин­гвис­ти­ке (The Association for Computational Linguistics), ко­то­рая име­ет ре­гио­наль­ные струк­ту­ры по все­му ми­ру (в ча­ст­но­сти, ев­роп. от­де­ле­ние). Ка­ж­дые два го­да про­хо­дят ме­ж­ду­нар. кон­фе­рен­ции КОЛИНТ (в 2008 кон­фе­рен­ция про­хо­ди­ла в Ман­че­сте­ре). Осн. на­прав­ле­ния К. л. об­суж­да­ют­ся так­же на еже­год­ной ме­ж­ду­нар. кон­фе­рен­ции «Диа­лог», ор­га­ни­зуе­мой Рос. НИИ ис­кус­ст­вен­но­го ин­тел­лек­та, фи­ло­ло­гич. ф-том МГУ, Ян­дек­сом и ря­дом др. ор­га­ни­за­ций. Со­от­вет­ст­вую­щая про­бле­ма­ти­ка ши­ро­ко пред­став­ле­на так­же на ме­ж­ду­нар. кон­фе­рен­ци­ях по ис­кусств. ин­тел­лек­ту раз­ных уров­ней.

Лит.: Зве­гин­цев В. А. Тео­ре­ти­че­ская и при­клад­ная лин­гвис­ти­ка. М., 1968; Пи­от­ров­ский Р. Г., Бек­та­ев К. Б., Пи­от­ров­ская А. А. Ма­те­ма­ти­че­ская лин­гвис­ти­ка. М., 1977; Го­ро­дец­кий Б. Ю. Ак­ту­аль­ные про­бле­мы при­клад­ной лин­гвис­ти­ки // Но­вое в за­ру­беж­ной лин­гвис­ти­ке. М., 1983. Вып. 12; Киб­рик А. Е. При­клад­ная лин­гвис­ти­ка // Киб­рик А. Е. Очер­ки по об­щим и при­клад­ным во­про­сам язы­ко­зна­ния. М., 1992; Kennedy G. An introduction to corpus linguistics. L., 1998; Bolshakov I. A., Gel­bukh A. Computational linguistics: models, resources, applications. Mex., 2004; На­цио­наль­ный кор­пус рус­ско­го язы­ка: 2003–2005. М., 2005; Ба­ра­нов А. Н. Вве­де­ние в при­клад­ную лин­гвис­ти­ку. 3-е изд. М., 2007; Ком­пь­ю­тер­ная лин­гвис­ти­ка и ин­тел­лек­ту­аль­ные тех­но­ло­гии. М., 2008. Вып. 7.

Вернуться к началу