Подпишитесь на наши новости
Вернуться к началу с статьи up
 

ПОИСКО́ВЫЙ СЕ́РВЕР

  • рубрика
  • родственные статьи
  • image description

    В книжной версии

    Том 26. Москва, 2014, стр. 595

  • image description

    Скопировать библиографическую ссылку:




Авторы: Д. В. Барашев, Н. С. Васильева, Б. А. Новиков

ПОИСКО́ВЫЙ СЕ́РВЕР (по­ис­ко­вая ма­ши­на), про­грамм­но-ап­па­рат­ный ком­плекс, пред­на­зна­чен­ный для фор­ми­ро­ва­ния по­ис­ко­вой вы­да­чи (по­ис­ка, хра­не­ния и пре­дос­тав­ле­ния ин­фор­ма­ции поль­зо­ва­те­лям), со­стоя­щей из до­ку­мен­тов спра­воч­но-ин­фор­ма­ци­он­но­го фон­да (СИФ) ре­ле­вант­ных (аде­к­ват­ных) по­ис­ко­во­му за­про­су, фор­му­ли­рую­ще­му ин­фор­ма­ци­он­ную по­треб­ность ко­неч­но­го поль­зо­ва­те­ля. Обыч­но яв­ля­ет­ся ча­стью по­ис­ко­вой сис­те­мы.

Историческая справка

Пер­вые про­то­ти­пы П. с. (1960-е гг.) бы­ли спо­соб­ны вы­пол­нять по­иск в кол­лек­ци­ях до­воль­но скром­но­го раз­ме­ра (по­ряд­ка ты­ся­чи до­ку­мен­тов). В нач. 1970-х гг. ин­фор­ма­ци­он­но-по­ис­ко­вые сис­те­мы (см. Ин­фор­ма­ци­он­ная сис­те­ма) пре­дос­тав­ля­ли воз­мож­ность по­ис­ка биб­лио­гра­фич. дан­ных по клю­че­вым сло­вам или сло­во­со­че­та­ни­ям (дис­крип­то­рам). За­да­ча со­став­ле­ния об­ра­зов по­ис­ко­вых до­ку­мен­тов в та­ких ин­фор­мац. сис­те­мах ре­ша­лась вруч­ную, спец. ко­ман­ды вво­ди­лись с кла­виа­ту­ры, а вре­мя со­став­ле­ния по­ис­ко­вой вы­да­чи по за­про­су из­ме­ря­лось ми­ну­та­ми и ча­са­ми. По ме­ре то­го как ко­ли­че­ст­во при­со­еди­нён­ных к Ин­тер­не­ту ком­пь­ю­те­ров уве­ли­чи­ва­лось, на­зрел во­прос о не­об­хо­ди­мо­сти соз­да­ния ин­стру­мен­тов, по­зво­ляю­щих лег­ко на­хо­дить тек­сто­вые и др. фай­лы на уда­лён­ном ком­пь­ю­те­ре, в идеа­ле – на лю­бом, где бы он ни рас­по­лагал­ся в ком­пь­ю­тер­ной се­ти. В кон. 1980-х гг. ста­ли по­яв­лять­ся спе­ци­аль­ные FTP-сер­ве­ры (File Transfer Pro­tocol – про­то­кол пе­ре­да­чи фай­лов), ко­то­рые ис­поль­зу­ют раз­ные се­те­вые со­еди­не­ния для пе­ре­да­чи ко­манд и дан­ных ме­ж­ду кли­ен­том и сер­ве­ром. Пер­вый ра­бо­то­спо­соб­ный, дос­туп­ный ши­ро­кой пуб­ли­ке П. с., ин­дек­си­рую­щий име­на фай­лов (про­цесс опи­са­ния до­ку­мен­тов и за­про­сов, в ре­зуль­та­те че­го ка­ж­до­му до­ку­мен­ту на­зна­ча­ет­ся на­бор клю­че­вых слов, от­ра­жаю­щих его смы­сло­вое со­дер­жа­ние) на FTP-сер­ве­рах, – «Ар­чи» («Archie»), соз­дан в 1990 в Мон­реа­ле; был спо­со­бен ин­дек­си­ро­вать до­ку­мен­ты ав­то­ма­ти­че­ски и оце­ни­вать ре­ле­вант­ность не­сколь­ких со­тен до­ку­мен­тов в се­кун­ду.

Раз­ви­тие Ин­тер­не­та и язы­ка HTML (HyperText Markup Language – язык раз­мет­ки ги­пер­тек­сто­вых до­ку­мен­тов во Все­мир­ной пау­ти­не; раз­ра­бо­тан брит. учёным Т. Бер­нер­сом-Ли в 1989 в ЦЕРНе) по­ло­жи­ло на­ча­ло П. с., осу­ще­ст­в­ляю­щим пол­но­тек­сто­вый по­иск, а изо­бре­те­ние и пром. реа­ли­за­ция в кон. 1990-х гг. ин­дек­са ци­тиро­ва­ния HTML до­ку­мен­тов при­ве­ли к су­ще­ст­вен­но­му уве­ли­че­нию ка­че­ст­ва по­ис­ка. В это же вре­мя дос­ти­же­ния в тех­но­ло­ги­ях хра­не­ния и об­ра­бот­ки дан­ных, в ча­ст­но­сти ис­поль­зо­ва­ние не­до­ро­го­го ши­ро­ко­дос­туп­но­го ап­па­рат­но­го обес­пе­че­ния, по­зво­ли­ли ре­шить мн. про­бле­мы го­ри­зон­таль­но­го мас­шта­би­ро­ва­ния П. с. (до­бав­ле­ние но­вых сер­ве­ров c пе­ре­рас­пре­де­ле­ни­ем на­груз­ки ме­ж­ду ни­ми).

Особенности технологий и тенденции развития

П. с., пред­на­зна­чен­ный для по­ис­ка в Ин­тер­не­те, как пра­ви­ло, вклю­ча­ет в се­бя три осн. ком­по­нен­та: по­ис­ко­во­го ро­бо­та, служ­бу ин­дек­си­ро­ва­ния и служ­бу по­ис­ка. За­да­чей по­ис­ко­во­го ро­бо­та яв­ля­ет­ся по­пол­не­ние и по­сто­ян­ное об­нов­ле­ние СИФ. Ро­бот по­сто­ян­но «об­хо­дит» веб-сер­ве­ры Все­мир­ной пау­ти­ны, по­лу­ча­ет их текст и фор­ми­ру­ет вход­ной мас­сив до­ку­мен­тов для служ­бы ин­дек­си­ро­ва­ния. Эта служ­ба за­ни­ма­ет­ся по­строе­ни­ем по­ис­ко­во­го ин­дек­са (хра­ни­ли­ще дан­ных, в ко­то­ром со­сре­до­то­че­ны ко­пии всех по­се­щён­ных ро­бо­том стра­ниц), об­нов­ле­ни­ем ин­дек­сов ци­ти­ро­ва­ния стра­ниц и др. ста­ти­стич. ин­фор­ма­ции. Служ­ба по­ис­ка ис­поль­зу­ет по­ис­ко­вый ин­декс для вы­пол­не­ния поль­зо­ва­тель­ских за­про­сов. Кро­ме трёх осн. ком­по­нент, су­ще­ст­вен­ную роль в П. с. иг­ра­ет служ­ба жур­на­ли­ро­ва­ния (фай­ло­вая сис­те­ма, в ко­то­рой осу­ще­ст­в­ля­ет­ся ве­де­ние жур­на­ла, хра­ня­ще­го спи­сок из­ме­не­ний и по­зво­ляю­ще­го со­хра­нить це­ло­ст­ность сис­те­мы при сбо­ях) и ана­ли­за дей­ст­вий поль­зо­ва­те­лей, пред­на­зна­чен­ная для сбо­ра об­рат­ной свя­зи и по­сле­дую­ще­го улуч­ше­ния ка­че­ст­ва по­ис­ка.

Для фор­ми­ро­ва­ния по­ис­ко­вой вы­да­чи П. с. мо­жет про­вес­ти пря­мой про­смотр тек­стов всех до­ку­мен­тов СИФ (ис­поль­зу­ют­ся эф­фек­тив­ные спо­со­бы пред­став­ле­ния и сжа­тия ин­фор­ма­ции, ста­ти­стич. рас­чё­ты и др.). Та­кая стра­те­гия по­ис­ка име­ет не­ко­то­рые пре­иму­ще­ст­ва, но при рос­те кол­лек­ции до­ку­мен­тов ста­но­вит­ся чрез­мер­но тру­до­ём­кой. Аль­тер­на­ти­вой яв­ля­ет­ся пред­ва­рит. об­ра­бот­ка до­ку­мен­тов и фор­ми­ро­ва­ние ин­дек­сов. Воз­мож­на ком­би­ни­ров. стра­те­гия, ко­гда вме­сте с ин­дек­сом П. с. ис­поль­зу­ет в про­цес­се вы­пол­не­ния за­про­са тек­сты до­ку­мен­тов. Ре­ле­вант­ность до­ку­мен­та оп­ре­де­ля­ет­ся П. с. на ос­но­ве мно­же­ст­ва фак­то­ров: рас­смат­ри­ва­ют­ся (в за­ви­си­мо­сти от мо­де­ли по­ис­ка) ин­фор­ма­тив­ность по­ис­ко­вых тер­ми­нов, сте­пень сов­па­де­ния до­ку­мен­та и за­про­са, ин­декс ци­ти­ро­ва­ния до­ку­мен­та, аб­со­лют­ное рас­по­ло­же­ние по­ис­ко­вых тер­ми­нов в тек­сте до­ку­мен­та и их рас­по­ло­же­ние от­но­си­тель­но друг дру­га и мно­гие др. по­ка­за­те­ли.

П. с., об­слу­жи­ваю­щие боль­шие по­то­ки по­ис­ко­вых за­про­сов и боль­шие кол­лек­ции до­ку­мен­тов, спо­соб­ст­ву­ют раз­ви­тию тех­но­ло­гий хра­не­ния и пе­ре­да­чи дан­ных. Ак­тив­но раз­ви­ва­ют­ся объ­ек­то­гра­фич. по­иск, в ко­то­ром в по­ис­ко­вой вы­да­че, по­ми­мо тек­сто­вых до­ку­мен­тов, при­сут­ст­ву­ют фак­ты об объ­ек­тах пред­мет­ной об­лас­ти, пер­со­на­ли­зи­ров. по­иск, при­даю­щий су­ще­ст­вен­ный вес ин­фор­ма­ции о пред­поч­те­ни­ях ко­неч­но­го поль­зо­ва­те­ля и ис­то­рии его по­ис­ко­вых за­про­сов.

Лит.: Се­га­ло­вич И. В. Как ра­бо­та­ют по­ис­ко­вые сис­те­мы // Мир Internet. 2002. № 10; Ман­нинг К. Д., Раг­ха­ван П., Шют­це Х. Вве­де­ние в ин­фор­ма­ци­он­ный по­иск. М., 2011.

Вернуться к началу