Подпишитесь на наши новости
Вернуться к началу с статьи up
 

ПО́ИСК ИНФОРМА́ЦИИ

  • рубрика
  • родственные статьи
  • image description

    В книжной версии

    Том 26. Москва, 2014, стр. 591

  • image description

    Скопировать библиографическую ссылку:




Авторы: Д. В. Барашев, Н. С. Васильева, Б. А. Новиков

ПО́ИСК ИНФОРМА́ЦИИ в Ин­тер­не­те, по­сле­до­ва­тель­ность дей­ст­вий (от оп­ре­де­ле­ния пред­ме­та по­ис­ка до по­лу­че­ния ин­фор­ма­ции) с ис­поль­зо­ва­ни­ем всех до­ступ­ных ре­сур­сов по­ис­ко­вых сис­тем. К ре­зуль­та­там П. и. предъ­яв­ля­ют­ся тре­бо­ва­ния пол­но­ты ох­ва­та ре­сур­сов, ми­ним. за­трат вре­ме­ни и макс. ско­ро­сти по­ис­ка. Вы­соко­ка­че­ст­вен­ный П. и. тре­бу­ет зна­чит. вы­чис­лит. ре­сур­сов, ко­то­рые, как пра­ви­ло, пре­дос­тав­ля­ют­ся круп­ны­ми транс­на­цио­наль­ны­ми кор­по­ра­ция­ми. От­ли­чит. осо­бен­но­сти П. и. в по­ис­ко­вых сис­те­мах – сбор ин­фор­мац. ис­точ­ни­ков по­ис­ко­вы­ми ро­бо­та­ми (по­ис­ко­вы­ми ма­ши­на­ми), не­об­хо­ди­мость ра­бо­ты с ог­ром­ны­ми мас­си­ва­ми не­струк­ту­ри­ро­ван­ных дан­ных, а так­же учёт оп­ре­де­лён­ных ас­пек­тов Ин­тер­не­та, та­ких как ис­поль­зо­ва­ние гра­фо­вой струк­ту­ры Все­мир­ной пау­ти­ны, ана­лиз дей­ст­вий поль­зо­ва­те­ля и др. Боль­шин­ст­во по­ис­ко­вых сис­тем име­ют воз­мож­ность П. и. по клю­че­вым сло­вам (один из са­мых рас­про­стра­нён­ных ви­дов по­ис­ка). Груп­па клю­че­вых слов, сфор­ми­ро­ван­ная по оп­ре­де­лён­ным пра­ви­лам, на­зы­ва­ет­ся за­про­сом к по­ис­ко­во­му сер­ве­ру. Совр. по­ис­ко­вые сис­те­мы пре­дос­тав­ля­ют воз­мож­ность под­клю­че­ния к сфор­ми­ро­ван­но­му за­про­су се­ман­тич. ана­ли­за­то­ра, с по­мо­щью ко­то­ро­го мож­но, вве­дя к.-л. сло­во, вы­брать до­ку­мен­ты, в ко­то­рых встре­ча­ют­ся про­из­вод­ные от это­го сло­ва в разл. па­де­жах, вре­ме­нах и пр. Поль­зо­ва­тель вво­дит за­прос и ак­ти­ви­зи­ру­ет по­иск; с по­мо­щью про­грам­мы об­ра­бот­ки за­про­са, ко­то­рая в со­от­вет­ст­вии с за­про­сом поль­зо­ва­те­ля «про­смат­ри­ва­ет» на­ли­чие нуж­ной ин­фор­ма­ции, по­лу­ча­ет под­бор­ку до­ку­мен­тов по сфор­му­ли­ро­ван­но­му за­про­су. Этот спи­сок до­ку­мен­тов ран­жи­ру­ет­ся в по­ряд­ке убы­ва­ния ре­ле­вант­но­сти по оп­ре­де­лён­ным кри­те­ри­ям (напр., в за­ви­си­мо­сти от ме­сто­по­ло­же­ния клю­че­вых слов – в за­го­лов­ке, в на­ча­ле тек­ста, в пер­вых па­ра­гра­фах). Не­смот­ря на схо­жий прин­цип ра­бо­ты, по­ис­ко­вые сис­те­мы раз­ли­ча­ют­ся по язы­кам за­про­са, зо­нам по­ис­ка, глу­би­не по­ис­ка внут­ри до­ку­мен­та, ме­то­дам ран­жи­ро­ва­ния и при­ори­те­тов, т. е. ес­ли ука­зать в стро­ке по­ис­ка для ка­ж­дой по­ис­ко­вой сис­те­мы за­прос оди­на­ко­вой кон­ст­рук­ции, мож­но по­лу­чить разл. ре­зуль­та­ты по­ис­ка. Для ка­ж­дой по­ис­ко­вой сис­те­мы су­ще­ст­ву­ют оп­ре­де­лён­ные пра­ви­ла фор­ми­ро­ва­ния за­про­са [напр., в по­ис­ко­вой сис­те­ме Ян­декс клю­че­вые сло­ва в за­про­се сле­ду­ет пи­сать строч­ны­ми бу­к­ва­ми – это обес­пе­чит по­иск всех клю­че­вых слов, а не толь­ко тех, ко­то­рые на­чи­на­ют­ся с про­пис­ной бу­к­вы; при по­ис­ке учи­ты­ва­ют­ся все фор­мы сло­ва по пра­ви­лам рус. язы­ка, не­за­ви­си­мо от фор­мы сло­ва в за­про­се; для по­ис­ка ус­той­чи­во­го сло­во­со­че­та­ния сле­ду­ет за­клю­чить сло­ва в ка­выч­ки; для по­ис­ка по точ­ной сло­во­фор­ме пе­ред сло­вом на­до по­ста­вить вос­кли­ца­тель­ный знак; для по­ис­ка внут­ри од­но­го пред­ло­же­ния сло­ва в за­про­се раз­де­ля­ют про­бе­лом (или зна­ком &) – нес­коль­ко на­бран­ных в за­про­се слов, раз­де­лён­ных про­бе­ла­ми, озна­ча­ют, что все они долж­ны вхо­дить в од­но пред­ло­же­ние ис­ко­мо­го до­ку­мен­та]. Су­ще­ст­ву­ют не­ко­то­рые при­чи­ны, по ко­то­рым до­ку­мент не мо­жет быть об­на­ру­жен по­ис­ко­вой сис­те­мой (напр., ес­ли в ней дан­ные ре­сур­сы не про­пи­са­ны).

П. и. мо­жет быть про­из­вё­ден при по­мо­щи разл. ме­то­дов, ко­то­рые, в за­ви­си­мо­сти от его це­лей и за­дач, мо­гут быть ис­поль­зо­ва­ны по от­дель­но­сти или в ком­би­на­ции друг с дру­гом. Ука­за­ние ад­ре­са стра­ни­цы – са­мый бы­ст­рый спо­соб П. и., но его мож­но ис­поль­зо­вать толь­ко в том слу­чае, ес­ли точ­но из­вес­тен ад­рес до­ку­мен­та или сай­та, где рас­по­ло­жен до­ку­мент. По­иск по ги­пер­ссыл­кам – наи­ме­нее удоб­ный спо­соб, т. к. с его по­мо­щью мож­но ис­кать до­ку­мен­ты, толь­ко близ­кие по смыс­лу те­ку­ще­му до­ку­мен­ту. По­сколь­ку все веб-стра­ни­цы во Все­мир­ной пау­ти­не фак­ти­че­ски ока­зы­ва­ют­ся свя­зан­ны­ми ме­ж­ду со­бой, П. и. мо­жет быть про­из­ве­дён пу­тём их по­сле­до­ват. про­смот­ра с по­мо­щью брау­зе­ра. Та­кой ме­тод наи­бо­лее тру­до­ёмок, од­на­ко «руч­ной» про­смотр веб-стра­ниц час­то ока­зы­ва­ет­ся един­ст­вен­но воз­мож­ным на за­клю­чит. эта­пах ин­фор­мац. по­ис­ка, тре­бую­ще­го глу­бо­ко­го ана­ли­за. Для те­ма­тич. по­ис­ка ис­поль­зу­ют по­ис­ко­вые ка­та­ло­ги, ко­то­рые яв­ля­ют­ся спра­воч­ни­ка­ми, со­дер­жа­щи­ми спи­ски ад­ре­сов Ин­тер­не­та, и пред­став­ля­ют со­бой сис­те­ма­ти­зир. кол­лек­цию (под­бор­ку) ссы­лок на др. ре­сур­сы Ин­тер­не­та. Как пра­ви­ло, ка­та­ло­ги ор­га­ни­зо­ва­ны в ви­де те­ма­тич. руб­ри­ка­то­ра (нау­ка, иск-во, но­во­сти и т. д.), пред­став­ляю­ще­го со­бой ие­рар­хич. струк­ту­ру (ка­ж­дая те­ма раз­ветв­ля­ет­ся на неск. по­ду­ров­ней), пе­ре­ме­ща­ясь по ко­то­рой мож­но най­ти нуж­ную ин­фор­ма­цию. По­ис­ко­вые ин­дек­сы ра­бо­та­ют как ал­фа­вит­ные ука­за­те­ли. Поль­зо­ва­тель за­да­ёт сло­во или груп­пу слов, ха­рак­те­ри­зую­щих его об­ласть по­ис­ка, и по­лу­ча­ет спи­сок ссы­лок на веб-стра­ни­цы, со­дер­жа­щие ука­зан­ные тер­ми­ны. По­ис­ко­вые ин­дек­сы ав­то­ма­ти­че­ски, при по­мо­щи по­ис­ко­вых ро­бо­тов, ска­ни­ру­ют стра­ни­цы Ин­тер­не­та и ин­дек­си­ру­ют их, т. е. за­но­сят в свою ба­зу дан­ных. В от­вет на за­прос, где най­ти нуж­ную ин­фор­ма­цию, по­ис­ко­вый сер­вер воз­вра­ща­ет спи­сок ги­пер­ссы­лок, ве­ду­щих к веб-стра­ни­цам, на ко­то­рых нуж­ная ин­фор­ма­ция име­ет­ся или упо­ми­на­ет­ся. По­иск с при­ме­не­ни­ем спе­ци­аль­ных средств – фак­ти­че­ски это ав­то­ма­ти­зир. ва­ри­ант про­смот­ра с по­мо­щью ги­пер­тек­сто­вых ссы­лок; це­ле­со­об­ра­зен, ес­ли ис­поль­зо­ва­ние по­ис­ко­вых ма­шин не мо­жет дать не­об­хо­ди­мых ре­зуль­та­тов (напр., в си­лу не­стан­дарт­но­сти за­про­са).

Осн. на­прав­ле­ния раз­ви­тия П. и. вклю­ча­ют по­вы­ше­ние ка­че­ст­ва по­ис­ка не­тек­сто­вых ви­дов ин­фор­ма­ции и муль­ти­языч­ный по­иск (мгно­вен­ный пе­ре­вод лю­бой веб-стра­ни­цы на лю­бой язык ми­ра). Бур­ный рост вы­чис­лит. тех­ни­ки и средств свя­зи при­вёл к по­яв­ле­нию «об­лач­ных» вы­чис­ле­ний (cloud computing), ко­то­рые по­зво­ля­ют осу­ще­ст­в­лять П. и. в глобаль­ной ком­пь­ю­тер­ной се­ти, при этом на­груз­ка на неё рас­пре­де­ля­ет­ся ав­то­ма­ти­че­ски. «Об­лач­ные» вы­чис­ле­ния пред­по­ла­га­ют, что вме­сто при­об­ре­те­ния и ус­та­нов­ки но­во­го про­дук­та (напр., про­грамм­но­го) для соб­ст­вен­но­го ком­пь­ю­те­ра (но­ут­бу­ка, план­ше­та, смарт­фо­на и др.) про­ис­хо­дит арен­да сер­ве­ра у ком­па­нии, пре­дос­тав­ляю­щей ус­лу­ги на ос­но­ве «об­лач­ных» вы­чис­ле­ний (cloud-про­вай­де­ра). Да­лее поль­зо­ва­те­ли управ­ля­ют сер­ве­ра­ми че­рез Ин­тер­нет, оп­ла­чи­вая при этом толь­ко фак­ти­че­ское их ис­поль­зо­ва­ние для об­ра­бот­ки и хра­не­ния дан­ных. Тер­мин «об­ла­ко» ос­но­ван на том, что на схе­мах с изо­бра­же­ни­ем ИТ-ин­фра­струк­ту­ры (IT – information technology – ин­фор­мац. тех­но­ло­гии) Ин­тер­нет обыч­но изо­бра­жа­ет­ся в ви­де об­ла­ка, за ко­то­рым от кли­ен­та скры­ва­ет­ся слож­ная ин­фра­струк­ту­ра и все тех­нич. де­та­ли.

«Об­лач­ные» вы­чис­ле­ния де­лят­ся на не­сколько осн. ка­те­го­рий по ти­пам пре­до­с­тав­ляе­мых ус­луг. IaaS (Infrastructure as a Service) – пре­дос­тав­ле­ние ком­пь­ю­тер­ной ин­фра­струк­ту­ры (ИТ-ин­фра­струк­ту­ры, вклю­чаю­щей сер­ве­ры, се­ти и уст­рой­ст­ва хра­не­ния ин­фор­ма­ции в фор­ме вир­туа­ли­за­ции как ус­лу­ги). PaaS (Platform as a Service) – пре­дос­тав­ле­ние ин­тег­ри­ро­ван­ной плат­фор­мы для раз­ра­бот­ки, тес­ти­ро­ва­ния, раз­вёр­ты­ва­ния и под­держ­ки веб-при­ло­же­ний как ус­лу­ги. SaaS (Software as a service) – биз­нес-мо­дель про­да­жи про­грамм­но­го обес­пе­че­ния, при ко­то­рой раз­ра­бот­чик (он же по­став­щик) раз­ра­ба­ты­ва­ет веб-при­ло­же­ние и са­мо­стоя­тель­но управ­ля­ет им, пре­дос­тав­ляя за­каз­чи­кам дос­туп к про­грамм­но­му обес­пе­че­нию че­рез Ин­тер­нет. DaaS (Desktop as a Service) – мо­дель рас­про­стра­не­ния и экс­плуа­та­ции про­грамм­но­го обес­пе­че­ния. Раз­ли­ча­ют мо­де­ли пуб­лич­но­го (ис­поль­зу­ет­ся од­но­вре­мен­но мно­же­ст­вом ком­па­ний и сер­ви­сов), ча­ст­но­го (без­опас­ная ИТ-ин­фра­струк­ту­ра, кон­тро­ли­руе­мая и экс­плуа­ти­руе­мая в ин­те­ре­сах од­ной-един­ст­вен­ной ор­га­ни­за­ции) и гиб­рид­но­го об­ла­ков.

Идео­ло­гия «об­лач­ных» вы­чис­ле­ний по­лу­чи­ла по­пу­ляр­ность в 2007. Их ин­ду­ст­рия стре­ми­тель­но раз­ви­ва­ет­ся и, по про­гно­зам ана­ли­ти­ков, к 2014 на её до­лю бу­дет при­хо­дить­ся бо­лее 10% всех рас­хо­дов на ИТ, до 2015 «об­лач­ный тра­фик» дос­тиг­нет уров­ня 1,6 зет­та­байт (ЗБ) в год [zettabyte – еди­ни­ца из­ме­ре­ния ко­ли­че­ст­ва ин­фор­ма­ции, рав­ная 270, или 1021 стан­дарт­ным (8-бит­ным) бай­там]. Ана­ли­тич. ком­па­ния «For­rester Research» опуб­ли­ко­ва­ла про­гноз раз­ви­тия рын­ка пуб­лич­ных «об­лач­ных» вы­чис­ле­ний, со­глас­но ко­то­ро­му к 2020 объ­ём «об­лач­но­го рын­ка» со­ста­вит 160 млрд. долл.

Лит.: Гу­сев В. С. Google: эф­фек­тив­ный по­иск. М., 2006; Кле­мен­ть­ев И. П., Ус­ти­нов В. А. Вве­де­ние в об­лач­ные вы­чис­ле­ния. Ека­те­рин­бург, 2009; Оли­фер В. Г., Оли­фер Н. А. Ком­пь­ю­тер­ные се­ти. Прин­ци­пы, тех­но­ло­гии, про­то­ко­лы. 4-е изд. М. [и др.], 2010; Ку­то­вен­ко А. Про­фес­сио­наль­ный по­иск в Ин­тер­не­те. СПб., 2011; Ман­нинг К. Д., Раг­хаван П., Шют­це Х. Вве­де­ние в ин­фор­ма­ци­он­ный по­иск. М., 2011; Фин­гар П. DOT.CLOUD. Облач­ные вы­чис­ле­ния – биз­нес-плат­фор­ма XXI в. М., 2011.

Вернуться к началу