ПО́ИСК ИНФОРМА́ЦИИ
-
Рубрика: Технологии и техника
-
Скопировать библиографическую ссылку:
ПО́ИСК ИНФОРМА́ЦИИ в Интернете, последовательность действий (от определения предмета поиска до получения информации) с использованием всех доступных ресурсов поисковых систем. К результатам П. и. предъявляются требования полноты охвата ресурсов, миним. затрат времени и макс. скорости поиска. Высококачественный П. и. требует значит. вычислит. ресурсов, которые, как правило, предоставляются крупными транснациональными корпорациями. Отличит. особенности П. и. в поисковых системах – сбор информац. источников поисковыми роботами (поисковыми машинами), необходимость работы с огромными массивами неструктурированных данных, а также учёт определённых аспектов Интернета, таких как использование графовой структуры Всемирной паутины, анализ действий пользователя и др. Большинство поисковых систем имеют возможность П. и. по ключевым словам (один из самых распространённых видов поиска). Группа ключевых слов, сформированная по определённым правилам, называется запросом к поисковому серверу. Совр. поисковые системы предоставляют возможность подключения к сформированному запросу семантич. анализатора, с помощью которого можно, введя к.-л. слово, выбрать документы, в которых встречаются производные от этого слова в разл. падежах, временах и пр. Пользователь вводит запрос и активизирует поиск; с помощью программы обработки запроса, которая в соответствии с запросом пользователя «просматривает» наличие нужной информации, получает подборку документов по сформулированному запросу. Этот список документов ранжируется в порядке убывания релевантности по определённым критериям (напр., в зависимости от местоположения ключевых слов – в заголовке, в начале текста, в первых параграфах). Несмотря на схожий принцип работы, поисковые системы различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, т. е. если указать в строке поиска для каждой поисковой системы запрос одинаковой конструкции, можно получить разл. результаты поиска. Для каждой поисковой системы существуют определённые правила формирования запроса [напр., в поисковой системе Яндекс ключевые слова в запросе следует писать строчными буквами – это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы; при поиске учитываются все формы слова по правилам рус. языка, независимо от формы слова в запросе; для поиска устойчивого словосочетания следует заключить слова в кавычки; для поиска по точной словоформе перед словом надо поставить восклицательный знак; для поиска внутри одного предложения слова в запросе разделяют пробелом (или знаком &) – несколько набранных в запросе слов, разделённых пробелами, означают, что все они должны входить в одно предложение искомого документа]. Существуют некоторые причины, по которым документ не может быть обнаружен поисковой системой (напр., если в ней данные ресурсы не прописаны).
П. и. может быть произвёден при помощи разл. методов, которые, в зависимости от его целей и задач, могут быть использованы по отдельности или в комбинации друг с другом. Указание адреса страницы – самый быстрый способ П. и., но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ. Поиск по гиперссылкам – наименее удобный способ, т. к. с его помощью можно искать документы, только близкие по смыслу текущему документу. Поскольку все веб-страницы во Всемирной паутине фактически оказываются связанными между собой, П. и. может быть произведён путём их последоват. просмотра с помощью браузера. Такой метод наиболее трудоёмок, однако «ручной» просмотр веб-страниц часто оказывается единственно возможным на заключит. этапах информац. поиска, требующего глубокого анализа. Для тематич. поиска используют поисковые каталоги, которые являются справочниками, содержащими списки адресов Интернета, и представляют собой систематизир. коллекцию (подборку) ссылок на др. ресурсы Интернета. Как правило, каталоги организованы в виде тематич. рубрикатора (наука, иск-во, новости и т. д.), представляющего собой иерархич. структуру (каждая тема разветвляется на неск. подуровней), перемещаясь по которой можно найти нужную информацию. Поисковые индексы работают как алфавитные указатели. Пользователь задаёт слово или группу слов, характеризующих его область поиска, и получает список ссылок на веб-страницы, содержащие указанные термины. Поисковые индексы автоматически, при помощи поисковых роботов, сканируют страницы Интернета и индексируют их, т. е. заносят в свою базу данных. В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих к веб-страницам, на которых нужная информация имеется или упоминается. Поиск с применением специальных средств – фактически это автоматизир. вариант просмотра с помощью гипертекстовых ссылок; целесообразен, если использование поисковых машин не может дать необходимых результатов (напр., в силу нестандартности запроса).
Осн. направления развития П. и. включают повышение качества поиска нетекстовых видов информации и мультиязычный поиск (мгновенный перевод любой веб-страницы на любой язык мира). Бурный рост вычислит. техники и средств связи привёл к появлению «облачных» вычислений (cloud computing), которые позволяют осуществлять П. и. в глобальной компьютерной сети, при этом нагрузка на неё распределяется автоматически. «Облачные» вычисления предполагают, что вместо приобретения и установки нового продукта (напр., программного) для собственного компьютера (ноутбука, планшета, смартфона и др.) происходит аренда сервера у компании, предоставляющей услуги на основе «облачных» вычислений (cloud-провайдера). Далее пользователи управляют серверами через Интернет, оплачивая при этом только фактическое их использование для обработки и хранения данных. Термин «облако» основан на том, что на схемах с изображением ИТ-инфраструктуры (IT – information technology – информац. технологии) Интернет обычно изображается в виде облака, за которым от клиента скрывается сложная инфраструктура и все технич. детали.
«Облачные» вычисления делятся на несколько осн. категорий по типам предоставляемых услуг. IaaS (Infrastructure as a Service) – предоставление компьютерной инфраструктуры (ИТ-инфраструктуры, включающей серверы, сети и устройства хранения информации в форме виртуализации как услуги). PaaS (Platform as a Service) – предоставление интегрированной платформы для разработки, тестирования, развёртывания и поддержки веб-приложений как услуги. SaaS (Software as a service) – бизнес-модель продажи программного обеспечения, при которой разработчик (он же поставщик) разрабатывает веб-приложение и самостоятельно управляет им, предоставляя заказчикам доступ к программному обеспечению через Интернет. DaaS (Desktop as a Service) – модель распространения и эксплуатации программного обеспечения. Различают модели публичного (используется одновременно множеством компаний и сервисов), частного (безопасная ИТ-инфраструктура, контролируемая и эксплуатируемая в интересах одной-единственной организации) и гибридного облаков.
Идеология «облачных» вычислений получила популярность в 2007. Их индустрия стремительно развивается и, по прогнозам аналитиков, к 2014 на её долю будет приходиться более 10% всех расходов на ИТ, до 2015 «облачный трафик» достигнет уровня 1,6 зеттабайт (ЗБ) в год [zettabyte – единица измерения количества информации, равная 270, или 1021 стандартным (8-битным) байтам]. Аналитич. компания «Forrester Research» опубликовала прогноз развития рынка публичных «облачных» вычислений, согласно которому к 2020 объём «облачного рынка» составит 160 млрд. долл.