вторник, 29 января 2008 г.

Поисковые машины (поисковые серверы, поисковые роботы)

Средства поиска этой группы позволяют пользователю по оп­ределенным правилам сформулировать требования к необходи­мой ему информации. После этого машина поиска автоматиче­ски просматривает документы на контролируемых (индексируе­мых) ею сайтах и отбирает соответствующие сформулированным пользователем требованиям.

В результате поиска создается одна или несколько страниц, со­держащих ссылки на релевантные запросу документы (Web-стра­ницы). Для каждой такой ссылки обычно также указываются дата создания документа, его объем, степень соответствия запросу, фрагменты текста, характеризующие содержание документа. Щел­чок на такой ссылке позволяет загрузить нужную страницу.

В случае большого количества найденных документов можно уточнить запрос и повторить поиск, но только среди отобранных страниц. В ряде машин поиска можно отметить ссылку на страни­цу, содержание которой в наибольшей степени удовлетворяет Ва­шим потребностям, и повторить поиск, потребовав искать похожие.

Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации. Однако сложность точного описания запроса и сложность авто­матического определения степени соответствия запросу просмат­риваемых роботом страниц приводят к тому, что количество страниц, отобранных «с первого захода», обычно или очень мало или чрезмерно велико. В целом поиск с использованием поиско­вого робота представляет собой итеративный процесс, в результа­те которого постепенно уточняется форма запроса.

Каждая машина поиска предусматривает формулировку за­проса на одном из понятных ему языков. Для поиска по русским

ключевым словам созданы специальные русскоязычные машины поиска. Некоторые из них одновременно допускают ввод англий­ских слов.

При использовании машин поиска следует иметь в виду, что они отличаются количеством и составом просматриваемых сай­тов, языком запросов, алгоритмами определения степени соот­ветствия документа сформулированному запросу, В силу этого количество и состав Web-страниц, отобранных для одного и того же запроса разными машинами поиска, могут различаться. Мно­гие современные машины поиска могут выполнять поиск, обра­тившись к другой поисковой системе или каталогу, например из Яндекса искать в Апорте или в List.ru.

Существуют следующие четыре вида поиска: естественно-языковой (или простой), строгий (или с языком запросов), расши­ренный и специальный. При всех видах поиска в специальном поле запроса задается фраза (ключевые слова) для поиска, воз­можно содержащая управляющие символы (спецсимволы, опера­торы), посредством которых можно уточнить допустимые сочета­ния ключевых слов. Информации, заданная в поле запроса, назы­вается запросом или строкой запроса.

При естественно-языковом поиске в строке запроса задается предложение или набор слов наиболее полно отражающих пред­мет поиска, например, социально-экономические показатели раз­вития России. Обычно операторы при простом поиске не исполь­зуются, а специальные символы в строке запроса игнорируются.

При строгом поиске в строке запросов помимо ключевых слов содержатся операторы, с помощью которых на специальном язы­ке формулируются сложные запросы, В запросе также могут быть указаны дополнительные требования к искомым документам, в

частности, ограничение на дату создания искомых документов, указание области поиска документов (на конкретном сервере или на определенном множестве серверов) и др.

Использование строгого поиска позволяет формировать за­просы большой сложности, отсекающие посторонние документы и снижающие затраты времени пользователя на их просмотр н списке найденных документов. Однако это требует от пользова­теля знания языка запросов.

При расширенном поиске требования, дополняющие список ключевых слов, могут быть указаны путем заполнения полей в специальной форме.

Специальный поиск применяется для поиска сайтов организа­ций, издательств, обществ и др. и также сводится к заполнению полей.

Знакомство с любой поисковой системой должно начинаться с изучения форм расширенного поиска или/и со знакомства с язы­ком запросов. В домашней странице поисковых машин всегда имеются ссылки на подобную информацию. Языки и формы за­просов для различных систем отличаются, но это различие незна­чительно и после овладения одной системой переход к другой не вызывает особых сложностей.