□ Поиск информации и поисковые машины
□ Как работает поисковая машина
□ Как устроен индекс поисковой машины
Как устроен индекс поисковой машины
Большинство пользователей только в общих чертах представляют себе, как работает поисковая машина. Поэтому в данной главе мы рассматриваем основные понятия и устройство поисковых систем (они же поисковые машины, или поисковики). Если вы хорошо знаете, что такое индекс и поисковый запрос, можете смело пропустить эту главу.
___ Главный элемент структуры современного Интернета — это поисковые машины, или поисковики. Разных поисковиков очень много, но среди них есть главные, наиболее известные и посещаемые. В мировом Интернете сейчас доминирует Google (произносится как «гугл»). В российском же, а точнее, в русскоязычном Интернете (Рунете) наиболее популярный поисковик — «Яндекс». В два раза (по количеству поисковых запросов в день) от «Яндекса» отстает «Рамблер», потом следует «русский» Google, затем, совсем далеко от лидеров, следует «Апорт».
___ Почему именно поисковики заняли в Интернете самое важное место? Потому что они упорядочивают хаос. Ведь сайты и их страницы «разбросаны» в Интернете без какого-либо порядка, без первой или последней страницы, без способа перехода к следующей странице. «Читать» Интернет подряд — невозможно. Ситуация тут такая же, как и с телефонными номерами. Телефонные номера рассыпаны в беспорядке в «пространстве» всех телефонных номеров. Есть, конечно, какие-то закономерности в распределении первых цифр номера (можно догадаться о районе города по номеру АТС или угадать оператора мобильной связи), но чтобы найти точный номер нужной организации, нужна записная книжка или какой-то другой список персон или организаций. Именно поэтому для номеров телефонов существуют справочники. Аналогом телефонных справочников в Интернете сейчас служат поисковые машины, которые обеспечивают «прозрачность» Интернета для пользователей. Как же они это делают?
Поиск информации и поисковые машины
___ За века, прошедшие со времени изобретения книг, человечество придумало только три основных способа поиска информации в большом количестве страниц. И каждый из нас встречался с ними еще до своего первого выхода в Интернет. В Интернете используются эти же способы для поиска нужной страницы, просто они автоматизированы и выполняются специальными программами. Эти способы — оглавление, ссылки и предметный указатель.
Оглавление
___Первый, самый естественный способ поиска нужной страницы — оглавление книги. Читатель книги просматривает ее оглавление, находит нужную главу, видит номер нужной страницы и открывает ее, пролистав книгу до нужного номера страницы.
Поиск информации и поисковые машины
___Этому способу поиска в Интернете соответствуют каталоги.
___В них страницы (сайты Интернета) разложены по рубрикам, так что пользователь может, последовательно просматривая оглавление каталога, выбрать нужную рубрику, просмотреть сайты, относящиеся к ней, а затем перейти на нужный сайт или
страницу.
___Сначала именно каталоги были основным способом упорядочения Интернета (в середине 1990-х годов), но потом постепенно уступили первенство поисковикам и на то было много причин. О существующих каталогах мы рассказывали в главе 1 «Предложение и поиск информации в Интернете".
Ссылки
___В Интернете идею отсылок читателя со страницы на страницу превратили в автоматические ссылки на страницы, на которых пользователь просто щелкает кнопкой мыши. Ссылки в Интернете называются гипертекстовыми ссылками («ги-пер» — потому, что ссылка уводит за пределы текста, на другую страницу).
___Ссылки — это основной, «корневой» принцип Интернета, а ведь, по сути, это старая идея, просто автоматизированная текстовая ссылка.
___Ссылки в каталогах и на обычных сайтах чаще всего расставляют вручную — вебмастер размечает специальными пометками фрагмент текста и присоединяет к нему адрес соответствующей страницы. Конечно, часто ссылки расставляются и автоматически при формировании веб-страницы.
|