Поисковые системы и принцип их работы

Поисковые системы и принцип их работы Поисковая система – программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете, и, как результат работы системы, выдают по заданному запросу пользователя ссылки на сайты, соответствующие введенному запросу. Итог работы системы – есть поисковая выдача.
Среди многих поисковых систем, наиболее востребованными среди «русскоязычной» аудитории, на сегодняшний день являются Google и Яндекс, а также Rambler.
Как они работают? Вот в этом попробуем разобраться.

Основные принципы работы

Поисковые машины (search engines) Машины веб-поиска (поисковых систем) - это сервера с огромной базой данных URL-адресов, которые автоматически обращаются к страницам WWW по всем этим адресам, изучают содержимое этих страниц, формируют и прописывают ключевые слова со страниц в свою базу данных (индексирует страницы).
Изучение содержания (текста) сайта поисковой системой происходит с помощью специального модуля - поисковый “паук” (crawler). Его задача заключается в том, чтобы просмотреть текст сканируемой страницы и оставить информацию (индекса) о ее содержании.

При индексации сайта происходит анализ текста, выбор всех слов из выкаченных страниц и дальнейшее расположение этих слов в алфавитном порядке вместе с адресами этих страниц. Во время поиска, происходит обращение к индексу по определенному запросу, поиск всех записей по данному слову и извлечение из индекса всех адресов страниц, относящихся к введенному запросу.
Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Простой запрос дает некоторое количество ссылок на документы, поскольку в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание.
Наиболее усовершенствованным среди русскоязычных поисковых систем является поисковый сервер Яндекс. В форме поиска Яndex можно написать по-русски фразу, которая приблизительно описывает то, что ищите, и благодаря своим некоторым операторам языка запросов, система постарается найти все, что относится к заданной области поиска.
Не менее популярная поисковая система Rambler, которая для увеличения (уменьшения) значимости вводимых в форме запроса фраз, также поддерживает те же операторы И, ИЛИ, НЕ, метасимвол *, коэффициентные символы + и -. Отметим изюминку Rambler - это статистика посещаемости ссылок, что хранится в собственной базы данных.

Но вернемся к индексации. При индексации текста со страниц одновременно происходит и индексация ссылок, так как, это необходимо для:
--- пополнения ссылок страниц. При индексации ссылок поисковики пополняют свой список веб-страниц;
--- поиск ссылок на заданный сайт. Большинство поисковиков позволяют вести поиск по конкретным ссылкам на заданный сайт или его страницу;
--- вычисление ранга авторитетности страниц. При помощи ссылок поисковые машины анализируют структуру ссылок сайтов друг на друга, для определения авторитетности страницы. Принцип прост: на кого больше ссылаются, тот и более авторитетен;
--- использование текста ссылок. Анализируя текст ссылки, поисковики могут получить тематическую классификацию страницы, иными словами краткое смысловое описание страницы.

Поскольку роботы поисковых систем переходят по встречаемым на страницах ссылкам и переиндексируют их, то страницы, на которые никто не ссылается, имеют очень мало шансов попасть в индекс поисковика. В связи с этим, добавление в поисковые системы адреса сайта, является первым шагом для «знакомства» сайта с Интернетом.
Поисковые системы являются самыми масштабными и ценными, но далеко не единственными источниками информации в Сети. Еще существуют Каталоги, Подборки ссылок, Архивы Gopher и Система поиска FTP-файлов и это еще не все.


Похожие материалы

Файл sitemap.xml

Файл sitemap.xml

Файл с информацией о страницах сайта для поисковых систем. Он оказывает помощь поисковым системам в сканировании и индексировании страниц сайта

Способы ускорения индексации сайта

Способы ускорения индексации сайта

Как увеличить количество визитов робота на страницы вашего сайта? Ответ на этот вопрос можно отыскать в этой статье, в которой приведены несколько способов для увеличения индексацию сайта.

Продвижение и регистрация сайта

Продвижение и регистрация сайта

Создать и разместить сайт - это хорошо. Вот только как правильно его продвинуть в Интернете? ведь Интернет - это это огромное количество информации, которая обновляется каждый день.



Яндекс.Метрика
  PR-CY.ru