Поисковые системы

ЗДРАСТВУЙТЕ

Делаю сайты, электронные учебники в виде сайта на заказ. Цена договорная (тел. 8-904-634-45-18) http://vkontakte.ru/id3019903

Мои сайты

http://sdhunters.narod.ru/
http://www.sqluchebnick.narod.ru/


Что такое поисковые системы?

Помочь пользователю найти нужную информацию в Сети призваны поисковые системы. В поиске нужных ресурсов пользователь вводит одно или несколько ключевых слов, которые, по его мнению, лучше всего отражают суть интересующего вопроса. Поисковая система за считанные секунды просматривает весь собственный каталог веб-ресурсов (индекс), состоящий из десятков и сотен гигабайт информации. В результате предлагается список ссылок на страницы, в которых встречаются указанные слова.

Любой поисковый сервер представляет собой огромное хранилище информации. Собирают эту информацию специальные роботы - так называемые Spiders (пауки) или Bots. Они ползают по узлам всемирной паутины и собирают данные о сайтах - индексируют их. Периодически робот возвращается на свой сервер и отдает ему собранную информацию. Там эта информация приводится в надлежащий вид, заносится в специальную базу данных и после этого может быть найдена пользователем поисковых сайтов. По некоторым данным, поисковые сервера могут дать Вам от 30 до 60% суммарного трафика веб-сайта.

Даже начинающий интернет-пользователь в подавляющем большинстве случаев начинает поиск в интернете нужной ему информации, товара или услуг с соответствующего запроса в поисковую систему или тематический каталог/рейтинг, которых в мире существует десятки тысяч.

Самые известные из них:
мировые - Google.com, Yahoo.com, Altavista.com, Alltheweb.com
российские - Yandex.ru, Rambler.ru, Aport.ru, Mail.ru

Сайты, занимающие первые 1-2 страницы в результатах поиска по заданным ключевым словам, обречены на большой приток посетителей. Таких посетителей еще называют целевыми, за них и идет конкуренция в интернете между коммерческими сайтами и проектами. По статистике - клиентами могут стать от 0.5 до 1% целевых посетителей.
Отсюда ясно, что, при прочих равных условиях (дизайн и интерфейс сайта, цены и качество предлагаемых на нем товаров и услуг, убедительность представленной на сайте информации), количество клиентов пропорционально количеству целевых посетителей.

   На начальном этапе развития интернета, число пользователей сети было невелико и количество информации относительно небольшим. В подавляющем большинстве случаев пользователями Интернет были сотрудники различных университетов или научных организаций. В то время поиск нужной информации в сети был не столь актуален, как теперь.
  • Одной из первых попыток организации доступа к информационным ресурсам сети стало создание тематических каталогов сайтов. Первым, открывшимся в апреле 1994 г, стал Yahoo. Это еще не было поисковой системой, в современном понимании, т.к. возможность поиска информации ограничивалась ресурсами зарегестрированными в каталоге Yahoo.
  • Каталоги ссылок ранее использовались довольно широко, но в настоящее время практически утратили свою популярность . Объяснение этому очень простое – даже современные, содержащие огромное количество ресурсов каталоги, представляют информацию лишь о довольно незначительной части сети. Для сравнения - самый полный каталог сети интернет - DMOZ содержит информацию о примерно 12.000.000 ресурсов, в то время как база данных самой полной поисковой системы Google состоит из более чем 28.000.000.000 документов.
  • Первой полноценной поисковой системой в 1994г. стал проект WebCrawler. Далее в 1995 году появились поисковые системы AltaVista и Lycos.
  • В 1997 году в Стэнфордском университете, в рамках исследовательского проекта, была создана Google - самая популярная поисковая система на данный момент в мире.
  • В 1997 году появилась поисковая система - Yandex, лидер в русскоязычной части Интернета.
  • На данный момент основными поисковыми системами являются три международных – Google, Yahoo и MSN Search. Остальные, коих не мало, используют целиком или частично базы и(или) алгоритмы выше приведенных систем.
  • В Рунете основной поисковой системой является Яндекс, далее по популярности идут Rambler, Google.ru, Mail.ru и Aport

    Поисковая система - это сумма следующих компонентов

    1. Web server (веб-сервер) – сервер поисковой машины, который осуществляет взаимодействие между пользователем и остальными компонентами системы.
    2. Spider (паук)- программа написанная по принципу браузера, предназначена для скачивания веб-страниц. Браузер предназначен для визуального использования страниц, а паук работает с HTML кодом напрямую. Чтобы посмотреть "сырой" исходник нажмите в меню браузера: Вид- Просмотр HTML кода
    3. Crawler («путешествующий» паук) – программа, которая автоматически уходит по всем внешним ссылкам страницы. Ее задача - поиск не известных (или измененных) документов и в расстановке приоритетов, куда дальше должен идти Spider.
    4. Indexer (индексатор) - программа-анализатор скаченных пауками веб-страниц. Она "разбирает" на части скачанную страницу и анализирует ее элементы, такие как текст, служебные html-теги, заголовки, особенности стилистики и структурные формы
    5. Database (база данных) – хранилище для скачанных и обработанных страниц - общая база данных поисковой машины.
    6. Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных поисковой системы. Именно она решает, какие страницы более соответствуют запросу пользователя и отсортировывает их в нужном порядке. Модуль работает согласно заданным поисковой системой алгоритмам ранжирования
    7. Так-же в поиковые ситемы встроены различные модули: определение IP-хоста сайта, WHOIS - определение имени владельца и сроков регистрации, copyscape - проверка "заимственности" содержания сайта и многое многое другое.
  •