Материал предоставлен https://it.rfei.ru

Современные поисковые системы

В 2014 году статистика использования поисковых систем российскими пользователями была следующая (источник, данные сентябрь 2014):

Статистика использования поисковых систем пользователями Рунета

Статистика для США выглядит следующим образом (источник, данные сентябрь 2014):

Разделение рынка поисковых систем США

Google

Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на ее основе создали систему Google. Cистема Google до сих пор остается самой популярной поисковой системой сети Интернет. За все время нахождения Google на рынке пока еще ни одной из конкурирующих поисковых систем не удалось сместить американскую поисковую систему с лидирующих позиций.

Google имеет наиболее обширную базу данных. Кроме того, среди основных преимуществ этой поисковой систем можно назвать высокую скорость работы. Перед специалистами компании Google стояла задача сделать работу поисковой системы быстрой и эффективной, и им это удалось. Сделав запрос, пользователи практически мгновенно получают результаты поиска (на это уходит всего лишь несколько секунд).

Плюс ко всему поисковая система Google выдает достаточно точную информацию. Результаты поиска в большинстве случаев соответствуют совершаемым запросам. При этом ссылки на сайты, которые более всего соответствуют указанным ключевым словам, находятся в верхней части страницы. Также отметим, что Google учитывает не только количество страниц в результатах поиска, но и их качество.

Таким образом, Google считается самой быстрой и эффективной, что позволяет ей завоевывать доверие всѐ большего количества пользователей сети Интернет, что обеспечивает ей звание самой популярной поисковой системы. Кроме того, специалисты компании Google занимаются постоянным усовершенствованием возможностей своей поисковой системы, что дает превосходные результаты.

Яндекс

Яндекс — российская ИТ-компания, владеющая одноименной системой поиска в Сети и интернет-порталом. Поисковая система “Яндекс” является седьмой среди крупнейших поисковых сайтов мира по количеству обработанных поисковых запросов (1,892 млрд, статистика за декабрь 2009 года).

Основным и приоритетным направлением компании является разработка поискового механизма, но за годы работы Яндекс стал мультипорталом. Сейчас Яндекс предоставляет более 40 различных сервисов (посмотреть все сервисы можно здесь). Самыми популярными являются: Яндекс.Картинки, Яндекс.Почта, Яндекс.Погода, Яндекс.Новости и другие.

Яndex расшифровывается как Языковый Индекс или, в английском написании, Yandex – Yet Another iNDEX. Также можно рассматривать Яndex как частичный перевод слова “Index” с английского на русский язык (”I” означает “Я”).

Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex.ru на тот момент были:

  1. Проверка уникальности документов (исключение копий в разных кодировках).
  2. Учет морфологии русского языка (в том числе и поиск по точной словоформе).
  3. Поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание).
  4. Тщательно разработанный алгоритм оценки релевантности, учитывающий не только количество слов запроса, найденных в тексте, но и “контрастность” слова (его относительную частоту для данного документа), расстояние между словами и положение слова в документе.

Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счет гибкого языка запросов (памятка по использованию языка запросов). Так, например, для операции исключения можно указать область действия: запрос A ~~ B найдет документы (страницы), в которых присутствует А, но не присутствует В, а запрос А ~ Б — документы, где слово Б не присутствует со словом А в одном предложении. Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && — во всем документе.

Оператор ! позволяет отключить морфологию для конкретного слова, а !! позволяет указать нормальную форму, что позволяет обойти некоторые проблемы связанные с омонимией. Например запрос !!Иванов будет находить Иванова и Ивановых, но не Ивана.

Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), двоичных форматах Word (.doc), Excel (.xls), PowerPoint (.ppt), Flash (.swf), RSS (блоги и форумы).

Механизм и термины веб-поискаПоисковые системы. Проверка знаний