Rating-News.ru - Агрегатор новостей
  • Круглосуточный контроль информационного поля
  • Мониторинг СМИ в 2 клика
  • Результаты анализа в виде таблиц
  • Доступ с любого ПК через интернет круглосуточно

ИНФОРМАЦИЯ О КРУПНЕЙШИХ ЗАРУБЕЖНЫХ ПОИСКОВЫХ СИСТЕМАХ.

GOOGLE (www.google.com)

Самая популярная среди пользователей и имеющая одну из самых больших баз проиндексированных документов (по собственным заявлениям - около 8 млрд.) поисковая система. Поисковый движок был разработан в 1997 году выпускниками Стэндфордского университета Сергеем Брином (Sergey Brin) и Ларри Пейджем (Larry Page), которые применили для ранжирования документов технологию PageRank, где одним из ключевых моментов является определение "авторитетности" конкретного документа на основе информации о документах, ссылающихся на него. Говоря общими словами, чем больше документов ссылается на данный документ и чем они авторитетнее, тем более авторитетным данный документ становится. Количественное значение авторитетности документа (другими словами, взвешенное количество ссылок или PageRank) относится к так называемым статическим факторам (т.е. независящим от конкретного запроса) и учитывается при определении релевантности документа конкретному запросу как весовой коэффициент. Наряду с этим Google применил для определения релевантности документа не только текст самого документа, но и текст ссылок на него. Эта технология позволила ему обеспечить выдачу довольно релевантных результатов на фоне других поисковиков. Довольно быстро Google стал лидировать в различных опросах по такому показателю, как удовлетворенность пользователей результатами поиска. Кроме поиска по HTML документам Google в настоящее время осуществляет поиск еще по другим типам документов, таких как Adobe Portable Document Format (pdf) или Microsoft Word (doc).

Google позволяет пользователям просматривать сохраненные копии документов, содержащихся в его поисковой базе.

Наряду с поиском по документам Google имеет сервисы поиска по изображениям (images.google.com), группам UseNet (groups.google.com), новостям (news.google.com), товарам (froogle.google.com), местный поиск по предприятиям и услугам (local.google.com) и другие поисковые сервисы, а также каталог сайтов (directory.google.com) на основе каталога Open Directory Project (dmoz.org). Google осуществляет поиск по документам на почти 100 языках, в том числе русском (русская локализация поисковика находится по адресу www.google.ru). В настоящее время многие порталы и специализированные сайты предоставляют услуги поиска информации в интернете на базе Google, что делает задачу успешного позиционирования сайтов в Google еще более важной. Крупнейшие из них - порталы AOL (www.aol.com), Netscape (www.netscape.com), iWon (www.iwon.com).

Нормированное значение показателя авторитетности PageRank для конкретного документа, загруженного в браузер, можно узнать, скачав и установив Google ToolBar (toolbar.google.com) - специальную панель инструментов для работы с этим поисковиком. Несмотря на то, что в поисковике имеется форма для бесплатного добавления страницы в базу, Google предпочитает сам находить новые документы по ссылкам с уже известных и не будет индексировать добавленную через форму страницу, если в его базе не найдется ни одной страницы, ссылающейся на нее.

Форма бесплатного добавления документов в поисковую базу находится по адресу http://www.google.com/addurl/.

Имеет собственную систему контекстной рекламы в результатах поиска Google AdWords (adwords.google.com).

YAHOO! SEARCH (search.yahoo.com)

Портал Yahoo! (www.yahoo.com) был основан в 1995 как каталог сайтов. С 2000 года после результатов поиска по каталогу в качестве дополнительных результатов стала появляться выдача поискового движка Inktomi. В 2001 году ее сменили результаты поиска Google, которые с 2002 стали выдаваться по умолчанию вместо результатов поиска по каталогу. В феврале 2004 года Yahoo! прекратил сотрудничество с Google и стал выдавать результаты своего собственного поискового движка. К этому времени Yahoo! были приобретены поисковые движки Inktomi, AllTheWeb и AltaVista, на основе которых и был создан свой собственный механизм поиска.

Наряду с поиском по документам (search.yahoo.com) портал Yahoo! предоставляет возможность поиска по изображениям, видеофайлам, каталогу, товарам, локальным предприятиям и услугам.

Если документ зарегистрирован в каталоге, то в сниппетах поисковой выдачи приводится его каталожное описание.

Результаты поискового механизма Yahoo! Search также транслируются на других поисковых сервисах, крупнейшими из которых являются принадлежащие Yahoo! сервисы AltaVista (www.altavista.com) и AllTheWeb (www.alltheweb.com), некогда имевшие собственные поисковые движки.

Так же, как и в Google, в поисковом движке Yahoo! Search существует понятие авторитетности документа, называемое Yahoo! Web Rank. Непродолжительное время после запуска собственного движка индикатор Yahoo! Web Rank можно было наблюдать, скачав и установив бета-версию Yahoo! Toolbar (toolbar.yahoo.com). Некоторые сайты предлагают сервисы по определению значения Yahoo! Toolbar (например,http://www.digitalpoint.com/tools/webrank/), но за корректность их показаний сложно ручаться.

В поисковую базу новые документы можно бесплатно добавить по адресу http://submit.search.yahoo.com/free/request, однако для этого потребуется пройти процедуру регистрации пользователя. Также есть возможность платной регистрации Search Submit Express, которая гарантирует постоянную 48-часовую переиндексацию документов.

Контекстная реклама в результах поиска осуществляется через собственный сервис Yahoo! Search Marketing (searchmarketing.yahoo.com), который организован на основе системы pay-per-click рекламы Overture, приобретенной порталом Yahoo! в октябре 2003 года.

MSN SEARCH (search.msn.com)

Поисковый сервис на портале MSN (www.msn.com) появился в 1998 году. До 2004 года он представлял собой трансляцию выдачи поискового сервиса Looksmart, который в свою очередь, в качестве главных результатов предоставлял результаты поиска по собственному каталогу, а в качестве вторичных - выдачу поискового движка Inktomi. В конце 2003 MSN Search отказался от услуг LookSmart и стал транслировать выдачу поискового движка Inktomi, параллельно разрабатывая свой собственный поисковый механизм. Этот механизм был официально введен в эксплуатацию 1 февраля 2005 года и содержит на данный момент более 5 миллиардов документов.

Кроме поиска по документам портал MSN предоставляет возможность поиска по новостям, изображениям, музыкальным файлам и энциклопедическим статьям.

Авторитетность документа, также как и у рассмотренных выше поисковых машин, является одним из ключевых факторов при ранжировании, однако никакой информации о значении этого параметра для конкретного документа не предоставляется пользователю.

Добавление документов в поисковую базу бесплатно и осуществляется с помощью формы, находящейся по адресуhttp://search.msn.com/docs/submit.aspx.

Контекстная реклама в результатах поиска осуществляется через собственный сервис MSN Advertising (http://advertising.msn.com/), сервис Yahoo! Search Marketing.

TEOMA (www.teoma.com)

Поисковый механизм разработан в 2000 г. При определении авторитетности документа по теме запроса учитывает тематическую популярность (Subject-Specific Popularity), то есть цитируемость документа документами сходной тематики, которая определяется с помощью алгоритма HITS (Hyperlink-Induced Topic Search), разработанного Джоном Клейнбергом (Jon Kleinberg). Этот алгоритм определяет важность страниц по двум критериям - "авторитеты" (authorities), то есть цитируемость другими страницами, и "хабы" (hubs), то есть ссылаемость на другие страницы, затем разбивает страницы на сообщества, каждое из которых представляет одну из возможных тем. Внутри сообщества вычисляется значение "авторитет"-веса каждой страницы как сумма "хаб"-весов, ссылающихся на нее страниц, и "хаб"-веса каждой страницы как сумма "авторитет"-весов цитируемых страниц. Эти значения выступают весовыми коэффициентами при определении релевантности страницы запросу. Однако алгоритм HITS плохо работает для очень конкретных запросов, в этом случае бывает невозможно выделить для них тематическое сообщество, и все документы ранжируются на общих основаниях. Подробное описание алгоритма HITS можно найти в статье Клейнберга "Авторитетные источники в гиперссылочной среде" ("Authoritative Sources in a Hyperlinked Environment", http://www.cs.cornell.edu/home/kleinber/auth.pdf).

Teoma также предлагает пользователю ряд дополнительных сервисов - уточнение запроса в виде несколько ключевых фраз по теме запроса и ссылки на страницы по теме запроса, подготовленные, коллективом экспертов и энтузиастов. В 2001 году Teoma была приобретена компанией Ask Jeeves, и ее поисковые результаты используются довольно популярным в Европе (особенно в Великобритании) поисковым сервисом Ask Jeeves (www.ask.com), что делает ее интересной в свете раскрутки англоязычных сайтов. Русского языка Teoma не поддерживает и для раскрутки сайтов, имеющих только русскоязычную версию, на данный момент совершенно бесполезна.

Специальных возможностей для регистрации документов в Teoma на данный момент не существует. Сервис регистрация и перерегистрация сайтов на платной основе закрыт. Teoma включает в свою базу документы, самостоятельно найденные роботом по ссылкам с уже имеющихся в поисковой базе документов.

Контекстная реклама в результатах поиска осуществляется с помощью сервиса Google AdWords.

Другие поисковые машины

Из множества глобальных поисковых систем, не являющихся лидерами, можно упомянуть, пожалуй, WiseNut (www.wisenut.com), разработанный в Корее в 2001 году и приобретенный 2002 году компанией LookSmart. Однако популярность WiseNut среди пользователей остается довольно низкой по сравнению с вышеупомянутыми поисковыми машинами.