4 июня в блоге собирательного образа службы поддержки пользователей поисковой системы Яндекс Платона Щукина появился весьма любопытный документ «Популярные заблуждения в вопросах ранжирования сайтов». Сотрудники поисковой команды Яндекса вдруг решили повернуться к пользователям лицом и прокомментировать некоторые нюансы алгоритма ранжирования, что делать они не очень-то любят.
Однако, формулировки Платона довольно обтекаемы или не совсем полны и, зачастую, допускают неоднозначное толкование. Сегодня мне бы хотелось поделиться своим видением нескольких наиболее интересных с моей точки зрения ответов Платона из этого документа.
«Страница, релевантная запросу при поиске по сайту, будет присутствовать и в общем поиске.
Не всегда.
Релевантную страницу определяют с учетом множества факторов. При построении общей выдачи некоторые факторы учитываются иначе, поэтому иногда на первой позиции в результатах поиска по сайту и в общей выдаче разные страницы. Проблемы в этой ситуации нет».
Вообще, если под факторами в ответе Платона подразумевать факторы ранжирования, участвующие в формируемой алгоритмом Матрикснет формуле, то получается довольно странная картина, смысл которой не совсем ясен: поиск по вебу и поиск по сайту описывают разные формулы. Однако, на мой взгляд, здесь в первую очередь идет речь о тех факторах, которые применяются уже к построенной Матрикснетом формуле, например, факторы антиспама, в частности, пост-штрафы.
Мне приходилось при анализе поисковой выдачи неоднократно сталкиваться со следующим явлением. Симптомы его таковы – сайт падает в результатах выдачи по запросу со сменой самой релевантной страницы. Однако, если ограничивать область поиска страницами сайта (по ссылке из сниппета «Показать еще с сайта» или с помощью оператора site), то самой релевантной страницей с сайта оказывается прежняя, а не та, которая ее заменила в основной выдаче. Причем, любопытен факт, что если выдачу сужать на меньшее количество документов другими способами, например, с помощью оператора date, то наблюдается аналогичная картина. Самое вероятное, на мой взгляд, объяснение этому факту – наиболее релевантная страница сайта получает пост-штраф по данному запросу по какой-либо причине (например, за переоптимизацию), однако, когда поисковая выдача ограничена сравнительно небольшим количеством документов (что может происходить при ограничении выдачи документами с одного сайта на сайт или ее сужении каким-либо другим способом), то данный пост-штраф не включается. Видимо, чтобы в случае выдачи с относительно малым числом документов, где количество релевантных ответов может быть невелико, антиспам ее сильно не ухудшил. Так что, если у вас при поиске по вебу и при поиске по сайту самые релевантные страницы не совпадают, то, на мой взгляд, это весьма неприятный симптом.
Кстати, на мой взгляд, то же самое явление наблюдается в достаточно популярной среди SEO-аналитиков проверке сайта на пост-штраф путем попарного сравнения по запросу анализируемого сайта с сайтами, ранжирующимися выше него в основной выдаче. Если при попарном сравнении анализируемого сайта с таким сайтом, сужая выдачу с помощью комбинации
запрос
Комментарии