Миссия алгоритма Панда – поиск контента высокого качества. Но что же это такое – высококачественный контент? Как подружиться с этим милым и беспощадным медведем?
Сегодня у маркерной доски выступает Майкл Коттам (Michael Cottam), который объяснит нам, что мы должны сделать, чтобы получить от Панды одобрение.
Всем привет, меня зовут Майкл Коттам, я независимый SEO консультант из Портленда, штат Орегон.
Сегодня мы поговорим про оптимизацию под алгоритм Панда. Никакой голословности: мы расскажем о реальных мерах, конкретных приемах, которые можно использовать. Во-первых, мы поговорим о том, какие факторы измеряет Панда, во-вторых, каким образом она делает это на вашем сайте, и, в-третьих, что вам нужно сделать, чтобы преуспеть, руководствуясь этими факторами.
Для начала вспомним основные факторы, которые касаются Панды:
Прежде всего, стоит поговорить о количестве контента. Когда Панда впервые вышла, многие сайты были сразу же исключены из поиска. Это были сайты, разбитые на множество страниц со всего лишь несколькими предложениями на каждой.
Как же панда измеряет объёмы контента на странице? Пожалуй, эти измерения – самые простые из всех. Нужно всего ничего: выделить все HTML теги и подсчитать слова.
Пример сайта с малым количеством контента – http://www.1001tur.ru/russia/
Прошлым летом serpIQ провел исследование, которое показало: чтобы ваш сайт оказался на первых местах в поисковой выдаче, на каждой странице сайта должно быть 1500-2500 слов. Исследование основано на результатах нескольких десятков тысяч поисковых операций по различным ключевым словам. Выделите HTML теги, подсчитайте слова – сколько их у вас? Проанализируйте свои собственные страницы и посмотрите – получается ли у вас 1500 слов на страницу?
Пример сайта с хорошим количеством контента – http://www.russiadiscovery.ru/
Как мы можем сыграть на этом? Дело в том, что размер имеет значение. 1500 слов – это минимум. Если получится, добавьте еще, до 2000 или 2500. Возможно, даже придется проштудировать весь сайт и собрать контент с четырех-пяти страниц в одну. Вы можете подумать, что в таком случае страница получится гигантской, это плохо для пользователей. Эту проблему можно решить с помощью вкладок навигации, разместив в итоге все содержимое на одной странице. Когда вы кликаете по вкладке, JavaScript изменяет CSS стиль во вкладках, чтобы в открытой вкладке показать только одну часть текста. Google увидит весь текст во вкладках, потому что текст на странице сначала загружается в HTML.
Теперь можно поговорить о втором пункте – уникальности контента. Сейчас в нашем распоряжении тонны материалов, написанных про дублированный контент, в том числе о том, как Google проверяет сайты на его наличие, и какие санкции за него предусмотрены.
В последнее время многие блоггеры писали, что пресс-релизы – это зло, что ссылки не учитываются, и Google не видит их вообще. Теперь Google в этом плане стал намного лучше. Если вы попробуете поискать в Google разосланный вами ранее пресс-релиз и забьете одно-два первых предложений из него, то в выдаче увидите 4-5 проиндексированных страниц с ним. По крайней мере, это лучше, чем было 3 года назад, когда поиск выдавал 60 проиндексированных страниц, не содержащих никакой дополнительной полезной информации.
Пресс-релизы поисковику, пожалуй, проще всего проверить на уникальность. Подумайте, что происходит, когда пресс-релиз публикуется повторно. Допустим, у Google есть шаблон какого-либо новостного сайта или ресурса о промышленности, на котором повторно опубликован пресс-релиз. Шаблон включает верхний/нижний колонтитулы, боковые поля, рекламу и сам пресс-релиз, как сплошной фрагмент материала, каковым он и является. Далее Google постарается «расчленить» страницу, шаблон, верхние, нижние колонтитулы и всё остальное, чтобы увидеть основной контент. И это для него – простейшая задача.
Выдача текста с сайта http://www.ayda.ru/thailand/ - видны сайты, скопировавшие текст с оригинального сайта
Если же на своем сайте вы «переплетаете» фрагменты текста, полученные с разных источников, дополняете собственным материалом и отзывами клиентов, чтобы получить текст, отличающийся от других сайтов, то поисковику будет сложнее понять, что ваш текст не несет никакой уникальной информации.
Что может сделать Google, чтобы понять, дублируется ли этот блок текста на других сайтах? Для этого существуют различные способы, например – хеширование, или обнаружение «следов» в виде повторяющихся словосочетаний и проч.
Сложности для поисковика начинаются тогда, когда у вас есть страницы с контентом, взятым из 12 разных источников. Если это не просто описание продукта, если есть еще и ваши собственные отзывы клиентов, или оригинальное вводное предложение и какой-либо другой уникальный текст, то Google будет очень сложно найти скопированную часть текста. Поисковику станет сложнее понять, где начинается и где кончается фрагмент текста, и соответственно, сложнее сравнить его с другими сайтами.
Что вам нужно сделать? Вам нужно «вплести» в текст оригинальный контент, созданный вами. Это могут быть обзоры, отзывы клиентов, рейтинги и так далее. Добавьте изображения и текст из других источников. Разбейте по-другому. Ведь вам не нужен гигантский блок текста, идентичный текстам на сотнях других сайтов, где продается тот же продукт, что и у вас.
Давайте поговорим о важной части алгоритма Панда – перегруженной верхней полосе страницы. В качестве примера чаще всего приводят навязчивую рекламу поверх окна. Но давайте обратимся к правилам Google, когда алгоритм был только-только запущен.
Оказывается, правило касается не только навязчивой рекламы поверх страницы, но и всего того, что не является целевым контентом. И из-за чего весь нужный контент сдвигается вниз. Суть перегруженности заключается в том, что когда пользователь приходит на страницу, он вынужден проматывать ее вниз, чтобы найти необходимую информацию. Именно в этом и заключается проблема перегруженных первых экранов.
Как Google может определить, перегружена ли страница или весь сайт? Легко. Посмотрите инструменты разработчика, встроенные в Chrome или Firefox – они отображают всю страницу, дают размеры и выделяют то, что находится наверху. Естественно, для Google это также просто.
Пример перегруженного первого экрана – http://www.bigtranstour.ru/
Поисковик не станет углубляться в HTML, относя первые Х слов к верхней части страницы. Сайты больше не отображаются таким образом, поэтому он будет анализировать всю страницу, чтобы определить, не перегружен ли верх. К тому же, в последнее время слишком часто используется CSS-позиционирование.
Проверьте и измерьте пиксели, чтобы определить, что это: реклама, шаблон или контент? На данный момент мы не знаем точно, как Google измеряет эти показатели, и можем лишь догадываться и делать выводы на основе очевидного. Но мы знаем, что учитывается, а что – нет, как написаны парсеры, а как – поисковые боты, и тому подобное. Мы используем всё, что знаем.
Пример неперегруженного первого экрана – http://www.orfey.net/
Будь я Google Пандой, то для того, чтобы определить, контент это или нет, я бы сначала проверил его на кликабельность. Так легче всего определить, связан ли данный элемент с другими. Конечно, это не однозначное доказательство, но меню, реклама и кнопки навигации – все они совершенно точно кликабельны.
Сбить с толку могут и элементы типа карусели с фотографиями, для прокрутки которых требуется кликнуть на них. Но в целом, чтобы сделать быстрый анализ и убедить Google, что в верхней части находится только контент, вам нужно убрать со страницы все кликабельное, все пустое пространство. Тогда на странице останутся только несколько блоков, которые и будут нужным контентом. Скорее всего, так Google и делает.
Как нам поступить в этом случае? Прежде всего – уменьшить шапку сайта. Если шапка имеет много пустого места и много информации, то контент будет съезжать вниз на каждой странице. Проведите анализ: обязательно ли меню должно быть таким широким? Не слишком ли много пустого пространства над логотипом? А может, контент сдвигают кнопки «поделиться»? Обратите внимание на такие детали. Подкорректировав их, вы сможете подвинуть контент вверх.
Можно задать другой вопрос: что значит «первый экран» или «верхняя полоса страницы»? Мы не знаем наверняка, но если предположить, что большинство людей работает в браузерах с разрешением выше 1280 на 1000, то это может послужить нам хорошим ориентиром. Если вы, анализируя собственный сайт, посмотрите на него с разрешением 1280 на 1000, то вы, скорее всего, сможете понять, что именно подразумевает Google под «верхней полосой страницы».
Изображения – это, безусловно, важный контент. Люди любят изображения больше, чем тексты. Они делают взаимодействие с сайтом более интересным. Так как Google измеряет ценность изображений на вашем сайте?
Если у вас есть хорошие и оригинальные изображения, то несомненно их следует показать пользователю. Если же у вас есть фотографии, которые встречаются на других сайтах, то пользы от них будет немного.
Пример сайта с неуникальными изображениями низкого качества http://ros-tour.ru/showNews4.html
Что, скорее всего, будет делать Google? Прежде всего, если вы никогда не пользовались обратным поиском Google по картинкам, то попробуйте. Он невероятно мощный. Я много работаю в сфере туризма, и в туристической индустрии есть одна проблема. Если на вашем сайте есть раздел об отелях, то вам необходимы уникальные фотографии этих отелей, а получить их очень сложно. Только если вы не объездите и не сфотографируете их сами, что, безусловно, очень дорого.
Пример сайта с уникальными изображениями высокого качества – http://www.astravel.ru/catalog/russia/russia/astrakhanobl/goldenfish
Можно взять изображения, которые есть в сети. Допустим, они будут высокого разрешения, более 5 000 точек в формате TIFF. Можно поменять формат на JPG или уменьшить их разрешение до 1000 точек. Вы можете немного обработать это изображение, можете конвертировать форматы. Изменить контрастность или даже наложить на изображение текст, сохранить его с другим именем – Google по-прежнему будет видеть это изображение как неуникальное.
Если вы сделаете обратный поиск отеля по изображениям в Google, то вы найдете сотни других сайтов, на которых будет точно такое же изображение. При этом на разных сайтах изображение будет называться по-разному, иметь разные размеры и форматы.
Обратный поиск по изображениям от Google действительно хорош. Думаю, нет смысла надеяться, что Панда не будет использовать эту возможность, чтобы определить уникальность картинки. Не сегодня, так завтра. Не думайте, что если вы переименуете файл или измените его размер/разрешение, вы получите оригинальную фотографию. Это не так.
Пример сайта с неуникальными изображениями http://www.indigotour.ru/hot/india/56.html#КАЛЛАРИПАЯТУ
Размер изображения, безусловно, является важным фактором, Google собирается его учитывать. Никто не станет заказывать бунгало на берегу моря в Бора-Бора, глядя на маленькую фотографию размером с почтовую марку. Если у вас есть фотография этого места с большим разрешением, то вы владеете шикарным контентом. Ваш сайт, скорее всего, понравится Панде, потому что пользователям совершенно точно понравится размер и уникальность фотографии.
Так как поступить? Используйте оригинальные фото большого размера. Вы можете возразить: «Но как сделать оригинальные фотографии? У меня на сайте несколько сотен или тысяч товаров. И изображения предоставляет производитель. Я не могу делать собственные фотографии».
Обратите внимание на целевые страницы, например, страницы категорий. Для каждого товара это делать необязательно, но страницы категорий должны иметь уникальные изображения. Например, можно сделать коллаж из нескольких фотографий. Возьмите исходники, которые прислали вам производители, и в графическом редакторе сделайте из них коллаж. Получится новое изображение, и ваша целевая страница будет ранжироваться намного лучше.
Конечно, более интересной будет страница с видео, которое можно воспроизводить, или картой, которую можно увеличивать и, допустим, смотреть на ней расположение отелей. Поэтому, помимо всего прочего, Панда еще и определяет, насколько пользователям интересно на вашем сайте.
Каким образом Google собирается это измерять? Вопрос интересный, потому что если вы посмотрите, как устроено видео на YouTube, то увидите, что по умолчанию видео с этого сервиса встраивается на сайты с помощью фрейма. Посмотрите, как инструменты карт встраиваются на сайт – это тоже фрейм.
Пример сайта без интерактивного контента http://www.bvl-voyage.ru/tour_daybook.php?tour_code=7%E1%E2%EC
Пример сайта с полезным контентом http://www.inters.ru/tury/R21.1.html
Чем это плохо? Давайте подумаем о том, как Google расценивал фреймы в прошлом с точки зрения ссылок и контента страниц. Раньше, если вы использовали встроенный фрейм, то Google считал, что вставка принадлежит встроенному фрейму, а не странице, на которой расположен этот фрейм. Поэтому если вы используете встроенные фреймы для добавления карт или видео, то нет уверенности в том, что Панда сможет распознать их как важный контент на вашем сайте.
Остается надежда, что Google работает с такими сайтами как YouTube, Wistia, Vimeo и другими над этим вопросом. Но, знаете, неплохое решение этой проблемы уже есть. С Wistia у вас есть SEO-встраивание, которое создает объект для встраивания, а не фрейм. В YouTube есть флажок, который появляется после кнопки «Поделиться» – «использовать старый код встраивания». Можно поступить таким образом.
Кроме того, чтобы повысить ценность контента на странице, можно сделать вступительное видео для категории, для страницы о компании, для страницы о продукте. Это может быть уже готовый текст, например, для страницы категории или информация о вашей компании. Поговорите на камеру в пределах 30 секунд для вступительного ролика или прочитайте отзыв о вашей работе. Потом используйте расшифровку этого видео в качестве дополнительного контента для страницы.
Если говорить о картах, то я предпочитаю использовать API Google Maps. Это API JavaScript. Возможно, у вас сразу появились вопросы. Может ли Google отследить JavaScript? Думаю, если учитывать, что карты – это собственный проект Google, то конечно им интересно узнать, есть ли на странице встроенная карта.
Пример сайта с видеообзором - http://tonkosti.ru
Хорошо, если вы сделаете скриншот карты и сохраните в формате JPEG. Изображение будет оригинальным или, по крайней мере, будет выглядеть оригинальным для Google, но пользы от него будет меньше, чем от настоящей встроенной интерактивной карты.
Я советую использовать API Google Maps. Думаю, что они сейчас уже в версии 3.0. На самом деле пользоваться Google Maps намного проще, чем вы думаете. К тому же, это положительно влияет на интерактивность контента.
Сегодня я рассказал о многом. Насколько всё это работает? Да, ссылки по-прежнему важны для ранжирования. Два или три года назад я бы сказал, что ссылки – это 80-90% из того, что нужно для продвижения сайта. Но Панда все изменила.
Вот пример. Откройте Google и вбейте в поиск [лучшее время для посещения Таити] (best time to visit Tahiti). Вы найдете мой маленький сайт, Visual Itineraries, под первым номером, выше таких сайтов, как TripAdvisor, Lonely Planet, USA Today. На эти сайты ссылаются большое количество доменов, от 10000 до 250 000. На мой сайт ссылается примерно 100 доменов. И у меня первое место.
Если вы думаете, мол, всё дело во внутренней ссылке на анкорный текст или в совпадении с тайтлом страницы, то вот вам другое доказательство. Сделайте поиск в Google по запросу [когда поехать во Французскую Полинезию] (when should I go to French Polynesia). Единственное слово, которое совпадает с тайтлом страницы или любым анкорным текстом, это слово «во» (to). Это стоп-слово, которое не будет засчитываться. И все равно мой сайт находится на 3-4 позиции на первой странице выдачи, вместе с теми сайтами, на которые ссылаются сотни тысяч доменов.
Открыв мой сайт, пожалуйста, не закрывайте его сразу, посмотрите – иначе у меня повысится показатель отказов. Посмотрите, как я организовал свой сайт. Обратите внимание на небольшой заголовок наверху, на изображения на сайте. Некоторые из них я сделал из скриншотов схем Excel. Еще у меня есть встроенные видео и карты Google Maps.
Майкл Коттам говорит довольно правильные вещи, которые, в целом, не вызывают вопросов. Только с одним моментом я не совсем согласен – в самом начале своей статьи Майкл говорит, что оптимальным для страницы будет содержание объемом 1500 – 2500 слов. Это довольно спорный момент, так как, кроме того, что довольно сложно грамотно и правильно разместить такое количество текста на одной странице, наверняка поднимется вопрос переспама, за что в итоге можно будет получить санкции. Также интересно – акцентируя внимание на Панде, автор словно забыл про ПФ (поведенческие факторы) – нужны ли такие большие тексты рядовым пользователям?
В ходе работы над этой статьёй было сделано интересное наблюдение – в русскоязычной выдаче довольно мало сайтов туристической тематики используют рекомендации, которые озвучил Майкл, – видео про туры или обзоры туров, карты со схемой проезда. Хотя, как раз этих вещей зачастую не хватает для того, чтобы сделать выбор в пользу той или иной компании.
Также было замечено, что фотографии у многих сайтов неуникальные, однотипные и заметно устаревшие. Довольно часто сайты не имеют фотографий хорошего качества, и на веб-ресурсе размещаются миниатюры. Общая тенденция многих сайтов туристической тематики – несовременный дизайн.
Если применить на практике все советы Майкла, то можно быть уверенным, что сайт выиграет в выдаче даже по сравнению с именитыми и «тяжелыми» сайтами.
SEO-специалист Uplab
Яков Коротков
Оригинал: http://moz.com/blog/panda-optimization-whiteboard-friday
Комментарии