Иногда на сайтах могут появляться дубли – страницы, где содержание текста почти полностью совпадает. Дубли способны заменять в выдаче ценные страницы или замедлять индексирование сайтов. Яндекс.Вебмастер упрощает поиск таких страниц: в разделе «Диагностика» появилось уведомление, сообщающее о дублях из-за GET-параметров.
Как пишет SEOnews, такое уведомление появится само и подписываться на него не нужно. При этом данные обновляются с задержкой в 2-3 дня, поэтому в отображаемую информацию могут не попасть уже исправленные страницы.
Дубли страниц с GET-параметрами. Изображение: webmaster.yandex.ru
Если дубли обнаружены, следует:
- Найти в Вебмастере раздел «Страницы в поиске» и выбрать в таблице «Исключенные страницы».
- Загрузить архив в подходящем формате и посмотреть скачанный файл: дубли будут иметь статус DUPLICATE.
Для того, чтобы оставить в поиске страницу, нужно:
- Добавить в файл robots.txt директиву Clean-param – так робот не станет учитывать незначащие GET-параметры в URL.
- Если добавить директиву Clean-param невозможно, то следует указать канонический адрес страницы, который будет участвовать в поиске. Однако нагрузку на сайт это не уменьшит.
- В случае, когда два первых варианта не подходят, можно закрыть дубли от индексации при помощи директивы Disallow.
Более подробно о работе с дублями Яндекс рассказал в блоге для вебмастеров.
Комментарии