X
    Categories: Оптимизация сайта

Как найти и обезвредить дубли страниц Replytocom

Приветствую Вас, уважаемые читатели!

Сегодня я расскажу о том, что за страшный зверь дубли страниц replytocom, как проверить свой сайт на replytocom и как удалить дубли страниц?

Вы, наверное, подумали, что я начал играть в компьютерную игру или начитался книг в стиле фэнтези или фантастики и там нашел такой термин? Нет, все намного проще. После очередного анализа своего блога при помощи программы Site Auditor я обнаружил, что Яндекс индексирует 43 страницы, а Google 3010(!). Я начал изучать материал по данной теме и узнал, что такое дубли страниц и насколько это вредно?

 

Также в последнее время заметил, что по поисковым запросам Google стал относится ко мне принебрежительно. Если месяц назад картина была такой:

То сейчас все намного хуже:

Итак, мне стало интерсно,  что происходит?

Как обнаружить дулированный контент replytocom?

здесь ваш рекламный код №1

Когда я установил бесплатную программу Xenu Link Sleuth  и провел анализ своего блога, то обнаружил огромное количество ссылок на страницы, в конце которых значилось l?replytocom=454.

Их было очень много, учитывая, что на моем блоге всего 70 записей, а цифра проиндексированных страниц 3010! После этого я выяснил, что же такое replytocom.

Движок Вордпресс довольно хорош, но одним из его недостатков является то, что при использовании древовидных комментариев, создаются дубли страниц. А древовидные комментарии установлены у всех по умолчанию, хотя в платных шаблонах может и по другому.

Под каждым комментарием есть кнопка “Ответить”, если на него навести, то слева внизу вы сможете увидеть адрес .  Это означает, что при ответе, создается новая страница, дублирующая предыдущую,  с таким же адресом и добавлением http//:…Replytocom=1402#respondent.

Проведите маленький эксперимент: откройте поисковик Google и вбейте в строку поиска site: вашсайт.ру replytocom, где вместо вашсайт.ру вставьте адрес вашего блога.

Вот какая картина была у меня

Из этого видно, что надо как то менять картину и удалять дубли страниц с Replytocom.

Как удалить дубли страниц Replytocom

  1. Отключаем древовидные комментарии

Заходим в админку » Настройки»  Обсуждения и убираем галочку “включить древовидные комментарии” и обязательно опускаемcя вниз и жмем  “Сохранить”

Не переживайте за старые комментарии, они все останутся, только будут расположены в столбик.

Согласен, что древовидные комментарии очень удобны, без них будет не весьма удобно для читателей сайта. Один из путей реализации — можно установить плагин WordPress Thread Comment, который установлен на моем блоге. После установки этого плагина  дубли replytocom образовываться больше не будут.

После отключения дубли создаваться не будут, но нам нужно убрать от индексации уже созданные, для этого идем далее.

 2. Вносим изменения в файл robots.txt

Поскольку файл  robots.txt  является лишь рекомендацией для поисковых роботов, то его изменение не гарантирует изменение в индексации роботом Google, тем не менее,  я УДАЛИЛ следующие строки из файла robots.txt:

Disallow: /*?replytocom

Disallow: /*?*

Disallow: /*?

После этого, за 2 месяца количество проиндексированных страниц уменьшилось:

11 ноября их 3010

11 января их 2010

Это все равно не мало, но прогресс на лицо, буду ждать полной очистки от дублей.

3. Удаление replytocom через “Инструменты для веб-мастеров Google”

Для этого Вам необходимо зайти в Google вебмастер  (если вы зарегистрированы), выбираете свой сайт и далее “Сканирование”=> “Параметры URL”. После этого добавляем новый параметр replytocom, как показано на рисунке ниже:

Далее сохраняем. Можно выбрать выариант «На усмотрение поисковых роботов».

Теперь мне остается подождать несколько дней или недель и снова проверить блог на дубли страниц и изменения в индексации страниц поисковиками google.

4.  Делаем редирект в файле .htacces

Этот пункт является не обязательным, но всё же, для подстраховки можно добавить эти пару строк в свой файл .htacces.

Данный файл .htacces находится в корневой папке вашего блога, если его нет, можно создать и добавить туда эти строки:

RewriteCond %{QUERY_STRING} replytocom=
 RewriteRule ^(.*)$ /$1? [R=301,L]

Это позволит переадресовать читателя, который попал на страницу с replytocom на основную заметку.

Вот основные шаги, которые помогут вамнаучиться  находить и научится  дубли страниц replytocom на своем блоге на движке WordPress.

5. Прошло семь месяцев, избавился ли я от дублей ? 

Вот такая картина теперь у меня с индексацией страниц:

Как видите, из 3010 страниц, которые были 11 ноября 2013 года в индексе Google, осталось 1030. От дублей, которые вызваны древовидными комментариями я избавился полностью, вот доказательство:

Я набрал в поисковике Google :

site:rabotaiuspeh.com replytocom

Обнаружил там всего 10 постов, в которых упоминались слова «дубли»  и «replytocom», но дублей, которые вызваны были ранее древовидными комментариями уже нет. Это, конечно же,  прогресс, но всё равно, дубли есть. Как это есть, спросите вы? Да, есть, но это уже совсем другие дубли, про которые я расскажу в  заметке про дубли страниц.

Напишите, пожалуйста, что вы думаете об этом.  Сталкивались ли вы с подобными проблемами и насколько быстро эти дубли исключались из индексации Гуглом?

Вот все, о чем хотел сегодня рассказать, уважаемые.

До встречи!

Интересные статьи по данной теме:

Необычные и смешные поисковые запросы читателей блога

Как ускорить индексацию сайта в Яндекс и Google

Что такое траст сайта? Как увеличить доверие поисковых систем?

С уважением, Вилков Николай

Все статьи блога

Хотите в числе первых узнавать о новых статьях и курсах?

Подпишитесь на обновления моего блога и мой канал на YouTube
Если статья вам понравилась, поделитесь с друзьями в социальных сетях. Спасибо!

Николай Вилков :