X

Как найти и обезвредить дубли страниц Replytocom

Приветствую Вас, уважаемые читатели!

Сегодня я расскажу о том, что за страшный зверь дубли страниц replytocom, как проверить свой сайт на replytocom и как удалить дубли страниц?

Вы, наверное, подумали, что я начал играть в компьютерную игру или начитался книг в стиле фэнтези или фантастики и там нашел такой термин? Нет, все намного проще. После очередного анализа своего блога при помощи программы Site Auditor я обнаружил, что Яндекс индексирует 43 страницы, а Google 3010(!). Я начал изучать материал по данной теме и узнал, что такое дубли страниц и насколько это вредно?

 

Также в последнее время заметил, что по поисковым запросам Google стал относится ко мне принебрежительно. Если месяц назад картина была такой:

То сейчас все намного хуже:

Итак, мне стало интерсно,  что происходит?

Как обнаружить дулированный контент replytocom?

здесь ваш рекламный код №1

Когда я установил бесплатную программу Xenu Link Sleuth  и провел анализ своего блога, то обнаружил огромное количество ссылок на страницы, в конце которых значилось l?replytocom=454.

Их было очень много, учитывая, что на моем блоге всего 70 записей, а цифра проиндексированных страниц 3010! После этого я выяснил, что же такое replytocom.

Движок Вордпресс довольно хорош, но одним из его недостатков является то, что при использовании древовидных комментариев, создаются дубли страниц. А древовидные комментарии установлены у всех по умолчанию, хотя в платных шаблонах может и по другому.

Под каждым комментарием есть кнопка “Ответить”, если на него навести, то слева внизу вы сможете увидеть адрес .  Это означает, что при ответе, создается новая страница, дублирующая предыдущую,  с таким же адресом и добавлением http//:…Replytocom=1402#respondent.

Проведите маленький эксперимент: откройте поисковик Google и вбейте в строку поиска site: вашсайт.ру replytocom, где вместо вашсайт.ру вставьте адрес вашего блога.

Вот какая картина была у меня

Из этого видно, что надо как то менять картину и удалять дубли страниц с Replytocom.

Как удалить дубли страниц Replytocom

  1. Отключаем древовидные комментарии

Заходим в админку » Настройки»  Обсуждения и убираем галочку “включить древовидные комментарии” и обязательно опускаемcя вниз и жмем  “Сохранить”

Не переживайте за старые комментарии, они все останутся, только будут расположены в столбик.

Согласен, что древовидные комментарии очень удобны, без них будет не весьма удобно для читателей сайта. Один из путей реализации — можно установить плагин WordPress Thread Comment, который установлен на моем блоге. После установки этого плагина  дубли replytocom образовываться больше не будут.

После отключения дубли создаваться не будут, но нам нужно убрать от индексации уже созданные, для этого идем далее.

 2. Вносим изменения в файл robots.txt

Поскольку файл  robots.txt  является лишь рекомендацией для поисковых роботов, то его изменение не гарантирует изменение в индексации роботом Google, тем не менее,  я УДАЛИЛ следующие строки из файла robots.txt:

Disallow: /*?replytocom

Disallow: /*?*

Disallow: /*?

После этого, за 2 месяца количество проиндексированных страниц уменьшилось:

11 ноября их 3010

11 января их 2010

Это все равно не мало, но прогресс на лицо, буду ждать полной очистки от дублей.

3. Удаление replytocom через “Инструменты для веб-мастеров Google”

Для этого Вам необходимо зайти в Google вебмастер  (если вы зарегистрированы), выбираете свой сайт и далее “Сканирование”=> “Параметры URL”. После этого добавляем новый параметр replytocom, как показано на рисунке ниже:

Далее сохраняем. Можно выбрать выариант «На усмотрение поисковых роботов».

Теперь мне остается подождать несколько дней или недель и снова проверить блог на дубли страниц и изменения в индексации страниц поисковиками google.

4.  Делаем редирект в файле .htacces

Этот пункт является не обязательным, но всё же, для подстраховки можно добавить эти пару строк в свой файл .htacces.

Данный файл .htacces находится в корневой папке вашего блога, если его нет, можно создать и добавить туда эти строки:

RewriteCond %{QUERY_STRING} replytocom=
 RewriteRule ^(.*)$ /$1? [R=301,L]

Это позволит переадресовать читателя, который попал на страницу с replytocom на основную заметку.

Вот основные шаги, которые помогут вамнаучиться  находить и научится  дубли страниц replytocom на своем блоге на движке WordPress.

5. Прошло семь месяцев, избавился ли я от дублей ? 

Вот такая картина теперь у меня с индексацией страниц:

Как видите, из 3010 страниц, которые были 11 ноября 2013 года в индексе Google, осталось 1030. От дублей, которые вызваны древовидными комментариями я избавился полностью, вот доказательство:

Я набрал в поисковике Google :

site:rabotaiuspeh.com replytocom

Обнаружил там всего 10 постов, в которых упоминались слова «дубли»  и «replytocom», но дублей, которые вызваны были ранее древовидными комментариями уже нет. Это, конечно же,  прогресс, но всё равно, дубли есть. Как это есть, спросите вы? Да, есть, но это уже совсем другие дубли, про которые я расскажу в  заметке про дубли страниц.

Напишите, пожалуйста, что вы думаете об этом.  Сталкивались ли вы с подобными проблемами и насколько быстро эти дубли исключались из индексации Гуглом?

Вот все, о чем хотел сегодня рассказать, уважаемые.

До встречи!

Интересные статьи по данной теме:

Необычные и смешные поисковые запросы читателей блога

Как ускорить индексацию сайта в Яндекс и Google

Что такое траст сайта? Как увеличить доверие поисковых систем?

С уважением, Вилков Николай

Все статьи блога

Хотите в числе первых узнавать о новых статьях и курсах?

Подпишитесь на обновления моего блога и мой канал на YouTube
Если статья вам понравилась, поделитесь с друзьями в социальных сетях. Спасибо!

Николай Вилков:

View Comments (54)

  • Помоему у вас картинки с посещаемостью "как было" и "как стало" перепутаны :)
    А так спасибо за статью!

  • Юрий, с картинками все верно. На них отображается не посещаемость, а по каким запросам в Google я находился и сейчас нахожусь на каком месте. Чем ближе место к 1 ому, тем лучше. Раньше по нескольким запросам в Google я был в 20-ке, а теперь только в 7 десятке и количество запросов резко упало. :P

  • На моем шаблоне стоит плагин для древовидных комментариев, поэтому о такой проблеме не слышал.

    Скажу только, что надо бороться со всеми ненужными страницами в индексе - от этого блог определенно станет лучше ранжироваться (увеличивается уникальность контента на странице).

  • Ого, никогда бы не догадалась проверить блог на дубли страниц. Спасибо, Николай. Пойду погляжу сейчас тоже, надеюсь у меня такой проблемы нет.

  • Юрий, это хорошо, что разобрались
    Диана, ну как проверка? Ты мне просто цифры черкни, сколько Яндекс индексирует страниц, а сколько Google и все станет понятно. :D

  • Ну я думаю, что строчки в robots.txt будет достаточно. :mrgreen: В роботсе нужно вообще прописать всех страниц, где знак вопроса встречается )))

    • Антон, такая строка в robots.txt у меня была и тем не менее Google эти записи игнорирует, у Яндекса с этим все хорошо.

  • Много информации, сразу все не пойму. У меня Яндекс писал, что с вопросительным знаком что-то не так и я его из роботс убрала. Комментарии древовидные, но страниц всего 49 индексирует. Нужно будет уделить время, разобраться. Может не в этом проблема?

    • Натала, если всего 49 индексирует, значит у Вас не та проблема, о которой я писал. У меня наоборот, при 70 статьях Гугл видит 3020 записей и применяет санкции ко мне

  • Нужно и мне просмотреть, а нет ли у меня каких то дубликатов на сайте.

    Спасибо за хорошее разъяснение.

    • Виктор, это нужно делать, если сильно ранятся показатели проиндексированных страниц в Яндексе и Google

  • Ага, несколько дней! Вашим методом не избавиться от соплей, они все равно будут висеть в индексе, с единственной разницей, в снипете будет написано "Описание веб-страницы недоступно из-за ограничений в файле robots.txt."
    Чтобы окончательно избавиться нужно делать редирект в файле .htaccess и открывать в robots.txt при чем полностью:
    Disallow: /*?replytocom
    Disallow: /*?*
    Disallow: /*?
    вот это все убирать, тогда будет результат и то через несколько месяцев в Гугле, в Яшке через 2-3 недели.
    Ваш метод бесполезен, проверял на 2 сайтах пару лет назад, ждал пол года, результаты минимальны 30-40 страниц.

    • Сергей, приветствую на блоге!
      Спасибо за совет, я в файл .htacces внес корректировку
      RewriteCond %{QUERY_STRING} replytocom=
      RewriteRule ^(.*)$ /$1? [R=301,L]
      между тэгами IfModule
      Древовидные комментарии я сразу отключил.
      В гугле за 4 дня 40 страниц только уменьшилось.
      Думаете, если убрать из robots.txt три эти строчки, то будет лучше, вы проверяли?

Related Post