X
    Categories: Оптимизация сайта

Как найти и обезвредить дубли страниц Replytocom

Приветствую Вас, уважаемые читатели!

Сегодня я расскажу о том, что за страшный зверь дубли страниц replytocom, как проверить свой сайт на replytocom и как удалить дубли страниц?

Вы, наверное, подумали, что я начал играть в компьютерную игру или начитался книг в стиле фэнтези или фантастики и там нашел такой термин? Нет, все намного проще. После очередного анализа своего блога при помощи программы Site Auditor я обнаружил, что Яндекс индексирует 43 страницы, а Google 3010(!). Я начал изучать материал по данной теме и узнал, что такое дубли страниц и насколько это вредно?

 

Также в последнее время заметил, что по поисковым запросам Google стал относится ко мне принебрежительно. Если месяц назад картина была такой:

То сейчас все намного хуже:

Итак, мне стало интерсно,  что происходит?

Как обнаружить дулированный контент replytocom?

здесь ваш рекламный код №1

Когда я установил бесплатную программу Xenu Link Sleuth  и провел анализ своего блога, то обнаружил огромное количество ссылок на страницы, в конце которых значилось l?replytocom=454.

Их было очень много, учитывая, что на моем блоге всего 70 записей, а цифра проиндексированных страниц 3010! После этого я выяснил, что же такое replytocom.

Движок Вордпресс довольно хорош, но одним из его недостатков является то, что при использовании древовидных комментариев, создаются дубли страниц. А древовидные комментарии установлены у всех по умолчанию, хотя в платных шаблонах может и по другому.

Под каждым комментарием есть кнопка “Ответить”, если на него навести, то слева внизу вы сможете увидеть адрес .  Это означает, что при ответе, создается новая страница, дублирующая предыдущую,  с таким же адресом и добавлением http//:…Replytocom=1402#respondent.

Проведите маленький эксперимент: откройте поисковик Google и вбейте в строку поиска site: вашсайт.ру replytocom, где вместо вашсайт.ру вставьте адрес вашего блога.

Вот какая картина была у меня

Из этого видно, что надо как то менять картину и удалять дубли страниц с Replytocom.

Как удалить дубли страниц Replytocom

  1. Отключаем древовидные комментарии

Заходим в админку ” Настройки”  Обсуждения и убираем галочку “включить древовидные комментарии” и обязательно опускаемcя вниз и жмем  “Сохранить”

Не переживайте за старые комментарии, они все останутся, только будут расположены в столбик.

Согласен, что древовидные комментарии очень удобны, без них будет не весьма удобно для читателей сайта. Один из путей реализации – можно установить плагин WordPress Thread Comment, который установлен на моем блоге. После установки этого плагина  дубли replytocom образовываться больше не будут.

После отключения дубли создаваться не будут, но нам нужно убрать от индексации уже созданные, для этого идем далее.

 2. Вносим изменения в файл robots.txt

Поскольку файл  robots.txt  является лишь рекомендацией для поисковых роботов, то его изменение не гарантирует изменение в индексации роботом Google, тем не менее,  я УДАЛИЛ следующие строки из файла robots.txt:

Disallow: /*?replytocom

Disallow: /*?*

Disallow: /*?

После этого, за 2 месяца количество проиндексированных страниц уменьшилось:

11 ноября их 3010

11 января их 2010

Это все равно не мало, но прогресс на лицо, буду ждать полной очистки от дублей.

3. Удаление replytocom через “Инструменты для веб-мастеров Google”

Для этого Вам необходимо зайти в Google вебмастер  (если вы зарегистрированы), выбираете свой сайт и далее “Сканирование”=> “Параметры URL”. После этого добавляем новый параметр replytocom, как показано на рисунке ниже:

Далее сохраняем. Можно выбрать выариант “На усмотрение поисковых роботов”.

Теперь мне остается подождать несколько дней или недель и снова проверить блог на дубли страниц и изменения в индексации страниц поисковиками google.

4.  Делаем редирект в файле .htacces

Этот пункт является не обязательным, но всё же, для подстраховки можно добавить эти пару строк в свой файл .htacces.

Данный файл .htacces находится в корневой папке вашего блога, если его нет, можно создать и добавить туда эти строки:

RewriteCond %{QUERY_STRING} replytocom=
 RewriteRule ^(.*)$ /$1? [R=301,L]

Это позволит переадресовать читателя, который попал на страницу с replytocom на основную заметку.

Вот основные шаги, которые помогут вамнаучиться  находить и научится  дубли страниц replytocom на своем блоге на движке WordPress.

5. Прошло семь месяцев, избавился ли я от дублей ? 

Вот такая картина теперь у меня с индексацией страниц:

Как видите, из 3010 страниц, которые были 11 ноября 2013 года в индексе Google, осталось 1030. От дублей, которые вызваны древовидными комментариями я избавился полностью, вот доказательство:

Я набрал в поисковике Google :

site:rabotaiuspeh.com replytocom

Обнаружил там всего 10 постов, в которых упоминались слова “дубли”  и “replytocom”, но дублей, которые вызваны были ранее древовидными комментариями уже нет. Это, конечно же,  прогресс, но всё равно, дубли есть. Как это есть, спросите вы? Да, есть, но это уже совсем другие дубли, про которые я расскажу в  заметке про дубли страниц.

Напишите, пожалуйста, что вы думаете об этом.  Сталкивались ли вы с подобными проблемами и насколько быстро эти дубли исключались из индексации Гуглом?

Вот все, о чем хотел сегодня рассказать, уважаемые.

До встречи!

Интересные статьи по данной теме:

Необычные и смешные поисковые запросы читателей блога

Как ускорить индексацию сайта в Яндекс и Google

Что такое траст сайта? Как увеличить доверие поисковых систем?

С уважением, Вилков Николай

Все статьи блога

Хотите в числе первых узнавать о новых статьях и курсах?

Подпишитесь на обновления моего блога и мой канал на YouTube
Если статья вам понравилась, поделитесь с друзьями в социальных сетях. Спасибо!

Николай Вилков :

View Comments (54)

  • Николай аналиогично не работает! У вас 1200 дублей в индексе гугла, пусть даже не основном, но он цапает эти страницы.

    Сейчас вижу вы убрали функцию ответов на комментарии. Уже упало количество дублей?

    • Александр, привет! Христос Воскресе!
      Было 3100 страниц в Гугле 11 ноября, вот сейчас 1280 страниц в Гугле по состоянию на 20 апреля, потихоньку вылетают, но так медленно...
      Древовидные комментарии я убрал сразу, без них можно обойтись, хотя и не очень комфортно читателям.
      Вот почему только с Гуглом такие проблемы с дублями....
      Я удалил в robots.txt строки:
      Disallow: /*?replytocom
      Disallow: /*?*
      И добавил в файл.htacces
      RewriteCond %{QUERY_STRING} replytocom=
      RewriteRule ^(.*)$ /$1? [R=301,L]
      между тэгами IfModule
      Disallow: /*?
      После вылета всех лишних страниц из индекса, подкорректирую robots.txt снова

  • Николай, это тоже не помогает. Пробовал.

    В общем есть 2 фишки как от них избавиться.

    1. Посмотрите уже реализовано на моем блоге. При нажатии на кнопку "ответить" в комментарии вы не увидите ссылку в трее вида replytocom, там просто #respond и все.

    То есть можно в одном месте подправить код и все. Новых дублей больше не будет. А вот старые еще есть и их надо убирать. Ну они сами вылетят со временем.

    2. Это поставить плагин Wordpress Thread Comment. Он выводит комменты яваскриптом. Так сделано у Сани Бобрина. У него нет дублей.

    Вот по-тихоньку жизнь налаживается. =)

    • Саша, спасибо за ценные советы, очень признателен.
      Постараюсь реализовать в ближайшее время.

  • А у меня опять полная неразбериха с дублями, поменяла рорботс 2 месяца назад. было 4100 дублей- за 2 месяца уменьшилось до 3280, а сегодня смотрю - за сутки подскачили на 540 дублей. такое разве может быть?

  • Пожалуйста Николай. Как я понял вы вообще убрали деревяшки. если что могу помочь, будут работать как надо!

    • Александр, простите, я не понял, что за "деревяшки"? Если Вы имеете в виду дубли страниц, сегодня установлю плагин, который вы порекомендовали.

  • Деревовидные комментарии. replytocom. Вы их убрали?

    • Ааа, вот почему "деревяшки", я их отключил еще в ноябре, как только увидел такое огромное количество дублей страниц. Вот сегодня плагин установлю и проанализирую, не возникает ли новых дублей в Google.

  • Отключить деревяшки, это самые простой и эффективный вариант конечно же. Но старые дубли остались. Кстати у вас url неправильно отображается - /.html

    • Про url знаю, спрашивал у Сергея Сосновского про эту проблему, он дал советы, но для меня их не так легко реализовать технически. Считаю, что это не очень страшно, лишний слеш в URL страниц.

      • ну, как сказать :) не красиво чтоли ) но даже не в красоте дело. Я бы побаивался этого :) По этому поводу ответил в почту.

  • Можно ли опубликовывать статьи если есть дубли, или же пока они не уйдут, статьи не нужно на сайт опубликовывать? просьба ответить

    • Зоя, наоборот, вы должны с удвоенной энергией продолжать писать полезные и уникальные статьи и правильно их рекламировать в соцсетях и на различных сервисах. Главное, это отключить древовидные комментариии на блоге, убедиться, что новые дубли не образуются и продолжать развитие блога. Дубли постепенно будут вылетать из индекса, со временем всё нормализуется. Кстати, я недавно писал, как реализовать древовидные комментарии на блоге так, что дубли не будут образовываться .

  • Николай, я сейчас собираю информацию про то, как удалить дубли страниц. До этого отключала древовидые комментарии, но читателям было не удобно и я теперь ищу простую и действенную практическую методику.
    У меня вопрос. Вы пишите, что:
    "Делаем редирект в файле .htacces
    Этот пункт является не обязательным, но всё же, для подстраховки можно добавить эти пару строк в свой файл .htacces."

    То есть можно не выполнять этот пункт?

    • Я такой редирект делал, но через пару дней убрал, поскольку мне файл .htacces программист менял полностью по другим причинам. Со временем replytocom уйдут и переадресация будет не нужна.
      Я древовидные комментарии вывел плагином WordPress Thread Comment, он не создает дубли, выводит ответы при помощи jawa

  • Программа Xenu Link Sleuth давненько установлена.
    Тут натолкнулся на эту статью и решил проверить на дубли.
    Я в шоке,срочно нужно убирать :shock:

  • Здравствуйте!!!! поменяла роботс, по вашей статье, 7 месяцев не было публикаций вообще- дубли ушли от 3500 до 300, начала заново пополнять статьями, и тут дубли опять растут, в чем может быть дело? :grin: :oops:

    • Это хороший результат, Зоя, такое уменьшение. Дело может быть шаблоне, смотря какие дубли у вас плодятся, если вызванные комментариями, то необходимо в настройках отключить древовидные комментарии.