Добрый день, друзья!
Сегодня речь пойдет о том, как правильно составить файл robots.txt для wordpress, для чего нужен, как редактируется и для чего этот файл добавлять в сервисы вебмастеров Яндекс и Google. Я вам напишу пример правильного файла robots.txt для wordpress, поскольку именно этот движок я использую для своего блога.
Утром вышел на улицу и был удивлен морозом, который ощутил на себе. Столбик термометра показывал минус 20 градусов, а когда дует встречный ветер, то ощущение на все -25..-30 градусов, честное слово. Слезы начинают не произвольно катиться из глаз, щеки леденеют, вспоминается сюжет сказки про Снежную королеву и оленей, которые от сильного ветра и холода не могли двигаться вперед. 🙂 Но человек крепче и настырней оленя, поэтому на работу я добрался благополучно.
На Украине сейчас морозы серьезные, не зря февраль на украинском языке пишется “лютый”, точней и не скажешь.
На днях, читательница моего блога, Зоя, просила проконсультировать её по одному вопросу на блоге и я заметил, что файл robots.txt у нее содержит небольшие ошибки. Следствием этого может являться проблемы с индексацией страниц. После этого я словил себя на мысли, что еще не освещал подобную тему, так созрела идея нового поста.
Данный вопрос для новичков очень важен, с этим файлом необходимо раз разобраться, правильно составить, загрузить на хостинг и забыть. Для тех, кто ведет блог давно, этот вопрос не вызовет сложностей.
Файл robots.txt является рекомендацией для поисковых роботов и указывает, что нужно индексировать в содержимом вашего блога, а что скрыть от индексации.
Важно для молодого сайта создать правильный файл robots.txt и разместить его в корневой директории вашего блога. После этого поисковые роботы (Google и Яндекс) будут иметь конкретные директивы , какие записи и посты необходимо индексировать, а которые нет.
Если не корректно составить этот файл, то можно создать огромное количество дублированных страниц, что в свою очередь приведет к попаданию блога под фильтры поисковых систем.
Я представлю вам универсальный пример файла robots.txt для wordpress, который размещен у меня. На любом блоге этот файл доступен по ссылке вашсайт.ru/robots.txt , где название сайта – его url
Если хотите детально разобраться во всех тонкостях файла, можете почитать тут
Итак, вот скрин моего файла robots.txt, скопировать содержимое можно пройдя по ссылке- https://rabotaiuspeh.com/robots.txt
Немного пояснений:
User-agent: * — знак “*” означает, что правила рекомендуют всем поисковым машинам.
User-agent: Yandex — для Яндекса нужно прописывать директиву персонально.
Disallow (англ. не разрешать): cqi-bin — cqi-bin это директория на сервере, где находятся скрипты, предназначенные для выполнения, эта папка находится в корневом каталоге.
Host: rabotaiuspeh.com – это главное зеркало моего блога
Sitemap: https://rabotaiuspeh.com/sitemap.xml Sitemap:
В последних двух строчках прописан адрес карты сайта для поисковых роботов
Не забудьте изменить внизу на свой url вместо моего https://rabotaiuspeh.com
А также можете в первую верхнюю часть добавить строки
Disallow: /*?* Disallow: /*?
Я их пока удалил, поскольку избавляюсь от дублей replytocom, которые вызваны древовидными комментариями ( подробности )
Основные правила составления файла robots.txt для wordpress
Важно!
- Между записями для одного поисковика в файле не должно быть пустых строк
- Имя “файл robots.txt” пишется только малыми буквами (писать Robots.txt или roBots.Txt не верно!)
- Строки
Disallow: /category/*/*
Disallow: /tag/
Прописывайте на ваше усмотрение, я категории закрываю, а теги у меня открыты
4. Если у вас ЧПУ в настройках (ссылки имеют вид , то данный файл вам подойдет.
Если у вас в настройках стандартные ЧПУ (имеют вид , тогда уберите строку
Disallow: /*?*
5. Вы всегда можете зайти и подкорректировать файл robots.txt , но не делайте это слишком часто. Не ждите мгновенных изменений в индексации после изменений файла, подождите пару недель, особенно, если у Вас молодой сайт. Помните, что поисковым роботам необходимо время для изменений.
Теперь полученный файл вы должны залить при помощи ftp-клиента в корневую папку вашего блога, если хотите подкорректировать уже существующий, то откройте через Notepad++ , измените и нажмите “сохранить”.
Анализ файла robots.txt и добавление в Яндекс и Google вебмастер
После этого вам желательно зайти в панель вебмастеров Яндекс (по ссылке)
Далее выберите свой сайт и слева “Настройка индексирования” =>>”Анализ robots.txt”
Затем добавляете свой файл robots.txt и проверяете его нажав на “проверить”
Для Google проводите подобные действия: регистрируйтесь, добавляйте свой сайт, затем в панели для вебмастеров добавляете для конкретного сайта файл robots.txt.
Теперь вы знаете, как правильно составить файл robots.txt, на что обратить внимание при его редактировании и как правильно добавить в панели для вебмастеров Google и Yandex.
Если есть вопросы или замечания по теме, пожалуйста пишите в комментариях. Буду признателен, если поделитесь данной статьей в социальных сетях, кнопки в конце поста.
Сегодня финиширует январский конкурс комментаторов, в 24-00 по Москве сделаю скрин, всем участникам УДАЧИ!
В завершении поста прекрассный захватывающий ролик, приятного просмотра:
До встречи!
Интересные статьи по данной теме:
Как ускорить индексацию сайта в Яндекс и Google
Оптимизация базы данных (MySQL), установка Optimize DB
Внутренняя оптимизация сайта – основные моменты
Как ускорить индексацию страниц сайта – 12 советов
С уважением, Вилков Николай
Хотите в числе первых узнавать о новых статьях и курсах?
Подпишитесь на обновления моего блога и мой канал на YouTube
Если статья вам понравилась, поделитесь с друзьями в социальных сетях. Спасибо!
View Comments (18)
Спасибо за полезную информацию! Вот кажется, что на эту тему уже всё знаешь, и опять же что то новое для себя находишь. Пойду проверять свои робот тексты на Яндексе и Гугле.
Сергей, приветствую на блоге!
Век живи, век учись, останавливаться не нужно :)
Николай! Очень полезная статья! Прочитав ее, мне не понятно для чего вы убрали Disallow: /*?*
Disallow: /*?
и как эти строки влияют, у меня тоже дубли были от древовидных комментариев, но ушли уже. Мне эти строки тоже надо убрать? Что означают эти строчки? Еще вопрос?- зачем для индексации теги нужны, почему вы их не закрываете? С ЧПУ тоже не понятно. У меня плагин стоит Cyr to Lat enhanced, но у меня нет в конце ссылок html. На данный момент можно настроить эти урлы?
У меня в роботсе почему то в последней строчке только вот это: Sitemap: , у вас же гляжу есть такая же строчка плюс к ней gz, вы что-нибудь сможете сказать по этому поводу?
У вас в файле нет строчки cqi-bin — cqi-bin , вы ее намеренно убрали? А page вообще нужно закрывать от индексации?
Эх, robots... меня все еще удивляет что он не идет из коробки. Такая хорошая CMS, а о такой мелочи никто не подумал.
Зоя, каждый настраивает robots.txt конкретно для себя и своих папок на блоге, у каждого есть свои папки, которые не нужно индексировать.Отвечаю на Ваши вопросы:
1. Disallow: /*?*
Disallow: /*?
Я выкинул для того. чтобы полностью из индексации убрать со временем "сопли", созданные древовидными комментариями (replytocom)
Если у Вас таких проблем нет, то оставьте эти строки.
2. Теги я не закрываю, считаю это правильным конкретно для своего блога, вы решайте сами.
3. У вас стоит ЧПУ, то, что без .html не играет роли. Если вы измените в настройках, все полетит и перелинковка, так что не трогайте.
4.Карта в формате gz рекомендуется также прописывать в robots.txt, это карта sitemap только в запакованном виде, подробней в новых постах
5. cqi-bin — cqi-bin строка для тех. у кого на хостинге в корневой директории есть такая папка, у меня нет. я эту строку и не использую.
Извините, Николай! А папка cqi-bin — cqi-bin находится должна В директории pгblшk html? Я гляжу у меня ее нет вовсе, а в robots.txt есть данная строчка. Удалить что-ли ее?
Николай! а как-то по другому может файл называться где скрипты хранятся?прочитала где-то, что в этом файле htaccess, вот теперь я в замешательстве, есть у меня такой файл или нет, прям сама разобраться не могу.
Николай, у меня Яндекс не индексирует картинки, может в robotse должна быть строчка Allow: /wp-content/uploads/? У вас индексируются картинки? Не пойму, как в роботсе должны отображаться данное? Правильно я думаю или же нет?
У Алалаича интересный взгляд на роботс, мож кому пригодится alaev.info/blog/post/4143