common.you_need_to_be_loggedin_to_add_tool_in_favorites
Генератор Robots.txt |
Общие директивы
Перед настройкой переопределений по умолчанию настройте поведение по умолчанию для всех краулеров.
Установите глобальное правило разрешения или блокировки для User-agent: *.
Если вашему серверу нужно больше свободного пространства, ограничьте использование обходных путей.
Необязательная директива хоста для зеркальных доменов.
Один путь на строку. Поддерживаются подстановочные знаки и завершающие косые черты.
Обеспечьте доступность индексации для определенных папок даже при блокировке более широких путей.
Указывайте один URL-адрес карты сайта на каждой строке. Добавьте дополнительные индексы карты сайта, если они у вас есть.
Обычные ползающие
Отключите возможность полной блокировки только тех поисковых роботов, которые вы хотите заблокировать. Оставьте им возможность использовать правило по умолчанию, указанное выше.
Пользовательские правила
Добавьте пользовательские агенты с настраиваемыми директивами разрешения или блокировки, задержками сканирования и подсказками карты сайта.
Пользовательские правила пока отсутствуют. Воспользуйтесь кнопкой выше, чтобы создать своё собственное.
Точная строка пользовательского агента или строка с подстановочным знаком.
Скопируйте сгенерированный выше файл и загрузите его в корневую папку вашего домена под именем robots.txt.
Генератор Robots.txt для лучшего сканирования и индексирования
Robots.txt – это небольшой текстовый файл, который направляет поисковых роботов на ваш сайт.
Используйте robots.txt, чтобы заблокировать такие области, как страницы администрирования, промежуточные папки, тестовые URL-адреса, страницы фильтрации и повторяющиеся пути.
Что означает robots.txt в SEO
Robots.txt является частью стандарта исключения роботов.
вашдомен.com/robots.txt
Поисковые системы часто проверяют этот файл заранее, поскольку он дает им четкие указания по сканированию.
Один важный момент:
- Robots.txt управляет сканированием
- Он не гарантирует индексацию.
Если вы хотите подтвердить, что страница может появиться в результатах поиска, используйте проверку индексируемости.
Почему файл robots.txt помогает оптимизировать бюджет сканирования
Поисковые системы не сканируют каждую страницу каждый день.
Если ваш сайт работает медленно или выдает ошибки, сканеры могут посещать меньше страниц за один проход.
Для достижения наилучших результатов используйте robots.txt с картой сайта:
- Robots.txt указывает ботам, что сканировать, а что пропускать.
- В Карте сайта перечислены страницы, которые вы хотите просканировать и проиндексировать.
Правила robots.txt, которые следует знать
Файл robots.txt использует несколько простых директив.
- Пользовательский агент
- Устанавливает, к какому боту применяется правило
- Запретить
- Блокирует сканирование папки или пути
- Разрешить
- Открывает определенный путь внутри заблокированной папки.
- Задержка сканирования
- Запрашивает замедление сканирования для некоторых ботов (не все боты следуют этому требованию)
Небольшая ошибка может заблокировать важные страницы, включая ключевые категории или основные целевые страницы.
Почему сайтам WordPress часто нужен файл robots.txt
WordPress может создавать множество URL-адресов, которые не помогают SEO, например страницы внутреннего поиска, некоторые страницы архивов и URL-адреса на основе параметров.
Даже на небольших сайтах чистый файл robots.txt будет разумной настройкой.
Разница в robots.txt и файле Sitemap
Карта сайта помогает поисковым системам находить страницы, которые вы хотите просканировать.
- Карта сайта улучшает обнаружение
- Robots.txt управляет доступом для сканирования.
Большинству веб-сайтов выгодно использовать оба варианта.
Как создать Robots.txt с помощью этого генератора
Robots.txt прост, но не прощает ошибок.
Установить доступ по умолчанию
Выберите, могут ли все боты сканировать ваш сайт по умолчанию.
Добавьте URL-адрес карты сайта
Добавьте карту сайта, чтобы сканеры могли быстрее найти важные страницы.
Осторожно добавляйте запрещенные пути
Блокируйте только то, что вы действительно не хотите, чтобы его сканировали.
/admin/ или /search/
Проверка перед публикацией
Еще раз проверьте, не заблокировали ли вы свою домашнюю страницу, блог, страницы категорий или основные страницы услуг.
Сопутствующие инструменты SEO, которые хорошо работают с robots.txt
Robots.txt – это часть технического SEO.
- Проверка карты сайта. Подтверждает, что ваша карта сайта действительна и удобна для чтения ботами.
- Проверка индекса Google: проверяет, может ли страница быть проиндексирована, и помечает распространенные блокировщики, такие как noindex.
- Проверка кода состояния HTTP: находит 200, 301, 404 и ошибки сервера, которые могут замедлить сканирование.
- Бесплатная проверка перенаправлений. Подтверждает, что перенаправления являются чистыми и не застревают в цепочках или циклах.
- Анализ метатегов. Проверяет заголовки, описания и метатеги роботов на наличие ошибок SEO.