開発中

Robots.txt ジェネレーター |

広告

一般指令

オーバーライドを階層化する前に、すべてのクローラーのデフォルトの動作を構成します。

User-agent: * のグローバル許可またはブロック ルールを設定します。

サーバーに余裕が必要な場合は、クローラーを抑制します。

ミラーリングされたドメインのオプションのホスト ディレクティブ。

1 行につき 1 つのパス。ワイルドカードと末尾のスラッシュをサポートします。

より広いパスがブロックされている場合でも、特定のフォルダーがクロール可能であることを確認します。

1行につき1つのサイトマップURLを入力してください。追加のサイトマップインデックスがある場合は追加してください。

一般的なクローラー

完全にブロックしたいクローラーのスイッチを切り替えます。上記のデフォルトルールを適用したままにしておきます。

カスタムルール

カスタマイズされた許可またはブロック ディレクティブ、クロール遅延、サイトマップのヒントを使用してユーザー エージェントを追加します。

上記の生成されたファイルをコピーし、robots.txt としてドメインのルートにアップロードします。

robots.txt ファイルを生成して、検索エンジンのクロール動作を制御します。
Table of Contents

Robots.txt は、サイト上の検索ボットをガイドする小さなテキスト ファイルです。

robots.txt を使用して、管理ページ、ステージング フォルダー、テスト URL、フィルター ページ、重複パスなどの領域をブロックします。

Robots.txt はロボット除外標準の一部です。

yourdomain.com/robots.txt

検索エンジンは、クロールの方向を明確に示すため、このファイルを早期にチェックすることがよくあります。

重要な点が 1 つあります:

  • Robots.txt はクロールを制御します
  • インデックス作成を保証するものではありません

ページが検索結果に表示されるかどうかを確認したい場合は、インデックス付け可能性チェックを使用します。

検索エンジンは毎日すべてのページをクロールするわけではありません。

サイトが遅い場合、またはエラーが返される場合、クローラーが実行ごとにアクセスするページが少なくなる可能性があります。

最良の結果を得るには、robots.txt をサイトマップとともに使用します。

  • Robots.txt は、何をクロールまたはスキップするかをボットにガイドします。
  • サイトマップ リストには、クロールしてインデックスを作成するページが含まれます

robots.txt ファイルでは、いくつかの単純なディレクティブが使用されます。

  • ユーザーエージェント
  • ルールを適用するボットを設定します
  • 禁止
  • フォルダーまたはパスのクロールをブロックします
  • 許可
  • ブロックされたフォルダー内の特定のパスを開きます
  • クロール遅延
  • 一部のボットに対して低速のクロールを要求します (すべてのボットがこれに従うわけではありません)

小さな間違いによって、主要なカテゴリや主要なランディング ページなどの重要なページがブロックされる可能性があります。

WordPress では、内部検索ページ、一部のアーカイブ ページ、パラメータベースの URL など、SEO に役立たない URL を多数作成できます。

小規模なサイトであっても、クリーンな robots.txt ファイルは賢明なセットアップです。

サイトマップは、検索エンジンがクロールするページを検出するのに役立ちます。

  • サイトマップにより発見が向上します
  • Robots.txt はクロール アクセスを制御します

ほとんどの Web サイトでは両方を使用することでメリットが得られます。

Robots.txt はシンプルですが、寛容ではありません。

デフォルトのアクセス権を設定する

すべてのボットがデフォルトでサイトをクロールできるかどうかを選択します。

サイトマップ URL を追加

サイトマップを含めると、クローラーが重要なページをより速く見つけられるようになります。

許可されていないパスは慎重に追加してください

本当にクロールされたくないものだけをブロックします。

/admin/ または /search/

公開前に確認する

ホームページ、ブログ、カテゴリ ページ、またはメイン サービス ページをブロックしていないかを再確認してください。

Robots.txt はテクニカル SEO の一部です