Robots.txt ジェネレーター |
一般指令
オーバーライドを階層化する前に、すべてのクローラーのデフォルトの動作を構成します。
User-agent: * のグローバル許可またはブロック ルールを設定します。
サーバーに余裕が必要な場合は、クローラーを抑制します。
ミラーリングされたドメインのオプションのホスト ディレクティブ。
1 行につき 1 つのパス。ワイルドカードと末尾のスラッシュをサポートします。
より広いパスがブロックされている場合でも、特定のフォルダーがクロール可能であることを確認します。
1行につき1つのサイトマップURLを入力してください。追加のサイトマップインデックスがある場合は追加してください。
一般的なクローラー
完全にブロックしたいクローラーのスイッチを切り替えます。上記のデフォルトルールを適用したままにしておきます。
カスタムルール
カスタマイズされた許可またはブロック ディレクティブ、クロール遅延、サイトマップのヒントを使用してユーザー エージェントを追加します。
まだカスタムルールがありません。上のボタンを使って作成してください。
正確な、またはワイルドカードのユーザーエージェント文字列。
上記の生成されたファイルをコピーし、robots.txt としてドメインのルートにアップロードします。
クロールとインデックス作成を改善するための Robots.txt ジェネレーター
Robots.txt は、サイト上の検索ボットをガイドする小さなテキスト ファイルです。
robots.txt を使用して、管理ページ、ステージング フォルダー、テスト URL、フィルター ページ、重複パスなどの領域をブロックします。
Robots.txt が SEO で意味するもの
Robots.txt はロボット除外標準の一部です。
yourdomain.com/robots.txt
検索エンジンは、クロールの方向を明確に示すため、このファイルを早期にチェックすることがよくあります。
重要な点が 1 つあります:
- Robots.txt はクロールを制御します
- インデックス作成を保証するものではありません
ページが検索結果に表示されるかどうかを確認したい場合は、インデックス付け可能性チェックを使用します。
Robots.txt がクロール バジェットに役立つ理由
検索エンジンは毎日すべてのページをクロールするわけではありません。
サイトが遅い場合、またはエラーが返される場合、クローラーが実行ごとにアクセスするページが少なくなる可能性があります。
最良の結果を得るには、robots.txt をサイトマップとともに使用します。
- Robots.txt は、何をクロールまたはスキップするかをボットにガイドします。
- サイトマップ リストには、クロールしてインデックスを作成するページが含まれます
知っておくべき Robots.txt のルール
robots.txt ファイルでは、いくつかの単純なディレクティブが使用されます。
- ユーザーエージェント
- ルールを適用するボットを設定します
- 禁止
- フォルダーまたはパスのクロールをブロックします
- 許可
- ブロックされたフォルダー内の特定のパスを開きます
- クロール遅延
- 一部のボットに対して低速のクロールを要求します (すべてのボットがこれに従うわけではありません)
小さな間違いによって、主要なカテゴリや主要なランディング ページなどの重要なページがブロックされる可能性があります。
WordPress サイトに Robots.txt が必要なことが多い理由
WordPress では、内部検索ページ、一部のアーカイブ ページ、パラメータベースの URL など、SEO に役立たない URL を多数作成できます。
小規模なサイトであっても、クリーンな robots.txt ファイルは賢明なセットアップです。
Robots.txt とサイトマップの違い
サイトマップは、検索エンジンがクロールするページを検出するのに役立ちます。
- サイトマップにより発見が向上します
- Robots.txt はクロール アクセスを制御します
ほとんどの Web サイトでは両方を使用することでメリットが得られます。
このジェネレーターを使用して Robots.txt を作成する方法
Robots.txt はシンプルですが、寛容ではありません。
デフォルトのアクセス権を設定する
すべてのボットがデフォルトでサイトをクロールできるかどうかを選択します。
サイトマップ URL を追加
サイトマップを含めると、クローラーが重要なページをより速く見つけられるようになります。
許可されていないパスは慎重に追加してください
本当にクロールされたくないものだけをブロックします。
/admin/ または /search/
公開前に確認する
ホームページ、ブログ、カテゴリ ページ、またはメイン サービス ページをブロックしていないかを再確認してください。
Robots.txt とうまく連携する関連 SEO ツール
Robots.txt はテクニカル SEO の一部です。
- サイトマップ チェッカー: サイトマップが有効であり、ボットが読みやすいことを確認します。
- Google インデックス チェッカー: ページのインデックスを作成できるかどうかを確認し、noindex などの一般的なブロッカーにフラグを立てます。
- HTTP ステータス コードを確認する: クロールを遅くする可能性がある 200、301、404、およびサーバー エラーを見つけます。
- 無料リダイレクト チェッカー: リダイレクトがクリーンであり、チェーンやループに陥っていないことを確認します。
- メタ タグ分析: タイトル、説明、ロボット メタ タグをレビューして SEO の間違いがないか確認します。