Ve vývoji

Generátor Robots.txt |

Inzerát

Obecné směrnice

Před přepsáním vrstev nakonfigurujte výchozí chování pro všechny prohledávače.

Nastavte globální pravidlo povolení nebo blokování pro User-agent: *.

Pokud váš server potřebuje prostor pro nadechnutí, omezte crawlery.

Volitelná direktiva hostitele pro zrcadlené domény.

Jedna cesta na řádek. Podporuje zástupné znaky a koncová lomítka.

Zajistěte, aby určité složky zůstaly procházitelné, i když jsou blokovány širší cesty.

Na každý řádek uveďte jednu URL adresu souboru Sitemap. Pokud máte další indexy souborů Sitemap, přidejte je.

Běžní roboti

Přepněte prohledávače, které chcete zcela zablokovat. Nechte je, aby se spoléhaly na výše uvedené výchozí pravidlo.

Vlastní pravidla

Přidejte uživatelské agenty s přizpůsobenými direktivami pro povolení nebo blokování, zpožděním procházení a nápovědami k souboru Sitemap.

Zkopírujte výše vygenerovaný soubor a nahrajte ho do kořenového adresáře vaší domény jako robots.txt.

Generujte soubory robots.txt pro ovládání chování vyhledávače při procházení.
Table of Contents

Robots.txt je malý textový soubor, který vede vyhledávací roboty na vašem webu.

Pomocí souboru robots.txt blokujte oblasti, jako jsou stránky správce, pracovní složky, testovací adresy URL, stránky filtrů a duplicitní cesty.

Robots.txt je součástí standardu vyloučení robotů.

vasedomena.com/robots.txt

Vyhledávače často kontrolují tento soubor brzy, protože jim poskytuje jasné pokyny pro procházení.

Jeden důležitý bod:

  • Robots.txt řídí procházení
  • Nezaručuje indexování

Pokud chcete potvrdit, že se stránka může objevit ve výsledcích vyhledávání, použijte kontrolu indexovatelnosti.

Vyhledávače neprocházejí každou stránku každý den.

Pokud je váš web pomalý nebo vrací chyby, prohledávače mohou navštívit méně stránek na spuštění.

Nejlepších výsledků dosáhnete použitím souboru robots.txt se souborem Sitemap:

  • Robots.txt vede roboty k tomu, co mají procházet nebo přeskakovat
  • Soubor Sitemap uvádí stránky, které chcete procházet a indexovat

Soubor robots.txt používá několik jednoduchých příkazů.

  • User-agent
  • Nastaví, na kterého robota se pravidlo vztahuje
  • Zakázat
  • Blokuje procházení složky nebo cesty
  • Povolit
  • Otevře konkrétní cestu v zablokované složce
  • Zpoždění procházení
  • Požaduje pomalejší procházení pro některé roboty (ne všichni roboti to dodržují)

Malá chyba může zablokovat důležité stránky, včetně klíčových kategorií nebo hlavních vstupních stránek.

WordPress dokáže vytvořit mnoho adres URL, které nepomáhají SEO, jako jsou stránky interního vyhledávání, některé archivní stránky a adresy URL založené na parametrech.

I na menších webech je čistý soubor robots.txt chytrým nastavením.

Sitemap pomáhá vyhledávačům objevit stránky, které chcete procházet.

  • Sitemap zlepšuje objevování
  • Robots.txt řídí přístup pro procházení

Většina webů těží z používání obou.

Robots.txt je jednoduchý, ale není shovívavý.

Nastavit výchozí přístup

Vyberte, zda mohou váš web ve výchozím nastavení procházet všichni roboti.

Přidejte adresu URL souboru Sitemap

Zahrňte svůj soubor Sitemap, aby prohledávače nalezly vaše důležité stránky rychleji.

Povolené cesty přidávejte opatrně

Blokujte pouze to, co skutečně nechcete procházet.

/admin/ nebo /search/

Před publikováním zkontrolujte

Znovu zkontrolujte, zda jste nezablokovali svou domovskou stránku, blog, stránky kategorií nebo stránky hlavních služeb.

Robots.txt je jedna část technického SEO.