În dezvoltare

Robots.txt Generator |

Publicitate

Directive generale

Configurați comportamentul implicit pentru toate crawlerele înainte de suprascrierile de stratificare.

Setați o regulă globală de permitere sau blocare pentru User-agent: *.

Limitează viteza crawlerelor dacă serverul tău are nevoie de spațiu.

Directivă opțională gazdă pentru domenii oglindite.

O cale pe linie. Acceptă wildcard-uri și bare oblice la final.

Asigurați-vă că anumite foldere rămân accesibile prin crawling chiar și atunci când căile mai largi sunt blocate.

Furnizați câte o adresă URL pentru harta site-ului pe fiecare rând. Adăugați indexuri suplimentare pentru harta site-ului, dacă aveți.

Crawler-e comune

Activează/dezactivează crawlerele pe care dorești să le blochezi complet. Lasă-le permisiunea de a se baza pe regula implicită de mai sus.

Reguli personalizate

Adăugați agenți utilizator cu directive de permitere sau blocare personalizate, întârzieri la accesarea cu crawlere și indicii pentru harta site-ului.

Copiați fișierul generat mai sus și încărcați-l în rădăcina domeniului dvs. ca robots.txt.

Generați fișiere robots.txt pentru a controla comportamentul de accesare cu crawlere a motorului de căutare.
Table of Contents

Robots.txt este un fișier text mic care ghidează roboții de căutare de pe site-ul dvs.

Folosiți robots.txt pentru a bloca zone precum paginile de administrare, dosarele de pregătire, adresele URL de testare, paginile de filtrare și căile duplicate.

Robots.txt face parte din standardul de excludere a roboților.

domeniul tău.com/robots.txt

Motoarele de căutare verifică adesea acest fișier devreme, deoarece le oferă instrucțiuni clare de accesare cu crawlere.

Un punct important:

  • Robots.txt controlează crawlingul
  • Nu garantează indexarea

Dacă doriți să confirmați că o pagină poate apărea în rezultatele căutării, utilizați o verificare a indexabilității.

Motoarele de căutare nu accesează cu crawlere fiecare pagină în fiecare zi.

Dacă site-ul dvs. este lent sau returnează erori, crawlerele pot vizita mai puține pagini pe rulare.

Pentru cele mai bune rezultate, utilizați robots.txt cu un sitemap:

  • Robots.txt îi îndrumă pe roboți despre ce să acceseze cu crawlere sau să omite
  • Haptul site-ului listează paginile pe care doriți să le accesați cu crawlere și să le indexați

Un fișier robots.txt folosește câteva directive simple.

  • Agent-utilizator
  • Setează la ce bot se aplică regula
  • Interziceți
  • Blochează accesarea cu crawlere pentru un dosar sau o cale
  • Permite
  • Deschide o anumită cale în interiorul unui folder blocat
  • Întârzierea accesării cu crawlere
  • Solicită accesarea cu crawlere mai lentă pentru unii roboți (nu toți roboții îl urmează)

O mică greșeală poate bloca pagini importante, inclusiv categorii cheie sau pagini de destinație de bază.

WordPress poate crea multe adrese URL care nu ajută la SEO, cum ar fi paginile de căutare interne, unele pagini de arhivă și adresele URL bazate pe parametri.

Chiar și pe site-uri mai mici, un fișier robots.txt curat este o configurare inteligentă.

Harta site-ului ajută motoarele de căutare să descopere paginile pe care doriți să le accesați cu crawlere.

  • Sitemap îmbunătățește descoperirea
  • Robots.txt controlează accesul cu crawlere

Majoritatea site-urilor web beneficiază de folosirea ambelor.

Robots.txt este simplu, dar nu este iertător.

Setați accesul implicit

Alegeți dacă toți roboții vă pot accesa cu crawlere site-ul în mod implicit.

Adăugați adresa URL a sitemapului dvs.

Includeți harta dvs. de site, astfel încât crawlerele să vă poată găsi mai rapid paginile importante.

Adăugați cu atenție căi nepermise

Blocați doar ceea ce nu doriți să fie accesat cu crawlere.

/admin/ sau /search/

Examinați înainte de publicare

Verificați din nou dacă nu v-ați blocat pagina de pornire, blogul, paginile de categorii sau paginile principale de servicii.

Robots.txt este o parte a SEO tehnic.