വികസനത്തിൽ

Robots.txt ജനറേറ്റർ |

പരസ്യം

പൊതു നിർദ്ദേശങ്ങൾ

ലെയറിംഗ് ഓവർറൈഡുകൾക്ക് മുമ്പ് എല്ലാ ക്രാളറുകൾക്കും ഡിഫോൾട്ട് സ്വഭാവം കോൺഫിഗർ ചെയ്യുക.

ഉപയോക്തൃ-ഏജന്റിന് ഒരു ആഗോള അനുവദിക്കൽ അല്ലെങ്കിൽ തടയൽ നിയമം സജ്ജമാക്കുക: *.

നിങ്ങളുടെ സെർവറിന് ശ്വസന സ്ഥലം ആവശ്യമുണ്ടെങ്കിൽ, ത്രോട്ടിൽ ക്രാളറുകൾ ഉപയോഗിക്കുക.

മിറർ ചെയ്ത ഡൊമെയ്‌നുകൾക്കുള്ള ഓപ്‌ഷണൽ ഹോസ്റ്റ് ഡയറക്റ്റീവ്.

ഓരോ വരിയിലും ഒരു പാത്ത്. വൈൽഡ്കാർഡുകളും ട്രെയിലിംഗ് സ്ലാഷുകളും പിന്തുണയ്ക്കുന്നു.

വിശാലമായ പാതകൾ തടഞ്ഞിരിക്കുമ്പോഴും നിർദ്ദിഷ്ട ഫോൾഡറുകൾ ക്രാൾ ചെയ്യാൻ കഴിയുന്നതാണെന്ന് ഉറപ്പാക്കുക.

ഓരോ വരിയിലും ഒരു സൈറ്റ്‌മാപ്പ് URL നൽകുക. കൂടുതൽ സൈറ്റ്‌മാപ്പ് സൂചികകൾ ഉണ്ടെങ്കിൽ അവ ചേർക്കുക.

സാധാരണ ക്രാളറുകൾ

നിങ്ങൾ പൂർണ്ണമായും തടയാൻ ആഗ്രഹിക്കുന്ന ക്രാളറുകളെ ടോഗിൾ ചെയ്യുക. മുകളിലുള്ള സ്ഥിരസ്ഥിതി നിയമത്തെ ആശ്രയിക്കാൻ അവരെ അനുവദിക്കുക.

ഇഷ്ടാനുസൃത നിയമങ്ങൾ

അനുവദനീയമായ അല്ലെങ്കിൽ തടയൽ നിർദ്ദേശങ്ങൾ, ക്രാൾ കാലതാമസങ്ങൾ, സൈറ്റ്മാപ്പ് സൂചനകൾ എന്നിവ ഉപയോഗിച്ച് ഉപയോക്തൃ-ഏജന്റുമാരെ ചേർക്കുക.

മുകളിൽ ജനറേറ്റ് ചെയ്‌ത ഫയൽ പകർത്തി robots.txt ആയി നിങ്ങളുടെ ഡൊമെയ്‌നിന്റെ റൂട്ടിലേക്ക് അപ്‌ലോഡ് ചെയ്യുക.

സെർച്ച് എഞ്ചിൻ ക്രോൾ ചെയ്യുന്ന സ്വഭാവം നിയന്ത്രിക്കാൻ robots.txt ഫയലുകൾ സൃഷ്ടിക്കുക.
Table of Contents

നിങ്ങളുടെ സൈറ്റിലെ തിരയൽ ബോട്ടുകളെ നയിക്കുന്ന ഒരു ചെറിയ ടെക്സ്റ്റ് ഫയലാണ് Robots.txt.

അഡ്‌മിൻ പേജുകൾ, സ്റ്റേജിംഗ് ഫോൾഡറുകൾ, ടെസ്റ്റ് URL-കൾ, ഫിൽട്ടർ പേജുകൾ, ഡ്യൂപ്ലിക്കേറ്റ് പാത്തുകൾ എന്നിവ പോലുള്ള ഏരിയകൾ ബ്ലോക്ക് ചെയ്യാൻ robots.txt ഉപയോഗിക്കുക.

Robots.txt എന്നത് റോബോട്ടുകൾ ഒഴിവാക്കൽ മാനദണ്ഡത്തിൻ്റെ ഭാഗമാണ്.

yourdomain.com/robots.txt

സെർച്ച് എഞ്ചിനുകൾ പലപ്പോഴും ഈ ഫയൽ നേരത്തെ തന്നെ പരിശോധിക്കുന്നു, കാരണം അത് അവർക്ക് വ്യക്തമായ ക്രാളിംഗ് ദിശകൾ നൽകുന്നു.

ഒരു പ്രധാന കാര്യം:

  • Robots.txt ക്രാളിംഗ് നിയന്ത്രിക്കുന്നു
  • ഇത് ഇൻഡക്‌സിംഗ് ഗ്യാരണ്ടി നൽകുന്നില്ല

തിരയൽ ഫലങ്ങളിൽ ഒരു പേജ് ദൃശ്യമാകുമെന്ന് നിങ്ങൾക്ക് സ്ഥിരീകരിക്കണമെങ്കിൽ, ഇൻഡെക്സബിലിറ്റി പരിശോധന ഉപയോഗിക്കുക.

സെർച്ച് എഞ്ചിനുകൾ എല്ലാ ദിവസവും എല്ലാ പേജുകളും ക്രാൾ ചെയ്യുന്നില്ല.

നിങ്ങളുടെ സൈറ്റ് മന്ദഗതിയിലാണെങ്കിൽ അല്ലെങ്കിൽ പിശകുകൾ നൽകുകയാണെങ്കിൽ, ഓരോ റണ്ണിലും ക്രാളറുകൾ കുറച്ച് പേജുകൾ സന്ദർശിച്ചേക്കാം.

മികച്ച ഫലങ്ങൾക്കായി, ഒരു സൈറ്റ്മാപ്പിനൊപ്പം robots.txt ഉപയോഗിക്കുക:

  • Robots.txt ബോട്ടുകൾക്ക് എന്താണ് ക്രാൾ ചെയ്യേണ്ടത് അല്ലെങ്കിൽ ഒഴിവാക്കേണ്ടത് എന്നതിനെ കുറിച്ച് മാർഗ്ഗനിർദ്ദേശം നൽകുന്നു
  • സൈറ്റ്മാപ്പ് ലിസ്റ്റുകൾ നിങ്ങൾ ക്രാൾ ചെയ്യാനും സൂചികയിലാക്കാനും ആഗ്രഹിക്കുന്ന പേജുകൾ

ഒരു robots.txt ഫയൽ കുറച്ച് ലളിതമായ നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു.

  • ഉപയോക്തൃ ഏജൻ്റ്
  • ഏത് ബോട്ടിനാണ് റൂൾ ബാധകമെന്ന് സജ്ജീകരിക്കുന്നു
  • അനുവദിക്കരുത്
  • ഒരു ഫോൾഡറിനോ പാതയ്‌ക്കോ വേണ്ടി ക്രോൾ ചെയ്യുന്നത് തടയുന്നു
  • അനുവദിക്കുക
  • തടഞ്ഞ ഒരു ഫോൾഡറിനുള്ളിൽ ഒരു നിർദ്ദിഷ്ട പാത തുറക്കുന്നു
  • ക്രാൾ-ഡിലേ
  • ചില ബോട്ടുകൾക്കായി സാവധാനത്തിലുള്ള ക്രാളിംഗ് അഭ്യർത്ഥിക്കുന്നു (എല്ലാ ബോട്ടുകളും ഇത് പിന്തുടരുന്നില്ല)

ഒരു ചെറിയ തെറ്റിന് പ്രധാന വിഭാഗങ്ങൾ അല്ലെങ്കിൽ പ്രധാന ലാൻഡിംഗ് പേജുകൾ ഉൾപ്പെടെയുള്ള പ്രധാനപ്പെട്ട പേജുകൾ തടയാൻ കഴിയും.

ആന്തരിക തിരയൽ പേജുകൾ, ചില ആർക്കൈവ് പേജുകൾ, പാരാമീറ്റർ അധിഷ്‌ഠിത URL-കൾ എന്നിങ്ങനെ SEO-യെ സഹായിക്കാത്ത നിരവധി URL-കൾ WordPress-ന് സൃഷ്‌ടിക്കാൻ കഴിയും.

ചെറിയ സൈറ്റുകളിൽ പോലും, വൃത്തിയുള്ള robots.txt ഫയൽ ഒരു മികച്ച സജ്ജീകരണമാണ്.

നിങ്ങൾ ക്രാൾ ചെയ്യാൻ ആഗ്രഹിക്കുന്ന പേജുകൾ കണ്ടെത്താൻ തിരയൽ എഞ്ചിനുകളെ ഒരു സൈറ്റ്മാപ്പ് സഹായിക്കുന്നു.

  • സൈറ്റ്മാപ്പ് കണ്ടെത്തൽ മെച്ചപ്പെടുത്തുന്നു
  • Robots.txt ക്രാളിംഗ് ആക്‌സസ് നിയന്ത്രിക്കുന്നു

മിക്ക വെബ്‌സൈറ്റുകളും രണ്ടും ഉപയോഗിക്കുന്നതിൽ നിന്ന് പ്രയോജനം നേടുന്നു.

Robots.txt ലളിതമാണ്, പക്ഷേ അത് ക്ഷമിക്കുന്നില്ല.

ഡിഫോൾട്ട് ആക്‌സസ് സജ്ജീകരിക്കുക

എല്ലാ ബോട്ടുകൾക്കും നിങ്ങളുടെ സൈറ്റ് ഡിഫോൾട്ടായി ക്രാൾ ചെയ്യാനാകുമോ എന്ന് തിരഞ്ഞെടുക്കുക.

നിങ്ങളുടെ സൈറ്റ്‌മാപ്പ് URL ചേർക്കുക

നിങ്ങളുടെ സൈറ്റ്‌മാപ്പ് ഉൾപ്പെടുത്തുക, അതുവഴി ക്രാളർമാർക്ക് നിങ്ങളുടെ പ്രധാനപ്പെട്ട പേജുകൾ വേഗത്തിൽ കണ്ടെത്താനാകും.

അനുവദനീയമല്ലാത്ത പാതകൾ ശ്രദ്ധാപൂർവ്വം ചേർക്കുക

ക്രാൾ ചെയ്യാൻ നിങ്ങൾ ശരിക്കും ആഗ്രഹിക്കാത്തത് മാത്രം തടയുക.

/admin/ അല്ലെങ്കിൽ /search/

പ്രസിദ്ധീകരിക്കുന്നതിന് മുമ്പ് അവലോകനം ചെയ്യുക

നിങ്ങളുടെ ഹോംപേജ്, ബ്ലോഗ്, കാറ്റഗറി പേജുകൾ അല്ലെങ്കിൽ പ്രധാന സേവന പേജുകൾ എന്നിവ നിങ്ങൾ തടഞ്ഞിട്ടില്ലെന്ന് രണ്ടുതവണ പരിശോധിക്കുക.

Robots.txt സാങ്കേതിക SEO യുടെ ഒരു ഭാഗമാണ്.

  • സൈറ്റ്മാപ്പ് ചെക്കർ: നിങ്ങളുടെ സൈറ്റ്മാപ്പ് സാധുവാണെന്നും ബോട്ടുകൾക്ക് വായിക്കാൻ എളുപ്പമാണെന്നും സ്ഥിരീകരിക്കുന്നു.
  • Google ഇൻഡക്‌സ് ചെക്കർ: ഒരു പേജ് സൂചികയിലാക്കാൻ കഴിയുമോ എന്ന് പരിശോധിക്കുകയും noindex പോലുള്ള സാധാരണ ബ്ലോക്കറുകൾ ഫ്ലാഗുചെയ്യുകയും ചെയ്യുന്നു.
  • HTTP സ്റ്റാറ്റസ് കോഡ് പരിശോധിക്കുക: 200, 301, 404, ക്രാളിംഗ് മന്ദഗതിയിലാക്കാൻ കഴിയുന്ന സെർവർ പിശകുകൾ എന്നിവ കണ്ടെത്തുന്നു.
  • സൗജന്യ റീഡയറക്‌ട് ചെക്കർ: റീഡയറക്‌ടുകൾ ശുദ്ധമാണെന്നും ചങ്ങലകളിലോ ലൂപ്പുകളിലോ കുടുങ്ങിയിട്ടില്ലെന്നും സ്ഥിരീകരിക്കുന്നു.
  • മെറ്റാ ടാഗുകൾ വിശകലനം: SEO പിശകുകൾക്കായി തലക്കെട്ടുകൾ, വിവരണങ്ങൾ, റോബോട്ടുകളുടെ മെറ്റാ ടാഗുകൾ എന്നിവ അവലോകനം ചെയ്യുന്നു.