Robots.txt ജനറേറ്റർ |
പൊതു നിർദ്ദേശങ്ങൾ
ലെയറിംഗ് ഓവർറൈഡുകൾക്ക് മുമ്പ് എല്ലാ ക്രാളറുകൾക്കും ഡിഫോൾട്ട് സ്വഭാവം കോൺഫിഗർ ചെയ്യുക.
ഉപയോക്തൃ-ഏജന്റിന് ഒരു ആഗോള അനുവദിക്കൽ അല്ലെങ്കിൽ തടയൽ നിയമം സജ്ജമാക്കുക: *.
നിങ്ങളുടെ സെർവറിന് ശ്വസന സ്ഥലം ആവശ്യമുണ്ടെങ്കിൽ, ത്രോട്ടിൽ ക്രാളറുകൾ ഉപയോഗിക്കുക.
മിറർ ചെയ്ത ഡൊമെയ്നുകൾക്കുള്ള ഓപ്ഷണൽ ഹോസ്റ്റ് ഡയറക്റ്റീവ്.
ഓരോ വരിയിലും ഒരു പാത്ത്. വൈൽഡ്കാർഡുകളും ട്രെയിലിംഗ് സ്ലാഷുകളും പിന്തുണയ്ക്കുന്നു.
വിശാലമായ പാതകൾ തടഞ്ഞിരിക്കുമ്പോഴും നിർദ്ദിഷ്ട ഫോൾഡറുകൾ ക്രാൾ ചെയ്യാൻ കഴിയുന്നതാണെന്ന് ഉറപ്പാക്കുക.
ഓരോ വരിയിലും ഒരു സൈറ്റ്മാപ്പ് URL നൽകുക. കൂടുതൽ സൈറ്റ്മാപ്പ് സൂചികകൾ ഉണ്ടെങ്കിൽ അവ ചേർക്കുക.
സാധാരണ ക്രാളറുകൾ
നിങ്ങൾ പൂർണ്ണമായും തടയാൻ ആഗ്രഹിക്കുന്ന ക്രാളറുകളെ ടോഗിൾ ചെയ്യുക. മുകളിലുള്ള സ്ഥിരസ്ഥിതി നിയമത്തെ ആശ്രയിക്കാൻ അവരെ അനുവദിക്കുക.
ഇഷ്ടാനുസൃത നിയമങ്ങൾ
അനുവദനീയമായ അല്ലെങ്കിൽ തടയൽ നിർദ്ദേശങ്ങൾ, ക്രാൾ കാലതാമസങ്ങൾ, സൈറ്റ്മാപ്പ് സൂചനകൾ എന്നിവ ഉപയോഗിച്ച് ഉപയോക്തൃ-ഏജന്റുമാരെ ചേർക്കുക.
ഇതുവരെ ഇഷ്ടാനുസൃത നിയമങ്ങളൊന്നുമില്ല. മുകളിലുള്ള ബട്ടൺ ഉപയോഗിച്ച് ഒന്ന് സൃഷ്ടിക്കുക.
കൃത്യമായ അല്ലെങ്കിൽ വൈൽഡ്കാർഡ് ഉപയോക്തൃ-ഏജന്റ് സ്ട്രിംഗ്.
മുകളിൽ ജനറേറ്റ് ചെയ്ത ഫയൽ പകർത്തി robots.txt ആയി നിങ്ങളുടെ ഡൊമെയ്നിന്റെ റൂട്ടിലേക്ക് അപ്ലോഡ് ചെയ്യുക.
മികച്ച ക്രാളിംഗിനും ഇൻഡക്സിംഗിനുമുള്ള Robots.txt ജനറേറ്റർ
നിങ്ങളുടെ സൈറ്റിലെ തിരയൽ ബോട്ടുകളെ നയിക്കുന്ന ഒരു ചെറിയ ടെക്സ്റ്റ് ഫയലാണ് Robots.txt.
അഡ്മിൻ പേജുകൾ, സ്റ്റേജിംഗ് ഫോൾഡറുകൾ, ടെസ്റ്റ് URL-കൾ, ഫിൽട്ടർ പേജുകൾ, ഡ്യൂപ്ലിക്കേറ്റ് പാത്തുകൾ എന്നിവ പോലുള്ള ഏരിയകൾ ബ്ലോക്ക് ചെയ്യാൻ robots.txt ഉപയോഗിക്കുക.
SEO-യിൽ Robots.txt എന്താണ് അർത്ഥമാക്കുന്നത്
Robots.txt എന്നത് റോബോട്ടുകൾ ഒഴിവാക്കൽ മാനദണ്ഡത്തിൻ്റെ ഭാഗമാണ്.
yourdomain.com/robots.txt
സെർച്ച് എഞ്ചിനുകൾ പലപ്പോഴും ഈ ഫയൽ നേരത്തെ തന്നെ പരിശോധിക്കുന്നു, കാരണം അത് അവർക്ക് വ്യക്തമായ ക്രാളിംഗ് ദിശകൾ നൽകുന്നു.
ഒരു പ്രധാന കാര്യം:
- Robots.txt ക്രാളിംഗ് നിയന്ത്രിക്കുന്നു
- ഇത് ഇൻഡക്സിംഗ് ഗ്യാരണ്ടി നൽകുന്നില്ല
തിരയൽ ഫലങ്ങളിൽ ഒരു പേജ് ദൃശ്യമാകുമെന്ന് നിങ്ങൾക്ക് സ്ഥിരീകരിക്കണമെങ്കിൽ, ഇൻഡെക്സബിലിറ്റി പരിശോധന ഉപയോഗിക്കുക.
എന്തുകൊണ്ടാണ് Robots.txt ക്രാൾ ബജറ്റിനെ സഹായിക്കുന്നത്
സെർച്ച് എഞ്ചിനുകൾ എല്ലാ ദിവസവും എല്ലാ പേജുകളും ക്രാൾ ചെയ്യുന്നില്ല.
നിങ്ങളുടെ സൈറ്റ് മന്ദഗതിയിലാണെങ്കിൽ അല്ലെങ്കിൽ പിശകുകൾ നൽകുകയാണെങ്കിൽ, ഓരോ റണ്ണിലും ക്രാളറുകൾ കുറച്ച് പേജുകൾ സന്ദർശിച്ചേക്കാം.
മികച്ച ഫലങ്ങൾക്കായി, ഒരു സൈറ്റ്മാപ്പിനൊപ്പം robots.txt ഉപയോഗിക്കുക:
- Robots.txt ബോട്ടുകൾക്ക് എന്താണ് ക്രാൾ ചെയ്യേണ്ടത് അല്ലെങ്കിൽ ഒഴിവാക്കേണ്ടത് എന്നതിനെ കുറിച്ച് മാർഗ്ഗനിർദ്ദേശം നൽകുന്നു
- സൈറ്റ്മാപ്പ് ലിസ്റ്റുകൾ നിങ്ങൾ ക്രാൾ ചെയ്യാനും സൂചികയിലാക്കാനും ആഗ്രഹിക്കുന്ന പേജുകൾ
Robots.txt നിങ്ങൾ അറിഞ്ഞിരിക്കേണ്ട നിയമങ്ങൾ
ഒരു robots.txt ഫയൽ കുറച്ച് ലളിതമായ നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു.
- ഉപയോക്തൃ ഏജൻ്റ്
- ഏത് ബോട്ടിനാണ് റൂൾ ബാധകമെന്ന് സജ്ജീകരിക്കുന്നു
- അനുവദിക്കരുത്
- ഒരു ഫോൾഡറിനോ പാതയ്ക്കോ വേണ്ടി ക്രോൾ ചെയ്യുന്നത് തടയുന്നു
- അനുവദിക്കുക
- തടഞ്ഞ ഒരു ഫോൾഡറിനുള്ളിൽ ഒരു നിർദ്ദിഷ്ട പാത തുറക്കുന്നു
- ക്രാൾ-ഡിലേ
- ചില ബോട്ടുകൾക്കായി സാവധാനത്തിലുള്ള ക്രാളിംഗ് അഭ്യർത്ഥിക്കുന്നു (എല്ലാ ബോട്ടുകളും ഇത് പിന്തുടരുന്നില്ല)
ഒരു ചെറിയ തെറ്റിന് പ്രധാന വിഭാഗങ്ങൾ അല്ലെങ്കിൽ പ്രധാന ലാൻഡിംഗ് പേജുകൾ ഉൾപ്പെടെയുള്ള പ്രധാനപ്പെട്ട പേജുകൾ തടയാൻ കഴിയും.
എന്തുകൊണ്ട് വേർഡ്പ്രസ്സ് സൈറ്റുകൾക്ക് പലപ്പോഴും Robots.txt ആവശ്യമാണ്
ആന്തരിക തിരയൽ പേജുകൾ, ചില ആർക്കൈവ് പേജുകൾ, പാരാമീറ്റർ അധിഷ്ഠിത URL-കൾ എന്നിങ്ങനെ SEO-യെ സഹായിക്കാത്ത നിരവധി URL-കൾ WordPress-ന് സൃഷ്ടിക്കാൻ കഴിയും.
ചെറിയ സൈറ്റുകളിൽ പോലും, വൃത്തിയുള്ള robots.txt ഫയൽ ഒരു മികച്ച സജ്ജീകരണമാണ്.
Robots.txt, സൈറ്റ്മാപ്പ് വ്യത്യാസം
നിങ്ങൾ ക്രാൾ ചെയ്യാൻ ആഗ്രഹിക്കുന്ന പേജുകൾ കണ്ടെത്താൻ തിരയൽ എഞ്ചിനുകളെ ഒരു സൈറ്റ്മാപ്പ് സഹായിക്കുന്നു.
- സൈറ്റ്മാപ്പ് കണ്ടെത്തൽ മെച്ചപ്പെടുത്തുന്നു
- Robots.txt ക്രാളിംഗ് ആക്സസ് നിയന്ത്രിക്കുന്നു
മിക്ക വെബ്സൈറ്റുകളും രണ്ടും ഉപയോഗിക്കുന്നതിൽ നിന്ന് പ്രയോജനം നേടുന്നു.
ഈ ജനറേറ്റർ ഉപയോഗിച്ച് Robots.txt എങ്ങനെ സൃഷ്ടിക്കാം
Robots.txt ലളിതമാണ്, പക്ഷേ അത് ക്ഷമിക്കുന്നില്ല.
ഡിഫോൾട്ട് ആക്സസ് സജ്ജീകരിക്കുക
എല്ലാ ബോട്ടുകൾക്കും നിങ്ങളുടെ സൈറ്റ് ഡിഫോൾട്ടായി ക്രാൾ ചെയ്യാനാകുമോ എന്ന് തിരഞ്ഞെടുക്കുക.
നിങ്ങളുടെ സൈറ്റ്മാപ്പ് URL ചേർക്കുക
നിങ്ങളുടെ സൈറ്റ്മാപ്പ് ഉൾപ്പെടുത്തുക, അതുവഴി ക്രാളർമാർക്ക് നിങ്ങളുടെ പ്രധാനപ്പെട്ട പേജുകൾ വേഗത്തിൽ കണ്ടെത്താനാകും.
അനുവദനീയമല്ലാത്ത പാതകൾ ശ്രദ്ധാപൂർവ്വം ചേർക്കുക
ക്രാൾ ചെയ്യാൻ നിങ്ങൾ ശരിക്കും ആഗ്രഹിക്കാത്തത് മാത്രം തടയുക.
/admin/ അല്ലെങ്കിൽ /search/
പ്രസിദ്ധീകരിക്കുന്നതിന് മുമ്പ് അവലോകനം ചെയ്യുക
നിങ്ങളുടെ ഹോംപേജ്, ബ്ലോഗ്, കാറ്റഗറി പേജുകൾ അല്ലെങ്കിൽ പ്രധാന സേവന പേജുകൾ എന്നിവ നിങ്ങൾ തടഞ്ഞിട്ടില്ലെന്ന് രണ്ടുതവണ പരിശോധിക്കുക.
Robots.txt-നൊപ്പം നന്നായി പ്രവർത്തിക്കുന്ന അനുബന്ധ SEO ടൂളുകൾ
Robots.txt സാങ്കേതിക SEO യുടെ ഒരു ഭാഗമാണ്.
- സൈറ്റ്മാപ്പ് ചെക്കർ: നിങ്ങളുടെ സൈറ്റ്മാപ്പ് സാധുവാണെന്നും ബോട്ടുകൾക്ക് വായിക്കാൻ എളുപ്പമാണെന്നും സ്ഥിരീകരിക്കുന്നു.
- Google ഇൻഡക്സ് ചെക്കർ: ഒരു പേജ് സൂചികയിലാക്കാൻ കഴിയുമോ എന്ന് പരിശോധിക്കുകയും noindex പോലുള്ള സാധാരണ ബ്ലോക്കറുകൾ ഫ്ലാഗുചെയ്യുകയും ചെയ്യുന്നു.
- HTTP സ്റ്റാറ്റസ് കോഡ് പരിശോധിക്കുക: 200, 301, 404, ക്രാളിംഗ് മന്ദഗതിയിലാക്കാൻ കഴിയുന്ന സെർവർ പിശകുകൾ എന്നിവ കണ്ടെത്തുന്നു.
- സൗജന്യ റീഡയറക്ട് ചെക്കർ: റീഡയറക്ടുകൾ ശുദ്ധമാണെന്നും ചങ്ങലകളിലോ ലൂപ്പുകളിലോ കുടുങ്ങിയിട്ടില്ലെന്നും സ്ഥിരീകരിക്കുന്നു.
- മെറ്റാ ടാഗുകൾ വിശകലനം: SEO പിശകുകൾക്കായി തലക്കെട്ടുകൾ, വിവരണങ്ങൾ, റോബോട്ടുകളുടെ മെറ്റാ ടാഗുകൾ എന്നിവ അവലോകനം ചെയ്യുന്നു.