विकासमा छ

Robots.txt जेनरेटर |

विज्ञापन

सामान्य निर्देशनहरू

लेयरिङ ओभरराइड गर्नु अघि सबै क्रलरहरूको लागि पूर्वनिर्धारित व्यवहार कन्फिगर गर्नुहोस्।

प्रयोगकर्ता-एजेन्टको लागि विश्वव्यापी अनुमति वा रोक नियम सेट गर्नुहोस्: *।

यदि तपाईंको सर्भरलाई सास फेर्न ठाउँ चाहिन्छ भने थ्रोटल क्रलरहरू।

मिरर गरिएका डोमेनहरूको लागि वैकल्पिक होस्ट निर्देशन।

प्रति रेखा एउटा बाटो। वाइल्डकार्ड र ट्रेलिङ स्ल्यासहरूलाई समर्थन गर्दछ।

फराकिलो मार्गहरू अवरुद्ध हुँदा पनि विशिष्ट फोल्डरहरू क्रल गर्न मिल्ने सुनिश्चित गर्नुहोस्।

प्रति लाइन एउटा साइटम्याप URL प्रदान गर्नुहोस्। यदि तपाईंसँग थप साइटम्याप अनुक्रमणिकाहरू छन् भने ती थप्नुहोस्।

साधारण क्रलरहरू

तपाईंले पूर्ण रूपमा ब्लक गर्न चाहनुभएको क्रलरहरू टगल गर्नुहोस्। तिनीहरूलाई माथिको पूर्वनिर्धारित नियममा भर पर्न अनुमति दिनुहोस्।

अनुकूलन नियमहरू

अनुकूलित अनुमति वा ब्लक निर्देशनहरू, क्रल ढिलाइहरू, र साइटम्याप संकेतहरू सहित प्रयोगकर्ता-एजेन्टहरू थप्नुहोस्।

माथिको उत्पन्न फाइल प्रतिलिपि गर्नुहोस् र यसलाई तपाईंको डोमेनको रूटमा robots.txt को रूपमा अपलोड गर्नुहोस्।

खोज इन्जिन क्रलिङ व्यवहार नियन्त्रण गर्न robots.txt फाइलहरू उत्पन्न गर्नुहोस्।
Table of Contents

Robots.txt एउटा सानो पाठ फाइल हो जसले तपाईंको साइटमा खोज बटहरूलाई मार्गदर्शन गर्दछ।

व्यवस्थापक पृष्ठहरू, स्टेजिङ फोल्डरहरू, परीक्षण URL हरू, फिल्टर पृष्ठहरू, र नक्कल मार्गहरू जस्ता क्षेत्रहरूलाई रोक्न robots.txt प्रयोग गर्नुहोस्।

Robots.txt रोबोट बहिष्करण मानकको अंश हो।

yourdomain.com/robots.txt

खोज इन्जिनहरूले प्राय: यस फाइललाई चाँडै जाँच गर्छन् किनभने यसले तिनीहरूलाई स्पष्ट क्रलिङ दिशाहरू दिन्छ।

एउटा महत्त्वपूर्ण बिन्दु:

  • Robots.txt नियन्त्रणहरू क्रलिङ
  • यसले अनुक्रमणिका ग्यारेन्टी गर्दैन

यदि तपाइँ पृष्ठ खोज परिणामहरूमा देखा पर्न सक्छ भनेर पुष्टि गर्न चाहनुहुन्छ भने, अनुक्रमणिका जाँच प्रयोग गर्नुहोस्।

खोज इन्जिनहरू हरेक दिन प्रत्येक पृष्ठ क्रल गर्दैनन्।

यदि तपाईंको साइट ढिलो छ वा त्रुटिहरू फर्काउँछ भने, क्रलरहरूले प्रति रन कम पृष्ठहरू भ्रमण गर्न सक्छन्।

उत्कृष्ट परिणामहरूको लागि, साइटम्यापको साथ robots.txt प्रयोग गर्नुहोस्:

  • Robots.txt के क्रल गर्ने वा छोड्ने बारे बटहरूलाई मार्गदर्शन गर्दछ
  • साइटम्याप सूचीहरू तपाईंले क्रल गर्न र अनुक्रमित गर्न चाहनुभएको पृष्ठहरू

robots.txt फाइलले केही सरल निर्देशनहरू प्रयोग गर्दछ।

  • प्रयोगकर्ता-एजेन्ट
  • कुन बोटमा नियम लागू हुन्छ सेट गर्दछ
  • अस्वीकार गर्नुहोस्
  • फोल्डर वा पथको लागि क्रलिङ रोक्छ
  • अनुमति दिनुहोस्
  • अवरुद्ध फोल्डर भित्र एक विशिष्ट मार्ग खोल्छ
  • क्रल-ढिलाइ
  • केही बटहरूको लागि ढिलो क्रलिङ अनुरोध गर्दछ (सबै बटहरूले यसलाई पछ्याउँदैनन्)

एउटा सानो गल्तीले महत्त्वपूर्ण पृष्ठहरू ब्लक गर्न सक्छ, मुख्य कोटीहरू वा कोर ल्यान्डिङ पृष्ठहरू सहित।

WordPress ले धेरै URL हरू सिर्जना गर्न सक्छ जसले SEO लाई मद्दत गर्दैन, जस्तै आन्तरिक खोज पृष्ठहरू, केही अभिलेख पृष्ठहरू, र प्यारामिटर-आधारित URL हरू।

साना साइटहरूमा पनि, सफा robots.txt फाइल एक स्मार्ट सेटअप हो।

साइटम्यापले खोज इन्जिनहरूलाई तपाईंले क्रल गर्न चाहनुभएको पृष्ठहरू पत्ता लगाउन मद्दत गर्दछ।

  • साइटम्याप खोज सुधार गर्दछ
  • Robots.txt ले क्रलिङ पहुँच नियन्त्रण गर्छ

धेरै वेबसाइटहरूले दुबै प्रयोग गरेर फाइदा लिन्छन्।

Robots.txt सरल छ, तर यो क्षमाशील छैन।

पूर्वनिर्धारित पहुँच सेट गर्नुहोस्

पूर्वनिर्धारित रूपमा सबै बटहरूले तपाईंको साइट क्रल गर्न सक्छन् कि भनेर छनौट गर्नुहोस्।

तपाईंको साइटम्याप URL थप्नुहोस्

तपाईंको साइटम्याप समावेश गर्नुहोस् ताकि क्रलरहरूले तपाईंको महत्त्वपूर्ण पृष्ठहरू छिटो फेला पार्न सकून्।

अस्वीकृत मार्गहरू सावधानीपूर्वक थप्नुहोस्

तपाईंले वास्तवमै क्रल गर्न नचाहनुभएको कुरा मात्र ब्लक गर्नुहोस्।

/admin/ वा /search/

प्रकाशित गर्नु अघि समीक्षा गर्नुहोस्

तपाईंले आफ्नो गृहपृष्ठ, ब्लग, कोटी पृष्ठहरू, वा मुख्य सेवा पृष्ठहरू ब्लक गर्नुभएको छैन भनेर डबल-जाँच गर्नुहोस्।

Robots.txt प्राविधिक SEO को एक भाग हो