قيد التطوير

مولد Robots.txt |

إعلان

التوجيهات العامة

قم بضبط السلوك الافتراضي لجميع برامج الزحف قبل تطبيق التجاوزات الطبقية.

قم بتعيين قاعدة عامة للسماح أو الحظر لـ User-agent: *.

قم بتقييد سرعة الزحف إذا كان خادمك بحاجة إلى مساحة للتنفس.

توجيه اختياري للمضيف للنطاقات المتطابقة.

مسار واحد لكل سطر. يدعم الأحرف البديلة والشرطات المائلة في نهاية السطر.

تأكد من بقاء مجلدات معينة قابلة للزحف حتى عند حظر مسارات أوسع.

أدخل رابطًا واحدًا لخريطة الموقع في كل سطر. أضف فهارس إضافية لخريطة الموقع إن وجدت.

الزواحف الشائعة

قم بتفعيل/إيقاف برامج الزحف التي تريد حظرها بالكامل. اتركها تعمل وفقًا للقاعدة الافتراضية المذكورة أعلاه.

القواعد الجمركية

أضف وكلاء المستخدمين مع توجيهات السماح أو الحظر المخصصة، وتأخيرات الزحف، وتلميحات خريطة الموقع.

انسخ الملف الذي تم إنشاؤه أعلاه وقم بتحميله إلى جذر نطاقك باسم robots.txt.

أنشئ ملفات robots.txt للتحكم في سلوك الزحف إلى محرك البحث.
Table of Contents

Robots.txt هو ملف نصي صغير يرشد برامج تتبع البحث على موقعك.

استخدم ملف robots.txt لحظر مناطق مثل صفحات الإدارة والمجلدات المرحلية وعناوين URL الاختبارية وصفحات التصفية والمسارات المكررة.

يعد ملف Robots.txt جزءًا من معيار استبعاد برامج الروبوت.

yourdomain.com/robots.txt

غالبًا ما تقوم محركات البحث بفحص هذا الملف مبكرًا لأنه يمنحها توجيهات واضحة للزحف.

نقطة مهمة:

  • يتحكم ملف Robots.txt في الزحف
  • ولا يضمن الفهرسة

إذا كنت تريد التأكد من إمكانية ظهور الصفحة في نتائج البحث، فاستخدم فحص الفهرسة.

محركات البحث لا تزحف إلى كل صفحة كل يوم.

إذا كان موقعك بطيئًا أو يعرض أخطاء، فقد تزور برامج الزحف عددًا أقل من الصفحات في كل مرة تشغيل.

للحصول على أفضل النتائج، استخدم ملف robots.txt مع خريطة الموقع:

  • Robots.txt يرشد برامج الروبوت إلى ما يجب الزحف إليه أو تخطيه
  • يسرد ملف Sitemap الصفحات التي تريد الزحف إليها وفهرستها

يستخدم ملف robots.txt بعض التوجيهات البسيطة.

  • وكيل المستخدم
  • يحدد الروبوت الذي تنطبق عليه القاعدة
  • عدم السماح
  • كتل الزحف لمجلد أو مسار
  • السماح
  • يفتح مسارًا محددًا داخل مجلد محظور
  • تأخير الزحف
  • يطلب زحفًا أبطأ لبعض برامج الروبوت (لا تتبعه جميع برامج الروبوت)

قد يؤدي خطأ صغير إلى حظر الصفحات المهمة، بما في ذلك الفئات الرئيسية أو الصفحات المقصودة الأساسية.

يمكن لـ WordPress إنشاء العديد من عناوين URL التي لا تساعد في تحسين محركات البحث، مثل صفحات البحث الداخلي وبعض صفحات الأرشيف وعناوين URL المستندة إلى المعلمات.

حتى في المواقع الأصغر حجمًا، يعد ملف robots.txt النظيف بمثابة إعداد ذكي.

تساعد خريطة الموقع محركات البحث على اكتشاف الصفحات التي تريد الزحف إليها.

  • يعمل خريطة الموقع على تحسين الاكتشاف
  • يتحكم Robots.txt في الوصول إلى الزحف

تستفيد معظم مواقع الويب من استخدام كليهما.

يعد ملف Robots.txt أمرًا بسيطًا، ولكنه ليس متسامحًا.

تعيين الوصول الافتراضي

اختر ما إذا كان بإمكان جميع برامج الروبوت الزحف إلى موقعك افتراضيًا.

أضف عنوان URL لخريطة الموقع

قم بتضمين خريطة الموقع الخاصة بك حتى تتمكن برامج الزحف من العثور على صفحاتك المهمة بشكل أسرع.

أضف المسارات غير المسموح بها بعناية

احظر فقط ما لا تريد الزحف إليه حقًا.

/admin/ أو /search/

المراجعة قبل النشر

تأكد جيدًا من أنك لم تقم بحظر صفحتك الرئيسية أو مدونتك أو صفحات الفئات أو صفحات الخدمة الرئيسية.

يعد ملف Robots.txt جزءًا من عملية تحسين محركات البحث الفنية.