common.you_need_to_be_loggedin_to_add_tool_in_favorites
مولد Robots.txt |
التوجيهات العامة
قم بضبط السلوك الافتراضي لجميع برامج الزحف قبل تطبيق التجاوزات الطبقية.
قم بتعيين قاعدة عامة للسماح أو الحظر لـ User-agent: *.
قم بتقييد سرعة الزحف إذا كان خادمك بحاجة إلى مساحة للتنفس.
توجيه اختياري للمضيف للنطاقات المتطابقة.
مسار واحد لكل سطر. يدعم الأحرف البديلة والشرطات المائلة في نهاية السطر.
تأكد من بقاء مجلدات معينة قابلة للزحف حتى عند حظر مسارات أوسع.
أدخل رابطًا واحدًا لخريطة الموقع في كل سطر. أضف فهارس إضافية لخريطة الموقع إن وجدت.
الزواحف الشائعة
قم بتفعيل/إيقاف برامج الزحف التي تريد حظرها بالكامل. اتركها تعمل وفقًا للقاعدة الافتراضية المذكورة أعلاه.
القواعد الجمركية
أضف وكلاء المستخدمين مع توجيهات السماح أو الحظر المخصصة، وتأخيرات الزحف، وتلميحات خريطة الموقع.
لا توجد قواعد مخصصة حتى الآن. استخدم الزر أعلاه لإنشاء واحدة.
سلسلة وكيل المستخدم الدقيقة أو سلسلة وكيل المستخدم التي تحتوي على أحرف بدل.
انسخ الملف الذي تم إنشاؤه أعلاه وقم بتحميله إلى جذر نطاقك باسم robots.txt.
مولد ملف Robots.txt لتحسين الزحف والفهرسة
Robots.txt هو ملف نصي صغير يرشد برامج تتبع البحث على موقعك.
استخدم ملف robots.txt لحظر مناطق مثل صفحات الإدارة والمجلدات المرحلية وعناوين URL الاختبارية وصفحات التصفية والمسارات المكررة.
ماذا يعني ملف Robots.txt في تحسين محركات البحث؟
يعد ملف Robots.txt جزءًا من معيار استبعاد برامج الروبوت.
yourdomain.com/robots.txt
غالبًا ما تقوم محركات البحث بفحص هذا الملف مبكرًا لأنه يمنحها توجيهات واضحة للزحف.
نقطة مهمة:
- يتحكم ملف Robots.txt في الزحف
- ولا يضمن الفهرسة
إذا كنت تريد التأكد من إمكانية ظهور الصفحة في نتائج البحث، فاستخدم فحص الفهرسة.
لماذا يساعد ملف Robots.txt في الزحف إلى الميزانية
محركات البحث لا تزحف إلى كل صفحة كل يوم.
إذا كان موقعك بطيئًا أو يعرض أخطاء، فقد تزور برامج الزحف عددًا أقل من الصفحات في كل مرة تشغيل.
للحصول على أفضل النتائج، استخدم ملف robots.txt مع خريطة الموقع:
- Robots.txt يرشد برامج الروبوت إلى ما يجب الزحف إليه أو تخطيه
- يسرد ملف Sitemap الصفحات التي تريد الزحف إليها وفهرستها
قواعد Robots.txt التي يجب أن تعرفها
يستخدم ملف robots.txt بعض التوجيهات البسيطة.
- وكيل المستخدم
- يحدد الروبوت الذي تنطبق عليه القاعدة
- عدم السماح
- كتل الزحف لمجلد أو مسار
- السماح
- يفتح مسارًا محددًا داخل مجلد محظور
- تأخير الزحف
- يطلب زحفًا أبطأ لبعض برامج الروبوت (لا تتبعه جميع برامج الروبوت)
قد يؤدي خطأ صغير إلى حظر الصفحات المهمة، بما في ذلك الفئات الرئيسية أو الصفحات المقصودة الأساسية.
لماذا تحتاج مواقع WordPress غالبًا إلى ملف Robots.txt
يمكن لـ WordPress إنشاء العديد من عناوين URL التي لا تساعد في تحسين محركات البحث، مثل صفحات البحث الداخلي وبعض صفحات الأرشيف وعناوين URL المستندة إلى المعلمات.
حتى في المواقع الأصغر حجمًا، يعد ملف robots.txt النظيف بمثابة إعداد ذكي.
الفرق بين ملف Robots.txt وخريطة الموقع
تساعد خريطة الموقع محركات البحث على اكتشاف الصفحات التي تريد الزحف إليها.
- يعمل خريطة الموقع على تحسين الاكتشاف
- يتحكم Robots.txt في الوصول إلى الزحف
تستفيد معظم مواقع الويب من استخدام كليهما.
كيفية إنشاء ملف Robots.txt باستخدام هذا المولد
يعد ملف Robots.txt أمرًا بسيطًا، ولكنه ليس متسامحًا.
تعيين الوصول الافتراضي
اختر ما إذا كان بإمكان جميع برامج الروبوت الزحف إلى موقعك افتراضيًا.
أضف عنوان URL لخريطة الموقع
قم بتضمين خريطة الموقع الخاصة بك حتى تتمكن برامج الزحف من العثور على صفحاتك المهمة بشكل أسرع.
أضف المسارات غير المسموح بها بعناية
احظر فقط ما لا تريد الزحف إليه حقًا.
/admin/ أو /search/
المراجعة قبل النشر
تأكد جيدًا من أنك لم تقم بحظر صفحتك الرئيسية أو مدونتك أو صفحات الفئات أو صفحات الخدمة الرئيسية.
أدوات تحسين محركات البحث ذات الصلة التي تعمل بشكل جيد مع ملف Robots.txt
يعد ملف Robots.txt جزءًا من عملية تحسين محركات البحث الفنية.
- مدقق خريطة الموقع: التأكد من أن خريطة الموقع الخاصة بك صالحة وسهلة القراءة لبرامج الروبوت.
- مدقق فهرس Google: يتحقق من إمكانية فهرسة الصفحة ويضع علامة على أدوات الحظر الشائعة مثل noindex.
- التحقق من رمز حالة HTTP: يبحث عن أخطاء 200 و301 و404 والخادم التي يمكن أن تؤدي إلى إبطاء الزحف.
- مدقق إعادة التوجيه المجاني: يؤكد أن عمليات إعادة التوجيه نظيفة وليست عالقة في سلاسل أو حلقات.
- تحليل العلامات الوصفية: مراجعة العناوين والأوصاف والعلامات الوصفية لبرامج الروبوت بحثًا عن أخطاء تحسين محركات البحث.