common.you_need_to_be_loggedin_to_add_tool_in_favorites
Generatore Robots.txt |
Direttive generali
Configurare il comportamento predefinito per tutti i crawler prima che la sovrapposizione dei livelli venga ignorata.
Imposta una regola globale di autorizzazione o blocco per User-agent: *.
Limita i crawler se il tuo server ha bisogno di spazio.
Direttiva host facoltativa per domini mirror.
Un percorso per riga. Supporta caratteri jolly e barre finali.
Assicurare che cartelle specifiche rimangano esplorabili anche quando percorsi più ampi sono bloccati.
Fornisci un URL della mappa del sito per riga. Aggiungi altri indici della mappa del sito, se disponibili.
Cingolati comuni
Seleziona i crawler che vuoi bloccare completamente. Lascia che si basino sulla regola predefinita sopra indicata.
Regole personalizzate
Aggiungi user-agent con direttive personalizzate di autorizzazione o blocco, ritardi di scansione e suggerimenti sulla mappa del sito.
Nessuna regola personalizzata ancora. Usa il pulsante qui sopra per crearne una.
Stringa esatta o con caratteri jolly dell'agente utente.
Copia il file generato sopra e caricalo nella radice del tuo dominio come robots.txt.
Generatore Robots.txt per una migliore scansione e indicizzazione
Robots.txt è un piccolo file di testo che guida i bot di ricerca sul tuo sito.
Utilizza robots.txt per bloccare aree come pagine di amministrazione, cartelle di staging, URL di test, pagine di filtro e percorsi duplicati.
Cosa significa Robots.txt nel SEO
Robots.txt fa parte dello standard di esclusione dei robot.
tuodominio.com/robots.txt
I motori di ricerca spesso controllano questo file in anticipo perché fornisce loro chiare indicazioni per la scansione.
Un punto importante:
- Robots.txt controlla la scansione
- Non garantisce l'indicizzazione
Se vuoi verificare che una pagina possa essere visualizzata nei risultati di ricerca, utilizza un controllo di indicizzazione.
Perché Robots.txt aiuta con il budget di scansione
I motori di ricerca non scansionano ogni pagina ogni giorno.
Se il tuo sito è lento o restituisce errori, i crawler potrebbero visitare meno pagine per esecuzione.
Per ottenere i migliori risultati, utilizza robots.txt con una mappa del sito:
- Robots.txt guida i bot su cosa scansionare o saltare
- La mappa del sito elenca le pagine che desideri scansionare e indicizzare
Regole di Robots.txt che dovresti conoscere
Un file robots.txt utilizza alcune semplici direttive.
- Agente utente
- Imposta a quale bot si applica la regola
- Non consentire
- Blocca la scansione di una cartella o di un percorso
- Consenti
- Apre un percorso specifico all'interno di una cartella bloccata
- Ritardo scansione
- Richiede una scansione più lenta per alcuni bot (non tutti i bot la seguono)
Un piccolo errore può bloccare pagine importanti, comprese le categorie chiave o le pagine di destinazione principali.
Perché i siti WordPress hanno spesso bisogno di Robots.txt
WordPress può creare molti URL che non aiutano la SEO, come pagine di ricerca interne, alcune pagine di archivio e URL basati su parametri.
Anche sui siti più piccoli, un file robots.txt pulito è una configurazione intelligente.
Robots.txt e differenza nella mappa del sito
Una mappa del sito aiuta i motori di ricerca a scoprire le pagine di cui desideri eseguire la scansione.
- La Mappa del sito migliora la scoperta
- Robots.txt controlla l'accesso alla scansione
La maggior parte dei siti Web trae vantaggio dall’utilizzo di entrambi.
Come creare Robots.txt utilizzando questo generatore
Robots.txt è semplice, ma non perdona.
Imposta l'accesso predefinito
Scegli se tutti i bot possono eseguire la scansione del tuo sito per impostazione predefinita.
Aggiungi l'URL della tua mappa del sito
Includi la mappa del tuo sito in modo che i crawler possano trovare le tue pagine importanti più velocemente.
Aggiungi attentamente i percorsi non consentiti
Blocca solo ciò che non vuoi veramente sottoporre a scansione.
/admin/ o /search/
Rivedi prima di pubblicare
Verifica di non aver bloccato la home page, il blog, le pagine delle categorie o le pagine dei servizi principali.
Strumenti SEO correlati che funzionano bene con Robots.txt
Robots.txt è una parte del SEO tecnico.
- Controllo mappa del sito: conferma che la tua mappa del sito è valida e facile da leggere per i bot.
- Controllo indice Google: verifica se una pagina può essere indicizzata e segnala blocchi comuni come noindex.
- Controlla il codice di stato HTTP: trova gli errori 200, 301, 404 e del server che possono rallentare la scansione.
- Controllo reindirizzamenti gratuito: conferma che i reindirizzamenti sono puliti e non bloccati in catene o cicli.
- Analisi dei meta tag: esamina titoli, descrizioni e meta tag dei robot per individuare eventuali errori SEO.