it-swarm.dev

Come trovare il percorso sitemap.xml sui siti Web?

Come posso trovare il sitemap.xml file di siti web?

per esempio. Andando a stackoverflow/sitemap.xml mi viene un 404. 

In stackoverflow/robots.txt è scritto il seguente:

"questo tecnicamente non è valido, dal momento che per qualche motivo dimenticato da Dio i percorsi della mappa del sito devono essere ASSOLUTI e non relativi..... Sitemap: /sitemap.xml"

37
jacktrades

Non penso che ci sia uno standard per quanto riguarda la posizione della mappa del sito. Questo è il motivo per cui devi specificare un URL arbitrario per la tua Sitemap quando ne aggiungi uno utilizzando gli Strumenti per i Webmaster di Google.

15
maksimov

Non esiste uno standard, quindi non c'è garanzia. Detto questo, è comune che la Sitemap sia auto etichettata e nella radice, come questa:

example.com/sitemap.xml

Il caso è sensibile su alcuni server, quindi tienilo a mente. Se non è lì, guarda nel file robots sulla radice:

example.com/robots.txt

Se non lo vedi elencato nel file robots, vai su Google e cerca questo:

site:example.com filetype:xml

Ciò limiterà i risultati ai file XML sul tuo dominio di destinazione. A questo punto è la prova e l'errore e in base alle specifiche del sito Web con cui si sta lavorando. Se ricevi più pagine di risultati dalla frase di ricerca di Google riportata sopra, prova a limitare ulteriormente i risultati:

filetype:xml site:example.com inurl:sitemap

o

filetype:xml site:example.com inurl:products

Se ancora non riesci a trovarlo puoi right-click > "View Source" e fare una ricerca (aka: "control find" o Ctrl + F) per .xml per vedere se c'è un riferimento ad esso nel codice.

89
Kirkland

L'ubicazione della sitemap influenza gli URL che può includere, ma altrimenti non esiste uno standard. Ecco un buon collegamento con maggiori spiegazioni: http://www.sitemaps.org/protocol.html#location

3
Johan Falk

Secondo la documentazione di protocol ci sono almeno tre opzioni che i progettisti di siti Web possono utilizzare per informare la posizione di sitemap.xml sui motori di ricerca:

  • Informando ogni motore di ricerca della posizione attraverso la loro interfaccia fornita
  • Aggiunta di url al file robots.txt
  • Invio di url ai motori di ricerca tramite http

Quindi, a meno che non abbiano scelto di pubblicare la posizione della sitemap sul proprio file robots.txt, non si può veramente sapere dove hanno messo i loro file sitemap.xml.

2
Jens

Utilizza gli operatori di ricerca di Google per trovarlo per te

cerca su google con il codice qui sotto ..

inurl: dominio.com filetype: xml

cambia domain.com nel dominio in cui desideri trovare la Sitemap. questo dovrebbe elencare tutti i file xml elencati per il dominio specificato .. comprese tutte le sitemap :)

0