it-swarm.dev

Como encontrar o sitemap.xml caminho em sites?

Como posso encontrar o arquivo sitemap.xml de sites?

por exemplo. Ir para stackoverflow/sitemap.xml me faz um 404. 

Em stackoverflow/robots.txt está escrito o seguinte:

"tecnicamente isso não é válido, já que por alguma razão esquecida por Deus os caminhos do sitemap devem ser ABSOLUTO e não relativos. Sitemap: /sitemap.xml"

37
jacktrades

Não acho que haja um padrão quanto à localização do sitemap. Essa é a razão pela qual você deve especificar um URL arbitrário em seu sitemap ao adicionar um usando as Ferramentas do Google para webmasters.

15
maksimov

Não há padrão, então não há garantia. Com isso dito, é comum que o sitemap seja rotulado e na raiz, assim:

example.com/sitemap.xml

O caso é sensível em alguns servidores, então tenha isso em mente. Se não estiver lá, procure no arquivo de robôs na raiz:

example.com/robots.txt

Se você não o visualizar listado no arquivo do robô, acesse o Google e pesquise:

site:example.com filetype:xml

Isso limitará os resultados a arquivos XML no seu domínio de destino. Neste ponto, sua tentativa e erro baseia-se nas especificidades do site com o qual você está trabalhando. Se você receber várias páginas de resultados da frase de pesquisa do Google acima, tente limitar ainda mais os resultados:

filetype:xml site:example.com inurl:sitemap

ou

filetype:xml site:example.com inurl:products

Se você ainda não consegue encontrá-lo, você pode right-click > "View Source" e fazer uma pesquisa (também conhecido como "control find" ou Ctrl + F) para .xml para ver se há uma referência a ele no código.

89
Kirkland

A localização do sitemap afeta quais URLs ele pode incluir, mas, por outro lado, não há um padrão. Aqui está um bom link com mais explicações: http://www.sitemaps.org/protocol.html#location

3
Johan Falk

De acordo com o documentação do protocolo existem pelo menos três opções que os designers do site podem usar para informar a localização do sitemap.xml aos mecanismos de pesquisa:

  • Informar cada mecanismo de pesquisa do local por meio de sua interface fornecida
  • Adicionando url ao arquivo robots.txt
  • Envio de url aos mecanismos de pesquisa por meio de http

Portanto, a menos que tenham escolhido publicar o local do sitemap em seu arquivo robots.txt, você não pode realmente saber onde colocou seus arquivos sitemap.xml.

2
Jens

Use os operadores de pesquisa do Google para encontrá-lo para você

pesquise no google com o código abaixo.

inurl: domain.com filetype: xml

altere domain.com para o domínio que você deseja encontrar o sitemap. isso deve listar todos os arquivos xml listados para o domínio fornecido ... incluindo todos os sitemaps :)

0
Rejneesh Raghunath