it-swarm.dev

Sitemap múltiplo: entradas no robots.txt?

Eu tenho pesquisado usando o Google, mas não consigo encontrar uma resposta para esta pergunta.

Um arquivo robots.txt pode conter a seguinte linha:

Sitemap: http://www.mysite.com/sitemapindex.xml

mas é possível especificar vários arquivos de índice de sitemaps no robots.txt e fazer com que os mecanismos de pesquisa reconheçam isso e rastreiem TODOS os sitemaps mencionados em cada arquivo de índice de sitemaps? Por exemplo, isso funcionará:

Sitemap: http://www.mysite.com/sitemapindex1.xml

Sitemap: http://www.mysite.com/sitemapindex2.xml

Sitemap: http://www.mysite.com/sitemapindex3.xml
37
user306942

Sim, é possível ter mais de um sitemap-index-file :

Você pode ter mais de um arquivo de índice de Sitemap.

Destaque por mim.

Sim, é possível listar vários arquivos de sitemap em robots.txt, veja também no site sitemap.org :

Você pode especificar mais de um Arquivo de Sitemap por arquivo robots.txt.

Sitemap: http://www.example.com/sitemap-Host1.xml

Sitemap: http://www.example.com/sitemap-Host2.xml

Destaque por mim, isso não pode ser mal interpretado, eu diria, de maneira simples, isso pode ser feito.

Isso também é necessário para envios cruzados, para os quais btw. a robots.txt foi escolhido.

Btw Google, Yahoo e Bing, todos são membros do sitemaps.org :

O Sitemap 0.90 é oferecido sob os termos da Licença Attribution-ShareAlike Creative Commons e possui ampla adoção, incluindo suporte do Google, Yahoo! E Microsoft.

Assim, você pode ter certeza de que suas entradas no mapa do site serão lidas corretamente pelos robôs do mecanismo de pesquisa.

Submetê-los através de ferramentas para webmasters também não pode prejudicar - como John Muellercomentado .

81
Miltan Chaudhury

Se o seu sitemap tiver mais de 10 MB (descompactado) ou tiver mais de 50.000 entradas, o Google solicitará o uso de vários sitemaps agrupados com um arquivo de índice do sitemap .

No seu robots.txt, aponte para um índice de sitemap que deve se parecer com o seguinte:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2012-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2012-01-01</lastmod>
   </sitemap>
</sitemapindex>
8
scott

É recomendável criar um arquivo de índice de sitemap, separar URLs XML para colocar no seu arquivo robots.txt.

Em seguida, coloque o URL do mapa do site indexado como abaixo no seu arquivo robots.txt.

Sitemap: http://www.yoursite.com/sitemap_index.xml

Se você quiser aprender como criar um URL de sitemap indexado, siga este guia do sitemap.org

Prática recomendada:

  • Crie sitemap de imagem, sitemap de vídeo separadamente, se o seu site tiver um grande número desses conteúdos.
  • Verifique a ortografia do arquivo dos robôs, deve ser robots.txt , não use robot.txt ou nenhum erro de ortografia. Coloque o arquivo robots.txt apenas na raiz diretamente.
  • Para mais informações, você pode visitar site oficial do robots.txt .
0
Deepak Mathur