it-swarm.dev

Jak najít sitemap.xml cestu na webových stránkách?

Jak mohu najít soubor sitemap.xml webových stránek?

např. Jít na stackoverflow/sitemap.xml mě dostane 404. 

V souboru stackoverflow/robots.txt je napsáno následující:

"technicky to neplatí, protože z nějakého důvodu, který byl zapomenut, musí být cesty Sitemap ABSOLUTNÍ a nikoli relativní. Mapa stránek: /sitemap.xml"

37
jacktrades

Nemyslím si, že by existoval standard týkající se umístění souboru Sitemap. To je důvod, proč byste měli ke svému souboru Sitemap zadat libovolnou adresu URL, pokud ji přidáte pomocí Nástrojů pro webmastery Google.

15
maksimov

Neexistuje žádná norma, takže zde není žádná záruka. S tím řekl, že jeho společný pro sitemap, které mají být označeny a na kořen, jako je tento:

example.com/sitemap.xml

Případ je na některých serverech citlivý, takže mějte na paměti. Pokud tam není, podívejte se do souboru robotů v kořenovém adresáři:

example.com/robots.txt

Pokud se nezobrazuje v souboru robotu, přejděte do Googlu a hledejte toto:

site:example.com filetype:xml

To omezí výsledky na soubory XML ve vaší cílové doméně. V tomto bodě jeho pokus-a-chyba a na základě specifiků webové stránky, se kterou pracujete. Pokud dostanete více stránek výsledků z vyhledávací fráze Google výše, zkuste výsledky dále omezit:

filetype:xml site:example.com inurl:sitemap

nebo

filetype:xml site:example.com inurl:products

Pokud stále nemůžete najít, můžete right-click > "View Source" a udělat vyhledávání (aka: "control find" nebo Ctrl + F) pro .xml a zjistit, zda je v kódu odkaz na něj.

89
Kirkland

Umístění souboru Sitemap ovlivňuje, které adresy URL mohou obsahovat, ale jinak neexistuje žádný standard. Zde je dobrý odkaz s více vysvětlením: http://www.sitemaps.org/protocol.html#location

3
Johan Falk

Podle protokolové dokumentace existují minimálně tři možnosti, které mohou návrháři stránek použít k informování o umístění sitemap.xml do vyhledávačů:

  • Informování každého vyhledávače o místě prostřednictvím jejich poskytnutého rozhraní
  • Přidání adresy URL do souboru robots.txt
  • Odeslání adresy URL do vyhledávačů prostřednictvím protokolu http

Takže pokud se nerozhodli publikovat umístění souboru Sitemap na svém souboru robots.txt, nemůžete vědět, kam dali své soubory sitemap.xml.

2
Jens

K vyhledání pro vás použijte operátory vyhledávání Google

vyhledávání Google s níže uvedeným kódem ..

inurl: domain.com filetype: xml

změnit doménu na doménu, kterou chcete najít. To by mělo obsahovat seznam všech souborů XML uvedených pro danou doménu .. včetně všech souborů Sitemap :)

0