it-swarm.dev

Jak znaleźć ścieżkę sitemap.xml na stronach internetowych?

Jak mogę znaleźć plik sitemap.xml stron internetowych?

na przykład Przejście do stackoverflow/sitemap.xml daje mi 404. 

W pliku stackoverflow/robots.txt jest napisane:

„To technicznie nie jest ważne, ponieważ dla niektórych zapomnianych przez Boga powodów. Ścieżki map witryn muszą być ABSOLUTNE, a nie względne Mapa strony: /sitemap.xml”

37
jacktrades

Nie sądzę, aby istniała norma dotycząca lokalizacji mapy witryny. To jest powód, dla którego powinieneś podać dowolny adres URL do swojej mapy witryny, gdy dodajesz go za pomocą Narzędzi Google dla webmasterów.

15
maksimov

Nie ma standardu, więc nie ma gwarancji. Mówiąc o tym, powszechne jest, że mapa witryny jest oznaczona etykietą samoprzylepną i umieszczona w katalogu głównym, tak jak poniżej:

example.com/sitemap.xml

Sprawa jest wrażliwa na niektórych serwerach, więc miej to na uwadze. Jeśli go tam nie ma, zajrzyj do pliku robotów w katalogu głównym:

example.com/robots.txt

Jeśli nie widzisz go na liście plików robotów, przejdź do Google i wyszukaj:

site:example.com filetype:xml

Spowoduje to ograniczenie wyników do plików XML w domenie docelowej. W tym momencie jego próba i błąd i na podstawie specyfiki witryny, z którą pracujesz. Jeśli otrzymasz kilka stron wyników z powyższej frazy wyszukiwania Google, spróbuj dalej ograniczyć wyniki:

filetype:xml site:example.com inurl:sitemap

lub

filetype:xml site:example.com inurl:products

Jeśli nadal nie możesz go znaleźć, możesz right-click > "View Source" i przeszukać (aka: „control find” lub Ctrl + F) dla .xml, aby sprawdzić, czy w kodzie jest odniesienie do niego.

89
Kirkland

Lokalizacja mapy witryny wpływa na to, które adresy URL mogą zawierać, ale poza tym nie ma standardu. Oto dobry link z dodatkowymi wyjaśnieniami: http://www.sitemaps.org/protocol.html#location

3
Johan Falk

Zgodnie z dokumentacją protocol istnieją co najmniej trzy opcje, których projektanci witryn mogą użyć do informowania wyszukiwarki sitemap.xml o lokalizacji:

  • Informowanie każdej wyszukiwarki o lokalizacji za pomocą udostępnionego interfejsu
  • Dodawanie adresu URL do pliku robots.txt
  • Przesyłanie adresu URL do wyszukiwarek za pośrednictwem http

Jeśli więc nie zdecydowali się opublikować lokalizacji mapy witryny w pliku robots.txt, tak naprawdę nie wiesz, gdzie umieścili swoje pliki sitemap.xml.

2
Jens

Użyj operatorów wyszukiwania Google, aby go znaleźć

wyszukaj google z poniższym kodem ..

inurl: domain.com typ pliku: xml

zmień domenę.com na domenę, w której chcesz znaleźć mapę witryny. Powinno to zawierać listę wszystkich plików xml wymienionych dla danej domeny .. łącznie ze wszystkimi mapami witryn :)

0