Jak mohu najít soubor sitemap.xml webových stránek?
např. Jít na stackoverflow/sitemap.xml mě dostane 404.
V souboru stackoverflow/robots.txt je napsáno následující:
"technicky to neplatí, protože z nějakého důvodu, který byl zapomenut, musí být cesty Sitemap ABSOLUTNÍ a nikoli relativní. Mapa stránek: /sitemap.xml"
Nemyslím si, že by existoval standard týkající se umístění souboru Sitemap. To je důvod, proč byste měli ke svému souboru Sitemap zadat libovolnou adresu URL, pokud ji přidáte pomocí Nástrojů pro webmastery Google.
Neexistuje žádná norma, takže zde není žádná záruka. S tím řekl, že jeho společný pro sitemap, které mají být označeny a na kořen, jako je tento:
example.com/sitemap.xml
Případ je na některých serverech citlivý, takže mějte na paměti. Pokud tam není, podívejte se do souboru robotů v kořenovém adresáři:
example.com/robots.txt
Pokud se nezobrazuje v souboru robotu, přejděte do Googlu a hledejte toto:
site:example.com filetype:xml
To omezí výsledky na soubory XML ve vaší cílové doméně. V tomto bodě jeho pokus-a-chyba a na základě specifiků webové stránky, se kterou pracujete. Pokud dostanete více stránek výsledků z vyhledávací fráze Google výše, zkuste výsledky dále omezit:
filetype:xml site:example.com inurl:sitemap
nebo
filetype:xml site:example.com inurl:products
Pokud stále nemůžete najít, můžete right-click > "View Source"
a udělat vyhledávání (aka: "control find" nebo Ctrl + F
) pro .xml
a zjistit, zda je v kódu odkaz na něj.
Umístění souboru Sitemap ovlivňuje, které adresy URL mohou obsahovat, ale jinak neexistuje žádný standard. Zde je dobrý odkaz s více vysvětlením: http://www.sitemaps.org/protocol.html#location
Podle protokolové dokumentace existují minimálně tři možnosti, které mohou návrháři stránek použít k informování o umístění sitemap.xml do vyhledávačů:
Takže pokud se nerozhodli publikovat umístění souboru Sitemap na svém souboru robots.txt, nemůžete vědět, kam dali své soubory sitemap.xml.
K vyhledání pro vás použijte operátory vyhledávání Google
vyhledávání Google s níže uvedeným kódem ..
inurl: domain.com filetype: xml
změnit doménu na doménu, kterou chcete najít. To by mělo obsahovat seznam všech souborů XML uvedených pro danou doménu .. včetně všech souborů Sitemap :)