Možný duplikát:
Co je duplicitní obsah a jak se mohu vyhnout penalizaci za to na mém webu?
Četl jsem, že bych měl použít značku NoIndex
pro přechodné stránky, jako jsou stránky indexu, stránkování nebo značky. Je to pravda? Mám blog Tumblr, který zvažuji vložit NoIndex
na stránky indexu, vyhledávání, značky, stránkování a data.
Je NoIndex
dost, nebo existují jiné metody? Měla by být indexová stránka webu označena jako NoFollow
? To opravdu nezní příliš dobře.
Na jaké stránky byste umístili NoIndex
?
Pokud více adres URL stránek produkuje stejný obsah, je to přesně to, k čemu <link rel="canonical">
. Je to pro sdělování vyhledávačům, že obsah více adres URL je stejný a použít tento konkrétní jako primární. Tím se zcela vyhnete problémům s duplicitou a je to velmi jednoduché.
Ne, neměli byste zastavit vyhledávací nástroje v indexování stránkování nebo stránek se značkami. (A rozhodně ne vaše indexová stránka!) U blogů nebo webů bez jasné struktury nabídek je to hlavní způsob, jak najdou váš obsah.
Vyhledávače častěji než tyto stránky dokážou tyto stránky dobře zpracovat a objevit váš nejdůležitější obsah, tj. Samotné položky blogu.
Pokud si však všimnete, že tyto stránky seznamu jsou indexovány více než blogové příspěvky, doporučuji vám zablokovat indexování „nekonečných konfigurací“, například třídění podle popularity. Nebo cokoli, kde jsou stejné položky uvedeny v různých pořadích - umožňují indexování jednoho rozumného pořadí a zbytek ignorovat.
Neexistuje nic, co by bránilo každému robotovi v pavouku na jakékoli stránce na vašem webu, pokud tomu tak není násilně zabráněno.
Jak již bylo řečeno, vždy můžete povzbudit robota sledovat a indexovat, co chcete/nechcete. Některé z těchto metod zahrnují:
robots.txt
a jeho umístění do kořenového adresáře.response header
pro každý zdroj.sitemap.xml
pouze se stránkami, které chcete mít pavouky.$_GET
v adrese URL, pokud pravdivě nevytvoří jedinečná data. (například www.abc.com/index.php?session=21389271893219
použijte místo toho $_POST
).404 NOT FOUND
na tyto stránky a 200
nebo přesměrovat na živé uživatele. (301
s jsou diskutabilní)Je jich víc, ale funguje to pro 99% většiny všeho. Trik je dobrý návrh výchozího adresáře URL.