it-swarm-eu.dev

Jak mohu detekovat odkazy, které ukazují na squattery domén?

Vím, jak najít mrtvé odkazy, které jdou na 404 stránek. V dnešní době však mnoho odkazů skutečně nezemře, ale místo toho skončí v squatteru domény. Uvědomuji si, že se jedná o vysoký řád, ale existuje nějaký způsob, jak zjistit, zda je web vlastně squatterem domény, aniž bych ve skutečnosti procházel každý web pomocí svého prohlížeče a zkoumal, zda není obrázek dívky s batohem atd. .?

4
delete

Možné metody detekce pro zaparkované stránky/domény:

Najděte nevyžádané fráze

Do případu necitlivé hledání obyčejných generických nevyžádaných frází, jako například „co potřebujete, když to potřebujete“ a „váš zdroj pro prakticky cokoli!“.

Najděte pozvánky na nákup

Vyhledejte text, například „Dotaz na tuto doménu“ a „Tato doména může být na prodej“.

Testujte 404 s na náhodných podstránkách

Navštivte testdomain.com/randomstring. Pokud dostanete číslo 404 nebo pokud samotná stránka obsahuje text „404“ nebo „nenalezen“, pravděpodobně není zaparkovaný.

Testování přesměrování na náhodných podstránkách

Jiné systémy parkovaných domén přesměrovávají testdomain.com/randomstring na testdomain.com.

Vyhledejte název domény v metaznačkách

Několik šablon parkovaných domén používá pro metaznačku autora následující formát:

<meta name="author" content="Nameofdomain.com" />

Jiní to dali do popisu:

<meta name="description" content="nameofdomain.com">

V každém případě je doménou v atributu „obsah“ pouze. To není pravděpodobné u aktivních webů.

Vyhledejte značku sady rámců

Některé šablony parkovaných domén používají značku <frameset> s několika interními rámečky k načtení externího obsahu (často z adresy 'information.com'), ale jinak na stránce nic jiného nenabízejí.

Použijte více testů

Žádný z těchto testů není nutně spolehlivým indikátorem parkované domény. Pravděpodobně budete muset zkombinovat více testů, abyste si vytvořili svůj vlastní algoritmus, a poté je otestujte a vylepšete na základě sady známých parkovaných domén a známých aktivních domén.

2
Nick

Jsou věci, které můžete hledat. Je dominantním prvkem na stránce iFrame? Je odpověď 301/302, která vás přenese mimo doménu? (mnoho squatterů vás jednoduše 302 nebo 301 na vaši vstupní stránku). Je poměr odkazů a textu neuvěřitelně vysoký?

Řekl bych, že je to velmi obtížné, ale to jsou alespoň některé společné vlastnosti.

Zdá se, že na stránce Wikipedia linkrot existuje projekt odkazující na nějaký projekt, který se o to pokouší: http://en.wikipedia.org/wiki/Wikipedia_talk:Linkrot - podrobnosti jsou ale útržkovité.

0
Mark Henderson