it-swarm-eu.dev

Jaký je ideální vyhledávač s vlastním hostitelem?

Mám interní (intranetový) web, který se skládá z několika blogů a fór, stovek statických stránek, spousty PDF souborů a několika dalších typů dokumentů. Během posledních několika let bylo toto spojení volně spojeno a nyní je jeho úkolem ho udržovat.

Hledám vyhledávač, který mohu hostit sám v ideálním případě:

  1. Umožňuje přímé prohledávání databází Blog/Forum, pokud jsou zadány informace o databázi a tabulky pro vyhledávání.

  2. Zpracovává většinu textových dokumentů (PDF/DOC/ODF)

  3. Je otevřený zdroj nebo umožňuje přístup ke zdrojovému kódu po zakoupení

Nezáleží mi na tom, v jakém jazyce nebo platformě je napsán. Normálně bych používal pouze vyhledávání na webu Google, ale to není možnost pro intranet.

11
Tim Post

Podívejte se Lucene

Napsáno Java k dispozici také pro . NET framework

Zde je článek CodeProject, který vysvětluje, jak to funguje a jak se používá. http://www.codeproject.com/KB/library/IntroducingLucene.aspx

7
jessegavin

Už jsem použil Sphider a byl jsem docela ohromen.

2
Darryl Hein

SearchBlox , který je založen na Lucene, může být schopen vyhovět vašim potřebám. Je zdarma a je dodáván s prolézacím modulem.

2
user5213

Normálně bych používal pouze vyhledávání na webu Google, ale to není možnost pro intranet.

Ve skutečnosti existuje vyhledávací zařízení Google, které je ekvivalentem vyhledávání na intranetu na webu Google. Nejedná se však o otevřený zdroj (vyhledávání na webu Google však není, v případě, že jste si toho nevšimli.)

0
delete