Tak jsem při brouzdání po scriptech narazil na php scrip na vlastní vyhledávač Sphider. Nedalo mi to vyzkoušet ho co umí a jak funguje, stáhl jsem ho do PC a chtěl zkusit na některém z free hostingů v CZ. Bohužel jsem narazil na problém se safe_mode zapnutým asi u všech zkoušených hostingů a byl jsem „nucen“ vyzkoušet ho na některém z placených.
Instalace je jednoduchá, stačí částečná znalost angl. jazyka, a script začal pracovat jak má. Poslal jsem tedy pavouka zaindexovat jeden web. Za pár sekund měl svou práci hotovou a vyhodil mi výsledky: cca 300 zaindexovaných stránek, nad 25000 klíčových slov, spousta odkazů … Spustil jsem tedy stránku s hledáním, zadal libovolné klíčové slovo a za 0,01sekundy vyhledávač vypsal odkazy dle relevancí.
Script funguje docela dobře, je schopen zaindexovat (dle tvůrců) cca 20tisíc stránek, je lehce nastavitelný a upravitelný, překlad do češtiny je jednoduchý, analizuje a vyřazuje nefunkční odkazy, vede spoustu statistik atd atd. Využití třeba pro někoho zajímavé (hledání na svých webech, na webech konkurence, na určitých vámi zadaných webech které vás zajímají, …)
Bohužel jsem zjistil že script zatěžuje asi docela hodně server tak jsme ho radši odinstaloval. (Doufám že po tomhle příspěvku nebude na mě nadávat půlka poskytovatelů hostingu :-)
A co vy? Nechcete taky vlastní vyhledávač?
Používám Sphider u nás ve firmě. Musel jsem ale celkem dost zasáhnout do kodu, abych upravil tento script pro podporu českých znaků. Umí indexovat dokumenty wordu, excelu, powerpointu i acrobatu. A tady je ten problem. Tyto dokumenty mají většinou různé druhy kodování (iso, utf, win). Dále je dobré robota spouštět z terminálu. V prostředí Windows pak třeba c:\php\php.exe sphider.php -f -u www.neconekde.cz
Přečteno 62 785×
Přečteno 62 432×
Přečteno 54 300×
Přečteno 52 676×
Přečteno 48 511×