Arch è un'estensione open source di Apache Nutch (un popolare, altamente scalabile per uso generico motore di ricerca) per la ricerca Intranet. Non felice con il motore di ricerca aziendale? Non sorprende, pochissime persone sono. Per quanto a nostra conoscenza, non ci sono i motori di intranet che funzionano come pure di ricerca Web globale del Google fa. C'è una ragione fondamentale per questo: gli algoritmi utilizzati da Google sul Web globale (o simili) non funzionano altrettanto bene sulla intranet per la mancanza di dati statistici. Arch (finalmente!) Risolve questo problema. Esso utilizza un nuovo metodo per fornire risultati di ricerca di alta precisione che funziona alla grande. Non ci credete? Ciechi strumenti di valutazione di prova sono inclusi. È possibile distribuire Arch e confrontare le sue prestazioni per il motore di ricerca in corso e / o Google (nella parte pubblica del sito) utilizzando una metodologia di test cieco.
In aggiunta alla eccellente qualità della ricerca, Arco ha molte caratteristiche fondamentali per gli ambienti aziendali:
- Protezione a livello di documento. Gli utenti possono trovare solo i documenti che sono autorizzati a vedere.
- Aggiornamenti dell'indice economico. Arch è in grado di mantenere gli indici aggiornati ed evitare regolare nuova scansione completa del sito.
- 24/7 Disponibilità. C'è sempre un indice di lavoro a disposizione, anche se non riesce a passo d'uomo.- Supporto per l'indicizzazione simultanea e cerca di più siti web, con la possibilità di cercare e gestire qualsiasi sito separatamente, se necessario. Dinamico aggiungendo e la rimozione dei siti web è facile.
- Una directory sito generato automaticamente.
- Supporto a basso costo, una volta distribuito.
- Doppia interfaccia (PHP e Java) per una facile implementazione e la personalizzazione.
- Sfaccettato ricerca "out of the box".
- Un set ampio ed estensibile di parser per l'analisi di una vasta gamma di formati di file: HTML, PHP, PDF, MS Office, Open Office, ecc
- A, architettura modulare basata su plugin che può essere facilmente personalizzato ed esteso.
- Il codice sorgente è incluso.
- Alte prestazioni e scalabilità. Arch può essere eseguito su cluster di computer per indice molto grandi insiemi di dati
Cosa c'è di nuovo in questa versione:.
Versione 1.9.2: migliorata l'analisi del documento, il porting su Nutch 1.9 .
Cosa c'è di nuovo nella versione 1.7:.
aggiunta la scansione di sicurezza, porting su Nutch 1.7
Requisiti :
Java 1.7, Cygwin
I commenti non trovato