Apache Nutch

Apache Nutch 2.3 Aggiornato

progetto Apache Nutch è una fonte aperta, scalabile, software web crawler Web-based altamente estensibile e gratuito che si basa su Apache Lucene (versione Java) libreria.Aggiunge specifiche Web, come un cingolato, un database link-grafico, parser per...

Per saperne di più