DKPro TC è un open source e completamente gratuito quadro classificazione testo scritto nel linguaggio di programmazione Java, basato su Apache UIMA Framework, e costruito in cima a macchina Weka Learning Toolkit, DKPro Core e DKPro Lab. Esso è stato progettato appositamente per ridurre gli esperimenti di apprendimento automatico supervisionato che implica qualsiasi tipo di dati testuali.
DKPro TC dispone di un codice di esempio Fetting-iniziato, che può essere utilizzato per le collezioni di testo standard, come ad esempio la Reuters-21578 Testo Categorizzazione corpus, in Groovy e Java; numerose funzionalità estrattori generiche, come POS-tag e n-grammi; comoda funzionalità di ottimizzazione dei parametri; vasta segnalazione, sostenendo un sacco di misure di performance standard; il supporto per la coppia-saggio classificazione dei documenti; . il supporto per la singola etichetta e la classificazione multi-label
Requisiti :
- Java 2 Standard Edition Runtime Environment
I commenti non trovato