DSTK - Data Science Toolkit 3 è un set di software per data mining e dati, che segue il modello CRISP DM. DSTK offre la comprensione dei dati utilizzando l'analisi statistica e testuale, la preparazione dei dati utilizzando la normalizzazione e l'elaborazione del testo, la modellazione e la valutazione per gli algoritmi di apprendimento automatico e di apprendimento statistico.
DSTK 3 offrirà interessanti funzionalità come Deep Neural Network (Deep Learning), Text Link Analysis con Visualizations, KMeans Clustering. Alcune di queste funzionalità possono essere presentate nella versione precedente, ma poiché gli algoritmi vengono riscritti per ridurre l'utilizzo di librerie esterne come Weka per ridurre le dimensioni del file, è necessario più tempo per svilupparle. DSTK Engine è ancora in fase beta, quindi potrebbero esserci alcuni bug e inaccuratezza.
DSTK 3 è costituito da DSTK Engine, DSTK ScriptWriter, DSTK Studio e DSTK Text Explorer. DSTK Engine è R semplificato, incentrato sul data mining. DSTK ScriptWriter offre GUI per scrivere script per DSTK Engine. DSTK Studio offre SPSS Statistics come GUI per il data mining e DSTK Text Explorer offre GUI per Text Mining.
Requisiti :
Java Runtime Environment, Microsoft. Net Framework
Limitazioni :
10-use trial
I commenti non trovato