WordTabulator è destinato per l'analisi del testo. Con l'aiuto di wordTabulator è possibile generare l'indice di elementi verbali estratti dal set testo definito. Elementi di Word possono essere parole, N-grammi (di dimensioni definite) o frasi (syntagmes). Il programma in grado di elaborare testi in Spaziale 2-byte di codifica (ANSI), come nella codifica multibyte UTF-8. Testi di partenza sono definite come una serie di file di testo piatti o HTML / documenti XML / SGML. In quest'ultimo caso il programma può filtrare il contenuto di markup. Inoltre, è possibile elaborare solo i contenuti definiti all'interno dei tag associati selezionati. Oppure si può ignorare che il contenuto di trasformazione. Include modulo morfologico per russi, tre diversi formati di indice della produzione, tre diversi tipi di elementi di parole (parole, N-grammi e frasi), il browser di contesto, e vero ordine alfabetico.
Dettagli del software:
Versione: 3.5
Data di caricamento: 15 Apr 15
Licenza: Libero
Popolarità: 370
Dimensione: 2708 Kb
I commenti non trovato