jPDFText è una libreria Java per estrarre il testo da documenti PDF. Con jPDFText, i documenti PDF possono essere elaborati per estrarre il contenuto testuale per l'archiviazione, la memorizzazione, la ricerca o l'indicizzazione. jPDFText è basato sulla tecnologia PDF proprietaria di Qoppas, quindi non è necessario installare alcun software o driver di terze parti. Poiché è scritto in Java, consente alla tua applicazione di rimanere indipendente dalla piattaforma ed eseguire su Windows, Linux, Unix (Solaris, HP UX, IBM AIX), Mac OS X e qualsiasi altra piattaforma che supporti l'ambiente di runtime Java.
Caratteristiche principali:
Carica documenti PDF da file, unità di rete, URL o flussi di input.
Estrai il testo nell'ordine di lettura logica.
Estrai parole come vettore di stringhe.
Funziona su Windows, Linux, Unix e Mac OS X (100% Java).
Non è necessario installare o configurare driver o software aggiuntivi durante la distribuzione.
Testato su JDK 1.4.2 e versioni successive.
I commenti non trovato