Scaricare Gratis ByteScout PDF Extractor SDK Per Windows ::: Strumenti di sviluppo

ByteScout PDF Extractor SDK

Software screenshot:

Dettagli del software:

Versione: 9.0.0.3079 ^Aggiornato

Data di caricamento: 15 Aug 18

Sviluppatore: ByteScout

Licenza: Shareware

Prezzo: 10.00 $

Popolarità: 130

Dimensione: 596 Kb

Scaricare

Currently 2.00/5
1
2
3
4
5

Rating: 2.0/5 (Total Votes: 2)

PDF Extractor SDK per gli sviluppatori di software Windows: PDF su testo, PDF su XML, Immagini da PDF, Leggi informazioni PDF, PDF su CSV per Excel.

Bytescout PDF Extractor SDK consente di convertire PDF in testo, PDF in XML, PDF in CSV, estrarre immagini da PDF, estrarre informazioni sui file PDF in interfacce .NET e ActiveX senza bisogno di alcun software aggiuntivo.

Benefici:
converte il PDF in testo semplice (e può seguire le colonne se si converte un giornale in formato PDF) - inclusa l'estrazione invisibile del testo;
converte le tabelle in PDF in Excel (CSV) leggendo le celle da un determinato rettangolo;
converte le tabelle nei file PDF in XML;
estrae i metadati dei file PDF (titolo, autore, descrizione) e ottiene altre informazioni sul file (numero di pagine, crittografate o meno);
estrae immagini incorporate da documenti PDF (in ASP.NET, VB.NET, C #, VB6 e VBScript);
Interfacce e classi DocumentMerger e DocumentSplitter per unire e dividere documenti PDF;
non richiede l'installazione di Adobe Reader o di altri software di lettura PDF;
fornisce interfacce .NET e ActiveX;
realizzato con codice C # gestito al 100%.

Novità di in questa versione:

Versione 9.0.0.3079: aggiunto il filtraggio del contenuto estratto per nome del font, dimensione del carattere e colore.
Motore OCR aggiornato all'ultima versione. Aggiorna i file di lingua dalla cartella 'tessdata'.
Miglioramento dell'estrazione del testo, raggruppamento di righe in dati tabulari, prestazioni, estrazione di moduli XFA, TableDetector, problemi di analisi PDF risolti.

Novità nella versione 8.7.0.2980:

Aggiunto il filtraggio del contenuto estratto per nome del font, dimensione del carattere e colore.
Motore OCR aggiornato all'ultima versione. Aggiorna i file di lingua dalla cartella 'tessdata'.
Miglioramento dell'estrazione del testo, raggruppamento di righe in dati tabulari, prestazioni, estrazione di moduli XFA, TableDetector, problemi di analisi PDF risolti.

Novità nella versione 8.6.0.2911:

Novità nella versione 8.2.0.2699:

La versione 8.2.0.2699 potrebbe includere aggiornamenti, miglioramenti o correzioni di errori non specificati.

Novità nella versione 8.0.0.2528

:

Aggiunto il filtraggio del contenuto estratto per nome del font, dimensione e colore del carattere.

Aggiornato il motore OCR alla versione più recente. Aggiorna i file di lingua dalla cartella "tessdata".

Migliore estrazione del testo.

Linee migliorate che raggruppano in dati tabulari.

Prestazioni migliorate.

Estrazione di moduli XFA migliorata.

Migliorato TableDetector.

Corretti i problemi di analisi PDF.

Risolto il problema della decodifica delle immagini JBIG.

ImageExtractor: estrazione fissa di immagini per pagina.

MultimediaExtractor: estrazione fissa su audio MPEG incorporato.

TextExtractor: proprietà RemoveHyphenation non funzionante.

Altri piccoli miglioramenti e correzioni di bug.

Novità nella versione 7.0.0.2474
:
Versione 7.0.0.2474:

aggiunta la nuova classe di utility DocumentPrinter che consente di stampare silenziosamente i documenti PDF (senza finestre di dialogo utente)

ha aggiunto una nuova classe JSONExtractor

aggiunto override per il metodo DocumentSplitter.Split () che consente di specificare la cartella di output per i file generati

corretto bug multi-threading in DocumentSplitter

tableDetector ora rispetta l'area di estrazione impostata dal metodo SetExtractionArea ()

nuove proprietà nelle classi di estrazione: ExtractionColumns - contiene le coordinate delle colonne rilevate; CustomExtractionColumns: consente di ignorare il rilevamento della colonna

I metodi GetPageRect * non hanno tenuto conto della rotazione della pagina.
Risolto bug nel programma di installazione che causava alcuni file dall'installazione precedente che interferivano con gli aggiornamenti

ha rielaborato il controllo della registrazione. Ora la libreria non genererà un'eccezione, ma lavorerà in modalità dimostrativa se manchi o immetti RegistrationName e RegistrationKey errati

PDF Multitool: aggiunto l'elenco dei documenti recenti al pulsante "Apri documento PDF"

PDF Multitool: la selezione può essere ridimensionata ora

PDF Multitool: aggiunta funzione JSON di estrazione

PDF Multitool: interfaccia utente di Table Detector migliorata

PDF Multitool: qualità di rendering dei font notevolmente migliorata

PDF Multitool: aggiunta l'opzione di debug "Mostra colonne di estrazione rilevate" nel menu di scelta rapida per visualizzare le colonne rilevate nella pagina corrente. Diventa visibile solo dopo aver eseguito qualsiasi estrazione contro la pagina visualizzata corrente

PDF Multitool: risolto il problema di rendering dei font su Windows a 32 bit

altri piccoli miglioramenti e correzioni di bug

Novità della versione nella versione 6.30.0.2421:
Versione 6.30.0.2421:

Aggiunta classe di utilità TextComparer (disponibile solo negli assembly di .NET 4.0) che consente di confrontare il testo in due documenti PDF e generare report.

Supporto migliorato dei profili colore ICC.

Gestione importata di caratteri incorporati.

Migliorato AttachmentExtractor.

Risolto il metodo XMLExtractor.SaveXMLToStream ().

Corretto il problema della duplicazione del testo estratto quando si utilizza l'opzione OCRCacheMode.WholePage.

Altre correzioni di bug e miglioramenti.

Novità nella versione 6.20.2354:
Versione 6.20.2354:

PDF in testo, PDF in CSV, funzioni PDF in XML migliorate

Nuovo video Estrai, Estrai esempi audio

Estrattori CSV e XML hanno migliorato il supporto per le tabelle con colonne vuote all'interno di

Nuovo MultimediaExtractor per estrarre video e audio da PDF

nuova proprietà PageDataCaching

nuovo esempio di "MemoryCareProcessingOfHugeFiles"

risolta l'eccezione nulla durante il tentativo di eliminare pagine già disposte

XLSExtractor: migliora il supporto dei caratteri

SkipInvisibleText ora salta il testo ritagliato (che non è visibile)

rendering dell'output di testo migliorato

XFDF Extractor: aggiunto il supporto per le checkbox

Output immagini migliorato per supportare più sottoformati

Miglioramento della gestione del testo Unicode

Novità nella versione 6.11.2149:
Versione 6.11.2149:

Campioni di elaborazione batch aggiornati per mostrare l'uso del metodo Reset ()

Esempio di codice sorgente C ++ aggiunto per Pages Extraction

DocumentMerger aggiunge il metodo Merge2 (inputfile1, inputfile2, outputfile) per unire 2 file

Risoluzione di errori minori di XLS Extractor

PDF Multitool ora consente di abilitare / disabilitare livelli di testo, immagine, vettore, aggiunge impostazioni avanzate per l'estrazione del testo

XML, CSV, l'estrazione della tabella migliora il supporto per le tabelle con le celle emtpry all'interno delle colonne

. La proprietà ExtractShadowLikeText è migliorata: miglior filtraggio per il testo simile all'ombra

Novità nella versione 6.10.2136:
Versione 6.10.2136:

PDF in XML, PDF in CSV, funzionalità PDF To Text migliorata

Esempio di riga di comando PDF To XLS aggiunto (basato su vbscript)

PDF To HTML SDK aggiunge una nuova proprietà .DetectHyperLinks (TRUE per impostazione predefinita) per abilitare / disabilitare il rilevamento automatico dei collegamenti nel testo

nuovo SearchablePDFMaker (disponibile per licenze PRO) per convertire PDF in file PDF ricercabili

nuove proprietà in extractor: ConsiderFontNames, ConsiderFornSize, ConsiderFontColors, ConsiderVerticalBorders nei file CFG

rilevamento delle colonne di intestazione (quando AutoAlighHeaderToColumns = true) è migliorato

.DetectLinesInsteadOfParagraphs sostituito con il nuovo .LineGroupingMode per controllare come le linee vengono unite in paragrafi

IMPORTANTE! PDF To XML corregge un problema di lunga data con coordinate Y errate per oggetti di testo (era il punto in basso a sinistra anziché in alto a sinistra)

.TableXMinIntersectionRequiredInPercents e .TableYMinIntersectionRequiredInPercent proprietà aggiunte

Esempio di codice sorgente C ++ aggiunto

XML Extractor corregge le colonne vuote mancanti in PreserveFormatting = true mode

correzioni minori a colori in alcuni file PDF

supporto per più lingue OCR aggiunte

PDF Multitool GUI: aggiunge il pulsante Copia negli Appunti alle finestre di dialogo di rendering TXT, CSV, XML e raster

XLSExtractor: aggiunge la proprietà PageToWorksheet per abilitare / disabilitare la generazione di fogli di lavoro separati per pagina

nuova proprietà .TextEncodingCodePage

PDFViewerControl: aggiunge ValidateContextMenu che consente all'utente di aggiungere elementi personalizzati al menu di scelta rapida

Controllo PDF Viewer: aggiunge proprietà ShowTextObjects, ShowImageObjects, ShowVectorObjects

XMLExtractor ora aggiunge l'attributo "OCRConfidence" per il testo riconosciuto

PDF / Una funzionalità di verifica (in versione beta)

migliorare i controlli e il controllo e l'allineamento del testo in base al layout originale. Il problema è stato causato dallo spostamento delle coordinate Y nei controlli durante l'analisi: non era corretto. Il modo corretto è quello di shif ...

XML Extractor aggiornato: ora produce tag CONTROL per caselle di controllo e campi di testo

modificato utilizzando la directory corrente nella directory temporanea

caselle di controllo, radiobox, caselle di modifica, caselle combinate sono meglio supportate

ora consente ai chiamanti di fiducia parziale

Novità nella versione 5.80.1781:
Versione 5.80.1781:

PDF a XML, PDF a CSV, funzionalità PDF a testo aggiornata

OCRMode ora offre 9 modalità

.DetectLineInsteadOfParagraph ora funziona molto meglio. Impostalo su False per catturare il testo multilinea nelle celle della tabella!

Supporto per i controlli PDF migliorato

Estrazione dati FDF e XFDF

Novità nella versione 5.10.1747:

Versione 5.10.1747:

PDF a XML, PDF a CSV, funzioni PDF a testo migliorate

ora supporta l'estrazione del testo dai controlli di testo

L'estrattore XML ora aggiunge lo stile, la dimensione, il nome e le coordinate del testo nei tag

Esempio di ASP.NET per l'utilizzo dell'OCR aggiunto

nuova proprietà OCRLanguageDataFolder per specificare il percorso della cartella "tessdata"

supporto migliorato dei file PDF

migliora il supporto per il testo ruotato

esempi di codice sorgente aggiornati

documentazione aggiornata

piccoli miglioramenti e correzioni

Novità nella versione 5.00.1626:

Versione 5.00.1626:

Funzionalità
OCR (testo da immagini) aggiunta: ora puoi estrarre il testo da immagini incorporate e riparare il testo danneggiato

problema risolto con CSV e XML Extractor mancanti ultime colonne con alcune impostazioni

supporto migliorato per file PDF danneggiati

la ricerca di testo di ricerca su più righe con le modalità di corrispondenza delle parole è ora supportata

ora può cercare testo con trattini e su linee diverse: guarda il nuovo esempio di codice sorgente Trova testo con i trattini

nuova proprietà .RTLTextAutoDetectionEnabled (false per impostazione predefinita) per rilevare automaticamente le lingue RTL

La demo della GUI del visualizzatore PDF è migliorata

piccoli miglioramenti e correzioni

Requisiti :

.NET Framework 2.0 o versioni successive

Limitazioni :

Nag, filigrana sull'output

15 Aug 18 In Strumenti di sviluppo, Componenti e le biblioteche