ByteScout PDF Extractor SDK

Software screenshot:
ByteScout PDF Extractor SDK
Dettagli del software:
Versione: 9.0.0.3079 Aggiornato
Data di caricamento: 15 Aug 18
Sviluppatore: ByteScout
Licenza: Shareware
Prezzo: 10.00 $
Popolarità: 130
Dimensione: 596 Kb

Rating: 2.0/5 (Total Votes: 2)


        PDF Extractor SDK per gli sviluppatori di software Windows: PDF su testo, PDF su XML, Immagini da PDF, Leggi informazioni PDF, PDF su CSV per Excel.

Bytescout PDF Extractor SDK consente di convertire PDF in testo, PDF in XML, PDF in CSV, estrarre immagini da PDF, estrarre informazioni sui file PDF in interfacce .NET e ActiveX senza bisogno di alcun software aggiuntivo.


Benefici:
 converte il PDF in testo semplice (e può seguire le colonne se si converte un giornale in formato PDF) - inclusa l'estrazione invisibile del testo;
 converte le tabelle in PDF in Excel (CSV) leggendo le celle da un determinato rettangolo;
 converte le tabelle nei file PDF in XML;
 estrae i metadati dei file PDF (titolo, autore, descrizione) e ottiene altre informazioni sul file (numero di pagine, crittografate o meno);
 estrae immagini incorporate da documenti PDF (in ASP.NET, VB.NET, C #, VB6 e VBScript);
 Interfacce e classi DocumentMerger e DocumentSplitter per unire e dividere documenti PDF;
non richiede l'installazione di Adobe Reader o di altri software di lettura PDF;
 fornisce interfacce .NET e ActiveX;
 realizzato con codice C # gestito al 100%.
    

Novità di in questa versione:

Versione 9.0.0.3079: aggiunto il filtraggio del contenuto estratto per nome del font, dimensione del carattere e colore.
Motore OCR aggiornato all'ultima versione. Aggiorna i file di lingua dalla cartella 'tessdata'.
Miglioramento dell'estrazione del testo, raggruppamento di righe in dati tabulari, prestazioni, estrazione di moduli XFA, TableDetector, problemi di analisi PDF risolti.

Novità nella versione 8.7.0.2980:

Aggiunto il filtraggio del contenuto estratto per nome del font, dimensione del carattere e colore.
Motore OCR aggiornato all'ultima versione. Aggiorna i file di lingua dalla cartella 'tessdata'.
Miglioramento dell'estrazione del testo, raggruppamento di righe in dati tabulari, prestazioni, estrazione di moduli XFA, TableDetector, problemi di analisi PDF risolti.

Novità nella versione 8.6.0.2911:

Aggiunto il filtraggio del contenuto estratto per nome del font, dimensione del carattere e colore.
Motore OCR aggiornato all'ultima versione. Aggiorna i file di lingua dalla cartella 'tessdata'.
Miglioramento dell'estrazione del testo, raggruppamento di righe in dati tabulari, prestazioni, estrazione di moduli XFA, TableDetector, problemi di analisi PDF risolti.

Novità nella versione 8.2.0.2699:

La versione 8.2.0.2699 potrebbe includere aggiornamenti, miglioramenti o correzioni di errori non specificati.

Novità nella versione 8.0.0.2528

:

  • Aggiunto il filtraggio del contenuto estratto per nome del font, dimensione e colore del carattere.
  • Aggiornato il motore OCR alla versione più recente. Aggiorna i file di lingua dalla cartella "tessdata".
  • Migliore estrazione del testo.
  • Linee migliorate che raggruppano in dati tabulari.
  • Prestazioni migliorate.
  • Estrazione di moduli XFA migliorata.
  • Migliorato TableDetector.
  • Corretti i problemi di analisi PDF.
  • Risolto il problema della decodifica delle immagini JBIG.
  • ImageExtractor: estrazione fissa di immagini per pagina.
  • MultimediaExtractor: estrazione fissa su audio MPEG incorporato.
  • TextExtractor: proprietà RemoveHyphenation non funzionante.
  • Altri piccoli miglioramenti e correzioni di bug.
  • Novità nella versione 7.0.0.2474

    :

    Versione 7.0.0.2474:

    • aggiunta la nuova classe di utility DocumentPrinter che consente di stampare silenziosamente i documenti PDF (senza finestre di dialogo utente)
    • ha aggiunto una nuova classe JSONExtractor
    • aggiunto override per il metodo DocumentSplitter.Split () che consente di specificare la cartella di output per i file generati
    • corretto bug multi-threading in DocumentSplitter
    • tableDetector ora rispetta l'area di estrazione impostata dal metodo SetExtractionArea ()
    • nuove proprietà nelle classi di estrazione: ExtractionColumns - contiene le coordinate delle colonne rilevate; CustomExtractionColumns: consente di ignorare il rilevamento della colonna
    • I metodi GetPageRect * non hanno tenuto conto della rotazione della pagina.
      Risolto bug nel programma di installazione che causava alcuni file dall'installazione precedente che interferivano con gli aggiornamenti
    • ha rielaborato il controllo della registrazione. Ora la libreria non genererà un'eccezione, ma lavorerà in modalità dimostrativa se manchi o immetti RegistrationName e RegistrationKey errati
    • PDF Multitool: aggiunto l'elenco dei documenti recenti al pulsante "Apri documento PDF"
    • PDF Multitool: la selezione può essere ridimensionata ora
    • PDF Multitool: aggiunta funzione JSON di estrazione
    • PDF Multitool: interfaccia utente di Table Detector migliorata
    • PDF Multitool: qualità di rendering dei font notevolmente migliorata
    • PDF Multitool: aggiunta l'opzione di debug "Mostra colonne di estrazione rilevate" nel menu di scelta rapida per visualizzare le colonne rilevate nella pagina corrente. Diventa visibile solo dopo aver eseguito qualsiasi estrazione contro la pagina visualizzata corrente
    • PDF Multitool: risolto il problema di rendering dei font su Windows a 32 bit
    • altri piccoli miglioramenti e correzioni di bug

    Novità della versione nella versione 6.30.0.2421:

    Versione 6.30.0.2421:

    • Aggiunta classe di utilità TextComparer (disponibile solo negli assembly di .NET 4.0) che consente di confrontare il testo in due documenti PDF e generare report.
    • Supporto migliorato dei profili colore ICC.
    • Gestione importata di caratteri incorporati.
    • Migliorato AttachmentExtractor.
    • Risolto il metodo XMLExtractor.SaveXMLToStream ().
    • Corretto il problema della duplicazione del testo estratto quando si utilizza l'opzione OCRCacheMode.WholePage.
    • Altre correzioni di bug e miglioramenti.

    Novità nella versione 6.20.2354:

    Versione 6.20.2354:

    • PDF in testo, PDF in CSV, funzioni PDF in XML migliorate
    • Nuovo video Estrai, Estrai esempi audio
    • Estrattori CSV e XML hanno migliorato il supporto per le tabelle con colonne vuote all'interno di
    • Nuovo MultimediaExtractor per estrarre video e audio da PDF
    • nuova proprietà PageDataCaching
    • nuovo esempio di "MemoryCareProcessingOfHugeFiles"
    • risolta l'eccezione nulla durante il tentativo di eliminare pagine già disposte
    • XLSExtractor: migliora il supporto dei caratteri
    • SkipInvisibleText ora salta il testo ritagliato (che non è visibile)
    • rendering dell'output di testo migliorato
    • XFDF Extractor: aggiunto il supporto per le checkbox
    • Output immagini migliorato per supportare più sottoformati
    • Miglioramento della gestione del testo Unicode

    Novità nella versione 6.11.2149:

    Versione 6.11.2149:

    • Campioni di elaborazione batch aggiornati per mostrare l'uso del metodo Reset ()
    • Esempio di codice sorgente C ++ aggiunto per Pages Extraction
    • DocumentMerger aggiunge il metodo Merge2 (inputfile1, inputfile2, outputfile) per unire 2 file
    • Risoluzione di errori minori di XLS Extractor
    • PDF Multitool ora consente di abilitare / disabilitare livelli di testo, immagine, vettore, aggiunge impostazioni avanzate per l'estrazione del testo
    • XML, CSV, l'estrazione della tabella migliora il supporto per le tabelle con le celle emtpry all'interno delle colonne
    • . La proprietà ExtractShadowLikeText è migliorata: miglior filtraggio per il testo simile all'ombra

    Novità nella versione 6.10.2136:

    Versione 6.10.2136:

    • PDF in XML, PDF in CSV, funzionalità PDF To Text migliorata
    • Esempio di riga di comando PDF To XLS aggiunto (basato su vbscript)
    • PDF To HTML SDK aggiunge una nuova proprietà .DetectHyperLinks (TRUE per impostazione predefinita) per abilitare / disabilitare il rilevamento automatico dei collegamenti nel testo
    • nuovo SearchablePDFMaker (disponibile per licenze PRO) per convertire PDF in file PDF ricercabili
    • nuove proprietà in extractor: ConsiderFontNames, ConsiderFornSize, ConsiderFontColors, ConsiderVerticalBorders nei file CFG
    • rilevamento delle colonne di intestazione (quando AutoAlighHeaderToColumns = true) è migliorato
    • .DetectLinesInsteadOfParagraphs sostituito con il nuovo .LineGroupingMode per controllare come le linee vengono unite in paragrafi
    • IMPORTANTE! PDF To XML corregge un problema di lunga data con coordinate Y errate per oggetti di testo (era il punto in basso a sinistra anziché in alto a sinistra)
    • .TableXMinIntersectionRequiredInPercents e .TableYMinIntersectionRequiredInPercent proprietà aggiunte
    • Esempio di codice sorgente C ++ aggiunto
    • XML Extractor corregge le colonne vuote mancanti in PreserveFormatting = true mode
    • correzioni minori a colori in alcuni file PDF
    • supporto per più lingue OCR aggiunte
    • PDF Multitool GUI: aggiunge il pulsante Copia negli Appunti alle finestre di dialogo di rendering TXT, CSV, XML e raster
    • XLSExtractor: aggiunge la proprietà PageToWorksheet per abilitare / disabilitare la generazione di fogli di lavoro separati per pagina
    • nuova proprietà .TextEncodingCodePage
    • PDFViewerControl: aggiunge ValidateContextMenu che consente all'utente di aggiungere elementi personalizzati al menu di scelta rapida
    • Controllo PDF Viewer: aggiunge proprietà ShowTextObjects, ShowImageObjects, ShowVectorObjects
    • XMLExtractor ora aggiunge l'attributo "OCRConfidence" per il testo riconosciuto
    • PDF / Una funzionalità di verifica (in versione beta)
    • migliorare i controlli e il controllo e l'allineamento del testo in base al layout originale. Il problema è stato causato dallo spostamento delle coordinate Y nei controlli durante l'analisi: non era corretto. Il modo corretto è quello di shif ...
    • XML Extractor aggiornato: ora produce tag CONTROL per caselle di controllo e campi di testo
    • modificato utilizzando la directory corrente nella directory temporanea
    • caselle di controllo, radiobox, caselle di modifica, caselle combinate sono meglio supportate
    • ora consente ai chiamanti di fiducia parziale

    Novità nella versione 5.80.1781:

    Versione 5.80.1781:

    • PDF a XML, PDF a CSV, funzionalità PDF a testo aggiornata
    • OCRMode ora offre 9 modalità
    • .DetectLineInsteadOfParagraph ora funziona molto meglio. Impostalo su False per catturare il testo multilinea nelle celle della tabella!
    • Supporto per i controlli PDF migliorato
    • Estrazione dati FDF e XFDF

    Novità nella versione 5.10.1747:

    Versione 5.10.1747:

    • PDF a XML, PDF a CSV, funzioni PDF a testo migliorate
    • ora supporta l'estrazione del testo dai controlli di testo
    • L'estrattore XML ora aggiunge lo stile, la dimensione, il nome e le coordinate del testo nei tag
    • Esempio di ASP.NET per l'utilizzo dell'OCR aggiunto
    • nuova proprietà OCRLanguageDataFolder per specificare il percorso della cartella "tessdata"
    • supporto migliorato dei file PDF
    • migliora il supporto per il testo ruotato
    • esempi di codice sorgente aggiornati
    • documentazione aggiornata
    • piccoli miglioramenti e correzioni

    Novità nella versione 5.00.1626:

    Versione 5.00.1626:


      Funzionalità
    • OCR (testo da immagini) aggiunta: ora puoi estrarre il testo da immagini incorporate e riparare il testo danneggiato
    • problema risolto con CSV e XML Extractor mancanti ultime colonne con alcune impostazioni
    • supporto migliorato per file PDF danneggiati
    • la ricerca di testo di ricerca su più righe con le modalità di corrispondenza delle parole è ora supportata
    • ora può cercare testo con trattini e su linee diverse: guarda il nuovo esempio di codice sorgente Trova testo con i trattini
    • nuova proprietà .RTLTextAutoDetectionEnabled (false per impostazione predefinita) per rilevare automaticamente le lingue RTL
    • La demo della GUI del visualizzatore PDF è migliorata
    • piccoli miglioramenti e correzioni

    Requisiti :

    .NET Framework 2.0 o versioni successive

    Limitazioni :

    Nag, filigrana sull'output

    Sistemi operativi supportati

    Programmi simili

    Altri software di sviluppo ByteScout

    Commenti a ByteScout PDF Extractor SDK

    I commenti non trovato
    Aggiungi commento
    Accendere le immagini!