Apache Parquet

Software screenshot:
Apache Parquet
Dettagli del software:
Versione: 2.3.1 Aggiornato
Data di caricamento: 9 Feb 16
Licenza: Libero
Popolarità: 39

Rating: nan/5 (Total Votes: 0)

Apache parquet è un formato di memorizzazione dei dati "colonnare", che è stato appositamente creato per il Apache Hadoop famiglia di progetti.

Parquet è raccomandato per essere utilizzato con dati di grandi dimensioni, soprattutto perché utilizza un sistema di compressione dei dati complessi, basandosi su una serie di algoritmi record di triturazione e ri-assemblaggio ottimizzati.

In questo modo i dati disaggregati, organizzato in un formato nidificato, e riassemblati quando interrogato.

Il formato parquet può essere utilizzato anche al di fuori l'ecosistema Hadoop, essendo specificamente progettato per essere il più agnostica possibile lavorare con qualsiasi tipo di quadro di elaborazione dei dati e il modello di memorizzazione dei dati.

< strong> Cosa c'è di nuovo in questa versione:

  • Rinomina pacchetti e Maven coordinate org.apache
  • Aggiungi statistiche di codifica a ColumnMetaData
  • Streaming parsimonia API
  • I nuovi tipi logici

Cosa c'è di nuovo nella versione 2.3.0:

  • Rinomina pacchetti e Maven coordinate org.apache
  • Aggiungi statistiche di codifica a ColumnMetaData
  • Streaming parsimonia API
  • I nuovi tipi logici

Limitazioni :

  • Il progetto è ancora in fase di sviluppo nel repository di Apache Incubator e potrebbe cambiare drasticamente a partire dalla versione alla versione.

Programmi simili

Presto
Presto

25 Feb 15

ActiveScaffold
ActiveScaffold

9 Apr 16

Cassandra Client
Cassandra Client

13 May 15

Relaxo
Relaxo

12 Apr 15

Altri software di sviluppo Apache Software Foundation

Apache POI
Apache POI

6 Mar 16

Apache jclouds
Apache jclouds

10 Feb 16

Apache Empire-db
Apache Empire-db

10 Dec 15

Apache Sling
Apache Sling

13 Apr 15

Commenti a Apache Parquet

I commenti non trovato
Aggiungi commento
Accendere le immagini!
Ricerca per categoria