Apache Parquet

Software screenshot:
Apache Parquet
Dettagli del software:
Versione: 2.3.1 Aggiornato
Data di caricamento: 9 Feb 16
Licenza: Libero
Popolarità: 39

Rating: nan/5 (Total Votes: 0)

Apache parquet è un formato di memorizzazione dei dati "colonnare", che è stato appositamente creato per il Apache Hadoop famiglia di progetti.

Parquet è raccomandato per essere utilizzato con dati di grandi dimensioni, soprattutto perché utilizza un sistema di compressione dei dati complessi, basandosi su una serie di algoritmi record di triturazione e ri-assemblaggio ottimizzati.

In questo modo i dati disaggregati, organizzato in un formato nidificato, e riassemblati quando interrogato.

Il formato parquet può essere utilizzato anche al di fuori l'ecosistema Hadoop, essendo specificamente progettato per essere il più agnostica possibile lavorare con qualsiasi tipo di quadro di elaborazione dei dati e il modello di memorizzazione dei dati.

< strong> Cosa c'è di nuovo in questa versione:

  • Rinomina pacchetti e Maven coordinate org.apache
  • Aggiungi statistiche di codifica a ColumnMetaData
  • Streaming parsimonia API
  • I nuovi tipi logici

Cosa c'è di nuovo nella versione 2.3.0:

  • Rinomina pacchetti e Maven coordinate org.apache
  • Aggiungi statistiche di codifica a ColumnMetaData
  • Streaming parsimonia API
  • I nuovi tipi logici

Limitazioni :

  • Il progetto è ancora in fase di sviluppo nel repository di Apache Incubator e potrebbe cambiare drasticamente a partire dalla versione alla versione.

Programmi simili

Redis-Dump
Redis-Dump

13 May 15

mongo-connector
mongo-connector

22 Jul 15

Query-Engine
Query-Engine

14 May 15

Altri software di sviluppo Apache Software Foundation

Apache Synapse
Apache Synapse

13 Apr 15

Apache UIMA
Apache UIMA

17 Feb 15

Apache CXF
Apache CXF

9 Feb 16

Apache MetaModel
Apache MetaModel

10 Feb 16

Commenti a Apache Parquet

I commenti non trovato
Aggiungi commento
Accendere le immagini!