Apache Parquet

Software screenshot:
Apache Parquet
Dettagli del software:
Versione: 2.3.1 Aggiornato
Data di caricamento: 9 Feb 16
Licenza: Libero
Popolarità: 159

Rating: nan/5 (Total Votes: 0)

Apache parquet è un formato di memorizzazione dei dati "colonnare", che è stato appositamente creato per il Apache Hadoop famiglia di progetti.

Parquet è raccomandato per essere utilizzato con dati di grandi dimensioni, soprattutto perché utilizza un sistema di compressione dei dati complessi, basandosi su una serie di algoritmi record di triturazione e ri-assemblaggio ottimizzati.

In questo modo i dati disaggregati, organizzato in un formato nidificato, e riassemblati quando interrogato.

Il formato parquet può essere utilizzato anche al di fuori l'ecosistema Hadoop, essendo specificamente progettato per essere il più agnostica possibile lavorare con qualsiasi tipo di quadro di elaborazione dei dati e il modello di memorizzazione dei dati.

< strong> Cosa c'è di nuovo in questa versione:

  • Rinomina pacchetti e Maven coordinate org.apache
  • Aggiungi statistiche di codifica a ColumnMetaData
  • Streaming parsimonia API
  • I nuovi tipi logici

Cosa c'è di nuovo nella versione 2.3.0:

  • Rinomina pacchetti e Maven coordinate org.apache
  • Aggiungi statistiche di codifica a ColumnMetaData
  • Streaming parsimonia API
  • I nuovi tipi logici

Limitazioni :

  • Il progetto è ancora in fase di sviluppo nel repository di Apache Incubator e potrebbe cambiare drasticamente a partire dalla versione alla versione.

Programmi simili

Query-Engine
Query-Engine

14 May 15

Neo4j
Neo4j

26 Jul 16

Pony
Pony

23 Feb 15

Altri software di sviluppo Apache Software Foundation

Apache Crunch
Apache Crunch

10 Dec 15

Apache Nutch
Apache Nutch

1 Mar 15

Apache Tobago
Apache Tobago

13 Apr 15

Commenti a Apache Parquet

I commenti non trovato
Aggiungi commento
Accendere le immagini!