Dettagli del software:
Versione: 0.13.0 Aggiornato
Data di caricamento: 10 Dec 15
Licenza: Libero
Popolarità: 71
Una pipeline è una concatenazione di operazioni per eseguire un processo specifico, disposti in modo che l'uscita di ciascun elemento è l'ingresso del successivo.
Apache Crunch fornisce un metodo più semplice di trattare con Apache Hadoop condutture MapReduce.
Crunch semplifica questo processo fornendo un gran numero di metodi e funzioni già pronti che possono essere utilizzati per assemblare e manipolare tubazioni MapReduce in varie forme.
Il progetto prevede un'API Java nativo, insieme a Scala un (nome Scrunch).
Support è inoltre incluso per la gestione di Avro i verbali e le HBase righe e colonne.
I commenti non trovato