DataFu

Software screenshot:
DataFu
Dettagli del software:
Versione: 1.2.0 / 1.3.0-rc1 Aggiornato
Data di caricamento: 10 Feb 16
Sviluppatore: LinkedIn
Licenza: Libero
Popolarità: 272

Rating: 4.0/5 (Total Votes: 4)

DataFu è stato sviluppato presso LinkedIn ed è scritto interamente in Java.

DataFu include funzioni / librerie per lavorare con:

- Statistiche

- Stima

- Sampling

- Sessioni

- Analisi di collegamento

- le operazioni di set

- Borse

DataFu è perfetto per il data mining e applicazioni statistiche che lavorano sulla parte superiore del database Hadoop o di maiale.

Queste funzioni consentono agli sviluppatori di sfruttare appieno tutti i dati memorizzati all'interno di un Hadoop o Pig database senza avere a che fare con i requisiti del sistema di massa al fine di farlo.

Cosa c'è di nuovo in questa versione:.

  • Coppia di UDF per campionamento casuale semplice con sostituzione
  • Più dipendenze ora confezionati in DataFu dipendenze in modo meno JAR necessari.
  • SetDifference UDF per calcolare set differenza (ad esempio A-B o A-B-C).

Cosa c'è di nuovo nella versione 1.2.0:

  • Coppia di UDF per un campionamento casuale semplice con sostituzione.
  • Più dipendenze ora confezionati in DataFu dipendenze in modo meno JAR necessari.
  • SetDifference UDF per calcolare set differenza (ad esempio A-B o A-B-C).

Cosa c'è di nuovo nella versione 1.1.0:.

  • Aggiunto SHA hash UDF
  • InUDF e AssertUDF aggiunti per Pig 0,12 compatibilità. Questi sono gli stessi e affermare.
  • SimpleRandomSample, che implementa un algoritmo di campionamento casuale semplice e scalabile.

Programmi simili

Nut
Nut

12 Apr 15

robots.js
robots.js

12 May 15

PDFKit
PDFKit

12 Apr 15

Altri software di sviluppo LinkedIn

Rest.li
Rest.li

20 Jul 15

LinkedIn
LinkedIn

15 Dec 14

Hopscotch
Hopscotch

1 Oct 15

Commenti a DataFu

I commenti non trovato
Aggiungi commento
Accendere le immagini!