HPC Challenge è una suite di benchmark ad alte prestazioni. L'HPC sfida consiste di fondamentalmente 7 parametri di riferimento:
1. HPL - benchmark Linpack TPP che misura il tasso virgola mobile di esecuzione per risolvere un sistema lineare di equazioni.
2. DGEMM - misura il tasso in virgola mobile di esecuzione del doppio precisione matrice reale matrice moltiplicazione.
3. STREAM - un semplice programma di benchmark sintetico che misura la larghezza di banda della memoria sostenibile (in GB / s) e il corrispondente tasso di calcolo per semplice kernel vettoriale.
4. PTRANS (Trasposizione matrice parallelo) - esercita le comunicazioni in cui coppie di processori comunicano tra loro contemporaneamente. È un utile test della capacità di comunicazione totale della rete.
5. RandomAccess - misura il tasso di aggiornamento casuali interi di memoria (GUPS).
6. FFTE - misura il tasso in virgola mobile di esecuzione del doppio complesso precisione unidimensionale Discrete Fourier Transform (DFT).
7. banda di comunicazione e la latenza - una serie di test per misurare la latenza e larghezza di banda di un certo numero di modelli di comunicazione simultanee; sulla base di b_eff (efficace benchmark larghezza di banda).
Compilazione:
Il primo passo è quello di creare un file di configurazione che riflette le caratteristiche della vostra macchina. Il file di configurazione dovrebbe essere creato nella directory hpl. Questa directory contiene le istruzioni (i file README e INSTALL) su come creare il file di configurazione. L'elenco hpl / installazione contiene molti esempi di file di configurazione. Un buon approccio è quello di copiare uno di questi nella directory hpl e se non funziona, allora cambiarlo. Questo file viene riutilizzato da tutti i componenti della suite HPC Challange.
Quando la configurazione è fatto, un file dovrebbe esistere nella directory hpl il cui nome inizia con Marca. e termina con il nome del sistema utilizzato per le prove. Ad esempio, se il nome del sistema è Unix, il file deve essere denominato Make.Unix.
Per costruire il file eseguibile di riferimento (per il sistema denominato Unix) digitare: make arch = Unix. Questo comando deve essere eseguito nella directory principale (non nella directory HPL). Si farà il punto nella directory hpl per il file di configurazione e utilizzarlo per costruire il file eseguibile di riferimento.
Configurazione:
L'HPC Challange è guidato da un file di input breve chiamato hpccinf.txt che è quasi lo stesso del file di input per HPL (abitualmente chiamato HPL.dat). Fare riferimento al file hpl / www / tuning.html per dettagli sul file di input per HPL. Un file di input di esempio è incluso nella distribuzione HPC Challange.
Le differenze tra le file di input HPL e file di input HPC Challange possono essere riassunti come segue:
* Linee 3 e 4 vengono ignorati. L'uscita va sempre al file denominato hpccoutf.txt.
* Non ci sono linee addizionali (che iniziano con la linea 33) che possono (ma non devono) essere utilizzato per personalizzare il benchmark HPC Challenge. Essi sono descritti di seguito.
Le linee aggiuntive nel file di input HPC Challenge (rispetto al file di input HPL) sono:
Linee 33 e 34 descrivono dimensioni di matrici aggiuntivi da utilizzare per l'esecuzione del benchmark PTRANS (uno dei componenti del benchmark HPC Challange).
* Le linee 35 e 36 descrivono i fattori di blocco aggiuntivi da utilizzare per l'esecuzione PTRANS benchmark.
Solo per completezza, ecco la lista di righe di file di input del HPC Challange con brevi descrizioni del loro significato:
* Linea 1: ignorato
* Linea 2: ignorato
* Linea 3: ignorato
* Linea 4: ignorato
* Linea 5: numero di dimensioni della matrice per HPL (e PTRANS)
* Linea 6: le dimensioni di matrice per HPL (e PTRANS)
* Linea 7: il numero di fattori di blocco per HPL (e PTRANS)
* Linea 8: fattori di blocco per HPL (e PTRANS)
* Linea 9: tipo di ordinamento processo di HPL
* Linea 10: numero di griglie di processo per HPL (e PTRANS)
* Linea 11: numero di righe di processo di ogni griglia procedimento per HPL (e
PTRANS)
* Linea 12: il numero di colonne di processo di ogni griglia processo di HPL
(E PTRANS)
* Linea 13: valore di soglia da non superare per scalato residuo per
HPL (e PTRANS)
* Linea 14: numero di metodi di fattorizzazione pannello di HPL
* Linea 15: metodi di fattorizzazione pannello di HPL
* Linea 16: serie di criteri di arresto ricorsive per HPL
* Linea 17: ricorsiva criteri di arresto per HPL
* Linea 18: numero di pannelli ricorsione conta HPL
* Linea 19: pannello ricorsione conta per HPL
* Linea 20: numero di metodi di fattorizzazione pannello ricorsive per HPL
* Linea 21: ricorsiva metodi di fattorizzazione pannello di HPL
* Linea 22: numero di metodi di trasmissione per HPL
* Linea 23: metodi di trasmissione per HPL
* Linea 24: il numero delle profondità look-ahead per HPL
* Linea 25: look-ahead profondità di HPL
* Linea 26: metodi di swap per HPL
* Linea 27: scambio soglia per HPL
* Linea 28: forma di L1 per HPL
* Linea 29: forma di U per HPL
* Linea 30: valore che specifica se equilibrio dovrebbe essere usato
da HPL
* Linea 31: allineamento memoria per HPL
* Linea 32: ignorato
* Linea 33: numero di ulteriore problema dimensioni per PTRANS
* Linea 34: ulteriore problema formati per PTRANS
* Linea 35: serie di fattori di blocco aggiuntivi per PTRANS
* Linea 36: fattori di blocco aggiuntivi per PTRANS
Cosa c'è di nuovo in questa versione:
- Questa versione ha aggiunto ottimizzata di RandomAccess che utilizzano Linear congruential Generator per la generazione di numeri casuali.
- riduzione globale è stato aggiunto a errori di calcolo in MPI FFT per ottenere stime di errore più accurati.
- L'ordine dei parametri di riferimento è stato riorganizzato in modo che la componente HPL corre scorso e può essere interrotta se le prestazioni di altri componenti non era soddisfacente.
- RandomAccess è ora prima di assistere nella messa a punto del codice.
- bug assortiti sono stati fissati.
I commenti non trovato