tapiro è uno strumento Python che contiene i programmi di stimare e tracciare informatività filogenetica per grandi insiemi di dati.
Citando tapiro
Quando si utilizza il tapiro, si prega di citare:
- Faircloth BC, Chang J, Alfaro ME: tapiro abilita alte analisi throughput informatività filogenetico.
- Townsend JP: Profiling informatività filogenetica. Biol sistematica. 2007 56: 222-231.
- Stagno SLK, Brina SDW, Muse SV: Hyphy: verifica di ipotesi utilizzando filogenesi. Bioinformatica 2005 21: 676-679.
Installazione
Per il momento, il modo più semplice per installare il programma è il seguente:
git clone git: //github.com/faircloth-lab/tapir.git / path / to / tapiro
Per eseguire i test:
cd / path / to / tapiro /
Test python / test_townsend_code.py
Usa
Il codice estimate_p_i.py richiama un file batch per hyphy che si trova in templates /. Questo file deve essere nella stessa posizione rispetto a dove si mettono estimate_p_i.py. Se si installa assottiglia come sopra, andrà tutto bene, per il momento.
Correre:
cd / path / to / tapiro /
python tapir_compute.py Input_Folder_of_Nexus_Files / Input.tree
& Nbsp; - uscita output_directory
& Nbsp; - epoche = 32-42,88-98,95-105,164-174
& Nbsp; - volte = 37,93,100,170
& Nbsp; - multiprocessing
--multiprocessing è facoltativo, senza di essa, ogni locus verrà eseguito consecutivamente.
Se avete già eseguito i risultati di cui sopra e salvate nella cartella di output (vedi sotto), è possibile utilizzare i dischi sito a tasso pre-esistenti, piuttosto che valutare quelli di nuovo con:
python tapir_compute.py Input_Folder_of_Site_Rate_JSON_Files / Input.tree
& Nbsp; - uscita output_directory
& Nbsp; - epoche = 32-42,88-98,95-105,164-174
& Nbsp; - volte = 37,93,100,170
& Nbsp; - multiprocessing
& Nbsp; - sito-tariffe
Risultati
tapiro scrive i risultati in un database SQLite nella directory di output di tua scelta. Questa directory contiene anche i file dei tassi sito in formato JSON per ogni locus attraversato tapir_compute.py.
È possibile accedere ai risultati del database come segue. Per ulteriori esempi, tra cui tracciato, vedere la documentazione
- Alzare sqlite:
& Nbsp; sqlite3 output_directory / filogenetico-informativeness.sqlite
- Ottenere dati integrati per tutte le epoche:
& Nbsp; selezionare locus, intervallo, pi da loci, intervallo in cui loci.id = interval.id
- Ottenere dati integrati per un'epoca specifica:
& Nbsp; selezionare locus, intervallo, pi da loci, intervallo
& Nbsp; dove interval = '95 -105 'e loci.id = interval.id;
- Ottenere il numero di loci avere max (PI) a diverse epoche:
& Nbsp; creare tabella temporanea max as select id, max (pi) come massimo da intervallo gruppo da id;
& Nbsp; create table t temporanea come selezionare interval.id, intervallo, max da intervallo, max
& Nbsp; dove interval.pi = max.max;
& Nbsp; selezionare l'intervallo, count (*) da t gruppo da intervallo;
Ringraziamenti
Ringraziamo Francesc Lopez-Giraldez e Jeffrey Townsend per averci fornito una copia del loro codice sorgente web-application. . BCF grazie S Hubbell e P Gowaty
Requisiti
- Python
- SciPy
- NumPy
- DendroPy
- hyphy2 (si prega di scaricare o costruire un singolo thread hyphy2)
I commenti non trovato