Burrows-Wheeler Aligner (BWA) è un programma efficiente che allinea sequenze nucleotidiche relativamente brevi nei confronti di una sequenza di riferimento lungo come il genoma umano.
Il software implementa due algoritmi, BWA-breve e BWA-SW. I precedenti lavori di ricerca sequenze più corto 200bp e il secondo per sequenze più lunghe fino a circa 100kbp.
Entrambi gli algoritmi fanno allineamento gapped. Di solito sono più precisi e più veloci su query con bassi tassi di errore. Si prega di consultare la pagina di manuale BWA per ulteriori informazioni.
Fa BWA allineare 454 letture?
& Nbsp; Sì e no. La componente BWA-SO di BWA funziona bene su 454 si legge su 200bp o più. Raggiunge simile precisione di allineamento a SSAHA2 mentre molto più veloce. BWA-SW funziona anche per letture più breve, ma la sensibilità è inferiore. Inoltre, BWA-SW non supporta l'allineamento accoppiato-end.
Qual è la lunghezza massima di sequenza di query in allineamento?
& Nbsp; Si consiglia di utilizzare solo BWA-corto di letture più breve di 200bp. Sebbene lavori BWA-short per un massimo di una query kbp pochi in linea di principio, la sua performance è degradata. Per molto tempo si legge, BWA-SW è meglio.
& Nbsp; La componente BWA-SW può allineare una sequenza BAC (circa 150kbp) contro il genoma umano. La velocità in termini di basi allineati per unità di tempo è paragonabile alla velocità di 1kbp allineamento lettura. In linea di principio, BWA-SW dovrebbe essere in grado di allineare alcuni sequenza di interrogazione Mbp ad una velocità simile, ma non ho provato.
Qual è la tolleranza degli errori di sequenziamento?
& Nbsp; Bwa-breve è stato progettato principalmente per tassi di errore di sequenziamento inferiori al 2%. Anche se gli utenti possono chiedere di tollerare più errori di opzioni della riga di comando di sintonizzazione, la sua performance è rapidamente degradato. Si noti che per Illumina legge, BWA-short può eventualmente tagliare le basi di bassa qualità dal 3'-end prima di allineamento e quindi è in grado di allineare più letture con alto tasso di errore nella coda, che è tipico di dati Illumina.
& Nbsp; BWA-SW tollera più errori riportati allineamento più. Simulazione suggerisce che BWA-SW può funzionare bene in errore del 2% per un allineamento 100bp, errore del 3% per un 200bp, 5% per 500bp e del 10% per l'allineamento 1000BP o più a lungo.
La BWA trovare chimerica legge?
& Nbsp; Sì, la componente BWA-SW è in grado di trovare chimera. BWA solito segnala un allineamento per ogni letto, ma potrebbe emettere due o più allineamenti se la lettura / contig è una chimera.
Fa SNPs chiamata BWA come MAQ?
& Nbsp; No, BWA fa solo l'allineamento. Tuttavia, esso emette allineamenti nel formato SAM che è supportato da diversi chiamanti SNP generici come samtools e GATK.
Vedo una lettura in una coppia è di alta qualità di mappatura, ma l'altra lettura è pari a zero. E 'questo diritto?
& Nbsp; Questo è corretto. Qualità Mapping è assegnato per la lettura individuale, non per una coppia di lettura. E 'possibile che una lettura può essere mappato senza ambiguità, ma il suo compagno cade in una ripetizione tandom e quindi la sua posizione esatta non può essere determinata.
Vedo una lettura spicca la fine di un cromosoma ed è contrassegnato come non mappato (bandiera 0x4). Che cosa sta succedendo qui?
& Nbsp; Internamente BWA concatena tutte le sequenze di riferimento in una sequenza lunga. Una lettura può essere mappato al bivio di due sequenze di riferimento adiacenti. In questo caso, BWA sarà la bandiera di leggere come non mappata, ma si vedrà la posizione, sigaro e tutti i tag. Una soluzione migliore sarebbe scegliere una posizione alternativa o assettare l'allineamento di fine, ma questo è piuttosto complicato nella programmazione e non è implementata al momento.
Fa lavori BWA su sequenze di riferimento di più di 4 GB in totale?
& Nbsp; No, questo non è possibile e non sarà supportato in futuro a causa della complessità tecnica coinvolti.
Errata strong>
L'intervallo di matrice suffisso di una stringa vuota dovrebbe [0, n-1] dove n è la lunghezza della stringa di dati, non [1, n-1], come si afferma in Li e Durbin (2009 e 2010). Corrispondentemente, abbiamo bisogno di definire O (a, -1) = 0 e rivedere il pseudocodice in figura 3 da Li e Durbin (2009). Implementazione BWA è in realtà corretto. L'errore si verifica solo sulla carta. Ci scusiamo per la confusione e ringraziamo Nils Homer e Abel Antonio Carrion Collado per la precisazione
Cosa c'è di nuovo in questa versione:.
- Bugfix:. duplicato colpi alternativi nel tag XA
- Bugfix: quando raccordo attivata, finiture BWA-ALN 1BP meno .
- Disabled l'allineamento del colore-spazio. 0.6.x non funziona con Solid legge attuale.
- Bugfix:. Segfault a causa di eccessivi basi ambigue
- Bugfix:. Posizione compagno non corretta in modalità SE
- Bugfix: rare segfault in modalità PE
- Quando macro _NO_SSE2 è in uso, ripiegare allo standard Smith-Waterman
- anziché SSE2-SW.
- Opzionalmente marchio divisa colpisce con punteggi più bassi di allineamento come secondario.
- Bugfix:. Loop infinito causato da basi ambigue
- uscita alternativa la sequenza query.
I commenti non trovato