MetagenomeDB è una libreria Python progettato per memorizzare facilmente, recuperare e annotare le sequenze metagenomiche. & Nbsp; MetagenomeDB agire come un livello di astrazione in cima ad un database MongoDB. Esso fornisce una API per creare e modificare e collegare due tipi di oggetti, vale a dire le sequenze e le collezioni:
& Nbsp; * sequenze (classe Sequenza) può essere legge, contigs, cloni di PCR, etc.
& Nbsp; * collezioni (classe Collection) rappresenta serie di sequenze; ad esempio, legge risultante dalla sequenziazione di un campione, contig assemblati da un insieme di letture, biblioteca PCR
Ogni oggetto può essere annotato utilizzando una sintassi simile ai dizionari:
# Prima, importiamo la libreria
importazione MetagenomeDB come mdb
# Viene creato un nuovo oggetto sequenza con due
# (Obbligatorio) proprietà, 'nome' e 'sequenza'
s = mdb.Sequence ({"name": "La mia sequenza", "sequenza": "TGC"})
# L'oggetto può essere annotato
print s ["lunghezza"]
s ["tipo"] = "leggere"
# Una volta modificato, hanno bisogno l'oggetto da impegnare
# Al database per le modifiche rimangano
s.commit ()
Gli oggetti di tipo sequenziale o Collection possono essere collegati tra loro in modo da rappresentare i vari dataset metagenomic. Esempi includono, ma non sono limitati a:
& Nbsp; * raccolta di legge risultante da una corsa di sequenziamento (rapporto tra sequenza multipla di oggetti e uno Collection)
& Nbsp; * insieme di contigs derivanti dal montaggio di una serie di letture (relazione tra due oggetti Collection)
& Nbsp; * letture che fanno parte di un contig (rapporto tra sequenza multipla di oggetti e una sequenza)
& Nbsp; * la sequenza che è simile ad un'altra sequenza (relazione tra due oggetti sequenza)
& Nbsp; * collezione che è parte di una collezione più grande (relazione tra due oggetti Collection)
Il risultato è una rete di sequenze e raccolta, che può essere esplorato con metodi dedicati; IEG, Collection.list_sequences (), Sequence.list_collections (), Sequence.list_related_sequences (). Ognuno di questi metodi consentono di sofisticati filtri utilizzando la sintassi di query MongoDB:
# Lista tutte le collezioni di 'collection_of_reads' tipo
# 'S' la sequenza appartengono a
collezioni = s.list_collections ({"tipo": "collection_of_reads"})
# Lista tutte le sequenze che appartengono anche a queste collezioni
# Con una lunghezza di almeno 50 bp
per c nelle collezioni:
& Nbsp; c.list_sequences stampa ({"lunghezza": {"$ gt": 50}})
MetagenomeDB fornisce anche una serie di strumenti da riga di comando per importare sequenze nucleotidiche, sequenze proteiche, BLAST e l'allineamento FASTA algoritmi di uscita, e file di assemblaggio ACE. . Altri strumenti sono forniti per aggiungere o rimuovere più oggetti, o per annotare loro
Requisiti
- Python
I commenti non trovato