Questo è il comando meryl che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
meryl - conteggio e utilità di kmer dentro e fuori dal core
SINOSSI
dei tempi memoria requisiti
meryl -P -m km [-c #] [-p] -s seq.fasta
meryl -P -m km [-c #] [-p] -n merconte
Costruzione a tavolo
meryl -B -m km [-c #] [-p] [-v] [-f|-r|-C] [-L occorrenza minore] [-U maxoccorrenza]
[-threads n | {-segmenti segmenti | -memoria megabyte} [-configbatch [-sg nome del lavoro]]]
-s seq.fasta -o tblprefisso
meryl -conteggio numero [-sgebuild "qsuboptionstring"] -o tblprefisso
meryl -unione numero [-sgemergere "qsuboptionstring"] -o tblprefisso
Esecuzione operazioni on a tavolo
meryl -M operazione [-v] -s tblprefisso [-s tblprefisso2 ...] -o produzione
Dumping a tavolo
meryl -Dh -s tblprefisso
meryl -Dt -n conto min -s tblprefisso
DESCRIZIONE
meryl calcola il contenuto di kmer delle sequenze genomiche. Il contenuto di Kmer è rappresentato come a
elenco di kmer e il numero di volte in cui ciascuno si verifica nelle sequenze di input. Il kmer può essere
limitato solo al kmer in avanti, solo al kmer inverso o al kmer canonico
(lessicograficamente più piccolo del kmer avanti e indietro in ogni posizione). Meryl può
riportare l'istogramma dei conteggi, l'elenco dei kmer e i loro conteggi, o può eseguire
operazioni matematiche e di set sui file di dati elaborati.
L'output di meryl sono due file binari, chiamati database Meryl, che possono essere rapidamente
scaricato per fornire un istogramma dei conteggi o i conteggi effettivi. Viene fornita una libreria C++
per l'accesso diretto ai file.
VERSIONI
-P Stimare i requisiti di memoria. Dato un file di sequenza (-s) o un limite superiore del
numero di mer nel file (-n), calcola la dimensione della tabella (-t in build) per ridurre al minimo
l'utilizzo della memoria. Questa modalità riconosce le seguenti opzioni:
-m # taglia di un mer (richiesto)
-c # compressione omopolimero (opzionale)
-p abilitare le posizioni
-s seq.fasta
File di sequenza da scansionare per determinare il numero di mer
-n # calcolare i parametri assumendo un file con così tanti valori al suo interno
Solo uno di -s, -n bisogno di essere specificato. Se vengono dati entrambi, -s ha la priorità.
-B Calcola le tabelle mer-count dato un file di sequenza (-s) e molti parametri. Di
impostazione predefinita, vengono elaborati entrambi i fili.
-f costruire solo per il filo in avanti
-r costruire solo per il filo inverso
-C usa meri canonici (presuppone entrambi i filamenti)
-L # NON salvare messaggi che si verificano meno di # volte
-U # NON salvare messaggi che si verificano più di # volte
-m # taglia di un mer (richiesto)
-c # compressione omopolimero (opzionale)
-p abilitare le posizioni
-s seq.fasta
sequenza per costruire la tabella per
-o tblprefisso
prefisso della tabella di output
-v intrattenere l'utente
I meryl il processo può essere eseguito in un grande batch di memoria, in molti piccoli batch di memoria,
o sotto il controllo SGE, il tutto con o senza l'utilizzo di più core CPU. Per impostazione predefinita,
il calcolo viene eseguito come un unico grande processo sequenziale. Operazione multi-thread
è possibile, con una spesa di memoria aggiuntiva, così come l'operazione segmentata, con un costo aggiuntivo
Spese I/O.
Filettate operazione
Dividi il conteggio in n pezzi di dimensioni quasi uguali. Questo usa un extra
h MB (da -P) per filo.
-threads n
uso n discussioni da costruire
segmentato, sequenziale operazione
Dividi il conteggio in pezzi che rientreranno in non più di m MB di
memoria, o in n pezzi di dimensioni uguali. Ogni pezzo viene calcolato in sequenza,
e i risultati vengono uniti alla fine. Solo uno di -memoria ed -segmenti is
necessario.
-memoria m
utilizzare al massimo m MB di memoria per segmento
-segmenti n
uso n segmenti
segmentato, batch operazione
Uguale a sequenziale, tranne che consente l'esecuzione manuale di ogni segmento
in parallelo. Solo uno di -memoria ed -segmenti è necessario. Vedi anche il
ESEMPIO sezione in questa pagina.
-memoria m
utilizzare al massimo m MB di memoria per segmento
-segmenti n
uso n segmenti
-configbatch
creare i lotti
-conteggio n
eseguire il numero di lotto n
-unione
unire i lotti
La modalità batch può essere eseguita sulla griglia.
-sg nome del lavoro
nome lavoro univoco per questa esecuzione. Meryl invierà lavori con nome
mpnome del lavoro, ncnome del lavoro, nmnome del lavoro, per le fasi di preparazione, conteggio e unione.
-sgebuild "opzioni"
-sgemergere "opzioni"
eventuali opzioni aggiuntive per qsub(1) (es. "-p all'153 ottobre -pe filo 2 -A
merylaccount") NB - -N verrà ignorato NB - assicurati di citare il
Opzioni
-M Dato un elenco di tabelle, eseguire un'operazione matematica, logica o soglia. Salvo che
specificato, tutte le operazioni richiedono un numero qualsiasi di database. Le operazioni matematiche sono:
verbale count è il conteggio minimo per tutti i database. Se il mer NON esiste in
tutti i database, il mer ha un conteggio zero e NON è nell'output.
minexista
count è il conteggio minimo per tutti i database che contengono la mer
max count è il conteggio massimo per tutti i database
aggiungere count è la somma dei conteggi per tutti i database
sotto count è il primo meno il secondo (solo binario)
abs count è il valore assoluto del primo meno il secondo (solo binario)
Le operazioni logiche sono:
ed restituisce mer se esiste in tutti i database
e restituisce mer se esiste in almeno uno, ma non in tutti, i database
or restituisce mer se esiste in almeno un database
xor restituisce mer se esiste in un numero dispari di database
Le operazioni di soglia sono:
meno di x
restituisce mer se ha count < x
meno che uguale x
restituisce mer se ha count <= x
più grande di x
restituisce mer se ha conteggio > x
Maggiore o uguale x
restituisce mer se ha count >= x
pari x
restituisce mer se ha count == x
Le operazioni di soglia funzionano esattamente su un database.
-s tblprefisso
uso tblprefisso come database
-o tblprefisso
creare questo output
-v intrattenere l'utente
-D Dump table (non tutti funzionano)
-DD Scarica un istogramma della distanza tra le stesse mer.
-Dt Dump mer >= una soglia. Utilizzo -n per specificare la soglia.
-DC Contare il numero di mer, mer distinti e mer unici.
-Dh Scarica (su stdout) un istogramma dei conteggi mer.
-s Leggi la tabella dei conteggi da qui (lascia fuori .mcdat o .mcidx).
ESEMPIO
Partita creazione of a tavolo
Inizializza il calcolo con -configbatch, che necessita di tutte le opzioni di compilazione. Esegui tutto
-conteggio lavori, allora -unione per il completamento.
meryl -configbatch -B [opzioni] -o filetto
meryl -conteggio 0 -o filetto
meryl -conteggio 1 -o filetto
...
meryl -conteggio N -o filetto
meryl -unione N -o filetto
Usa Meryl online utilizzando i servizi onworks.net