IngleseFranceseSpagnolo

Ad


Favicon di OnWorks

cmcalibrate: online nel cloud

Esegui cmcalibrate nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando cmcalibrate che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


cmcalibrate: adatta le code esponenziali per la determinazione del valore E del modello di covarianza

SINOSSI


cmcalibrare [opzioni] cmfile

DESCRIZIONE


cmcalibrare determina i parametri di coda esponenziale per la determinazione del valore E mediante generazione
sequenze casuali, ricercandole con il CM e raccogliendo i punteggi delle risultanti
colpi. Un istogramma dei punteggi dei bit dei risultati è adattato a una coda esponenziale e il
i parametri della coda adattata vengono salvati nel file CM. I parametri della coda esponenziale
vengono quindi utilizzati per stimare la significatività statistica dei risultati trovati in cmcerca ed
cmscan.

È necessario calibrare un file CM cmcalibrare prima che possa essere utilizzato in cmcerca or scansione cm,
con un'unica eccezione: non è necessario calibrare i file CM che includono solo
modelli con zero coppie di basi prima dell'esecuzione cmsearch.

cmcalibrare è molto lento. Ci vogliono un paio d'ore per calibrare una singola dimensione media
CM su una singola CPU. cmcalibrare verrà eseguito in parallelo su tutti i core disponibili se Infernal
è stato costruito su un sistema che supporta il threading POSIX (vedere la sezione Installazione del file
guida per l'utente per ulteriori informazioni). Utilizzando i core risulteranno approssimativamente -piega
accelerazione rispetto a una singola CPU. È possibile utilizzare anche MPI (Message Passing Interface).
parallelizzazione con il --mpi opzione se Infernal è stato creato con MPI abilitato, ma utilizzando
non è consigliabile utilizzare più di 161 processori poiché l'aumento oltre 161 non accelera
la calibrazione. Per ulteriori informazioni, consultare la sezione Installazione della guida per l'utente.

I --previsione l'opzione può essere utilizzata per stimare quanto tempo impiegherà l'esecuzione del programma per a
dato cmfile sulla macchina attuale. Per prevedere il tempo di esecuzione processori con
MPI, utilizzare inoltre il file --nprevisione opzione.

Le sequenze casuali cercate cmcalibrare sono generati da un HMM su cui è stato addestrato
sequenze genomiche reali con vari contenuti GC. L'obiettivo è avere le distribuzioni GC
nelle sequenze casuali siano simili a quelli delle sequenze genomiche effettive.

Vengono eseguiti quattro cicli di ricerche e successivi adattamenti esponenziali della coda, uno ciascuno per
i quattro diversi algoritmi CM che possono essere utilizzati cmcerca ed scansione cm: CYK glocale,
Inside glocale, CYK locale e Inside locale.

I parametri dei valori E determinati da cmcalibrare vengono utilizzati solo da cmcerca ed cmscan
programmi. Se non utilizzerai questi programmi, non perdere tempo con la calibrazione
i tuoi modelli

VERSIONI


-h Aiuto; stampare un breve promemoria dell'utilizzo della riga di comando e delle opzioni disponibili.

-L Imposta la lunghezza totale delle sequenze casuali su cui effettuare la ricerca megabasi (Mb). Di
predefinito is 1.6 MB. Crescente farà sì che la coda esponenziale si adatti di più
precisi e i valori E sono più accurati, ma richiederà più tempo (raddoppiando). sarà all'incirca
raddoppiare il tempo di esecuzione). Decrescente non è raccomandato in quanto renderà il
si adatta in modo meno preciso e i valori E sono meno accurati.

VERSIONI PER PREVEDERE OBBLIGATORIO ORARIO E MEMORIA


--previsione
Prevedere il tempo di esecuzione della calibrazione di cmfile (con le opzioni fornite) acceso
la macchina corrente ed uscire. La calibrazione non viene eseguita. Le previsioni
dovrebbero essere considerate stime approssimative. Se il multithreading è abilitato (vedi
sezione Installazione della guida per l'utente), la tempistica terrà conto del numero
dei nuclei disponibili.

--nprevisione
Con --previsione, specificare che i processori verranno utilizzati per la calibrazione.
Ciò potrebbe essere utile per prevedere il tempo di esecuzione di un'esecuzione MPI
processori.

--memreq
Prevedere la quantità di memoria richiesta per la calibrazione cmfile (con fornito
opzioni) sulla macchina corrente ed uscire. La calibrazione non viene eseguita.

VERSIONI CONTROLLARE ESPONENZIALE CODA SI ADATTA


--gtailn
adattare la coda esponenziale per Glocal Inside e glocal CYK a punteggi più alti
nella coda dell'istogramma, dove is volte il numero di Mb cercati. IL
valore predefinito di è 250. Il valore 250 è stato scelto perché funziona bene
empiricamente rispetto ad altri valori.

--ltailn
adattare la coda esponenziale per Inside locale e CYK locale a punteggi più alti
nella coda dell'istogramma, dove is volte il numero di Mb cercati. IL
valore predefinito di è 750. Il valore 750 è stato scelto perché funziona bene
empiricamente rispetto ad altri valori.

--tailp
Ignora il --gtailn ed --ltailn opzioni prefissate e adattarle frazione coda di
l'istogramma su una coda esponenziale, per tutte le modalità di ricerca.

OPTIONAL USCITA FILE


--hfile
Salvare gli istogrammi adattati al file . Il formato di questo file è a due spazi
colonne delimitate per riga. La prima colonna contiene i valori dell'asse x dei punteggi in bit di
ogni contenitore. La seconda colonna contiene i valori dell'asse y del numero di risultati per contenitore. Ogni
la serie è delimitata da una linea con un singolo carattere "&". Il file conterrà
una serie per ciascuna delle quattro code esponenziali si inserisce nel seguente ordine:
CYK glocale, Inside glocale, CYK locale e Inside locale.

--file
Salva le informazioni sulla trama di sopravvivenza in un file . Il formato di questo file è a due spazi
colonne delimitate per riga. La prima colonna contiene i valori dell'asse x dei punteggi in bit di
ogni contenitore. La seconda colonna contiene i valori dell'asse y della frazione di risultati che soddisfano o
superare il punteggio per ciascun contenitore. Ogni serie è delimitata da una linea con un singolo
carattere "&". Il file conterrà tre serie di dati per ciascuno dei quattro CM
modalità di ricerca nel seguente ordine: glocal CYK, glocal Inside, local CYK e
interno locale. La prima serie è il grafico di sopravvivenza empirico dell'istogramma
di risultati nella sequenza casuale. La seconda serie è l'adattamento della coda esponenziale
la distribuzione empirica. La terza serie è l'adattamento esponenziale della coda se lambda
sono stati fissati e impostati come logaritmo naturale di 2 (0.691314718).

--qqfile
Salvare le informazioni sul grafico quantile-quantile su file . Il formato di questo file è
due colonne delimitate da spazi per riga. La prima colonna contiene i valori dell'asse x e
la seconda colonna contiene i valori dell'asse y. La distanza dei punti da
la linea di identità (y=x) è una misura di quanto è buono l'adattamento esponenziale della coda, il
più i punti sono vicini alla linea di identità, migliore è l'adattamento. Ogni serie lo è
delimitato da una linea con un singolo carattere "&". Il file conterrà una serie
di dati empirici per ciascuna delle quattro code esponenziali si inserisce nel seguente
ordine: CYK glocale, Inside glocale, CYK locale e Inside locale.

--file
Risparmia statistiche delimitate dallo spazio di diversi adattamenti della coda esponenziale nel file .
Il file conterrà i valori lambda e mu per le code esponenziali adattate
code dell'istogramma di diverse dimensioni. I campi nel file sono etichettati
in modo informativo.

--xfile
Salva su file un elenco dei punteggi in ciascuna coda dell'istogramma adattata . Ogni riga di
questo file avrà un punteggio diverso che indica che esisteva un successo nella coda con
quel punteggio. Ogni serie è delimitata da una linea con un solo carattere "&". IL
il file conterrà una serie per ciascuno dei quattro adattamenti di coda esponenziale nel file
seguente ordine: CYK glocal, Inside glocal, CYK locale e Inside locale.

ALTRO VERSIONI


--seme
Semina il generatore di numeri casuali con , un intero >= 0. Se è diverso da zero,
le simulazioni stocastiche saranno riproducibili; lo stesso comando darà lo stesso
risultati. Se è 0, il generatore di numeri casuali viene seminato arbitrariamente e
le simulazioni stocastiche varieranno da un'esecuzione all'altra dello stesso comando. Il predefinito
il seme è 181.

--beta
Per impostazione predefinita, viene utilizzato il banding dipendente dalla query (QDB) per accelerare la ricerca CM
algoritmi con una probabilità di perdita della coda beta di 1E-15. Questo valore beta può essere
cambiato in con --beta . Il parametro beta è la quantità di probabilità
massa esclusa nel calcolo della banda, valori più alti di beta danno maggiori accelerazioni
ma sacrificare una maggiore precisione rispetto ai valori inferiori. Il valore predefinito utilizzato è 1E-15.
(Per ulteriori informazioni su QDB vedere Nawrocki e Eddy, PLoS Computational Biology
3(3): e56.)

--non fasciato
Disattivare QDB durante la calibrazione del valore E. Ciò rallenterà la calibrazione.

--nonull3
Disattivare il modello null aggiuntivo post hoc null3. Questo non è raccomandato a meno che
prevedi di utilizzare la stessa opzione per cmcerca e / o cmscan.

--a caso
Utilizzare invece il modello nullo in background del CM per generare sequenze casuali
del più realistico HMM. A meno che il CM non sia stato creato utilizzando il file --nullo opzione a
costruire, il modello nullo di sfondo sarà del 25% ciascuno A, C, G e U.

--gc
Generare le sequenze casuali utilizzando la distribuzione nucleotidica dalla sequenza
filetto .

--processore
Specifica quello essere utilizzati CPU worker paralleli. Se è impostato come "0", quindi il
il programma verrà eseguito in modalità seriale, senza utilizzare thread. Puoi anche controllare
questo numero impostando una variabile di ambiente, INFERNALE_NCPU. Questa opzione sarà
essere disponibile solo se la macchina su cui è stato costruito Infernal è in grado di utilizzarlo
Filettatura POSIX (per ulteriori informazioni, consultare la sezione Installazione della guida per l'utente
informazione).

--mpi Eseguire come programma parallelo MPI. Questa opzione sarà disponibile solo se Infernal lo ha
stato configurato e creato con il flag "--enable-mpi" (vedere il file Installation
sezione della guida per l'utente per ulteriori informazioni).

Utilizzare cmcalibrate online utilizzando i servizi onworks.net


Server e workstation gratuiti

Scarica app per Windows e Linux

Comandi Linux

Ad