Questo è il comando phytime che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre numerose workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online di Windows o emulatore online di MAC OS
PROGRAMMA:
NOME
phytime - Stima bayesiana dei tempi di divergenza da allineamenti di sequenze di grandi dimensioni
DESCRIZIONE
La stima bayesiana dei tempi di divergenza dalle sequenze molecolari si basa su sofisticati
Sono state utilizzate tecniche di Monte Carlo a catena di Markov e campionatori Metropolis-Hastings (MH)
utilizzato con successo in quel contesto. Questo approccio comporta pesanti oneri computazionali che
può ostacolare l'analisi di grandi set di dati filogenomici. Stima affidabile della divergenza
i tempi possono anche essere estremamente lunghi, se non impossibili, per gli allineamenti di sequenza
che trasmettono segnali filogenetici deboli o contrastanti, sottolineando la necessità di ulteriori
metodi di campionamento efficienti. Questo articolo descrive un nuovo approccio che stima la
densità a posteriori dei tassi di sostituzione e dei tempi dei nodi. La distribuzione a priori dei tassi
tiene conto della loro potenziale autocorrelazione lungo i lignaggi, mentre le priorità sulle età dei nodi
sono modellati con densità uniformi. Inoltre, la funzione di verosimiglianza è approssimata da un
densità normale multivariata. La combinazione di queste componenti porta a risultati convenienti
semplificazioni matematiche, che consentono la distribuzione a posteriori di velocità e tempi
stimato utilizzando un algoritmo di campionamento di Gibbs. L'analisi di quattro set di dati del mondo reale
dimostra che questo campionatore supera l'approccio MH standard e dimostra la
idoneità di questo nuovo metodo per l'analisi di set di dati di grandi dimensioni e/o difficili.
SINOSSI
tempo di fitoterapia [argomenti del comando]
VERSIONI
Tutte le opzioni seguenti sono facoltative, eccetto '-i', '-u' e '--calibration'.
Opzioni di comando:
-i (o --ingresso) nome_file_sequenza
seq_file_name è il nome del file della sequenza nucleotidica o amminoacidica in PHYLIP
formato.
-d (o --tipo di dati) tipo_dati
data_type è 'nt' per nucleotide (predefinito), 'aa' per sequenze di amminoacidi o
'generico', (usa il formato file NEXUS e il parametro 'simboli' qui).
-q (o --sequenziale)
Modifica il formato interlacciato (predefinito) in formato sequenziale.
-m (o --modello) modello
modello: nome del modello di sostituzione. - Modelli basati sui nucleotidi: HKY85 (predefinito) |
JC69 | K80 | F81 | F84 | TN93 | GTR | personalizzato (*) (*) : per l'opzione personalizzata, un
stringa di sei cifre identifica il modello. Ad esempio, 000000
corrisponde a F81 (o JC69 a condizione che la distribuzione delle frequenze nucleotidiche sia
uniforme). 012345 corrisponde a GTR. Questa opzione può essere utilizzata per codificare qualsiasi
modello annidato all'interno di GTR.
- Modelli basati su amminoacidi: LG (predefinito) | WAG | JTT | MtREV | Dayhoff | DCMut |
RtREV | CpREV | VT
Blosum62 | MtMam | MtArt | HIVw |
HIVb | personalizzato
--aa_rate_file Nome del file
filename è il nome del file che fornisce il tasso di sostituzione degli amminoacidi
matrice in formato PAML. È obbligatorio utilizzare questa opzione quando si analizza amino
sequenze acide con il modello `custom'.
--calibrazione Nome del file
filename è il nome del file di calibrazione che fornisce informazioni definite a priori
limiti per le età dei nodi. Si prega di leggere il manuale per ulteriori informazioni su
formato di questo file.
-t (o --ts/tv) ts/rapporto_tv
ts/tv_ratio: rapporto di transizione/trasversione. Solo sequenze di DNA. Può essere fisso
valore positivo (es:4.0) o e per ottenere la stima della massima verosimiglianza.
-v (o --pinv) prop_invar
prop_invar: proporzione di siti invariabili. Può essere un valore fisso compreso tra [0,1]
range o e per ottenere la stima di massima verosimiglianza.
-c (o --nclassi) nb_subst_cat
nb_subst_cat: numero di categorie di tasso di sostituzione relativo. Predefinito:
nb_subst_cat=4. Deve essere un numero intero positivo.
-a (o --alfa) gamma
gamma: distribuzione del parametro di forma della distribuzione gamma. Può essere fisso
valore positivo o e per ottenere la stima di massima verosimiglianza.
-u (o --albero di input) file_albero_utente
user_tree_file: nome del file dell'albero iniziale. L'albero deve essere in formato Newick.
--r_seme num
num è il seme utilizzato per avviare il generatore di numeri casuali. Deve essere un numero intero.
--run_id ID_stringa
Aggiungere la stringa ID_string alla fine di ogni file di output PhyML. Questa opzione può
essere utile quando si eseguono simulazioni che coinvolgono PhyML.
--silenzioso
Nessuna domanda interattiva (per l'esecuzione in modalità batch) e output silenzioso.
--nessun_controllo_di_memoria
Nessuna domanda interattiva per l'utilizzo della memoria (per l'esecuzione in modalità batch). Uscita normale
altrimenti.
--catena_len num
num è il numero di generazioni o esecuzioni del Markov Chain Monte Carlo. Impostato su
1E+6 per impostazione predefinita. Deve essere un numero intero.
--frequenza_campione num
La catena viene campionata ogni num generazioni. Impostato su 1E+3 per impostazione predefinita. Deve essere un
numero intero.
--nessun_dato
Utilizzare questa opzione per campionare solo dalle articolazioni anteriori (piuttosto che dall'articolazione posteriore)
densità dei parametri del modello).
--fastlk
Utilizzare l'approssimazione normale multivariata alla verosimiglianza e accelerare
calcoli
Utilizzare phytime online utilizzando i servizi onworks.net