Este es el comando phytime que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
phytime: estimación bayesiana de los tiempos de divergencia a partir de grandes alineaciones de secuencia
DESCRIPCIÓN
La estimación bayesiana de los tiempos de divergencia de las secuencias moleculares se basa en sofisticados
Las técnicas de Monte Carlo de la cadena de Markov y los muestreadores de Metropolis-Hastings (MH) se han
utilizado con éxito en ese contexto. Este enfoque implica grandes cargas computacionales que
puede dificultar el análisis de grandes conjuntos de datos filogenómicos. Estimación confiable de divergencia
Los tiempos también pueden consumir mucho tiempo, si no imposibles, para las alineaciones de secuencia.
que transmiten señales filogenéticas débiles o conflictivas, enfatizando la necesidad de más
métodos de muestreo eficientes. Este artículo describe un nuevo enfoque que estima el
densidad posterior de tasas de sustitución y tiempos de nodo. La distribución previa de tarifas
explica su autocorrelación potencial a lo largo de los linajes, mientras que los antecedentes en las edades de los nodos
se modelan con densidades uniformes. Además, la función de verosimilitud se aproxima mediante un
densidad normal multivariante. La combinación de estos componentes conduce a
simplificaciones matemáticas, permitiendo la distribución posterior de tasas y tiempos
estimado utilizando un algoritmo de muestreo de Gibbs. El análisis de cuatro conjuntos de datos del mundo real
muestra que este muestreador supera el enfoque estándar de MH y demuestra la
idoneidad de este nuevo método para analizar conjuntos de datos grandes y / o difíciles.
SINOPSIS
tiempo fisico [argumentos de comando]
OPCIONES
Todas las opciones siguientes son opcionales excepto '-i', '- u' y '--calibration'.
Opciones de comando:
-i (o --aporte) nombre_archivo_seq
seq_file_name es el nombre del archivo de secuencia de nucleótidos o aminoácidos en PHYLIP
formato.
-d (o --tipo de datos) tipo de datos
data_type es 'nt' para nucleótidos (predeterminado), 'aa' para secuencias de aminoácidos o
'genérico', (utilice el formato de archivo NEXUS y el parámetro 'símbolos' aquí).
-q (o --secuencial)
Cambia el formato entrelazado (predeterminado) a formato secuencial.
-m (o --modelo) modelo
modelo: nombre del modelo de sustitución. - Modelos basados en nucleótidos: HKY85 (predeterminado) |
JC69 | K80 | F81 | F84 | TN93 | GTR | custom (*) (*): para la opción personalizada, un
cadena de seis dígitos identifica el modelo. Por ejemplo, 000000
corresponde a F81 (o JC69 siempre que la distribución de frecuencias de nucleótidos sea
uniforme). 012345 corresponde a GTR. Esta opción se puede utilizar para codificar cualquier
modelo que está anidado dentro de GTR.
- Modelos basados en aminoácidos: LG (predeterminado) | WAG | JTT | MtREV | Dayhoff | DCMut |
RtREV | CpREV | Vermont
Blosum62 | MtMam | MtArt | VIHw |
HIVb | personalizado
--aa_rate_file nombre de archivo
nombre de archivo es el nombre del archivo que proporciona la tasa de sustitución de aminoácidos
matriz en formato PAML. Es obligatorio utilizar esta opción al analizar amino.
secuencias de ácido con el modelo "personalizado".
--calibración nombre de archivo
nombre de archivo es el nombre del archivo de calibración que proporciona
límites para las edades de los nodos. Lea el manual para obtener más información sobre el
formato de este archivo.
-t (o --ts/ tv) ts / tv_ratio
ts / tv_ratio: relación de transición / transversión. Solo secuencias de ADN. Puede ser un fijo
valor positivo (ej: 4.0) oe para obtener la estimación de máxima verosimilitud.
-v (o --pinv) invar_prop
prop_invar: proporción de sitios invariables. Puede ser un valor fijo en [0,1]
range o e para obtener la estimación de máxima verosimilitud.
-c (o --clases) nb_subst_cat
nb_subst_cat: número de categorías de tasa de sustitución relativa. Defecto :
nb_subst_cat = 4. Debe ser un número entero positivo.
-a (o --alfa) gama
gamma: distribución del parámetro de forma de distribución gamma. Puede ser un fijo
valor positivo oe para obtener la estimación de máxima verosimilitud.
-u (o --árbol de entrada) archivo_árbol_usuario
user_tree_file: nombre de archivo del árbol de inicio. El árbol debe estar en formato Newick.
--r_semilla número
num es la semilla utilizada para iniciar el generador de números aleatorios. Debe ser un entero.
--run_id ID_cadena
Agregue la cadena ID_string al final de cada archivo de salida PhyML. Esta opción puede
ser útil cuando se ejecutan simulaciones que involucran PhyML.
--tranquilo
Sin preguntas interactivas (para ejecutar en modo por lotes) y salida silenciosa.
--no_memory_check
No hay preguntas interactivas sobre el uso de la memoria (para ejecutar en modo por lotes). Salida normal
de otra manera.
--chain_len número
num es el número de generaciones o ejecuciones de la cadena de Markov Monte Carlo. Ajustado a
1E + 6 por defecto. Debe ser un entero.
--sample_freq número
La cadena se muestrea cada número de generaciones. Establecido en 1E + 3 de forma predeterminada. Debe ser un
entero.
--sin datos
Utilice esta opción para tomar muestras de los anteriores únicamente (en lugar de la articulación posterior
densidad de los parámetros del modelo).
--fastlk
Utilice la aproximación normal multivariante a la probabilidad y acelere
cálculos
Use phytime en línea usando los servicios de onworks.net