这是可以使用我们的多个免费在线工作站之一(例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器)在 OnWorks 免费托管服务提供商中运行的命令 phyml
程序:
您的姓名
phyml - 使用最大似然估计系统发育
概要:
phyml [命令参数]
下面的所有选项都是可选的(“-i”除外,如果您想使用命令行
界面)。
命令选项:
-i (或 - 输入) 序列文件名
序列文件名 是 PHYLIP 中核苷酸或氨基酸序列文件的名称
格式。
-d (或 - 数据类型) 数据类型
数据类型 是 'nt' 代表核苷酸(默认),'aa' 代表氨基酸序列,或
'generic',(在此处使用 NEXUS 文件格式和 'symbols' 参数)。
-q (或 --顺序)
将交错格式(默认)更改为顺序格式。
-n (或 - 多) nb_数据集
nb_数据集 是一个整数,对应于要分析的数据集的数量。
-p (或 --pars) [] 使用最小简约起始树。 考虑到此选项
当“-u”选项不存在时,以及当要进行树拓扑修改时。
-b (或 --引导程序) INT
INT > 0: int 是引导复制的数量。
INT = 0: 近似似然比检验和引导值都不是
计算。
INT = -1:近似似然比测试返回 aLRT 统计数据。
INT = -2: 近似似然比测试返回基于 Chi2 的参数分支
支持。
INT = -4:(默认)类似 SH 的分支单独支持。
-m (或 - 模型) 模型
模型:替代模型名称。 —— 核苷酸基于模型: 港币85 (默认) |
JC69 | K80 | F81 | F84 | TN93 | GTR | 定制 (对于自定义选项,一串
六位数字标识型号。 例如,000000)
对应于 F81(或 JC69,前提是核苷酸频率的分布为
制服)。 012345 对应于 GTR。 此选项可用于编码任何
嵌套在 GTR 中的模型。
- 氨基酸 基于模型: LG (默认) | WAG | 联合技术 | 倒车 | 戴霍夫 | 输出端 |
转速 | CPREV | VT 开花62 | 妈妈 | 艺术 | 艾滋病毒 | 艾滋病毒 | 定制
--aa_rate_file 文件名
文件名 是提供氨基酸替换率的文件名
PAML 格式的矩阵。 分析氨基时必须使用此选项
带有“自定义”模型的酸序列。
-f e, m或 fA,fC,fG,fT
e :字符频率确定如下:
- 核苷酸序列:(经验)估计平衡基频
通过计算比对中不同碱基的出现。
- 氨基酸序列:(经验)平衡氨基酸频率是
通过计算比对中不同氨基酸的出现来估计。
m :字符频率确定如下:
- 核苷酸序列:(ML)平衡基频估计使用
最大似然
- 氨基酸序列:(模型)平衡氨基酸频率为
使用替代模型定义的频率进行估计。
"fA,fC,fG,fT" :仅对基于核苷酸的模型有效。 fA、fC、fG 和 fT 是
分别对应A、C、G、T频率的浮点数
(警告:不要在核苷酸频率值之间使用任何空格,
只有逗号!)
-t (或 --ts/电视) ts/tv_比率
ts/tv_比率 :转变/颠换比。 仅 DNA 序列。 可以是固定的
正值(例如:4.0)或 e 以获得最大似然估计。
-v (或 --pinv) prop_invar
prop_invar: 不变位点的比例。 可以是[0,1]中的一个固定值
range 或 e 以获得最大似然估计。
-c (或 --n类) nb_subst_cat
nb_subst_cat :相对替代率类别的数量。 默认:
nb_subst_cat=4. 必须是正整数。
-a (或 - α) 伽玛
伽玛 :伽马分布形状参数的分布。 可以是固定的
正值或 e 得到最大似然估计。
-s (或 - 搜索) 移动
树拓扑搜索操作选项。 可以是 NNI (默认,快速)或 SPR (a
比 NNI 慢一点)或 最佳 (最好的 NNI 和 SPR 搜索)。
-u (或 --输入树) 用户树文件
用户树文件 : 起始树文件名。 树必须是 Newick 格式。
-o 的params
此选项侧重于特定的参数优化。
的params=tlr : 树拓扑 (t)、分支长度 (l) 和速率参数 (r) 分别为
优化。
的params=tl : 优化树拓扑和分支长度。
的params=lr :优化分支长度和速率参数。
的params=l : 优化分支长度。
的params=r : 速率参数被优化。
的params=n : 没有优化参数。
--rand_start
此选项将初始树设置为随机。 仅当 SPR 搜索为
被执行。
--n_rand_starts NUM
NUM 是要使用的初始随机树的数量。 仅当 SPR 时有效
将进行搜索。
--r_种子 NUM
NUM 是用于启动随机数生成器的种子。 必须是整数。
--print_site_lnl
在文件 *_phyml_lk.txt 中打印每个站点的可能性。
--打印跟踪
在文件中打印在树搜索过程中探索的每个 phyLOGeny
*_phyml_trace.txt。
--运行ID ID_字符串
附加字符串 ID_字符串 在每个 PhyML 输出文件的末尾。 此选项可能
在运行涉及 PhyML 的模拟时很有用。
- 安静的
没有交互式问题(以批处理模式运行)和安静的输出。
--无内存检查
没有关于内存使用的交互式问题(以批处理模式运行)。 正常输出
除此以外。
--alias_subpatt
站点别名是在子树级别泛化的。 有时导致更快
计算。 参见 Kosakovsky Pond SL, Muse SV, Sytematic Biology (2004)
例。
--启动进度显示 NUM (默认 = 20)
NUM 是引导程序进度条更新的频率。 必须是
一个整数。
类PHYLIP 接口
您也可以使用不带参数的 PhyML,在这种情况下,通过以下方式更改参数的值
键入屏幕上显示的相应字符。
示例
DNA交错序列文件,默认参数:
物理层 -i 序列1
AA交错序列文件,默认参数:
物理层 -i 序列2 -d aa
AA 序列文件,自定义:
物理层 -i 序列3 -q -d aa -m 联合技术 -c 4 -a e
使用 onworks.net 服务在线使用 phyml