这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 formatdb,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
formatdb - 为 BLAST 格式化蛋白质或核苷酸数据库
概要
格式数据库 [-[-B 文件名[-F 文件名[-L 文件名[-T 文件名[-V[-a[-b[-e]
[-i 文件名[-l 文件名[-n STR[-o[-p F[-s[-t STR[-v N]
商品描述
格式数据库 之前必须使用以格式化蛋白质或核苷酸源数据库
这些数据库可以通过blastall、blastpgp 或MegaBLAST 进行搜索。 源数据库
可以是 FASTA 或 ASN.1 格式。 尽管 FASTA 格式最常用作
输入到 格式数据库,使用 ASN.1 对那些使用 ASN.1 作为
其他格式的通用来源,例如 GenBank 报告。 一旦一个源数据库文件
已被格式化 格式数据库 BLAST 不需要它。 请注意,如果您是
将使用定期更新到您的 BLAST 数据库 合并(1), 你需要
保留源数据库文件。
配置
下面是选项的摘要。
- 打印使用信息
-B 文件名
从指定的 Gifile 生成的二进制 Gifile -F. 此选项指定
二进制 GI 列表文件的名称。 此选项应与 -F 选项。 一种
文本 GI 列表可以用 -F 选项和 -B 选项将产生
二进制格式的 GI 列表。 二进制文件较小,BLAST 不需要
转换它,所以它可以更快地阅读。
-F 文件名
用于使用的 Gifile(包含 gi 列表的文件) -B or -L
-L 文件名
创建一个名为的别名文件 文件名, 将搜索到的序列限制为
由 -F.
-T 文件名
根据表中的表在 ASN.1 deflines 中设置分类 ID 文件名.
-V 详细:检查数据库中的非唯一字符串 ID
-a 输入文件是 ASN.1 格式的数据库(否则需要 FASTA)
-b ASN.1 数据库是二进制的(与 ASCII 文本相反)
-e 输入是一个序列条目。 源 ASN.1 数据库(文本 ascii 或二进制)可以
包含一个 Bioseq-set 或仅一个 Bioseq。 在后一种情况下 -e 应该提供。
-i 文件名
用于格式化的输入文件
-l 文件名
日志文件名(默认 = 格式db.log)
-n STR BLAST 文件的基本名称(默认为原始 FASTA 文件的名称)
-o 解析 SeqID 并创建索引。 如果源数据库是 FASTA 格式,则
FASTA 定义行中的数据库标识符必须遵循以下约定
FASTA 定义格式。
-p F 输入是核苷酸,而不是蛋白质。
-s 仅按登录名索引,而不按位置索引。 这对序列集特别有用
就像 EST 的登录名和基因座名称相同。 Formatdb 运行
如果使用此选项,则更快并生成更小的临时文件。 它是强烈
推荐用于 EST、STS、GSS 和 HTGS。
-t STR 数据库文件的标题 [String]
-v N 将大型 FASTA 文件分解为大小的“卷” N 百万字母(4000
默认)。 作为创建卷的一部分, 格式数据库 编写一种新型的 BLAST
数据库文件,称为别名文件,扩展名为“nal”或“pal”。
使用 onworks.net 服务在线使用 formatdb