这是 gt-extractseq 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
gt-extractseq - 从给定的序列文件或 fastaindex 中提取序列。
概要
gt 提取序列 [选项...] [sequence_file(s)] | 快速索引
商品描述
-frompos [折扣值]
从此位置提取序列从 1 开始计数(默认值:0)
-拓扑 [折扣值]
从 1 开始提取到此位置的序列(默认值:0)
-比赛 [绳子]
提取描述与给定模式匹配的所有序列。 给定的模式
必须是有效的扩展正则表达式。 (默认:未定义)
键 [文件名]
为指定文件中的键提取子字符串(默认值:未定义)
-宽度 [折扣值]
设置 FASTA 序列打印的输出宽度(0 禁用格式化)(默认值:0)
-o [文件名]
将输出重定向到指定文件(默认值:未定义)
-gzip [是|否]
写入 gzip 压缩输出文件(默认:无)
-bzip2 [是|否]
写入 bzip2 压缩输出文件(默认:无)
-力 [是|否]
强制写入输出文件(默认值:否)
-救命
显示帮助并退出
-版
显示版本信息并退出
选项 -keys 允许从给定序列中提取子字符串或序列
文件或来自 fasta 索引。 要提取的子字符串在密钥文件中指定
作为此选项的参数给出。 密钥文件必须包含以下形式的行
k
or
基杰
其中 k 是一个字符串(键),可选的 i 和 j 是正整数,使得
i⇐j。 k 是键和可选数字 i 和 j 指定的第一个位置
substring 和要提取的子串的最后位置。 这些职位是
从 1 开始计数。如果 k 与第一个和第二个之间的字符串相同
符号的出现| 在 fasta 标头中,然后是 fasta 标头和相应的
序列输出。 例如在 fasta 标题中
>tr|A0AQI4|A0AQI4_9ARCH 假定的氨单加氧酶(片段)
fasta 键是 A0AQI4。 如果同时指定了 i 和 j,则对应的子串
以fasta格式显示。 在后一种情况下,fasta 格式序列的头在
输出开始于
> kij
其次是原始的原始 fasta 标头。
如果序列输入是 fasta 文件,则以下内容成立:
· 输入文件中的重复行导致输出中只有一个序列
· 序列按照原始序列文件中的顺序输出
· 输出的格式可以由选项控制 -宽度, -o, -gzip及
-bzip2
如果序列输入来自 fasta 索引(见下文),则以下内容成立:
· 选项 -宽度 是必须的
· 选项 -o, -gzip 和 -bzip2 不工作
· 序列按照对应的密钥出现在密钥文件中的顺序输出
如果参数列表的末尾只包含一个文件名,比如 fastaindex,那么它是
检查是否有文件 fastaindex.kys。 这构成了 fasta 索引的一部分,即
通过调用 suffixerator 工具构造如下:
gt 后缀符 -protein -ssp -tis -des -sds -kys -indexname fastaindex \
-db 输入文件1 [输入文件2 ..]
这将读取提供给选项的蛋白质序列文件 -D b 并创建几个文件:
· 表示序列的文件 fastaindex.esq。
· 文件 fastaindex.ssp 指定序列分隔符位置。
· 一个文件 fastaindex.des 逐行显示 fasta 标题。
· 文件 fastaindex.sds 给出序列头分隔符位置。
· 一个包含 fasta 文件中的键的文件 fastaindex.kys。
要使后缀命令起作用,形式为 |key| 的键在 fasta 标题中必须
满足以下约束:
· 它们的长度必须相同,不长于 128,且不短于 1
· 它们必须按字典顺序出现
REPORTING BUGS
将错误报告给[电子邮件保护]>.
使用 onworks.net 服务在线使用 gt-extractseq