Amazon Best VPN GoSearch

OnWorks 网站图标

sreformat - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 sreformat

这是可以在 OnWorks 免费托管服务提供商中使用我们的多个免费在线工作站之一运行的命令 sreformat,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


sreformat - 将序列文件转换为不同的格式

概要


重新格式化 [选项] 格式 序列文件

商品描述


重新格式化 读取序列文件 序列文件 以任何支持的格式,将其重新格式化为新的
指定的格式 格式, 然后打印重新格式化的文本。

支持的输入格式包括(但不限于)未对齐格式 FASTA、
Genbank、EMBL、SWISS-PROT、PIR 和 GCG,以及对齐的格式 Stockholm、Clustal、GCG
无国界医生和菲利普。

可用的未对齐输出文件格式代码包括 法斯塔 (FASTA 格式); 标志
(EMBL/SWISSPROT 格式); 基因库 (基因库格式); GCG (GCG 单序列格式);
数据 (GCG 平面文件数据库格式); PIR (PIR/CODATA 平面文件格式); (生的
顺序,无其他信息)。

可用的对齐输出文件格式代码包括 斯德哥尔摩 (PFAM/斯德哥尔摩格式);
无国界医生 (GCG MSF 格式); a2m (对齐的 FASTA 格式); 飞利浦 (Felsenstein 的 PHYLIP 格式);
集群 (Clustal V/W/X 格式); 和 塞莱克斯 (旧的 SELEX/HMMER/Pfam 注释
对齐格式);

所有这些代码都被不区分大小写地解释(例如 MSF、Msf 或 msf 都可以工作)。

未对齐的格式文件无法重新格式化为对齐的格式。 但是,对齐格式
可以重新格式化为未对齐的格式——间隙字符被简单地去除。

这个程序最初被命名为 重新格式化, 但这个名字与 GCG 的程序冲突
同名。

配置


-d 脱氧核糖核酸; 将 U 转换为 T,以确保核酸序列显示为 DNA 而不是
核糖核酸。 看 -r。

-h 打印简要帮助; 包括版本号和所有选项的摘要,包括
专家选项。

-l 小写; 将所有序列残基转换为小写。 看 -u。

-n 对于 DNA/RNA 序列,转换任何非明确 RNA/DNA 的字符(例如
ACGTU/acgtu) 到 N。用于将 IUPAC 歧义代码转换为 N,用于软件
不能处理所有 IUPAC 代码(例如一些公共 RNA 折叠代码)。 如果
该文件是一个对齐,间隙字符也保持不变。 如果序列是
不是核酸序列,此选项将以可预测的方式破坏数据
时尚。

-r 核糖核酸; 将 T 转换为 U,以确保核酸序列显示为 RNA 而不是
脱氧核糖核酸。 看 -d。

-u 大写; 将所有序列残基转换为大写。 看 -l。

-x 对于 DNA 序列,将非 IUPAC 字符(例如 X)转换为 N。 这是为了
与坚持使用 X 而不是 IUPAC 的愚昧人的兼容性
歧义字符 N。(X 表示氨基酸残基中的歧义)。

警告:像 -n 选项,代码不会检查你是否真的给了它
脱氧核糖核酸。 它只是简单地将非 IUPAC DNA 符号转换为 N。所以如果你
不小心给它蛋白质序列,它会很高兴地转换大多数氨基酸
酸残基为 N。

专家 配置


--gapsym
将所有间隙字符转换为 . 用于为程序准备对齐文件
对间隙符号有严格要求。 只有在输入时才有意义 序列文件 is
一种对齐方式。

--信息
指定序列文件格式 , 而不是允许程序
自动检测文件格式。 常见的例子包括 Genbank、EMBL、GCG、PIR、
斯德哥尔摩、Clustal、MSF 或 PHYLIP; 请参阅印刷文档以获取完整的
接受的格式名称列表。

--明加普
If 序列文件 是对齐方式,删除包含 100% 间隙字符的任何列,
最小化对齐的总长度。 (如果你已经提取了,通常很有用
来自较大比对的比对序列的子集。)

--无间隙
删除任何包含任何间隙符号的对齐列。 作为前奏有用
到系统发育分析,您只想分析包含 100%
残留物,所以你想去掉任何有间隙的列。 才有意义
如果文件是对齐文件。

--pfam 仅对于 SELEX 对齐输出格式,将整个对齐放在一个块中
(不要包装成多个块)。 这接近于内部使用的格式
Pfam 在斯德哥尔摩和剑桥。

--山姆 尝试将间隙字符转换为 UC Santa Cruz SAM 样式,其中 . 意味着差距
一个插入列,一个 - 表示在共识/匹配列中删除。 这仅
适用于转换对齐的文件格式,并且仅当对齐已经
遵守 SAM 共识/匹配中残基的大写约定
列,插入列中的残基小写。 这是真的,例如,
由旧版 HMMER 生成的所有比对。 (HMMER2 产生比对
即使在间隙字符选择中也遵守 SAM 的约定。)这个选项是
添加以允许将 Pfam 对齐重新格式化为更适合
使用 UCSC SAM 软件配置 HMM 构造。

--samfrac
尝试将对齐间隙字符和残基情况转换为 UC Santa Cruz SAM
风格,其中一个 . 表示插入列中的间隙和 a - 表示删除
一致/匹配列,大写表示匹配/一致残基,小写
case 表示插入的残留物。 这仅适用于转换对齐的文件
格式,但与 --山姆 选项,无论文件是否有效,它都会工作
遵守大写/小写残留约定。 相反,任何包含
超过一小部分 间隙字符被解释为插入列,并且
所有其他列都被解释为匹配列。 添加此选项是为了允许
Pfam 对齐将重新格式化为更适合配置文件 HMM 的内容
使用 UCSC SAM 软件构建。

--wussify
转换 RNA 二级结构注释字符串(共识和个体)
从旧的“KHS”格式,><,到新的 WUSS 符号,<>。 如果符号已经
在 WUSS 格式中,此选项会在没有警告的情况下搞砸。 只有SELEX和
Stockholm 格式文件目前有二级结构标记。

--杜乌斯
从新的 WUSS 符号转换 RNA 二级结构注释字符串,<>,
回到旧的 KHS 格式,><。 如果注释已经在 KHS 中,则此选项
会在没有警告的情况下破坏它。 只有 SELEX 和 Stockholm 格式文件有
二级结构标记。

使用 onworks.net 服务在线使用 sreformat


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。