英语法语西班牙语

Ad


OnWorks 网站图标

compseqe - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 compseqe

这是命令 compseqe,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


compseq - 计算序列中唯一单词的组成

概要


比较 -序列 后继 [-infile 入档] -字 整数 [-帧 整数] -ignorebz 布尔
-逆转 布尔 [-计算频率 布尔] -输出文件 输出文件 [-零计数 布尔]

比较 -救命

商品描述


比较 是来自 EMBOSS(“欧洲分子生物学公开赛”)的命令行程序
软件套件”)。 它是“Nucleic:Composition,Protein:Composition”命令的一部分
组。

配置


输入 部分
-序列 后继

-infile 入档
这是先前由 'compseq' 生成的文件,可用于设置预期的
此分析中单词的频率。 当前运行中的字长必须是
与此结果文件中的相同。 显然,您应该使用从
蛋白质序列 如果您正在计算蛋白质序列词频,并且您必须
如果您正在分析核苷酸序列,请使用由核苷酸频率制成的。

其他要求 部分
-字 整数
这是要计算的单词 (n-mer) 的大小。 因此,如果你想计算密码子频率
对于核苷酸序列,您应该在此处输入 3。 默认值:2

额外 部分
-帧 整数
'compseq' 的正常行为是计算所有单词出现的频率
通过每次将长度为 'word' 的窗口向上移动一个。 此选项允许您
每次将窗口向上移动单词的长度,跳过中间的
字。 您可以仅计算出现在单词单个框架中的单词
将此值设置为非零的数字。 如果你把它设置为 1 它只会计数
第 1、2 帧中的单词只会计算第 2 帧中的单词,依此类推。

-ignorebz 布尔
氨基酸代码 B 代表天冬酰胺或天冬氨酸,代码 Z 代表
谷氨酰胺或谷氨酸。 这些不是常用的代码,您可能不希望
计算包含它们的单词,只需在“其他”单词的计数中注明它们。 默认
值:Y

-逆转 布尔
如果您还希望计算 的反向补语中的单词,请将其设置为 true
核酸序列。 默认值:N

-计算频率 布尔
如果设置为真,则从
观察到的序列中单个碱基或残基的频率。 如果您正在报告
字长为 1(单碱基或残基),那么使用它没有意义
选项,因为计算出的预期频率将等于观察到的频率
频率。 像这样计算预期频率将给出一个近似值
使用频率输入文件可能获得的预期频率
由该程序的先前运行产生。 如果一个期望词的输入文件
频率已被指定,那么将使用该文件中的值而不是
从序列中计算预期频率,即使 'calcfreq' 设置为
是真实的。 默认值:N

输出 部分
-输出文件 输出文件
这是结果文件。

-零计数 布尔
如果不显示带有的单词,则可以使输出结果文件小得多
零计数。 默认值:是

使用 onworks.net 服务在线使用 compseqe


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad