这是 bp_unflatten_seqp 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
bp_unflatten_seq - 将 genbank 或 genbank 样式的特征文件解压为嵌套
序列特征层次
概要
bp_unflatten_seq.PLS -e 3 -gff 〜/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS——细节 〜/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS -i foo.embl --从 embl --to chadoxml -o out.chado.xml
bp_unflatten_seq.PLS --notypemap --detail --to asciitree -ethresh 2 AE003644_Adh-genomic.gb
商品描述
这个脚本将 展开 将 SeqFeatures 的 genbank 或 genbank 样式文件放入嵌套的
层次结构。
参见 Bio::SeqFeature::Tools::Unflattener
在 GenBank/EMBL 表示中,特征是“平坦的”——例如,没有链接
在 mRNA 和 CDS 之间,除了隐式链接(例如通过标签或通过剪接位点
坐标),这可能很难编码。
使用默认输出格式最容易说明这一点, 数据树
未平展的 genbank 功能集可能如下所示 (AB077698)
序列号:AB077698
数据库条目 1..2701[+]
基因
基因
CDS hCHCR-G 80..1144[+]
外显子 80..1144[+]
Five_prime_UTR 1..79[+]
定位序列特征 137..196[+]
定位序列特征 239..292[+]
定位序列特征 617..676[+]
定位序列特征 725..778[+]
Three_prime_UTR 1145..2659[+]
多聚腺苷酸位点 1606..1606[+]
多聚腺苷酸位点 2660..2660[+]
或者像这样(AE003734的一部分)
基因
mRNA CG3320-RA
CDS CG3320-PA 53126..54971[-]
外显子 52204..53323[-]
外显子 53404..53631[-]
外显子 53688..53735[-]
外显子 53798..53918[-]
外显子 54949..55287[-]
mRNA CG3320-RB
CDS CG3320-PB 53383..54971[-]
外显子 52204..53631[-]
外显子 53688..53735[-]
外显子 53798..53918[-]
外显子 54949..55287[-]
非扁平化还将“规范化”包含层次结构(从某种意义上说)
标准化 - 例如确保始终有一个成绩单记录,即使 genbank
只指定CDS和基因)
默认情况下,GenBank 类型将映射到 SO 类型
参见 Bio::SeqFeature::Tools::TypeMapper
指挥 LINE 争论
-i|输入文件
输入文件(也可以指定为最后一个参数)
-从格式
输入格式(默认为 genbank)
将它用于非平面格式可能没有多大意义; 即除了
欧洲分子生物学实验室/基因库
-格式化
输出格式(默认为 asciitree)
应该真的是嵌套 SeqFeature 感知的格式; 我认为这只是
asciitree、chadoxml 和 gff3
-gff
导出为 GFF3 格式(pre-3 GFF 对未展平的序列没有意义,因为
他们没有固定的表示特征图的方式)
-o|输出文件
outfile 默认为 STDOUT
-详情
显示关于特征的额外细节(仅限 asciitree 模式)
-e|ethresh 整数
设置 unflattening 的错误阈值
默认情况下,如果这个脚本在 genbank 中遇到奇怪的东西,它会抛出一个 wobbly
文件 - 提高错误阈值以表示这些被忽略(并报告
标准错误)
-游牧
在 unflattening 中抑制 use_magic(参见 Bio::SeqFeature::Tools::Unflattener
-无类型映射
抑制类型映射(参见 Bio::SeqFeature::Tools::TypeMapper
ALL
Bio::SeqFeature::Tools::Unflattener 允许对 unflattening 进行细粒度控制
process - 需要添加更多选项以允许在命令行进行此控制
信息反馈
关于邮寄 书单
用户反馈是该模块和其他 Bioperl 模块演变过程中不可或缺的一部分。 发送
您的意见和建议最好发送到 Bioperl 邮件列表。 您的参与
非常感谢。
[电子邮件保护] - 一般讨论;一般交流
http://bioperl.org/wiki/Mailing_lists - 关于邮件列表
报告仪表板 错误
向 Bioperl 错误跟踪系统报告错误,以帮助我们跟踪错误及其
解析度。 错误报告可以通过电子邮件或网络提交:
https://github.com/bioperl/bioperl-live/issues
使用 onworks.net 服务在线使用 bp_unflatten_seqp