英语法语西班牙语

Ad


OnWorks 网站图标

map2slimp - 云端在线

在 OnWorks 免费托管服务提供商中通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器运行 map2slimp

这是命令 map2slimp 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


map2slim - 将基因关联映射到“超薄”本体

概要


光盘走
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo 基因关联/gene_association.fb

商品描述


给定一个 GO slim 文件和一个当前本体(在一个或多个文件中),该脚本将映射
GO 中术语的基因关联文件(包含对完整 GO 的注释)
苗条的。

该脚本可用于创建一个新的基因关联文件,其中包含最多的
相关的 GO 瘦种质,或在计数模式下,在这种情况下,它将给出不同的基因
每个细长项的产品计数

此处描述了关联文件格式:

<http://www.geneontology.org/GO.annotation.shtml#文件>

争论


-b 文件
这个论点补充说 条款 到苗条的本体; 请参阅下面的文档
一个解释。 新的细长本体文件,包括桶术语将被写入
文件

-外图 制图 文件
这将为完整本体中的每个术语生成一个映射文件,同时显示
最相关的狭义词和所有祖先的狭义词。 如果你使用这个
选项,不提供基因关联文件

节目名称
(仅适用于 -outmap)

在 slim 映射文件中显示术语的名称

-c 这将强制 map2slim 给出 assoc 文件的计数,而不是映射它

-t 当与 -c 将标签输出,以便缩进反映
slim 文件中的树层次结构

-o 输出 文件
这会将映射的关联(或计数)写入指定的文件,而不是写入
屏幕

下载


这个脚本是 转perl 包,可从 CPAN 获得

<http://search.cpan.org/~cmungall/go-perl/>

如果不安装 go-perl,此脚本将无法运行

MAPPING 算法
GO 是一个 DAG,而不是一棵树。 这意味着一个 GO 术语通常有不止一条路径
直到根 Gene_Ontology 节点; 路径可能与细长中的多个术语相交
本体 - 这意味着一个注释可以映射到多个细长的术语!

(注意 你需要在线查看这个才能看到下面的图片 - 如果你没有在
http://www.geneontology.org 网站,您可以查看以下网址:
<http://geneontology.cvs.sourceforge.net/*结帐*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)

假设示例 蓝色圆圈表示 GO slim 中的术语,黄色圆圈表示
完整本体中的术语。 完整的本体包含了瘦的,所以蓝色的术语是
也在本体中。

GO ID 地图 SLIM ID 所有苗条的祖先
========================================
5 2 + 3 2,3,1
6 3 仅 3,1
7 4 仅 4,3,1
8 3 仅 3,1
9 4 仅 4,3,1
10 2 + 3 2,3,1

第二列显示了超薄直接映射中最相关的 ID。 第三个
列显示了 slim 中的所有祖先。

特别注意 ID 9 的映射,尽管它有两条路径通过
细长过孔 3 和 4, 3 被丢弃,因为它被 4 包含。

另一方面,10 映射到 2 和 3,因为它们都是
到根的两个有效路径,并且都不包含另一个。

使用的算法是:

映射完整本体中的任何一项:找到所有有效路径到根节点
完整的本体

对于每条路径,取路径中遇到的第一个细长项

丢弃该集合中任何多余的细项,即被其他细项包含的细项
在集合中

条款
如果您使用 -b 选项运行脚本,将添加存储桶术语。 对于任何项 P
如果 P 至少有一个孩子 C,那么会在 P 下创建一个桶项 P'。这是
一个笼统的术语,用于映射作为 P 的后代的完整本体中的任何术语,但是
不是细长本体中 P 的任何孩子的后代。

例如,slim generic.0208 具有以下术语和结构:

%DNA 结合; 转到:0003677
%染色质结合; 转到:0003682
%转录因子活性; 转到:0003700,转到:0000130

添加桶项后,它将如下所示:

%DNA 结合; 转到:0003677
%染色质结合; 转到:0003682
%转录因子活性; 去:0003700 ; 同义词:GO:0000130
@bucket:Z-OTHER-DNA 结合; slim_temp_id:12

来自完整本体的术语是 DNA 结合的其他子代,例如单
搁浅的 DNA 结合及其后代将映射到桶项。

桶项有一个细长的 ID,它是暂时的,只是为了方便
映射。 它不应该在外部使用。

桶项有前缀Z-OTHER; Z 是一个黑客,以确保该术语是
总是按字母顺序列在最后。

如果使用桶项,则算法略有修改。 桶项有一个
与所有其他兄弟姐妹的隐含关系不在苗条中。

Do I 需要 条款?

如今,大多数超薄文件完全或接近“完整”,即没有间隙。
这意味着 -b 选项不会产生明显不同的结果。 例如,
您可能会看到创建了一个存储桶术语 OTHER-binding,但没有对其进行任何注释:因为所有
GO 中 binding 的子代在 slim 文件中表示。

桶选项实际上只对一些较旧的归档瘦文件是必要的,
它们是静态的,以一种相当特别的方式生成; 他们倾向于积累“差距”
随着时间的推移(例如,GO 会添加一个新的绑定子项,但静态的细长文件不会达到
日期,因此任何注释到这个新术语的基因产物都将映射到
苗条的)

图形 错误
请注意,相对于当前,slim 本体文件可能已过时
本体论。

目前,map2slim 不标记超薄图和中图之间的图不匹配
完整的本体文件; 它将完整的本体作为真正的图。 然而
如果您选择 -t -c 作为选项。

OUTPUT
在正常模式下,将写入标准格式的基因关联文件。 GO ID 列
(5) 将包含 GO slim ID。 映射对应于表中的第 2 列
以上。 请注意,输出文件可能包含比输入文件更多的行。 这是
因为一些完整的 GO ID 有不止一个相关的细长 ID。

COUNT个 MODE

map2slim 可以使用 -c 选项运行,这将给出不同基因的计数
产品映射到每个细长的术语。 各列如下

GO 术语
第一列是 GO ID 后跟术语名称(术语名称提供为
它可以在完整的 GO 和超薄本体中找到 - 这些通常是相同的
但偶尔slim文件会落后于GO文件的变化)

这是最相关的细长项的基因产物的计数
这是最相关/直接苗条的不同基因产物的数量
ID。 最直接的意思是直接与该术语关联,
或者关联是针对这个苗条的孩子的,并且没有苗条的孩子
关联映射到的术语。

对于大多数slims来说,这个计数会直接等价于关联数
映射到这个狭隘的术语。 但是,一些较旧的细长文件“参差不齐”,因为它们
承认“差距”。 例如,如果slim拥有“生物过程”的所有子代
除了“behavior”,“behavior”或其子代的所有注释都将是
算在这里

见下面的例子

推断与瘦术语相关的基因产物数量
以及注释到此任何后代的不同基因产物的数量
slim ID(或直接注释到 slim ID)。

淘汰标志
GO本体

举个例子; 如果我们像这样使用 -t 和 -c:

map2slim -t -c GO_slims/goslim_generic.obo 本体/gene_ontology.obo 基因关联/gene_association.fb

那么部分结果可能是这样的:

GO:0008150 bio_process (biological_process) 34 10025 bio_process
GO:0007610 行为(behavior) 632 632 bio_process
GO:0000004 生物过程未知(生物过程未知) 832 832 bio_process
GO:0007154 细胞通讯(细胞通讯)333 1701 bio_process
GO:0008037 细胞识别(细胞识别)19 19 bio_process
19 个产品被映射到 GO:0008037 或其子代之一。 (GO:0008037 是 slim 中的叶节点,所以这两个计数是相同的)。

另一方面,GO:0008150 仅获取与此最相关的 34 种产品
学期。 这是因为大多数注释会映射到细长中 GO:0008150 的某个子节点,
例如 GO:0007610(行为)。 这 34 个基因产物要么直接注释为
GO:0008150,或者这个词的一些孩子不是在苗条的。 这可以指向
在苗条的'差距'。 请注意,使用 -b 选项运行 map2slim 将“堵塞”这些间隙
与人工填料术语。

使用 onworks.net 服务在线使用 map2slimp


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    斯威格
    斯威格
    SWIG 是一种软件开发工具
    连接用 C 编写的程序和
    C++ 具有各种高级
    编程语言。 SWIG 用于
    不同的...
    下载痛饮
  • 2
    WooCommerce Nextjs 反应主题
    WooCommerce Nextjs 反应主题
    React WooCommerce 主题,构建于
    Next JS、Webpack、Babel、Node 和
    Express,使用 GraphQL 和 Apollo
    客户。 React 中的 WooCommerce 商店(
    包含:产品...
    下载 WooCommerce Nextjs React 主题
  • 3
    archlabs_repo
    archlabs_repo
    ArchLabs 的软件包仓库 这是一个
    也可以获取的应用程序

    https://sourceforge.net/projects/archlabs-repo/.
    它已在 OnWorks 中托管...
    下载 archlabs_repo
  • 4
    和风项目
    和风项目
    Zephyr 项目是新一代
    实时操作系统 (RTOS)
    支持多种硬件
    架构。 它基于一个
    小尺寸内核...
    下载 Zephyr 项目
  • 5
    SCCons
    SCCons
    SCons是一个软件构建工具
    这是一个更好的选择
    经典的“Make”构建工具
    我们都知道并热爱。 SCons 是
    实施了一个...
    下载 SCons
  • 6
    聚苯乙烯
    聚苯乙烯
    PSeInt 是一个伪代码解释器
    讲西班牙语的编程学生。
    它的主要目的是成为一个工具
    学习和理解基本的
    概念...
    下载 PSeInt
  • 更多 ”

Linux 命令

Ad