这是 cd-hit-para 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
cd-hit-para.pl - 将一个大的集群作业分成几部分来运行 cd-hit 或 cd-hit-est 作业
概要
cd-hit-para.pl 选项
商品描述
这个脚本将一个大的集群作业分成几部分并将作业提交到远程
计算机通过网络使其并行。 所有工作完成后,
脚本合并聚类结果,就像您只运行一个 cd-hit 或
cd-hit-est。
如果您的计算机这样做,您也可以使用它在一台计算机上划分大型作业
没有足够的内存(与 -L 选项)。
要求:
1 通过网络运行此脚本时,您所在的目录
运行脚本,输入文件必须在所有远程主机上可用
相同的路径。
2 如果您选择“ssh”提交作业,您必须拥有
无密码 ssh 到任何远程主机,请参阅 ssh 手册了解如何设置
无密码 ssh。
3 我建议使用排队系统而不是 ssh,
我目前支持 PBS 和 SGE
4 cd-hit cd-hit-2d cd-hit-est cd-hit-est-2d
cd-hit-div cd-hit-div.pl 必须在此脚本所在的同一目录中。
可选项
-i fasta 格式的输入文件名,必需
-o 输出文件名,必填
--P 程序,“cd-hit”或“cd-hit-est”,默认为“cd-hit”
--乙 主机列表的文件名,
除非 -Q or -L 提供选项
--L 本地计算机上的 CPU 数量,默认为 0
当你不在集群上运行它时,你可以使用这个选项来划分一个大的
将作业分成小块,我建议你只使用“--L 1”,除非你有
每个 cpu 有足够的 RAM
--S 将输入 DB 分割成的段数,默认 64
--问 提交给队列排队系统的作业数,默认为 0
默认情况下,程序使用 ssh 模式提交远程作业
--T 排队系统类型,支持“PBS”、“SGE”,默认PBS
--R 重启文件,在运行崩溃后使用
-h 打印此帮助
可以在命令行中指定更多 cd-hit/cd-hit-est 选项
问题、错误,请联系 Weizhong Li [email protected]
使用 onworks.net 服务在线使用 cd-hit-para