英語フランス語スペイン語

Ad


OnWorksファビコン

cdhit-454 - クラウドでオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターを介して、OnWorks の無料ホスティング プロバイダーで cdhit-454 を実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド cdhit-454 です。

プログラム:

NAME


cd-hit-454 - 454 データ用に最適化された、シーケンスをすばやくグループ化する

SYNOPSIS


cdhit-454 [オプション]

DESCRIPTION


====== CD-HIT バージョン 4.6 (23 年 2016 月 XNUMX 日に構築) ======

オプション

-i fasta 形式でファイル名を入力、必須

-o 出力ファイル名、必須

-c シーケンス同一性しきい値、デフォルト 0.98 これは「グローバル シーケンス同一性」です
次のように計算: アラインメント内の同一アミノ酸の数を完全なアミノ酸数で割った値
短いシーケンスの長さ + ギャップ

-b アライメントのband_width、デフォルトは10

-M プログラムのメモリ制限 (MB 単位)、デフォルトは 800。 無制限の場合は 0。

-T スレッド数、デフォルトは 1。 0 を指定すると、すべての CPU が使用されます

-n word_length、デフォルトは 10、選択についてはユーザーズガイドを参照してください。

-aL 長いシーケンスのアライメント カバレッジ。0.0 に設定されている場合はデフォルト 0.9、
アライメントは配列の 90% をカバーする必要があります

-アル 長いシーケンスのアライメント カバレッジ制御。99999999 に設定されている場合、デフォルトは 60、
シーケンスの長さが 400 の場合、アライメントは 340 (400-60) 以上である必要があります。
残渣

-として 短いシーケンスのアライメント カバレッジ。0.0 に設定されている場合はデフォルト 0.9、
アライメントは配列の 90% をカバーする必要があります

-なので 短いシーケンスのアライメント カバレッジ制御。99999999 に設定されている場合、デフォルトは 60、
シーケンスの長さが 400 の場合、アライメントは 340 (400-60) 以上である必要があります。
残渣

-B 1 または 0、デフォルトは 0、デフォルトでは、1 に設定されている場合、シーケンスは RAM に保存されます。
ハードドライブに保存されているため、使用することをお勧めします -B 巨大なデータベースの場合は 1

-g 1 または 0、cd-hit のデフォルト アルゴリズムによるデフォルトは 0、シーケンスはクラスタリングされます。
しきい値を満たす最初のクラスター (高速クラスター)。 1 に設定すると、プログラムは次のようになります。
しきい値を満たす最も類似したクラスターにクラスター化します (正確ですが遅い)
モード)、ただし 1 または 0 のどちらでも最終クラスターの代表は変わりません。

-D インデルあたりの最大サイズ、デフォルト 1

-一致 一致スコア、デフォルト 2

-ミスマッチ
スコアの不一致、デフォルト -1

-ギャップ ギャップ開始スコア、デフォルト -3

-ギャップ拡張
ギャップ拡張スコア、デフォルト -1

-バク バックアップクラスターファイルの書き込み (1 または 0、デフォルトは 0)

-h このヘルプを印刷する

質問、バグがある場合は、Weizhong Li までお問い合わせください。 [メール保護]

cd-hit が役立つと思われる場合は、以下を引用してください。

「相同性の高い配列をクラスタリングして大きなタンパク質のサイズを縮小する」
データベース」、Weizhong Li、Lukasz Jaroszewski、Adam Godzik、バイオインフォマティクス、(2001)
17:282-283 「Cd-hit: 大規模なセットをクラスタリングして比較するための高速プログラム」
タンパク質またはヌクレオチド配列」、Weizhong Li & Adam Godzik、バイオインフォマティクス、(2006)
22:1658-1659 「Beifang Niu、Limin Fu、Shulei Sun、および Weizhong Li。人工および
メタゲノムデータのパイロシーケンシング読み取りにおける自然な重複。 BMCバイオインフォマティクス
(2010)11:187

onworks.net サービスを使用してオンラインで cdhit-454 を使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad