gmap - クラウド上のオンライン

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド gmap です。

プログラム:

NAME


gmap - ゲノムマッピングおよびアライメントプログラム

SYNOPSIS


gmap [OPTIONS...] <ファスタ ファイル...>, or cat | gmap [オプション...]

OPTIONS


入力 オプション (しなければならない include -d or -g)
-D, --ディレクトリ=ディレクトリにジョブを開始します。
ゲノムディレクトリ。 デフォルト(によって指定されたとおり) --with-gmapdb 構成プログラムへ)
is / var / cache / gmap

-d, --db=STRING
ゲノムデータベース。引数が「?」の場合(引用符付き)、このコマンドのリストは次のとおりです。
利用可能なデータベース。

-k, --kmer=INT
ゲノムデータベースで使用する kmer サイズ (許容値: 16 以下)。そうでない場合
指定すると、プログラムはゲノム内で利用可能な最大の kmer サイズを見つけます。
データベース

- サンプリング=INT
ゲノムデータベースで使用するサンプリング。 指定されていない場合、プログラムは
選択したk-merサイズ内のゲノムデータベースで利用可能な最小のサンプリング値

-G, --ゲノムフル
完全なゲノム (すべての ASCII 文字が許可され、セットアップ中に明示的に構築される) を使用します。
圧縮版

-g, --gseg=ファイル名
ユーザー提供のゲノムセグメント

-1, --selfalign
標準入力を介して FASTA 形式で XNUMX ​​つのシーケンスをそれ自体に対してアライメントします (取得に便利です)
ヌクレオチド配列のタンパク質翻訳)

-2, --ペアアライン
標準入力を介して FASTA 形式の XNUMX つの配列をアライメントします。最初の配列はゲノム配列で、XNUMX 番目の配列はゲノム配列です。
XNUMXつはcDNAです

--コマンドライン=STRING、弦
コマンドラインで提供されるこれら XNUMX つの配列を整列させます。最初の配列はゲノム配列で、もう XNUMX つはゲノム配列です。
XNUMX番目はcDNAです

-q, - 部=INT/ INT
n個のシーケンスのうちi番目のみを処理します(例:0/100または99/100(
コンピューターファームへのジョブの配布)。

--入力バッファサイズ=INT
入力バッファのサイズ(プログラムは効率のために一度にこれだけ多くのシーケンスを読み取ります)
(デフォルトは1000)

計算オプション

-B, - バッチ=INT
バッチモード(デフォルト= 2)

モード オフセット 位置 ゲノム
0 注意 mmap mmap を参照
1 mmap とプリロード mmap に注意してください
(デフォルト) 2 注を参照 mmap & preload mmap & preload
3 mmap とプリロードの割り当てに関する注意事項を参照してください
4 ノートを参照してください。割り当てます。
5 拡張 割り当て 割り当て

注:単一のシーケンスの場合、すべてのデータ構造はmmapを使用します
mmapが利用できず、割り当てが選択されていない場合は、fileioを使用します(非常に遅い)

についての注意 - バッチ とオフセット: オフセットの拡張を制御できます
独立して --expand-offsets 国旗。 NS - バッチ=5 オプションはと同等です
- バッチ=4 さらに --expand-offsets=1

--expand-offsets=INT
ゲノムオフセットインデックスの値を拡張するかどうか:0(いいえ、デフォルト)、または1(はい)。
拡張するとアライメントが速くなりますが、より多くのメモリが必要になります

--ノスプライシング
スプライシングをオフにします (ゲノム配列をゲノム上に整列させるのに役立ちます)

--最小イントロン長=INT
9 つの内部イントロンの最小長 (デフォルトは XNUMX)。このサイズ以下ではゲノムギャップ
イントロンではなく欠失とみなされます。

-K, --イントロンの長さ=INT
200000 つの内部イントロンの最大長 (デフォルトは XNUMX)

-w, --localsplicedist=INT
配列末端の既知のスプライス部位の最大長 (デフォルトは 2000000)

-L, - 全長=INT
最大合計イントロン長 (デフォルトは 2400000)

-x, --キメラ-マージン=INT
残りのシーケンスの検索をトリガーする、アライメントされていないシーケンスの量
(デフォルトは 30)。キメラリードのアライメントを可能にし、いくつかの点で役立つ可能性があります。
非キメラ読み取り。オフにするには、ゼロに設定します。

--キメラなし
キメラの検索をオフにします。と同じ効果 --キメラ-マージン=0

-t, --nスレッド=INT
ワーカースレッドの数

-c, --chrサブセット=文字列
検索を指定された染色体に限定する

-z, - 方向=STRING
cDNA 方向 (sense_force、antisense_force、sense_filter、antisense_filter、または
自動 (デフォルト))

-H, --トリメンデキソン=INT
指定された一致数よりも少ない末端エクソンをトリムします (nt の場合、デフォルトは 9)。

--正規モード=INT
正規および半正規イントロンの報酬 0=低報酬、1=高報酬
(デフォルト)、2=高同一性シーケンスの場合は低い報酬、それ以外の場合は高い報酬

--異種間
正規スプライシングのより高感度な検索を使用します。これは、特に次の場合に役立ちます。
異種間の調整やその他の困難なケース

--allow-close-indels=INT
相互に近い挿入と削除を許可します (0=いいえ、1=はい (デフォルト)、2=のみ
高品質のアライメントのために)

--マイクロエクソン-スプライスプロブ=FLOAT
スプライスサイトの確率のXNUMXつがこれよりも大きい場合にのみ、マイクロエキソンを許可します
値(デフォルトは0.95)

--cmetdir=STRING
メチルシトシンインデックスファイルのディレクトリ(cmetindexを使用して作成)(デフォルトは
を使用して指定されたゲノムインデックスファイルの場所 -D, -V, -d)

--アトディル=STRING
A-to-I RNA編集インデックスファイルのディレクトリ(atoiindexを使用して作成)(デフォルトは
を使用して指定されたゲノムインデックスファイルの場所 -D, -V, -d)

- モード=STRING
アラインメントモード:標準(デフォルト)、cmet-strand、cmet-nonstrand、atoi-strand、
atoi-非ストランド、ttoc-ストランド、またはttoc-非ストランド。 非標準モードには
以前にcmetindexまたはatoiindexプログラムを実行したことがある
ゲノム上のttocモード)

-p, --プルーンレベル
プルーニング レベル: 0= プルーニングなし (デフォルト)、1= 不良シーケンス、2= 反復シーケンス、3= 不良、および
反復的な

出力タイプ

-S, - まとめ
線形の概要のみを表示

-A, --整列
位置合わせを表示

-3, -継続的
配置を XNUMX つの連続線で表示します

-4, --エクソンごとの連続
アライメントをエクソンごとに XNUMX 行で表示します

-Z, -圧縮
圧縮形式での印刷出力

-E, --エクソン=STRING
エクソン (「cdna」または「ゲノム」) を出力します。

-P, --タンパク質_dna
タンパク質配列 (cDNA) を印刷する

-Q, --プロテインジェネ
タンパク質配列(ゲノム)を印刷する

-f, - フォーマット=INT
出力用のその他の形式 ( -A および -S オプションとその他のオプションがリストされています
[出力タイプ] の下):
psl (または 1) = PSL (BLAT) 形式、
gff3_gene (または 2) = GFF3 遺伝子形式、
gff3_match_cdna (または 3) = GFF3 cDNA_match フォーマット、
gff3_match_est (または 4) = GFF3 EST_match 形式、
splicesites (または 6) = splicesites 出力 (GSNAP スプライシング ファイル用)、
introns = イントロン出力 (GSNAP スプライシング ファイル用)、
map_exons (または 7) = IIT FASTA エクソン マップ形式、
map_ranges (または 8) = IIT FASTA 範囲マップ形式、
coords (または 9) = テーブル形式の座標、
sampe = SAM フォーマット (フラグにpaired_readビットを設定)、
samse = SAM フォーマット (paired_read ビットの設定なし)

出力オプション

-n, --npath=INT
表示するパスの最大数 (デフォルトは 5)。 1 に設定すると、GMAP はレポートしません。
キメラアラインメントは XNUMX つのパスを意味するため。単一のアライメントが必要な場合
キメラ アライメントを加えた場合は、これを 0 に設定します。

--次善のスコア=INT
スコアが最適パスのこの値内にあるパスのみをレポートします。デフォルトでは、
このオプションが提供されていない場合、
プログラムは見つかったすべてのパスを出力します。

-O, - 順序付けられました
入力と同じ順序で出力を出力します(複数のワーカーが存在する場合にのみ関連します)
糸)

-5, --md5
各クエリ シーケンスの MD5 チェックサムを出力します。

-o, --キメラオーバーラップ
キメラ ブレークポイントで表示するオーバーラップ (存在する場合)

--failsonly
失敗した配置のみを印刷し、結果がないものを印刷します

--失敗しない
失敗したアライメントの印刷を除外する

-V, --snpsdir=STRING
SNPインデックスファイルのディレクトリ(snpindexを使用して作成)(デフォルトは
を使用して指定されたゲノムインデックスファイル -D および -d)

-v, --use-snps=STRING
既知のSNPを含むデータベースを使用する( .iit、以前に使用して構築された
snpindex)SNPに対する耐性

--分割出力=STRING
複数ファイル出力のベース名 (nomapping とは別に)、
uniq、mult、(およびキメラの場合) --キメラ-マージン が選択されています)

-失敗-入力=STRING
完全に失敗したアライメントを入力 FASTA または FASTQ 形式として指定されたファイルに出力します。
ファイル。 の場合 --分割出力 フラグも指定されている場合、このファイルは追加で生成されます
.nomapping ファイルの出力に追加されます。

-追加-出力
日時 --分割出力 or --失敗した入力 が与えられると、このフラグは出力をに追加します
既存のファイル。 それ以外の場合、デフォルトでは新しいファイルが作成されます。

-- 出力バッファサイズ=INT
クエリでの出力スレッドのバッファサイズ(デフォルトは1000)。 の数が
印刷される結果がこのサイズを超えると、ワーカースレッドは
バックログがクリアされます

-F, - 全長
Met から始まる完全長タンパク質を想定します。

-a, --cdsstart=INT
指定されたヌクレオチドからコドンを翻訳します (1 ベース)

-T, -切り捨て
全長タンパク質周囲のアライメントの切断、Met to Stop を意味する -F フラグ。

-Y, -耐性
フレームシフトを補正して cDNA を翻訳します

GFF3 出力のオプション

--gff3-add-separators=INT
各クエリ シーケンスの後に ### 区切り文字を追加するかどうか 値: 0 (いいえ)、1 (はい、
デフォルト)

SAM出力のオプション

--no-sam-headers
'@'で始まるヘッダーを印刷しないでください

--sam-use-0M
隣接する挿入と削除の間にCIGARに0Mを挿入します。Picardが必要です。
ただし、他のツールでエラーが発生する可能性があります

--force-xs-dir
RNA-Seqアラインメントの場合、XS:A :?を禁止します。 センスの方向がはっきりしないとき、
この値を任意にXS:A:+に置き換えます。 次のような一部のプログラムに役立つ場合があります
カフリンクスとして、XS:A :?を処理できません。 ただし、このフラグを使用すると、
これらの場合のXS:A:+の報告値は、意味がありません。

--md-小文字-snp
MD文字列では、既知のSNPが -v 国旗、
異なるヌクレオチドが存在する場合、それらを小文字で出力します。
参照とは異なるが、既知の代替対立遺伝子と一致する

--葉巻エラーの場合のアクション
CIGARの長さとシーケンスの長さの間に不一致がある場合に実行するアクション
許可される値: 無視、警告 (デフォルト)、中止

-- 読み取りグループ ID=STRING
読み取りグループID(RG-ID)フィールドに入力する値

-- 読み取りグループ名=STRING
読み取りグループ名(RG-SM)フィールドに入力する値

--read-group-library=STRING
読み取りグループライブラリ(RG-LB)フィールドに入力する値

--読み取りグループプラットフォーム=STRING
読み取りグループライブラリ(RG-PL)フィールドに入力する値

品質スコアのオプション

-品質-プロトコル=STRING
入力品質スコアのプロトコル。 許可される値:イルミナ(ASCII 64-126)
(に相当します -J 64 -j -31)サンガー(ASCII 33-126)( -J 33 -j 0)

デフォルトはサンガーです(高品質の印刷シフトなし)
SAM出力ファイルは、サンガープロトコルの品質スコアを持つ必要があります

または、次のフラグを使用して印刷シフトを指定できます。

-j, --quality-print-shift=INT
FASTQ品質スコアを出力でこの量だけシフトします(サンガーのデフォルトは0です)
プロトコル; イルミナ入力をサンガー出力に変更するには、 -31)

外部マップファイルのオプション

-M, --mapdir=ディレクトリにジョブを開始します。
マップディレクトリ

-m, - 地図=iitファイル
マップファイル。引数が「?」の場合(引用符付き)、
これは、利用可能なマップ ファイルのリストです。

-e, --マペクソン
各エクソンを個別にマッピングする

-b, --map両方
ゲノムの両方の鎖からのヒットを報告する

-u, --側面=INT
側面攻撃を表示 (デフォルトは 0)

--印刷コメント
各ヒットのコメント行を表示する

アライメント出力オプション

-N, -- ノーレングス
イントロンの長さが揃っていない

-I, --反転モード=INT
ゲノム (-) 鎖へのアライメントのモード: 0=cDNA を反転しません (デフォルト)
1=cDNA を反転し、ゲノム (-) 鎖を印刷します。 2= cDNA を反転し、ゲノム (+) を印刷します。
ストランド

-i, --イントロンギャップ=INT
イントロンの各末端に表示するヌクレオチド (デフォルトは 3)

-l, --ラップ長=INT
位置合わせのためのラップの長さ (デフォルトは 50)

出力オプションのフィルタリング

--min-trimed-coverage=FLOAT
この値未満のトリミングされたカバレッジで位置合わせを印刷しません (デフォルト = 0.0、これは
フィルタリングなしを意味します) これに関係なく、キメラアライメントが出力されることに注意してください。
filter

--最小アイデンティティ=FLOAT
この値よりも小さい ID の配置を印刷しません (デフォルト = 0.0、つまり印刷しないことを意味します)
フィルタリング) このフィルタに関係なくキメラ アラインメントが出力されることに注意してください
ヘルプオプション

- チェック
コンパイラの仮定を確認してください

- バージョン
バージョンを表示

- 助けて このヘルプメッセージを表示する

GMAPスイートの他のツールは/ usr / lib / gmapにあります

onworks.net サービスを使用してオンラインで gmap を使用する



最新のLinuxおよびWindowsオンラインプログラム