ນີ້ແມ່ນຄໍາສັ່ງ gsnap ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍສະຖານີເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
gsnap - Genomic Short-read Nucleotide Alignment Program
ສະຫຼຸບສັງລວມ
gsnap [OPTIONS... ] <FSTA ໄຟລ໌>, or ແມວ | gmap [ຕົວເລືອກ...]
OPTIONS
ການປ້ອນຂໍ້ມູນ ທາງເລືອກໃນການ (ຕ້ອງ ປະກອບດ້ວຍ -d)
-D, --dir=ລະບົບ
ໄດເລກະທໍລີ Genome. ຄ່າເລີ່ມຕົ້ນ (ຕາມທີ່ລະບຸໂດຍ --with-gmapdb ກັບໂຄງການ configure)
is /var/cache/gmap
-d, --db=ຄັກ
ຖານຂໍ້ມູນ Genome
--use-sarray=INT
ວ່າຈະໃຊ້ array suffix ຫຼືບໍ່, ເຊິ່ງຈະໃຫ້ຄວາມໄວເພີ່ມຂຶ້ນ. ຄ່າທີ່ອະນຸຍາດ: 0
(ບໍ່), 1 (ແມ່ນແລ້ວ, ບວກກັບ GSNAP/GMAP algorithm, ຄ່າເລີ່ມຕົ້ນ), ຫຼື 2 (ແມ່ນ, ແລະໃຊ້ພຽງແຕ່ຄຳຕໍ່ທ້າຍເທົ່ານັ້ນ.
array algorithm). ໃຫ້ສັງເກດວ່າ arrays ຕໍ່ທ້າຍຈະມີຄວາມລໍາອຽງຕໍ່ກັບ SNP alleles ໃນ
ການຈັດຮຽງທີ່ທົນທານຕໍ່ SNP.
-k, --kmer=INT
ຂະຫນາດ kmer ທີ່ຈະໃຊ້ໃນຖານຂໍ້ມູນ genome (ຄ່າທີ່ອະນຸຍາດ: 16 ຫຼືນ້ອຍກວ່າ) ຖ້າບໍ່ໄດ້ລະບຸ,
ໂຄງການຈະຊອກຫາຂະຫນາດ kmer ທີ່ສູງທີ່ສຸດທີ່ມີຢູ່ໃນຖານຂໍ້ມູນ genome
--ການເກັບຕົວຢ່າງ=INT
ການເກັບຕົວຢ່າງເພື່ອໃຊ້ໃນຖານຂໍ້ມູນ genome. ຖ້າບໍ່ໄດ້ລະບຸ, ໂຄງການຈະຊອກຫາ
ຄ່າຕົວຢ່າງທີ່ນ້ອຍທີ່ສຸດທີ່ມີຢູ່ໃນຖານຂໍ້ມູນ genome ພາຍໃນຂະຫນາດ k-mer ທີ່ເລືອກ
-q, -- ສ່ວນ=INT/INT
ປະມວນຜົນພຽງແຕ່ i-th ອອກຈາກທຸກໆ n ລໍາດັບເຊັ່ນ: 0/100 ຫຼື 99/100 (ເປັນປະໂຫຍດສໍາລັບ
ແຈກຢາຍວຽກໃຫ້ຟາມຄອມພິວເຕີ).
--input-buffer-size=INT
ຂະຫນາດຂອງ input buffer (ໂຄງການອ່ານລໍາດັບນີ້ຈໍານວນຫຼາຍໃນເວລາສໍາລັບປະສິດທິພາບ)
(ຄ່າເລີ່ມຕົ້ນ 1000)
--ຄວາມຍາວຂອງບາໂຄດ=INT
ຈໍານວນຂອງ barcode ທີ່ຈະເອົາອອກຈາກການເລີ່ມຕົ້ນຂອງການອ່ານ (ຄ່າເລີ່ມຕົ້ນ 0)
--ປະຖົມນິເທດ=ຄັກ
ການວາງທິດທາງຂອງຄູ່ທ້າຍອ່ານຄ່າທີ່ອະນຸຍາດ: FR (fwd-rev, ຫຼື Illumina ປົກກະຕິ;
ຄ່າເລີ່ມຕົ້ນ), RF (rev-fwd, ສໍາລັບການໃສ່ແຜ່ນວົງມົນ), ຫຼື FF (fwd-fwd, ສາຍດຽວກັນ)
--fastq-id-start=INT
ຕຳແໜ່ງເລີ່ມຕົ້ນຂອງຕົວລະບຸໃນສ່ວນຫົວ FASTQ, ກຳນົດຊ່ອງຫວ່າງ (>= 1)
--fastq-id-end=INT
ສິ້ນສຸດຕຳແໜ່ງຂອງຕົວລະບຸໃນສ່ວນຫົວ FASTQ, ກຳນົດຊ່ອງຫວ່າງ (>= 1)
ຕົວຢ່າງ:
@HWUSI-EAS100R:6:73:941:1973#0/1
start=1, end=1 (ຄ່າເລີ່ມຕົ້ນ) => ຕົວລະບຸແມ່ນ HWUSI-EAS100R:6:73:941:1973#0
@SRR001666.1 071112_SLXA-EAS1_s_7:5:1:817:345 length=36
start=1, end=1 => ຕົວລະບຸແມ່ນ SRR001666.1 start=2, end=2 => ຕົວລະບຸແມ່ນ
071112_SLXA-EAS1_s_7:5:1:817:345 start=1, end=2 => ຕົວລະບຸແມ່ນ SRR001666.1
071112_SLXA-EAS1_s_7:5:1:817:345
--force-single-end
ເມື່ອໄຟລ໌ FASTQ ຫຼາຍຖືກສະຫນອງໃຫ້ຢູ່ໃນເສັ້ນຄໍາສັ່ງ, GSNAP ຖືວ່າພວກເຂົາເປັນ
ການຈັບຄູ່ໄຟລ໌ທີ່ຈັບຄູ່. ທຸງນີ້ປະຕິບັດຕໍ່ແຕ່ລະໄຟລ໌ເປັນອັນດຽວ.
--filter-ພົມມະຈັນ=ຄັກ
ຂ້າມການອ່ານທີ່ໝາຍໄວ້ໂດຍໂຄງການພົມມະຈັນ Illumina. ຄາດວ່າຈະມີສະຕິງຫຼັງຈາກ
accession ມີ 'Y' ຫຼັງຈາກຈໍ້າສອງເມັດທໍາອິດ, ເຊັ່ນນີ້:
@accession 1:Y:0:CTTGTA
ບ່ອນທີ່ 'Y' ຫມາຍເຖິງການກັ່ນຕອງໂດຍພົມມະຈັນ. ຄ່າ: off (ຄ່າເລີ່ມຕົ້ນ), ບໍ່ວ່າຈະ,
ທັງສອງ. ສໍາລັບ 'ທັງສອງ', 'Y' ຢູ່ໃນຈຸດສິ້ນສຸດຂອງການອ່ານແບບຄູ່ຈະຖືກກັ່ນຕອງ.
ສໍາລັບ 'ທັງສອງ', ຕ້ອງການ 'Y' ຢູ່ໃນທັງສອງສົ້ນຂອງການອ່ານແບບຄູ່ (ຫຼືຢູ່ໃນທ້າຍດຽວເທົ່ານັ້ນ.
ຂອງການອ່ານຈົບດຽວ).
--allow-pe-name-mismatch
ອະນຸຍາດໃຫ້ຊື່ການເຂົ້າມາຂອງການອ່ານທີ່ບໍ່ກົງກັນໃນໄຟລ໌ທີ່ຈັບຄູ່ທ້າຍ
--gunzip
ຍົກເລີກການບີບອັດໄຟລ໌ປ້ອນຂໍ້ມູນ gzipped
--bunzip2
ຍົກເລີກການບີບອັດໄຟລ໌ປ້ອນຂໍ້ມູນທີ່ບີບອັດ bzip2
ທາງເລືອກໃນການຄິດໄລ່
ຫມາຍເຫດ: GSNAP ມີສູດການຄິດໄລ່ ultrafast ສໍາລັບການຄິດໄລ່ບໍ່ກົງກັນເຖິງແລະ
ລວມທັງ
((ຄວາມຍາວອ່ານ+2)/ກິໂລແມັດ - 2) ("ບໍ່ກົງກັນໄວໄວ"). ໂຄງການຈະດໍາເນີນການໄວທີ່ສຸດຖ້າຫາກວ່າ
max-mismatches (ບວກກັບ suboptimal-levels) ຢູ່ໃນຄ່ານັ້ນ. ນອກຈາກນີ້, indels, ໂດຍສະເພາະ
end indels, ໃຊ້ເວລາດົນກວ່າທີ່ຈະຄິດໄລ່, ເຖິງແມ່ນວ່າ algorithm ຍັງຖືກອອກແບບໃຫ້ໄວ.
-B, --ຊຸດ=INT
ໂໝດຊຸດ (ຄ່າເລີ່ມຕົ້ນ = 2)
Mode Offsets Positions Genome Suffix array
0 ເບິ່ງບັນທຶກ mmap mmap mmap
1 ເບິ່ງບັນທຶກ mmap & preload mmap mmap
2 ເບິ່ງບັນທຶກ mmap & preload mmap & preload mmap & preload
3 ເບິ່ງບັນທຶກການຈັດສັນ mmap & preload mmap & preload
(ຄ່າເລີ່ມຕົ້ນ) 4 ເບິ່ງບັນທຶກ allocate mmap & preload
5 ເບິ່ງບັນທຶກການຈັດສັນ allocate allocate
ຫມາຍເຫດ: ສໍາລັບລໍາດັບດຽວ, ໂຄງສ້າງຂໍ້ມູນທັງຫມົດໃຊ້ mmap
ຖ້າ mmap ບໍ່ສາມາດໃຊ້ໄດ້ແລະບໍ່ໄດ້ເລືອກການຈັດສັນ, ຫຼັງຈາກນັ້ນຈະໃຊ້ fileio (ຊ້າຫຼາຍ)
ຫມາຍເຫດກ່ຽວກັບການຊົດເຊີຍ: ການຂະຫຍາຍການຊົດເຊີຍສາມາດຄວບຄຸມໄດ້
ເປັນເອກະລາດໂດຍ --expand-offsets ທຸງ. ຢ່າງໃດກໍຕາມ, ການຊົດເຊີຍແມ່ນເຂົ້າເຖິງ
ຂ້ອນຂ້າງໄວໃນ GSNAP ລຸ້ນນີ້.
--use-shared-memory=INT
ຖ້າ 1 (ຄ່າເລີ່ມຕົ້ນ), ຫຼັງຈາກນັ້ນ, ຫນ່ວຍຄວາມຈໍາທີ່ຈັດສັນຈະຖືກແບ່ງປັນລະຫວ່າງຂະບວນການທັງຫມົດໃນ node ນີ້.
ຖ້າ 0, ຫຼັງຈາກນັ້ນແຕ່ລະຂະບວນການມີຄວາມຊົງຈໍາທີ່ຈັດສັນເອກະຊົນ
--expand-offsets=INT
ວ່າຈະຂະຫຍາຍດັດຊະນີ genomic offsets ຄ່າ: 0 (ບໍ່, ຄ່າເລີ່ມຕົ້ນ), ຫຼື 1 (ແມ່ນ).
ການຂະຫຍາຍເຮັດໃຫ້ການຈັດຮຽງໄວຂຶ້ນ, ແຕ່ຕ້ອງການຄວາມຈຳຫຼາຍ
-m, --max-ບໍ່ກົງກັນ=ລູກລອຍ
ອະນຸຍາດໃຫ້ມີຈໍານວນບໍ່ກົງກັນສູງສຸດ (ຖ້າບໍ່ໄດ້ລະບຸ, ຈາກນັ້ນກຳນົດຄ່າເລີ່ມຕົ້ນ
ລະດັບ ultrafast ຂອງ ((readlength+index_interval-1)/kmer - 2)) (ຕາມຄ່າເລີ່ມຕົ້ນ, the
ໄລຍະຫ່າງດັດຊະນີ genome ແມ່ນ 3, ແຕ່ນີ້ສາມາດປ່ຽນແປງໄດ້ໂດຍການໃຫ້ຄ່າທີ່ແຕກຕ່າງກັນ
ສໍາລັບການ -q ກັບ gmap_build ເມື່ອປະມວນຜົນ genome.)
ຖ້າລະບຸລະຫວ່າງ 0.0 ແລະ 1.0, ຫຼັງຈາກນັ້ນຖືວ່າເປັນສ່ວນຫນຶ່ງ
ຂອງຄວາມຍາວຂອງການອ່ານແຕ່ລະຄົນ. ຖ້າບໍ່ດັ່ງນັ້ນ, ຖືວ່າເປັນຕົວເລກທີ່ບໍ່ກົງກັນ
(ລວມທັງການລົງໂທດ indel ແລະ splicing) ສໍາລັບ RNA-Seq, ທ່ານອາດຈະຈໍາເປັນຕ້ອງໄດ້ເພີ່ມທະວີການນີ້.
ຄ່າເລັກນ້ອຍເພື່ອຈັດຮຽງການອ່ານທີ່ຂະຫຍາຍຜ່ານຈຸດສິ້ນສຸດຂອງ exon.
-- ການຄຸ້ມຄອງນາທີ=ລູກລອຍ
ການຄຸ້ມຄອງຕໍາ່ສຸດທີ່ຕ້ອງການສໍາລັບການສອດຄ່ອງ. ຖ້າລະບຸລະຫວ່າງ 0.0 ແລະ 1.0, ຫຼັງຈາກນັ້ນ
ຖືວ່າເປັນສ່ວນໜຶ່ງຂອງຄວາມຍາວທີ່ອ່ານແຕ່ລະອັນ. ຖ້າບໍ່ດັ່ງນັ້ນ, ຖືວ່າເປັນສ່ວນປະກອບ
ຈໍານວນຂອງຄູ່ພື້ນຖານ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 0.0.
--query-unk-mismatch=INT
ຈະນັບຕົວອັກສອນທີ່ບໍ່ຮູ້ຈັກ (N) ໃນການສອບຖາມເປັນບໍ່ກົງກັນ (0=ບໍ່ (ຄ່າເລີ່ມຕົ້ນ),
1=ແມ່ນ)
--genome-unk-mismatch=INT
ຈະນັບຕົວອັກສອນທີ່ບໍ່ຮູ້ຈັກ (N) ໃນ genome ເປັນບໍ່ກົງກັນ (0=no, 1=yes
(ຄ່າເລີ່ມຕົ້ນ))
--ຄົ້ນຫາສູງສຸດ=INT
ຈໍານວນສູງສຸດຂອງການຈັດວາງເພື່ອຊອກຫາ (ຄ່າເລີ່ມຕົ້ນ 1000). ຕ້ອງໃຫຍ່ກວ່າ --npaths,
ຊຶ່ງເປັນຕົວເລກທີ່ຈະລາຍງານ. ການຮັກສາຕົວເລກນີ້ໃຫ້ໃຫຍ່ຈະອະນຸຍາດໃຫ້ສໍາລັບການສຸ່ມ
ການຄັດເລືອກລະຫວ່າງຫຼາຍການຈັດຕໍາແຫນ່ງ. ການຫຼຸດຜ່ອນຈໍານວນນີ້ສາມາດເລັ່ງການ
ໂຄງການ.
-i, --indel-ການລົງໂທດ=INT
ການລົງໂທດສໍາລັບ indel (ຄ່າເລີ່ມຕົ້ນ 2). ອະນຸຍາດໃຫ້ນັບບໍ່ກົງກັນ. ຊອກຫາ
indels, ເຮັດໃຫ້ການລົງໂທດ indel ໜ້ອຍກວ່າ ຫຼືເທົ່າກັບ max-mismatch. ຄ່າ < 2 ສາມາດ
ນໍາໄປສູ່ການບວກທີ່ບໍ່ຖືກຕ້ອງໃນຕອນທ້າຍຂອງການອ່ານ
--indel-endlength=INT
ຄວາມຍາວຂັ້ນຕອນທ້າຍຕ້ອງການສໍາລັບການຈັດຕັ້ງ indel (ຄ່າເລີ່ມຕົ້ນ 4)
-y, --max-middle-insertions=INT
ຈໍານວນສູງສຸດຂອງການແຊກໃສ່ກາງທີ່ອະນຸຍາດໃຫ້ (ຄ່າເລີ່ມຕົ້ນ 9)
-z, --max-middle-deletions=INT ຈໍານວນສູງສຸດຂອງການລົບກາງທີ່ອະນຸຍາດໃຫ້ (ຄ່າເລີ່ມຕົ້ນ 30)
-Y, --max-end-insertions=INT
ຈໍານວນສູງສຸດຂອງການແຊກທ້າຍອະນຸຍາດໃຫ້ (ຄ່າເລີ່ມຕົ້ນ 3)
-Z, --max-end-ລຶບ=INT
ຈໍານວນສູງສຸດຂອງການລົບສຸດທ້າຍອະນຸຍາດໃຫ້ (ຄ່າເລີ່ມຕົ້ນ 6)
-M, -- ລະດັບທີ່ເໝາະສົມ=INT
ລາຍງານການຕີທີ່ດີທີ່ສຸດເກີນການຕີທີ່ດີທີ່ສຸດ (ຄ່າເລີ່ມຕົ້ນ 0) hits ທັງຫມົດທີ່ມີຄະແນນດີທີ່ສຸດບວກ
ມີການລາຍງານລະດັບ suboptimal
-a, --adapter-strip=ຄັກ
ວິທີການຖອນຕົວດັດແປງຈາກການອ່ານ. ຄ່າທີ່ອະນຸຍາດໃນປັດຈຸບັນ: ປິດ, ຈັບຄູ່ແລ້ວ.
ຄ່າເລີ່ມຕົ້ນແມ່ນ "ປິດ". ເພື່ອເປີດ, ໃຫ້ລະບຸ "ຈັບຄູ່", ເຊິ່ງເອົາອະແດັບເຕີອອກຈາກ
paired-end ອ່ານຖ້າພວກມັນປະກົດວ່າມີຢູ່.
--trim-mismatch-score=INT
ຄະແນນທີ່ຈະນໍາໃຊ້ສໍາລັບການບໍ່ກົງກັນໃນເວລາທີ່ trimming ສຸດທ້າຍ (ຄ່າເລີ່ມຕົ້ນແມ່ນ -3; ປິດ
trimming, ລະບຸ 0). ຄຳເຕືອນ: ການປິດການຕັດຈະໃຫ້ຜົນບວກທີ່ບໍ່ຖືກຕ້ອງ
ບໍ່ກົງກັນໃນຕອນທ້າຍຂອງການອ່ານ
--trim-indel-ຄະແນນ=INT
ຄະແນນທີ່ຈະໃຊ້ສໍາລັບ indels ເມື່ອຕັດໃນຕອນທ້າຍ (ຄ່າເລີ່ມຕົ້ນແມ່ນ -2; ເພື່ອປິດການຕັດ,
ລະບຸ 0). ຄໍາເຕືອນ: ການປິດການຕັດຈະໃຫ້ indels ບວກທີ່ບໍ່ຖືກຕ້ອງຢູ່ທີ່
ສິ້ນສຸດການອ່ານ
-V, --snpsdir=ຄັກ
ໄດເລກະທໍລີສໍາລັບໄຟລ໌ດັດສະນີ SNPs (ສ້າງໂດຍໃຊ້ snpindex) (ຄ່າເລີ່ມຕົ້ນແມ່ນສະຖານທີ່ຂອງ
ໄຟລ໌ດັດຊະນີ genome ທີ່ລະບຸໂດຍໃຊ້ -D ແລະ -d)
-v, --use-snps=ຄັກ
ໃຊ້ຖານຂໍ້ມູນທີ່ມີ SNPs ທີ່ຮູ້ຈັກ (ໃນ .iit, ສ້າງຂຶ້ນໃນເມື່ອກ່ອນໂດຍໃຊ້
snpindex) ສໍາລັບຄວາມທົນທານຕໍ່ SNPs
--cmtdir=ຄັກ
ໄດເລກະທໍລີສໍາລັບໄຟລ໌ດັດສະນີ methylcytosine (ສ້າງໂດຍໃຊ້ cmetindex) (ຄ່າເລີ່ມຕົ້ນແມ່ນ
ສະຖານທີ່ຂອງໄຟລ໌ດັດຊະນີ genome ທີ່ລະບຸໂດຍໃຊ້ -D, -V, ແລະ -d)
--atoidir=ຄັກ
ໄດເລກະທໍລີສໍາລັບໄຟລ໌ດັດນີດັດແກ້ A-to-I RNA (ສ້າງໂດຍໃຊ້ atoiindex) (ຄ່າເລີ່ມຕົ້ນແມ່ນ
ສະຖານທີ່ຂອງໄຟລ໌ດັດຊະນີ genome ທີ່ລະບຸໂດຍໃຊ້ -D, -V, ແລະ -d)
--ໂໝດ=ຄັກ
ໂໝດການຈັດຮຽງ: ມາດຕະຖານ (ຄ່າເລີ່ມຕົ້ນ), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi-nonstranded, ttoc-stranded, ຫຼື ttoc-nonstranded. ໂໝດບໍ່ມາດຕະຖານຕ້ອງການ
ທ່ານໄດ້ດໍາເນີນໂຄງການ cmetindex ຫຼື atoiindex ກ່ອນຫນ້ານີ້ (ເຊິ່ງກວມເອົາ
ຮູບແບບ ttoc) ໃນ genome
-t, --nthreads=INT
ຈໍານວນຂອງກະທູ້ພະນັກງານ
ທາງເລືອກສໍາລັບການຈັດ GMAP ພາຍໃນ GSNAP
--gmap-mode=ຄັກ
ກໍລະນີທີ່ຈະໃຊ້ GMAP ສໍາລັບການຈັດຮຽງທີ່ຊັບຊ້ອນທີ່ປະກອບດ້ວຍຫຼາຍ splices ຫຼື indels
ຄ່າທີ່ອະນຸຍາດ: none, all, pairsearch, indel_knownsplice, terminal, ປັບປຸງ
(ຫຼືຫຼາຍຄ່າ, ແຍກດ້ວຍເຄື່ອງໝາຍຈຸດ).
ຄ່າເລີ່ມຕົ້ນ: ທັງໝົດ, ເຊັ່ນ, ການຄົ້ນຫາຄູ່, indel_knownsplice, terminal, ປັບປຸງ
--trigger-score-for-gmap=INT
ລອງຊອກຫາຄູ່ GMAP ຢູ່ໃນເຂດ genomic ໃກ້ຄຽງຖ້າຄະແນນທີ່ດີທີ່ສຸດ (ລວມຂອງທັງສອງປາຍ
ຖ້າ paired-end) ເກີນຄ່ານີ້ (ຄ່າເລີ່ມຕົ້ນ 5)
--gmap-min-match-length=INT
ຮັກສາ GMAP ຕີພຽງແຕ່ຖ້າມັນມີການແຂ່ງຂັນຫຼາຍອັນນີ້ (ຄ່າເລີ່ມຕົ້ນ 20)
--gmap-ເງິນອຸດໜູນ=INT
ຄະແນນບໍ່ກົງກັນພິເສດ/indel ອະນຸຍາດໃຫ້ຈັດຮຽງ GMAP (ຄ່າເລີ່ມຕົ້ນ 3)
--max-gmap-pairsearch=INT
ດໍາເນີນການຄົ້ນຫາຄູ່ GMAP ໃນພາກພື້ນ genomic ໃກ້ຄຽງເຖິງຜູ້ສະຫມັກຈໍານວນຫຼາຍນີ້
ສິ້ນສຸດ (ຄ່າເລີ່ມຕົ້ນ 50). ຕ້ອງການຄູ່ຄົ້ນຫາໃນ --gmap-mode
--max-gmap-terminal=INT
ປະຕິບັດ GMAP terminal ໃນພາກພື້ນ genomic ໃກ້ຄຽງຈົນກ່ວາຜູ້ສະຫມັກຈໍານວນຫຼາຍນີ້ສິ້ນສຸດລົງ
(ຄ່າເລີ່ມຕົ້ນ 50). ຕ້ອງການ terminal ໃນ --gmap-mode
--max-gmap-ປັບປຸງ=INT
ດໍາເນີນການປັບປຸງ GMAP ໃນພາກພື້ນ genomic ໃກ້ຄຽງຈົນກ່ວາຜູ້ສະຫມັກຈໍານວນຫຼາຍນີ້ສິ້ນສຸດລົງ
(ຄ່າເລີ່ມຕົ້ນ 5). ຮຽກຮ້ອງໃຫ້ມີການປັບປຸງໃນ --gmap-mode
--microexon-spliceprob=ລູກລອຍ
ອະນຸຍາດໃຫ້ microexons ພຽງແຕ່ຖ້າຫາກວ່າຄວາມເປັນໄປໄດ້ຂອງເວັບໄຊ splice ມີຫຼາຍກ່ວານີ້
ຄ່າ (ຄ່າເລີ່ມຕົ້ນ 0.95)
ທາງເລືອກການເຊື່ອມຕໍ່ສໍາລັບ DNA-Seq
--find-dna-chimeras=INT
ຊອກຫາ splicing ຫ່າງໄກໃນຂໍ້ມູນ DNA-Seq (0=no (ຄ່າເລີ່ມຕົ້ນ), 1=yes) ອັດຕະໂນມັດ
inactivated ສໍາລັບຂໍ້ມູນ RNA-Seq ຖ້າ -N or -s ໄດ້ລະບຸໄວ້)
ທາງເລືອກການເຊື່ອມຕໍ່ສໍາລັບ RNA-Seq
-N, --novelsplicing=INT
ຊອກຫາ splicing ນິຍາຍ (0=no (ຄ່າເລີ່ມຕົ້ນ), 1=yes)
--splingdir=ຄັກ
ໄດເລກະທໍລີສໍາລັບ splicing ທີ່ກ່ຽວຂ້ອງກັບສະຖານທີ່ທີ່ຮູ້ຈັກຫຼື introns ຮູ້ຈັກ, ຕາມທີ່ລະບຸໄວ້ໂດຍ
-s or -- use-spling ທຸງ (ຄ່າເລີ່ມຕົ້ນແມ່ນໄດເລກະທໍລີທີ່ຄິດໄລ່ຈາກ -D ແລະ -d ທຸງ).
ຫມາຍເຫດ: ພຽງແຕ່ສາມາດໃຫ້ຊື່ເສັ້ນທາງເຕັມທີ່ -s ທຸງແທນ.
-s, -- use-spling=ຄັກ
ຊອກຫາ splicing ທີ່ກ່ຽວຂ້ອງກັບສະຖານທີ່ທີ່ຮູ້ຈັກຫຼື introns ຮູ້ຈັກ (ໃນ .iit), ຢູ່ທີ່
ໄລຍະທາງສັ້ນ ຫຼືທາງໄກ ເບິ່ງຄໍາແນະນໍາ README ສໍາລັບຄວາມແຕກຕ່າງລະຫວ່າງທີ່ຮູ້ຈັກ
ສະຖານທີ່ແລະ intros ຮູ້ຈັກ
--ambig-splice-noclip
ສໍາລັບການ splicing ທີ່ຮູ້ຈັກບໍ່ຊັດເຈນໃນຕອນທ້າຍຂອງການອ່ານ, ຢ່າ clip ຢູ່ໃນສະຖານທີ່ splice,
ແຕ່ຂະຫຍາຍເຂົ້າໄປໃນ intro. ທຸງນີ້ເຮັດໃຫ້ຄວາມຮູ້ສຶກພຽງແຕ່ຖ້າຫາກວ່າທ່ານສະຫນອງການ
-- use-spling ທຸງ, ແລະທ່ານກໍາລັງພະຍາຍາມທີ່ຈະລົບລ້າງທັງຫມົດ clipping ອ່ອນກັບ
--trim-mismatch-score=0
-w, -- localsplicedist=INT
ຄໍານິຍາມຂອງເຫດການ splicing ນະວະນິຍາຍທ້ອງຖິ່ນ (ຄ່າເລີ່ມຕົ້ນ 200000)
--novelend-splicedist=INT
ໄລຍະທາງເພື່ອຊອກຫາ splices ນະວະນິຍາຍໃນຕອນທ້າຍຂອງການອ່ານ (ຄ່າເລີ່ມຕົ້ນ 50000)
-e, --local-splice-ການລົງໂທດ=INT
ການລົງໂທດສໍາລັບ splice ທ້ອງຖິ່ນ (ຄ່າເລີ່ມຕົ້ນ 0). ອະນຸຍາດໃຫ້ນັບບໍ່ກົງກັນ
-E, --distant-splice-ການລົງໂທດ=INT
ການລົງໂທດສໍາລັບການ splice ຫ່າງໄກ (ຄ່າເລີ່ມຕົ້ນ 1). A splice ຫ່າງໄກແມ່ນຫນຶ່ງບ່ອນທີ່ intron ໄດ້
ຄວາມຍາວເກີນມູນຄ່າຂອງ -w, ຫຼື -- localsplicedist, ຫຼືແມ່ນການປີ້ນກັນ, scramble,
ຫຼືການໂອນຍ້າຍລະຫວ່າງສອງໂຄໂມໂຊມທີ່ແຕກຕ່າງນັບບໍ່ກົງກັນ
ອະນຸຍາດໃຫ້
-K, --distant-splice-endlength=INT
ຄວາມຍາວຕໍາ່ສຸດທີ່ຕ້ອງໃຊ້ສໍາລັບການຈັດລຽງ spliced ຫ່າງໄກ (ຄ່າເລີ່ມຕົ້ນ 20, min
ອະນຸຍາດແມ່ນມູນຄ່າຂອງ -k, ຫຼືຂະຫນາດ kmer)
-l, --shortend-splice-endlength=INT
ຄວາມຍາວຂັ້ນຕອນສຸດທ້າຍຕ້ອງການສໍາລັບການຈັດຕໍາແຫນ່ງ spliced ປາຍສັ້ນ (ຄ່າເລີ່ມຕົ້ນ 2, ແຕ່ວ່າ
ເວັ້ນເສຍແຕ່ວ່າສະຖານທີ່ splice ທີ່ຮູ້ຈັກແມ່ນສະຫນອງໃຫ້ກັບ -s ທຸງ, GSNAP ອາດຈະຍັງຕ້ອງການ
ຄວາມຍາວທ້າຍເປັນມູນຄ່າຂອງ -k, ຫຼືຂະຫນາດ kmer ເພື່ອຊອກຫາ splice ທີ່ໃຫ້
--distant-splice-identity=ລູກລອຍ
ການລະບຸຕົວຕົນຂັ້ນຕ່ຳຢູ່ທ້າຍທີ່ຕ້ອງການສຳລັບການຈັດຮຽງທີ່ຫ່າງໆ (ຄ່າເລີ່ມຕົ້ນ 0.95)
--antistranded-ການລົງໂທດ=INT
(ບໍ່ໄດ້ປະຕິບັດໃນປັດຈຸບັນ, ເນື່ອງຈາກວ່າມັນນໍາໄປສູ່ຜົນໄດ້ຮັບທີ່ບໍ່ດີ) ການລົງໂທດສໍາລັບ
antistranded splicing ເມື່ອໃຊ້ stranded RNA-Seq protocols. ມູນຄ່າທາງບວກ,
ເຊັ່ນ: 1, ຄາດຫວັງວ່າ antisense ໃນການອ່ານຄັ້ງທໍາອິດແລະຄວາມຮູ້ສຶກກ່ຽວກັບການອ່ານຄັ້ງທີສອງ.
ຄ່າເລີ່ມຕົ້ນແມ່ນ 0, ເຊິ່ງປະຕິບັດຕໍ່ຄວາມຮູ້ສຶກ ແລະ ຄວາມຕ້ານທານໄດ້ດີເທົ່າທຽມກັນ
--merge-distant-samechr
ລາຍງານ splices ຫ່າງໄກຢູ່ໃນໂຄໂມໂຊມດຽວກັນເປັນ splice ດຽວ, ຖ້າເປັນໄປໄດ້.
ຈະຜະລິດສາຍ SAM ດຽວແທນທີ່ຈະເປັນສອງສາຍ SAM, ເຊິ່ງຍັງເຮັດສໍາລັບ
ການປ່ຽນສະຖານທີ່, ການປີ້ນ, ແລະເຫດການຂູດຮີດ
ຕົວເລືອກສຳລັບການອ່ານແບບຄູ່
--pairmax-dna=INT
ຄວາມຍາວຂອງພັນທຸກໍາສູງສຸດສໍາລັບການອ່ານຄູ່ DNA-Seq, ຫຼືອ່ານອື່ນໆໂດຍບໍ່ມີການ splicing
(ຄ່າເລີ່ມຕົ້ນ 1000). ໃຊ້ຖ້າ -N or -s ບໍ່ໄດ້ລະບຸ.
--pairmax-rna=INT
ຄວາມຍາວທັງໝົດຂອງ genomic ສູງສຸດສໍາລັບການອ່ານຄູ່ RNA-Seq, ຫຼືການອ່ານອື່ນໆທີ່ສາມາດມີ a
splic (ຄ່າເລີ່ມຕົ້ນ 200000). ໃຊ້ຖ້າ -N or -s ຖືກກໍານົດ. ອາດຈະກົງກັບ
ມູນຄ່າສໍາລັບ -w, -- localsplicedist.
--ຄູ່ຄາດຫວັງ=INT
ຄວາມຍາວຂອງຄູ່ປາຍທີ່ຄາດໄວ້, ໃຊ້ສໍາລັບການໂທຫາ splices ຢູ່ໃນສ່ວນກາງຂອງ paired-end
ອ່ານ (ຄ່າເລີ່ມຕົ້ນ 200). ຖືກປິດໃນສະບັບກ່ອນຫນ້າ, ແຕ່ໄດ້ຟື້ນຟູຄືນໃຫມ່.
--ຄູ່=INT
ການບ່ຽງເບນທີ່ອະນຸຍາດຈາກຄວາມຍາວຂອງຄູ່ທີ່ຄາດໄວ້, ໃຊ້ສໍາລັບການເອີ້ນ splices ໃນ
ສ່ວນກາງຂອງການອ່ານແບບຄູ່ (ຄ່າເລີ່ມຕົ້ນ 100). ໄດ້ຖືກປິດໃນເມື່ອກ່ອນ
ສະບັບ, ແຕ່ໄດ້ຟື້ນຟູ.
ທາງເລືອກສໍາລັບຄະແນນທີ່ມີຄຸນນະພາບ
--quality-protocol=ຄັກ
ອະນຸສັນຍາສຳລັບຄະແນນຄຸນນະພາບການປ້ອນຂໍ້ມູນ. ຄ່າທີ່ອະນຸຍາດ: illumina (ASCII 64-126)
(ທຽບເທົ່າກັບ -J 64 -j -31) sanger (ASCII 33-126) (ທຽບເທົ່າກັບ -J 33 -j 0)
ຄ່າເລີ່ມຕົ້ນແມ່ນ sanger (ບໍ່ມີການປ່ຽນການພິມທີ່ມີຄຸນນະພາບ)
ໄຟລ໌ຜົນຜະລິດ SAM ຄວນມີຄະແນນທີ່ມີຄຸນນະພາບໃນ sanger protocol
ຫຼືທ່ານສາມາດປັບແຕ່ງພຶດຕິກໍານີ້ດ້ວຍທຸງເຫຼົ່ານີ້:
-J, --quality-ສູນ-ຄະແນນ=INT
ຄະແນນຄຸນນະພາບ FASTQ ແມ່ນສູນຢູ່ທີ່ຄ່າ ASCII ນີ້ (ຄ່າເລີ່ມຕົ້ນແມ່ນ 33 ສໍາລັບນັກຮ້ອງ
ພິທີການ; ສໍາລັບ Illumina, ເລືອກ 64)
-j, --quality-print-shift=INT
Shift ຄະແນນຄຸນນະພາບ FASTQ ໂດຍຈໍານວນນີ້ຢູ່ໃນຜົນຜະລິດ (ຄ່າເລີ່ມຕົ້ນແມ່ນ 0 ສໍາລັບ sanger
ພິທີການ; ເພື່ອປ່ຽນການປ້ອນຂໍ້ມູນ Illumina ເປັນຜົນຜະລິດ Sanger, ເລືອກ -31)
ຕົວເລືອກຜົນໄດ້ຮັບ
-n, --npaths=INT
ຈໍານວນເສັ້ນທາງສູງສຸດທີ່ຈະພິມ (ຄ່າເລີ່ມຕົ້ນ 100).
-Q, --ງຽບ-ຖ້າ-ຫຼາຍເກີນໄປ
ຖ້າພົບເຫັນຫຼາຍກວ່າຈໍານວນເສັ້ນທາງສູງສຸດ, ຫຼັງຈາກນັ້ນບໍ່ມີຫຍັງຖືກພິມ.
-O, --ສັ່ງ
ພິມຜົນຜະລິດໃນລໍາດັບດຽວກັນກັບການປ້ອນຂໍ້ມູນ (ທີ່ກ່ຽວຂ້ອງພຽງແຕ່ຖ້າມີພະນັກງານຫຼາຍກວ່າຫນຶ່ງຄົນ
ກະທູ້)
--show-refdiff
ສໍາລັບຜົນຜະລິດ GSNAP ໃນການຈັດຕໍາແຫນ່ງທີ່ທົນທານຕໍ່ SNP, ສະແດງໃຫ້ເຫັນຄວາມແຕກຕ່າງທັງຫມົດທີ່ກ່ຽວຂ້ອງກັບ
genome ອ້າງອີງເປັນກໍລະນີຕ່ໍາ (ຖ້າບໍ່ດັ່ງນັ້ນ, ມັນສະແດງໃຫ້ເຫັນຄວາມແຕກຕ່າງທັງຫມົດທີ່ກ່ຽວຂ້ອງກັບ
ທັງການອ້າງອີງແລະ genome ສະຫຼັບ)
--clip-overlap
ສໍາລັບການອ່ານຄູ່ທ້າຍທີ່ມີການຈັດວາງທັບຊ້ອນ, clip ພາກພື້ນທີ່ທັບຊ້ອນ.
--merge-ທັບຊ້ອນ
ສໍາລັບການອ່ານຄູ່ທ້າຍທີ່ການຈັດວາງທັບຊ້ອນກັນ, ຮວມທັງສອງປາຍເຂົ້າໄປໃນປາຍດຽວ
(ການປະຕິບັດ beta)
--print-snps
ພິມຂໍ້ມູນລະອຽດກ່ຽວກັບ SNPs ໃນການອ່ານ (ເຮັດວຽກພຽງແຕ່ຖ້າ -v ຍັງໄດ້ເລືອກ)
(ຍັງບໍ່ໄດ້ປະຕິບັດຢ່າງເຕັມທີ່)
-- ລົ້ມເຫລວ
ພິມພຽງແຕ່ການຈັດລໍາດັບທີ່ລົ້ມເຫລວ, ທີ່ບໍ່ມີຜົນໄດ້ຮັບ
--nofails
ບໍ່ລວມການພິມການຈັດຮຽງທີ່ລົ້ມເຫລວ
-A, -- ຮູບແບບ=ຄັກ
ປະເພດຮູບແບບອື່ນ, ນອກເຫນືອຈາກຄ່າເລີ່ມຕົ້ນ. ປະຈຸບັນປະຕິບັດ: sam, m8 (BLAST
ຮູບແບບຕາຕະລາງ)
--split-output=ຄັກ
ຊື່ພື້ນຖານສໍາລັບການສົ່ງອອກຫຼາຍໄຟລ໌, ແຍກຕ່າງຫາກສໍາລັບການຕັ້ງຊື່, halfmapping_uniq,
halfmapping_mult, unpaired_uniq, unpaired_mult, paired_uniq, paired_mult,
concordant_uniq, ແລະຜົນໄດ້ຮັບ concordant_mult
-o, --output-file=ຄັກ
ຊື່ໄຟລ໌ສໍາລັບຜົນໄດ້ຮັບການຖ່າຍທອດອັນດຽວ.
--failed-input=ຄັກ
ພິມການຈັດຮຽງທີ່ລົ້ມເຫລວຢ່າງສິ້ນເຊີງເປັນການປ້ອນ FASTA ຫຼື FASTQ ຮູບແບບ, ໃສ່ທີ່ໃຫ້
ໄຟລ໌, ຕໍ່ທ້າຍ .1 ຫຼື .2, ສໍາລັບຂໍ້ມູນຄູ່. ຖ້າ --split-output ທຸງຍັງ
ໃຫ້, ໄຟລ໌ນີ້ຖືກສ້າງຂຶ້ນນອກຈາກຜົນຜະລິດໃນໄຟລ໌ .nomapping.
--append-output
ເມື່ອໃດ --split-output or --failed-input ແມ່ນໃຫ້, ທຸງນີ້ຈະເພີ່ມຜົນຜະລິດເຂົ້າໃສ່
ໄຟລ໌ທີ່ມີຢູ່. ຖ້າບໍ່ດັ່ງນັ້ນ, ຄ່າເລີ່ມຕົ້ນແມ່ນການສ້າງໄຟລ໌ໃຫມ່.
--order-ໃນບັນດາ-ທີ່ດີທີ່ສຸດ=ຄັກ
ໃນບັນດາການຈັດລຽງລໍາດັບທີ່ຕິດກັບຄະແນນທີ່ດີທີ່ສຸດ, ໃຫ້ຄໍາສັ່ງທີ່ສອດຄ້ອງກັນໃນຄໍາສັ່ງນີ້.
ຄ່າທີ່ອະນຸຍາດ: genomic, Random (ຄ່າເລີ່ມຕົ້ນ)
--output-buffer-size=INT
ຂະຫນາດຂອງບັຟເຟີ, ໃນການສອບຖາມ, ສໍາລັບຫົວຂໍ້ຜົນຜະລິດ (ຄ່າເລີ່ມຕົ້ນ 1000). ໃນເວລາທີ່ຈໍານວນຂອງ
ຜົນໄດ້ຮັບທີ່ຈະພິມເກີນຂະຫນາດນີ້, ກະທູ້ຂອງພະນັກງານໄດ້ຖືກຢຸດເຊົາຈົນກ່ວາ
Backlog ຖືກລຶບລ້າງແລ້ວ
ທາງເລືອກສໍາລັບຜົນຜະລິດ SAM
--no-sam-headers
ຢ່າພິມສ່ວນຫົວທີ່ເລີ່ມຕົ້ນດ້ວຍ '@'
--add-paired-nomappers
ເພີ່ມແຖວນາມສະກຸນຕາມຄວາມຕ້ອງການເພື່ອເຮັດໃຫ້ຜົນທີ່ຈັບຄູ່-ທ້າຍທັງໝົດສະລັບກັນລະຫວ່າງທຳອິດ
ທ້າຍແລະທີ່ສຸດທີ່ສອງ
--paired-flag-ຫມາຍຄວາມວ່າ-concordant=INT
ບໍ່ວ່າຈະເປັນບິດທີ່ຈັບຄູ່ຢູ່ໃນທຸງ SAM ຫມາຍເຖິງຄວາມສອດຄ່ອງກັນເທົ່ານັ້ນ (1) ຫຼືຄູ່ບວກ
ຄວາມສອດຄ່ອງ (0, ຄ່າເລີ່ມຕົ້ນ)
--sam-headers-batch=INT
ສ່ວນຫົວພິມສຳລັບຊຸດນີ້ເທົ່ານັ້ນ, ຕາມທີ່ລະບຸໄວ້ -q
--sam-use-0M
ແຊກ 0M ໃນ CIGAR ລະຫວ່າງການແຊກທີ່ຕິດກັນ ແລະການລຶບທີ່ຕ້ອງການໂດຍ Picard,
ແຕ່ສາມາດເຮັດໃຫ້ເກີດຄວາມຜິດພາດໃນເຄື່ອງມືອື່ນໆ
--sam-multiple-primaries
ອະນຸຍາດໃຫ້ການຈັດຮຽງຫຼາຍອັນຖືກໝາຍເປັນຫຼັກ ຖ້າພວກມັນມີດີເທົ່າກັນ
ຄະແນນແຜນທີ່
--force-xs-dir
ສຳລັບການຈັດຮຽງ RNA-Seq, ບໍ່ອະນຸຍາດ XS:A:? ໃນເວລາທີ່ທິດທາງຄວາມຮູ້ສຶກແມ່ນບໍ່ຈະແຈ້ງ, ແລະ
ປ່ຽນແທນຄ່ານີ້ດ້ວຍ XS:A:+. ອາດຈະເປັນປະໂຫຍດສໍາລັບບາງໂຄງການ, ເຊັ່ນ
ເປັນ Cufflinks, ທີ່ບໍ່ສາມາດຈັດການກັບ XS:A:?. ຢ່າງໃດກໍຕາມ, ຖ້າທ່ານໃຊ້ທຸງນີ້,
ມູນຄ່າລາຍງານຂອງ XS:A:+ ໃນກໍລະນີເຫຼົ່ານີ້ຈະບໍ່ມີຄວາມຫມາຍ.
--md-ຕົວພິມນ້ອຍ-snp
ໃນ MD string, ເມື່ອ SNPs ທີ່ຮູ້ຈັກແມ່ນໃຫ້ໂດຍ -v ທຸງ, ຄວາມແຕກຕ່າງຂອງການພິມ
nucleotides ເປັນຕົວພິມນ້ອຍເມື່ອພວກມັນ, ແຕກຕ່າງຈາກການອ້າງອີງແຕ່ກົງກັບທີ່ຮູ້ຈັກ
allele ສະຫຼັບ
--extend-soft-clips
ຂະຫຍາຍການຈັດຮຽງຜ່ານພື້ນທີ່ຕັດທີ່ອ່ອນໆ
--action-if-cigar-error
ການປະຕິບັດທີ່ຈະປະຕິບັດຖ້າຫາກວ່າມີຄວາມຂັດແຍ້ງລະຫວ່າງຄວາມຍາວ CIGAR ແລະຄວາມຍາວລໍາດັບ
ຄ່າທີ່ອະນຸຍາດ: ບໍ່ສົນໃຈ, ເຕືອນ, noprint (ຄ່າເລີ່ມຕົ້ນ), ຍົກເລີກ
--read-group-id=ຄັກ
ຄ່າທີ່ຈະໃສ່ໃນຊ່ອງ read-group id (RG-ID).
--read-group-name=ຄັກ
ຄ່າທີ່ຈະໃສ່ໃນຊ່ອງອ່ານຊື່ກຸ່ມ (RG-SM).
--read-group-library=ຄັກ
ຄ່າທີ່ຈະໃສ່ໃນຫ້ອງສະໝຸດກຸ່ມອ່ານ (RG-LB).
--read-group-platform=ຄັກ
ຄ່າທີ່ຈະໃສ່ໃນຫ້ອງສະໝຸດກຸ່ມອ່ານ (RG-PL).
ທາງເລືອກການຊ່ວຍເຫຼືອ
--ກວດສອບ
ກວດເບິ່ງສົມມຸດຕິຖານຂອງ compiler
- ການປ່ຽນແປງ
ສະແດງໃຫ້ເຫັນສະບັບ
- ຊ່ວຍ ສະແດງຂໍ້ຄວາມຊ່ວຍເຫຼືອນີ້
ເຄື່ອງມືອື່ນໆຂອງຊຸດ GMAP ແມ່ນຢູ່ໃນ /usr/lib/gmap
ໃຊ້ gsnap ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net