ນີ້ແມ່ນຄໍາສັ່ງ pbalign ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
pbalign - ການສ້າງແຜນທີ່ລໍາດັບ PacBio ກັບການອ້າງອີງ
ລາຍລະອຽດ
ການນໍາໃຊ້: pbalign [-h] [--verbose] [--version] [--profile] [--debug]
[--regionTable REGIONTABLE] [--configFile CONFIGFILE] [--pulseFile PULSEFILE]
[--algorithm {blasr, bowtie, gmap}] [--maxHits MAXHITS] [--minAnchorSize
MINANCHORSIZE] [--useccs {useccs,useccsall,useccsdenovo}] [--noSplitSubreads]
[--concordant] [--nproc NPROC] [--algorithmOptions ALGORITHMOPTIONS]
[--maxDivergence MAXDIVERGENCE] [--minaccuracy MINACCURACY] [--minLength MINLENGTH]
[--scoreFunction {alignerscore,editdist,blasrscore}] [--scoreCutoff SCORECUTOFF]
[--hitPolicy {randombest,allbest,random,all,leftmost}] [--filterAdapterOnly]
[--forQuiver] [--loadQVs] [--byread] [--metrics METRICS] [--seed SEED] [--tmpDir
TMPDIR] inputFileName referencePath outputFileName
ການສ້າງແຜນທີ່ PacBio ລໍາດັບການອ້າງອີງໂດຍໃຊ້ສູດການຄິດໄລ່ທີ່ເລືອກຈາກການຄັດເລືອກ
ຮອງຮັບລະບົບການຈັດຮຽງແຖວຄຳສັ່ງ. ການປ້ອນຂໍ້ມູນສາມາດເປັນ fasta, pls.h5, bas.h5 ຫຼື
ccs.h5 ໄຟລ໌ຫຼື fofn (ໄຟລ໌ຊື່ໄຟລ໌). ຜົນຜະລິດແມ່ນຢູ່ໃນຮູບແບບ cmp.h5 ຫຼື sam.
ຕຳ ແໜ່ງ ການໂຕ້ຖຽງ:
inputFileName
ໄຟລ໌ປ້ອນຂໍ້ມູນສາມາດເປັນໄຟລ໌ fasta, plx.h5, bax.h5, ccs.h5 ຫຼື fofn.
ເສັ້ນທາງອ້າງອີງ
ບໍ່ວ່າຈະເປັນໄຟລ໌ fasta ອ້າງອີງ ຫຼືບ່ອນເກັບຂໍ້ມູນອ້າງອີງ.
outputFileName
ຜົນຜະລິດ cmp.h5 ຫຼືໄຟລ໌ sam.
ທາງເລືອກ ການໂຕ້ຖຽງ:
-h, - ຊ່ວຍ
ສະແດງຂໍ້ຄວາມຊ່ວຍເຫຼືອນີ້ ແລະອອກ
-- verbose, -v
ກໍານົດລະດັບ verbosity
- ການປ່ຽນແປງ
ສະແດງຕົວເລກສະບັບຂອງໂຄງການແລະອອກ
--ໂປຣໄຟລ໌
ພິມໂປຣໄຟລ໌ເວລາແລ່ນຢູ່ທາງອອກ
--debug
ຈັບຂໍ້ຍົກເວັ້ນໃນ debugger (ຕ້ອງການ ipdb)
--ຕາຕະລາງພາກພື້ນ ພາກພື້ນ
ລະບຸຕາຕະລາງພາກພື້ນສໍາລັບການກັ່ນຕອງການອ່ານ.
--configFile ຕັ້ງຄ່າ
ລະບຸຊຸດຂອງຄ່າ argument ທີ່ກໍານົດໂດຍຜູ້ໃຊ້.
--pulseFile PULSEFILE
ເມື່ອການປ້ອນຂໍ້ມູນອ່ານຢູ່ໃນຮູບແບບ fasta ແລະຜົນຜະລິດແມ່ນ cmp.h5 ທາງເລືອກນີ້ສາມາດລະບຸໄດ້
pls.h5 ຫຼື bas.h5 ຫຼື FOFN ໄຟລ໌ທີ່ວັດແທກກໍາມະຈອນສາມາດໂຫຼດໄດ້ສໍາລັບ Quiver.
-- ສູດການຄິດໄລ່ { blasr, bowtie, gmap}
ເລືອກອັນໜຶ່ງຈາກ ('blasr', ' bowtie', 'gmap'). ສູດການຄິດໄລ່ເລີ່ມຕົ້ນແມ່ນ blasr.
--maxHits MAXHITS
ຈໍານວນສູງສຸດຂອງການແຂ່ງຂັນຂອງແຕ່ລະຄົນທີ່ອ່ານກັບລໍາດັບການອ້າງອີງທີ່ຈະເປັນ
ການປະເມີນຜົນ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 10.
--minAnchorSize MINANCHORSIZE
ຂະໜາດສະມໍຕ່ຳສຸດກຳນົດຄວາມຍາວຂອງການອ່ານທີ່ຕ້ອງກົງກັບ
ລໍາດັບອ້າງອີງ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 12.
--useccs {useccs,useccsall,useccsdenovo}
ແຜນທີ່ ccsSequence ກັບ genome ທໍາອິດ, ຫຼັງຈາກນັ້ນຈັດລໍາດັບ subreads ກັບໄລຍະຫ່າງນັ້ນ
CCS ອ່ານແຜນທີ່.
useccs: ພຽງແຕ່ແຜນທີ່ຍ່ອຍທີ່ຂະຫຍາຍຄວາມຍາວຂອງ
ແມ່ແບບ.
useccsall: ແຜນທີ່ການອ່ານຍ່ອຍທັງໝົດ.
useccsdenovo: ແຜນທີ່ ccs ເທົ່ານັ້ນ.
--noSplitSubreads
ຢ່າແຍກການອ່ານອອກເປັນ subreads ເຖິງແມ່ນວ່າມີພື້ນທີ່ການອ່ານຍ່ອຍ. ຄ່າເລີ່ມຕົ້ນ
ຄ່າແມ່ນບໍ່ຖືກຕ້ອງ.
--ສອດຄ່ອງ
ແຜນທີ່ຍ່ອຍຍ່ອຍຂອງ ZMW ໄປຫາສະຖານທີ່ genomic ດຽວກັນ.
--nproc NPROC
ຈໍານວນຂອງກະທູ້. ຄ່າເລີ່ມຕົ້ນແມ່ນ 8.
--algorithmOptions ALGORITHMOPTIONS
ຜ່ານທາງເລືອກການຈັດຕໍາແຫນ່ງຜ່ານ.
--maxDivergence MAXDIVERGENCE
ຄວາມແຕກຕ່າງເປີເຊັນສູງສຸດທີ່ອະນຸຍາດໃຫ້ອ່ານຈາກລໍາດັບອ້າງອີງ.
ຄ່າເລີ່ມຕົ້ນແມ່ນ 30.
--minaccuracy MINACURACY
ຄວາມຖືກຕ້ອງຂອງອັດຕາສ່ວນຕໍ່າສຸດຂອງການຈັດຕໍາແຫນ່ງທີ່ຈະໄດ້ຮັບການປະເມີນ. ຄ່າເລີ່ມຕົ້ນ
ແມ່ນ 70.
-- ຄວາມຍາວນາທີ MINLENGTH
ຄວາມຍາວການອ່ານຕໍາ່ສຸດທີ່ຂອງການຈັດຕໍາແຫນ່ງທີ່ຈະໄດ້ຮັບການປະເມີນ. ຄ່າເລີ່ມຕົ້ນ
ແມ່ນ 50.
--scoreFunction {alignerscore,editdist,blsrscore}
ກໍານົດຫນ້າທີ່ຄະແນນສໍາລັບການປະເມີນການຈັດຕໍາແຫນ່ງ.
alignerscore : ຄະແນນຂອງ aligner ໃນແທັກ SAM 'as'.
editdist : ແກ້ໄຂໄລຍະຫ່າງລະຫວ່າງການອ່ານແລະການອ້າງອີງ. blasrscore : blasr ຂອງ
ຟັງຊັນຄະແນນເລີ່ມຕົ້ນ.
ຄ່າເລີ່ມຕົ້ນແມ່ນ alignerscore.
--ຄະແນນຕັດ SCORECUTOFF
ຄະແນນທີ່ບໍ່ດີທີ່ສຸດທີ່ຈະອອກການຈັດລໍາດັບ.
--hitPolicy {randombest,allbest,ສຸ່ມ,ທັງໝົດ,ຊ້າຍສຸດ}
ລະບຸນະໂຍບາຍສໍາລັບວິທີການປິ່ນປົວຫຼາຍຕີ
Random : ເລືອກການຕີແບບສຸ່ມ.
ທັງຫມົດ : ເລືອກ hits ທັງຫມົດ.
ດີທີ່ສຸດ
: ເລືອກທຸກຄະແນນທີ່ດີທີ່ສຸດ hits.
Randombest: ເລືອກການຕີແບບສຸ່ມຈາກການຕີຄະແນນດີທີ່ສຸດທັງໝົດ.
ຊ້າຍສຸດ: ເລືອກ hit ທີ່ມີຄະແນນທີ່ດີທີ່ສຸດແລະໄດ້
ການປະສານງານແຜນທີ່ນ້ອຍທີ່ສຸດໃນການອ້າງອີງໃດໆ.
ຄ່າເລີ່ມຕົ້ນແມ່ນແບບສຸ່ມທີ່ສຸດ.
--filterAdapterOnly
ຖ້າລະບຸໄວ້, ຢ່າລາຍງານການກົດດັນຂອງອະແດັບເຕີເທົ່ານັ້ນໂດຍໃຊ້ຄຳອະທິບາຍປະກອບທີ່ມີການອ້າງອີງ
entry
--forQuiver
ໄຟລ໌ cmp.h5 ຜົນຜະລິດທີ່ຈະຖືກຈັດຮຽງ, ໂຫຼດຂໍ້ມູນກໍາມະຈອນ QV, ແລະ
repacked, ດັ່ງນັ້ນມັນສາມາດໄດ້ຮັບການບໍລິໂພກໂດຍ quiver ໂດຍກົງ. ນີ້ຮຽກຮ້ອງໃຫ້ມີການປ້ອນຂໍ້ມູນ
ໄຟລ໌ທີ່ຈະຢູ່ໃນຮູບແບບ PacBio bas/pls.h5, ແລະ --useccs ຈະຕ້ອງບໍ່ມີ. ຄ່າເລີ່ມຕົ້ນແມ່ນ
ບໍ່ຖືກຕ້ອງ.
--loadQVs
ຄ້າຍຄືກັບ --forQuiver, ຄວາມແຕກຕ່າງພຽງແຕ່ວ່າ --useccs ສາມາດລະບຸໄດ້.
ຄ່າເລີ່ມຕົ້ນແມ່ນຜິດ.
--ອ່ານ
ໂຫຼດຂໍ້ມູນກໍາມະຈອນໂດຍໃຊ້ - ອ່ານ ທາງເລືອກແທນທີ່ຈະເປັນ -bymetric. ພຽງແຕ່ເຮັດວຽກໃນເວລາທີ່
--forQuiver or --loadQVs ຖືກກໍານົດ. ຄ່າເລີ່ມຕົ້ນແມ່ນຜິດ.
--metrics ມທ
ໂຫຼດຕົວຊີ້ວັດທີ່ລະບຸ (ລາຍການທີ່ຂັ້ນດ້ວຍເຄື່ອງໝາຍຈຸດ) ແທນການວັດແທກມາດຕະຖານ
ຕ້ອງການໂດຍ quiver. ທາງເລືອກນີ້ເຮັດວຽກພຽງແຕ່ເມື່ອ --forQuiver or --loadQVs ຖືກກໍານົດ.
ຄ່າເລີ່ມຕົ້ນ: ລຶບ QV, ລຶບແທັກ, ການແຊກ QV, ຮວມ QV, ການປ່ຽນແທນ QV
-- ແກ່ນ ແກ່ນ
ເລີ່ມຕົ້ນຕົວສ້າງຕົວເລກແບບສຸ່ມດ້ວຍຈຳນວນເຕັມທີ່ບໍ່ມີສູນ. Zero ຫມາຍຄວາມວ່າ
ເວລາລະບົບປະຈຸບັນຖືກນໍາໃຊ້. ຄ່າເລີ່ມຕົ້ນແມ່ນ 1.
--tmpDir TMPDIR
ລະບຸໄດເລກະທໍລີເພື່ອບັນທຶກໄຟລ໌ຊົ່ວຄາວ. ຄ່າເລີ່ມຕົ້ນແມ່ນ / ຮອຍຂີດຂ່ວນ.
ໃຊ້ pbalign ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net