ນີ້ແມ່ນຄໍາສັ່ງ meryl ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
meryl - ການນັບ kmer ໃນແລະນອກຂອງຫຼັກແລະຜົນປະໂຫຍດ
ສະຫຼຸບສັງລວມ
ການຄາດຄະເນ ຫນ່ວຍຄວາມຈໍາ ຄວາມຕ້ອງການ
ເມຣິລ -P -m kmersize [-c #] [-p] -s seq.fasta
ເມຣິລ -P -m kmersize [-c #] [-p] -n ສິນຄ້າ
ການກໍ່ສ້າງ a ຕາຕະລາງ
ເມຣິລ -B -m kmersize [-c #] [-p] [-v] [-f|-r|-C] [-L ເຫດການເລັກນ້ອຍ] [-U ສູງສຸດ]
[- ກະທູ້ n | {- ພາກສ່ວນ ສ່ວນ | - ຄວາມຊົງຈໍາ megabytes} [-configbatch [-sge ຊື່ວຽກ]]]
-s seq.fasta -o tblprefix
ເມຣິລ - ນັບຊຸດ ຈໍານວນ [-sgebuild "qsuboptionstring"] -o tblprefix
ເມຣິລ - ການລວມ ຈໍານວນ [- sgeerge "qsuboptionstring"] -o tblprefix
ການປະຕິບັດ ການດໍາເນີນງານ on a ຕາຕະລາງ
ເມຣິລ -M ປະຕິບັດງານ [-v] -s tblprefix [-s tblprefix2 ... ] -o output
Dumping a ຕາຕະລາງ
ເມຣິລ -Dh -s tblprefix
ເມຣິລ - ດທ -n ຈຳນວນໜ້ອຍ -s tblprefix
ລາຍລະອຽດ
ເມຣິລ ຄິດໄລ່ເນື້ອໃນ kmer ຂອງລໍາດັບ genomic. ເນື້ອຫາ Kmer ແມ່ນເປັນຕົວແທນເປັນ
ບັນຊີລາຍຊື່ຂອງ kmers ແລະຈໍານວນເວລາທີ່ແຕ່ລະຄົນເກີດຂື້ນໃນລໍາດັບການປ້ອນຂໍ້ມູນ. Kmer ສາມາດເປັນ
ຈຳກັດໃຫ້ສະເພາະແຕ່ກມເມີຣ໌, ກມເມີປີ້ນກັບເທົ່ານັ້ນ, ຫຼື ເຄເມີເມີຣ໌
(ເປັນ lexicographically ຂະຫນາດນ້ອຍກວ່າ kmer ຂ້າງຫນ້າແລະ reverse ໃນແຕ່ລະສະຖານທີ່). Meryl ສາມາດເຮັດໄດ້
ລາຍງານ histogram ຂອງການນັບ, ບັນຊີລາຍການຂອງ kmers ແລະການນັບຂອງເຂົາເຈົ້າ, ຫຼືສາມາດປະຕິບັດ
ຄະນິດສາດແລະກໍານົດການດໍາເນີນງານກ່ຽວກັບໄຟລ໌ຂໍ້ມູນການປຸງແຕ່ງ.
ຜົນໄດ້ຮັບຂອງ ເມຣິລ ແມ່ນສອງໄຟລ໌ສອງ, ເອີ້ນວ່າຖານຂໍ້ມູນ meryl, ເຊິ່ງສາມາດໄວໄດ້
dumped ເພື່ອສະຫນອງ histogram ຂອງການນັບ, ຫຼືການນັບຕົວຈິງ. ມີຫ້ອງສະໝຸດ C++ ໃຫ້
ສໍາລັບການເຂົ້າເຖິງໂດຍກົງກັບໄຟລ໌.
OPTIONS
-P ຄາດຄະເນຄວາມຕ້ອງການຄວາມຈໍາ. ໄດ້ຮັບໄຟລ໌ລໍາດັບ (-s) ຫຼືຂອບເຂດຈໍາກັດເທິງສຸດ
ຈໍານວນ mers ໃນໄຟລ໌ (-n), ຄິດໄລ່ຂະຫນາດຕາຕະລາງ (-t ໃນການກໍ່ສ້າງ) ເພື່ອຫຼຸດຜ່ອນ
ການນໍາໃຊ້ຄວາມຊົງຈໍາ. ໂໝດນີ້ຮັບຮູ້ຕົວເລືອກຕໍ່ໄປນີ້:
-m # ຂະຫນາດຂອງ mer (ຕ້ອງການ)
-c # ການບີບອັດ homopolymer (ທາງເລືອກ)
-p ເຮັດໃຫ້ຕໍາແຫນ່ງ
-s seq.fasta
ໄຟລ໌ລໍາດັບທີ່ຈະສະແກນເພື່ອກໍານົດຈໍານວນຂອງ mers
-n # compute params ສົມມຸດວ່າໄຟລ໌ທີ່ມີ mers ຈໍານວນຫຼາຍນີ້ຢູ່ໃນມັນ
ພຽງແຕ່ຫນຶ່ງຂອງ -s, -n ຈໍາເປັນຕ້ອງໄດ້ລະບຸໄວ້. ຖ້າທັງສອງແມ່ນໃຫ້, -s ໃຊ້ເວລາບູລິມະສິດ.
-B ຄິດໄລ່ຕາຕະລາງການນັບຈໍານວນທີ່ໃຫ້ໄຟລ໌ລໍາດັບ (-s) ແລະຕົວກໍານົດການຈໍານວນຫລາຍ. ໂດຍ
ເລີ່ມຕົ້ນ, ທັງສອງ strands ຖືກປຸງແຕ່ງ.
-f ພຽງແຕ່ສ້າງສໍາລັບ strand ຂ້າງຫນ້າ
-r ການກໍ່ສ້າງພຽງແຕ່ສໍາລັບສາຍປີ້ນກັບກັນ
-C ໃຊ້ canonical mers (ສົມມຸດວ່າທັງສອງ strands)
-L # ຢ່າຊ່ວຍປະຢັດ mers ທີ່ເກີດຂື້ນຫນ້ອຍກວ່າ # ເທື່ອ
-U # ຢ່າບັນທຶກ mers ທີ່ເກີດຂຶ້ນຫຼາຍກວ່າ # ເທື່ອ
-m # ຂະຫນາດຂອງ mer (ຕ້ອງການ)
-c # ການບີບອັດ homopolymer (ທາງເລືອກ)
-p ເຮັດໃຫ້ຕໍາແຫນ່ງ
-s seq.fasta
ລໍາດັບການສ້າງຕາຕະລາງສໍາລັບ
-o tblprefix
ຄໍານໍາຫນ້າຕາຕະລາງຜົນຜະລິດ
-v ບັນເທີງຜູ້ໃຊ້
ໄດ້ ເມຣິລ ຂະບວນການສາມາດດໍາເນີນການໃນຫນຶ່ງ batch ຄວາມຈໍາຂະຫນາດໃຫຍ່, ໃນຈໍານວນຫຼາຍຫນ່ວຍຄວາມຈໍາຂະຫນາດນ້ອຍ,
ຫຼືພາຍໃຕ້ການຄວບຄຸມ SGE, ທັງໝົດມີ ຫຼື ບໍ່ໃຊ້ CPU ຫຼາຍແກນ. ໂດຍຄ່າເລີ່ມຕົ້ນ,
ການຄິດໄລ່ແມ່ນເຮັດໄດ້ເປັນຫນຶ່ງຂະບວນການຕາມລໍາດັບຂະຫນາດໃຫຍ່. ການດໍາເນີນງານຫຼາຍ threaded
ເປັນໄປໄດ້, ໃນຄ່າໃຊ້ຈ່າຍເພີ່ມເຕີມຂອງຫນ່ວຍຄວາມຈໍາ, ເຊັ່ນດຽວກັນກັບການດໍາເນີນງານ segmented, ເພີ່ມເຕີມ
ຄ່າໃຊ້ຈ່າຍ I/O.
ກະທູ້ ປະຕິບັດງານ
ແບ່ງການນັບອອກເປັນ n ຕ່ອນທີ່ມີຂະໜາດເກືອບເທົ່າກັນ. ນີ້ໃຊ້ພິເສດ
h MB (ຈາກ -P) ຕໍ່ກະທູ້.
- ກະທູ້ n
ການນໍາໃຊ້ n ກະທູ້ທີ່ຈະສ້າງ
ການແບ່ງສ່ວນ, ລໍາດັບ ປະຕິບັດງານ
ແບ່ງການນັບອອກເປັນຕ່ອນທີ່ຈະພໍດີເປັນບໍ່ເກີນ m MB ຂອງ
ຫນ່ວຍຄວາມຈໍາ, ຫຼືເຂົ້າໄປໃນ n ຕ່ອນຂະຫນາດເທົ່າທຽມກັນ. ແຕ່ລະຊິ້ນໄດ້ຖືກຄິດໄລ່ຕາມລໍາດັບ,
ແລະຜົນໄດ້ຮັບຈະຖືກລວມເຂົ້າກັນໃນຕອນທ້າຍ. ພຽງແຕ່ຫນຶ່ງຂອງ - ຄວາມຊົງຈໍາ ແລະ - ພາກສ່ວນ is
ຕ້ອງການ.
- ຄວາມຊົງຈໍາ m
ໃຊ້ຫຼາຍທີ່ສຸດ m MB ຂອງຫນ່ວຍຄວາມຈໍາຕໍ່ສ່ວນ
- ພາກສ່ວນ n
ການນໍາໃຊ້ n ສ່ວນ
ການແບ່ງສ່ວນ, ເປັນຊຸດ ປະຕິບັດງານ
ຄືກັນກັບລໍາດັບ, ຍົກເວັ້ນນີ້ອະນຸຍາດໃຫ້ແຕ່ລະພາກສ່ວນຖືກປະຕິບັດດ້ວຍຕົນເອງ
ໃນຂະຫນານ. ພຽງແຕ່ຫນຶ່ງຂອງ - ຄວາມຊົງຈໍາ ແລະ - ພາກສ່ວນ ແມ່ນຈໍາເປັນ. ຍັງເບິ່ງໄດ້
EXAMPLE ພາກສ່ວນໃນຫນ້ານີ້.
- ຄວາມຊົງຈໍາ m
ໃຊ້ຫຼາຍທີ່ສຸດ m MB ຂອງຫນ່ວຍຄວາມຈໍາຕໍ່ສ່ວນ
- ພາກສ່ວນ n
ການນໍາໃຊ້ n ສ່ວນ
-configbatch
ສ້າງ batch ໄດ້
- ນັບຊຸດ n
ແລ່ນຈໍານວນ batch n
- ການລວມ
ລວມ batch ໄດ້
ໂໝດ batched ສາມາດແລ່ນຢູ່ໃນຕາຂ່າຍໄຟຟ້າ.
-sge ຊື່ວຽກ
ຊື່ວຽກທີ່ເປັນເອກະລັກສໍາລັບການປະຕິບັດນີ້. Meryl ຈະສົ່ງວຽກທີ່ມີຊື່
mpຊື່ວຽກ, ncຊື່ວຽກ, ນມຊື່ວຽກ, ສໍາລັບຂັ້ນຕອນການກະກຽມ, ນັບແລະ merge.
-sgebuild "ທາງເລືອກ"
- sgeerge "ທາງເລືອກ"
ທາງເລືອກໃນການເພີ່ມເຕີມໃດໆ qsub(1) (ເຊັ່ນ: “-ປ -153 -pe ກະທູ້ 2 -A
merylaccount") NB - -N ຈະຖືກລະເລີຍ NB - ໃຫ້ແນ່ໃຈວ່າຈະອ້າງເຖິງ
ທາງເລືອກໃນການ
-M ໃຫ້ບັນຊີລາຍຊື່ຂອງຕາຕະລາງ, ປະຕິບັດຄະນິດສາດ, ມີເຫດຜົນຫຼືຂອບເຂດ. ເວັ້ນເສຍແຕ່
ລະບຸໄວ້, ການດໍາເນີນງານທັງຫມົດໃຊ້ເວລາຖານຂໍ້ມູນໃດໆ. ການດໍາເນີນງານຄະນິດສາດແມ່ນ:
ນາທີ count ແມ່ນການນັບຂັ້ນຕ່ຳສຳລັບຖານຂໍ້ມູນທັງໝົດ. ຖ້າ mer ບໍ່ມີຢູ່ໃນ
ຖານຂໍ້ມູນທັງໝົດ, mer ມີການນັບສູນ, ແລະບໍ່ໄດ້ຢູ່ໃນຜົນຜະລິດ.
ບໍ່ມີຢູ່
count ແມ່ນການນັບຕໍາ່ສຸດທີ່ສໍາລັບຖານຂໍ້ມູນທັງໝົດທີ່ມີ mer
ສູງສຸດທີ່ເຄຍ count ແມ່ນການນັບສູງສຸດສໍາລັບຖານຂໍ້ມູນທັງໝົດ
ເພີ່ມ count ແມ່ນຜົນລວມຂອງການນັບສໍາລັບຖານຂໍ້ມູນທັງຫມົດ
ການຍ່ອຍ ການນັບແມ່ນຄັ້ງທໍາອິດລົບທີສອງ (binary ເທົ່ານັ້ນ)
abs ການນັບແມ່ນຄ່າຢ່າງແທ້ຈິງຂອງລົບທໍາອິດທີ່ສອງ (binary ເທົ່ານັ້ນ)
ການດໍາເນີນງານຕາມເຫດຜົນແມ່ນ:
ແລະ outputs mer iff ມັນມີຢູ່ໃນຖານຂໍ້ມູນທັງຫມົດ
ນັນ outputs mer iff ມັນມີຢູ່ໃນຢ່າງຫນ້ອຍຫນຶ່ງ, ແຕ່ບໍ່ແມ່ນທັງຫມົດ, ຖານຂໍ້ມູນ
or outputs mer iff ມັນມີຢູ່ໃນຢ່າງຫນ້ອຍຫນຶ່ງຖານຂໍ້ມູນ
xor outputs mer iff ມັນມີຢູ່ໃນຈໍານວນຄີກຂອງຖານຂໍ້ມູນ
ການດໍາເນີນງານຂອບເຂດແມ່ນ:
ຫນ້ອຍກ່ວາ x
outputs mer iff ມັນມີການນັບ < x
ຫນ້ອຍກວ່າເທົ່າກັບ x
outputs mer iff ມັນມີການນັບ <= x
ໃຫຍ່ກວ່າ x
outputs mer iff ມັນມີການນັບ > x
ໃຫຍ່ກວ່າຫຼາຍກ່ວາ x
outputs mer iff ມັນມີການນັບ >= x
ເທົ່າທຽມກັນ x
outputs mer iff ມັນມີການນັບ == x
ການປະຕິບັດຂອບເຂດເຮັດວຽກຢູ່ໃນຖານຂໍ້ມູນອັນດຽວ.
-s tblprefix
ການນໍາໃຊ້ tblprefix ເປັນຖານຂໍ້ມູນ
-o tblprefix
ສ້າງຜົນຜະລິດນີ້
-v ບັນເທີງຜູ້ໃຊ້
-D ໂຕະຖິ້ມຂີ້ເຫຍື້ອ (ບໍ່ແມ່ນວຽກທັງໝົດນີ້)
- ດ ຖິ້ມ histogram ຂອງໄລຍະຫ່າງລະຫວ່າງ mers ດຽວກັນ.
- ດທ Dump mers >= a threshold. ໃຊ້ -n ເພື່ອກໍານົດຂອບເຂດ.
- ດີຄ ນັບຈໍານວນ mers, mers ທີ່ແຕກຕ່າງກັນແລະ mers ເປັນເອກະລັກ.
-Dh Dump (to stdout) ຮິສໂຕແກຣມຂອງການນັບ mer.
-s ອ່ານຕາຕະລາງການນັບຈາກທີ່ນີ້ (ອອກຈາກ .mcdat ຫຼື .mcidx).
EXAMPLE
Batch ການສ້າງ of a ຕາຕະລາງ
ເລີ່ມຕົ້ນການຄິດໄລ່ດ້ວຍ -configbatch, ເຊິ່ງຕ້ອງການທາງເລືອກໃນການກໍ່ສ້າງທັງຫມົດ. ປະຕິບັດທັງຫມົດ
- ນັບຊຸດ ວຽກເຮັດງານທໍາ, ຫຼັງຈາກນັ້ນ - ການລວມ ເພື່ອໃຫ້ສໍາເລັດ.
ເມຣິລ -configbatch -B [ທາງເລືອກ] -o ເອກະສານ
ເມຣິລ - ນັບຊຸດ 0 -o ເອກະສານ
ເມຣິລ - ນັບຊຸດ 1 -o ເອກະສານ
...
ເມຣິລ - ນັບຊຸດ N -o ເອກະສານ
ເມຣິລ - ການລວມ N -o ເອກະສານ
ໃຊ້ meryl ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net