ນີ້ແມ່ນຄໍາສັ່ງ minimap ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
minimap - ແຜນທີ່ໄວລະຫວ່າງລໍາດັບ DNA ຍາວ
ສະຫຼຸບສັງລວມ
ແຜນທີ່ຫຍໍ້ [-lSOV] [-k Khmer] [-w winSize] [-I batchSize] [-d dumpFile] [-f occThres] [-r
ແບນວິດ] [-m minShared] [-c ຈຳນວນນາທີ] [-L minMatch] [-g maxGap] [-T ຂີ້ຝຸ່ນ] [-t
nThreads] [-x ຕັ້ງໄວ້ລ່ວງ ໜ້າ] target.fa query.fa > output.paf
ລາຍລະອຽດ
Minimap ແມ່ນເຄື່ອງມືເພື່ອຊອກຫາຕໍາແຫນ່ງແຜນທີ່ປະມານຫຼາຍຢ່າງມີປະສິດທິພາບລະຫວ່າງສອງ
ຊຸດຂອງລໍາດັບຍາວ, ເຊັ່ນ: ລະຫວ່າງການອ່ານແລະການອ້າງອີງ, ລະຫວ່າງ genomes ແລະ
ລະຫວ່າງການອ່ານທີ່ບໍ່ມີສຽງດົນນານ. Minimap ມີດັດສະນີແລະໄລຍະການສ້າງແຜນທີ່. ໃນການດັດສະນີ
ໄລຍະ, ມັນເກັບກໍາ minimizers ທັງຫມົດຂອງ batch ໃຫຍ່ຂອງລໍາດັບເປົ້າຫມາຍໃນຕາຕະລາງ hash; ໃນ
ໄລຍະແຜນທີ່, ມັນກໍານົດກຸ່ມທີ່ດີຂອງ colinear minimizer hits. Minimap ເຮັດ
ບໍ່ສ້າງການຈັດຮຽງລະອຽດລະຫວ່າງເປົ້າໝາຍ ແລະ ລຳດັບການສອບຖາມ. ມັນເທົ່ານັ້ນ
ສົ່ງຜົນໃຫ້ຈຸດເລີ່ມຕົ້ນໂດຍປະມານ ແລະຈຸດສິ້ນສຸດຂອງກຸ່ມເຫຼົ່ານີ້.
OPTIONS
Indexing ທາງເລືອກໃນການ
-k INT ຫຍໍ້ຄວາມຍາວ k-mer [15]
-w INT ຫຍໍ້ຂະໜາດໜ້າຈໍ [2/3 ຂອງຄວາມຍາວ k-mer]. ຕົວຫຍໍ້ແມ່ນ k-mer ນ້ອຍທີ່ສຸດ
ຢູ່ໃນປ່ອງຢ້ຽມຂອງ w k-mers ຕິດຕໍ່ກັນ.
-I NUMBER ໂຫຼດສູງສຸດ NUMBER ພື້ນຖານເປົ້າຫມາຍເຂົ້າໄປໃນ RAM ສໍາລັບດັດສະນີ [4G]. ຖ້າມີຫຼາຍກ່ວາ
NUMBER ຖານໃນ target.fa, minimap ຕ້ອງການອ່ານ query.fa ຫຼາຍຄັ້ງເພື່ອສ້າງແຜນທີ່
ຕໍ່ກັບແຕ່ລະ batch ຂອງລໍາດັບເປົ້າຫມາຍ. NUMBER ອາດຈະສິ້ນສຸດດ້ວຍ k/K/m/M/g/G.
-d ເອກະສານ Dump minimizer index to ເອກະສານ [ບໍ່ມີການຖິ້ມຂີ້ເຫຍື້ອ]
-l ຊີ້ບອກວ່າ target.fa ໃນຄວາມເປັນຈິງແມ່ນດັດຊະນີ minimizer ສ້າງໂດຍທາງເລືອກ -d, ບໍ່ແມ່ນ
ໄຟລ໌ FASTA ຫຼື FASTQ.
ການເຮັດແຜນທີ່ ທາງເລືອກໃນການ
-f ລູກລອຍ ບໍ່ສົນໃຈດ້ານເທິງ ລູກລອຍ ສ່ວນຫນຶ່ງຂອງຕົວຫຍໍ້ທີ່ເກີດຂຶ້ນຫຼາຍທີ່ສຸດ [0.001]
-r INT ແບນວິດໂດຍປະມານສໍາລັບການ minimizer hits ໃນເບື້ອງຕົ້ນ clustering [500]. ກ ຫຍໍ້
ມົນຕີ ແມ່ນຕົວຫຍໍ້ທີ່ມີທັງໃນລຳດັບເປົ້າໝາຍ ແລະຄຳຖາມ. ກ ຫຍໍ້
ມົນຕີ ກຸ່ມ ແມ່ນກຸ່ມຂອງ hits minimizer colinear ທີ່ມີທ່າແຮງລະຫວ່າງເປົ້າຫມາຍ
ແລະ ລຳ ດັບການສອບຖາມ.
-m ລູກລອຍ ຮວມຕົວຫຍໍ້ຂັ້ນເລີ່ມຕົ້ນຕີກຸ່ມຫາກ ລູກລອຍ ຫຼືສ່ວນທີ່ສູງກວ່າຂອງຕົວຫຍໍ້
ຖືກແບ່ງປັນລະຫວ່າງກຸ່ມ [0.5]
-c INT ຮັກສາກຸ່ມການຕີໜ້ອຍສຸດຖ້າມັນມີ INT ຫຼື hits ໜ້ອຍທີ່ສຸດ [4]
-L INT ຍົກເລີກການຕີກຸ່ມນ້ອຍສຸດຖ້າຫຼັງຈາກ colinearization, ຈໍານວນການຈັບຄູ່
ພື້ນຖານແມ່ນຂ້າງລຸ່ມນີ້ INT [40]. ທາງເລືອກນີ້ສ່ວນໃຫຍ່ແມ່ນຫຼຸດຜ່ອນຂະຫນາດຂອງຜົນຜະລິດ. ມັນມີ
ຜົນກະທົບເລັກນ້ອຍຕໍ່ຄວາມໄວແລະຄວາມຊົງຈໍາສູງສຸດ.
-g INT ແຍກກຸ່ມການຕີໜ້ອຍສຸດທີ່ຊ່ອງຫວ່າງ INT-bp ຫຼືດົນກວ່ານັ້ນບໍ່ມີ
ການຕີໜ້ອຍສຸດໃດໆ [10000]
-T INT ພື້ນທີ່ໜ້າກາກຢູ່ໃນລຳດັບການສອບຖາມທີ່ມີເກນຄະແນນ SDUST INT; 0 ເພື່ອປິດການໃຊ້ງານ
[0]. SDUST ເປັນສູດການຄິດໄລ່ເພື່ອກໍານົດຄວາມຊັບຊ້ອນຕາມມາທີ່ຕໍ່າ. ມັນບໍ່ແມ່ນ
ເປີດໃຊ້ໂດຍຄ່າເລີ່ມຕົ້ນ. ຖ້າ SDUST ເປັນທີ່ຕ້ອງການ, ຄ່າລະຫວ່າງ 20 ຫາ 25 ແມ່ນ
ແນະນໍາ. ເກນທີ່ສູງກວ່າຈະປິດບັງລຳດັບໜ້ອຍລົງ.
-S ປະຕິບັດແຜນທີ່ທັງໝົດທຽບກັບທັງໝົດ. ໃນໂຫມດນີ້, ຖ້າຊື່ລໍາດັບຄໍາຖາມແມ່ນ
lexicographically ຂະຫນາດໃຫຍ່ກ່ວາຊື່ລໍາດັບເປົ້າຫມາຍ, hits ລະຫວ່າງເຂົາເຈົ້າ
ຈະຖືກສະກັດກັ້ນ; ຖ້າຊື່ລໍາດັບຄໍາຖາມແມ່ນຄືກັນກັບຊື່ເປົ້າຫມາຍ,
hits ນ້ອຍສຸດເສັ້ນຂວາງຈະຖືກສະກັດກັ້ນ.
-O ຫຼຸດການຕີໜ້ອຍລົງ ຖ້າມັນຢູ່ໄກຈາກ hits ອື່ນໆ (ແບບທົດລອງ). ນີ້
ທາງເລືອກແມ່ນເປັນປະໂຫຍດສໍາລັບການສ້າງແຜນທີ່ chromosomes ຍາວຈາກສອງຊະນິດທີ່ແຕກຕ່າງກັນ.
-x STR ການປ່ຽນແປງຫຼາຍການຕັ້ງຄ່າໂດຍອີງໃສ່ STR [ບໍ່ໄດ້ຕັ້ງ]. ມັນແນະນໍາໃຫ້ສະຫມັກ
ທາງເລືອກນີ້ກ່ອນທາງເລືອກອື່ນ, ເຊັ່ນວ່າທາງເລືອກຕໍ່ໄປນີ້ອາດຈະ override
ການຕັ້ງຄ່າຫຼາຍທີ່ດັດແກ້ໂດຍທາງເລືອກນີ້.
ava10k ສໍາລັບ PacBio ຫຼື Oxford Nanopore all-vs-all read map (-Sw5 -L100 -m0).
ການປ້ອນຂໍ້ມູນ / ຜົນຜະລິດ ທາງເລືອກໃນການ
-t INT ຈໍານວນກະທູ້ [3]. Minimap ໃຊ້ຫຼາຍທີ່ສຸດສາມກະທູ້ໃນເວລາເກັບກໍາ
minimizers ໃນລໍາດັບເປົ້າຫມາຍ, ແລະນໍາໃຊ້ເຖິງ INT+1 ກະທູ້ໃນເວລາສ້າງແຜນທີ່ (the
ກະທູ້ພິເສດແມ່ນສໍາລັບ I/O, ເຊິ່ງມັກຈະບໍ່ເຮັດວຽກແລະໃຊ້ເວລາ CPU ຫນ້ອຍ).
-V ພິມໝາຍເລກເວີຊັນເພື່ອ stdout
OUTPUT ຮູບແບບ
Minimap ສົ່ງອອກຕຳແໜ່ງແຜນທີ່ໃນຮູບແບບ Pairwise mApping (PAF). PAF ແມ່ນ TAB-
ຮູບແບບຂໍ້ຄວາມທີ່ຂັ້ນດ້ວຍແຕ່ລະແຖວປະກອບດ້ວຍຢ່າງໜ້ອຍ 12 ຊ່ອງຂໍ້ມູນຕາມທີ່ໄດ້ອະທິບາຍໄວ້ໃນ
ຕາຕະລາງຕໍ່ໄປນີ້:
┌────┬──────────────────────────────────── ───────────────────────── ┐
│ທ່ານ Col │ ປະເພດ │ ລາຍລະອຽດ │
├────┼────────────────────────────────── ───────────────────────── ┤
│ 1 │ string │ Query sequence name │
│ 2 │ int │ ຄວາມຍາວລຳດັບແບບສອບຖາມ │
│ 3 │ int │ Query start coordinate (0-based) │
│ 4 │ int │ ຈຸດປະສານງານທ້າຍແບບສອບຖາມ (0-based) │
│ 5 │ char │ `+' ຖ້າສອບຖາມ ແລະ ເປົ້າໝາຍຢູ່ໃນສາຍດຽວກັນ; `-' ຖ້າກົງກັນຂ້າມ │
│ 6 │ string │ ຊື່ລຳດັບເປົ້າໝາຍ │
│ 7 │ int │ ຄວາມຍາວລຳດັບເປົ້າໝາຍ │
│ 8 │ int │ ຈຸດປະສານງານເປົ້າໝາຍຢູ່ໃນສາຍເດີມ │
│ 9 │ int │ ຈຸດປະສານງານເປົ້າໝາຍຢູ່ໃນສາຍເດີມ │
│ 10 │ int │ ຈຳນວນຖານທີ່ກົງກັນໃນແຜນທີ່ │
│ 11 │ int │ ຖານຕົວເລກ, ລວມທັງຊ່ອງຫວ່າງ, ໃນແຜນທີ່ │
│ 12 │ int │ ຄຸນນະພາບການສ້າງແຜນທີ່ (0-255 ກັບ 255 ສໍາລັບຂາດ) │
└────┴─────────────────────────────────── ───────────────────────── ┘
ເມື່ອການຈັດຕັ້ງມີຢູ່, ຖັນ 11 ໃຫ້ຈໍານວນທັງຫມົດຂອງລໍາດັບທີ່ກົງກັນ,
ບໍ່ກົງກັນແລະຊ່ອງຫວ່າງໃນການຈັດຕໍາແຫນ່ງ; ຖັນ 10 ແບ່ງດ້ວຍຖັນ 11 ໃຫ້ການຈັດລໍາດັບ
ຕົວຕົນ. ເນື່ອງຈາກ minimap ບໍ່ໄດ້ສ້າງການຈັດລໍາດັບລາຍລະອຽດ, ສອງຄໍລໍາເຫຼົ່ານີ້ແມ່ນ
ປະມານ. PAF ອາດຈະມີຊ່ອງຂໍ້ມູນເພີ່ມເຕີມໃນລະຫັດທີ່ພິມແບບ SAM
ຮູບແບບ. Minimap ຂຽນຈຳນວນຂອງ minimizer hits ໃນ cluster ໃສ່ cm tag.
ໃຊ້ minimap ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net