ພາສາອັງກິດພາສາຝຣັ່ງແອສປາໂຍນ

Ad


OnWorks favicon

minimap - ອອນລາຍໃນຄລາວ

ເປີດໃຊ້ minimap ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຄໍາສັ່ງ minimap ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


minimap - ແຜນທີ່ໄວລະຫວ່າງລໍາດັບ DNA ຍາວ

ສະຫຼຸບສັງລວມ


ແຜນທີ່ຫຍໍ້ [-lSOV] [-k Khmer] [-w winSize] [-I batchSize] [-d dumpFile] [-f occThres] [-r
ແບນວິດ] [-m minShared] [-c ຈຳນວນນາທີ] [-L minMatch] [-g maxGap] [-T ຂີ້ຝຸ່ນ] [-t
nThreads] [-x ຕັ້ງໄວ້ລ່ວງ ໜ້າ] target.fa query.fa > output.paf

ລາຍລະອຽດ


Minimap ແມ່ນເຄື່ອງມືເພື່ອຊອກຫາຕໍາແຫນ່ງແຜນທີ່ປະມານຫຼາຍຢ່າງມີປະສິດທິພາບລະຫວ່າງສອງ
ຊຸດຂອງລໍາດັບຍາວ, ເຊັ່ນ: ລະຫວ່າງການອ່ານແລະການອ້າງອີງ, ລະຫວ່າງ genomes ແລະ
ລະຫວ່າງການອ່ານທີ່ບໍ່ມີສຽງດົນນານ. Minimap ມີດັດສະນີແລະໄລຍະການສ້າງແຜນທີ່. ໃນການດັດສະນີ
ໄລຍະ, ມັນເກັບກໍາ minimizers ທັງຫມົດຂອງ batch ໃຫຍ່ຂອງລໍາດັບເປົ້າຫມາຍໃນຕາຕະລາງ hash; ໃນ
ໄລຍະແຜນທີ່, ມັນກໍານົດກຸ່ມທີ່ດີຂອງ colinear minimizer hits. Minimap ເຮັດ
ບໍ່ສ້າງການຈັດຮຽງລະອຽດລະຫວ່າງເປົ້າໝາຍ ແລະ ລຳດັບການສອບຖາມ. ມັນເທົ່ານັ້ນ
ສົ່ງຜົນໃຫ້ຈຸດເລີ່ມຕົ້ນໂດຍປະມານ ແລະຈຸດສິ້ນສຸດຂອງກຸ່ມເຫຼົ່ານີ້.

OPTIONS


Indexing ທາງເລືອກໃນການ
-k INT ຫຍໍ້ຄວາມຍາວ k-mer [15]

-w INT ຫຍໍ້ຂະໜາດໜ້າຈໍ [2/3 ຂອງຄວາມຍາວ k-mer]. ຕົວຫຍໍ້ແມ່ນ k-mer ນ້ອຍທີ່ສຸດ
ຢູ່ໃນປ່ອງຢ້ຽມຂອງ w k-mers ຕິດຕໍ່ກັນ.

-I NUMBER ໂຫຼດສູງສຸດ NUMBER ພື້ນຖານເປົ້າຫມາຍເຂົ້າໄປໃນ RAM ສໍາລັບດັດສະນີ [4G]. ຖ້າມີຫຼາຍກ່ວາ
NUMBER ຖານ​ໃນ target.fa, minimap ຕ້ອງການອ່ານ query.fa ຫຼາຍຄັ້ງເພື່ອສ້າງແຜນທີ່
ຕໍ່ກັບແຕ່ລະ batch ຂອງລໍາດັບເປົ້າຫມາຍ. NUMBER ອາດຈະສິ້ນສຸດດ້ວຍ k/K/m/M/g/G.

-d ເອກະສານ Dump minimizer index to ເອກະສານ [ບໍ່ມີການຖິ້ມຂີ້ເຫຍື້ອ]

-l ຊີ້ບອກວ່າ target.fa ໃນ​ຄວາມ​ເປັນ​ຈິງ​ແມ່ນ​ດັດ​ຊະ​ນີ minimizer ສ້າງ​ໂດຍ​ທາງ​ເລືອກ​ -d, ບໍ່ແມ່ນ
ໄຟລ໌ FASTA ຫຼື FASTQ.

ການເຮັດແຜນທີ່ ທາງເລືອກໃນການ
-f ລູກລອຍ ບໍ່ສົນໃຈດ້ານເທິງ ລູກລອຍ ສ່ວນຫນຶ່ງຂອງຕົວຫຍໍ້ທີ່ເກີດຂຶ້ນຫຼາຍທີ່ສຸດ [0.001]

-r INT ແບນວິດໂດຍປະມານສໍາລັບການ minimizer hits ໃນເບື້ອງຕົ້ນ clustering [500]. ກ ຫຍໍ້
ມົນຕີ ແມ່ນຕົວຫຍໍ້ທີ່ມີທັງໃນລຳດັບເປົ້າໝາຍ ແລະຄຳຖາມ. ກ ຫຍໍ້
ມົນຕີ ກຸ່ມ ແມ່ນກຸ່ມຂອງ hits minimizer colinear ທີ່ມີທ່າແຮງລະຫວ່າງເປົ້າຫມາຍ
ແລະ ລຳ ດັບການສອບຖາມ.

-m ລູກລອຍ ຮວມຕົວຫຍໍ້ຂັ້ນເລີ່ມຕົ້ນຕີກຸ່ມຫາກ ລູກລອຍ ຫຼືສ່ວນທີ່ສູງກວ່າຂອງຕົວຫຍໍ້
ຖືກແບ່ງປັນລະຫວ່າງກຸ່ມ [0.5]

-c INT ຮັກສາກຸ່ມການຕີໜ້ອຍສຸດຖ້າມັນມີ INT ຫຼື hits ໜ້ອຍທີ່ສຸດ [4]

-L INT ຍົກເລີກການຕີກຸ່ມນ້ອຍສຸດຖ້າຫຼັງຈາກ colinearization, ຈໍານວນການຈັບຄູ່
ພື້ນຖານແມ່ນຂ້າງລຸ່ມນີ້ INT [40]. ທາງເລືອກນີ້ສ່ວນໃຫຍ່ແມ່ນຫຼຸດຜ່ອນຂະຫນາດຂອງຜົນຜະລິດ. ມັນ​ມີ
ຜົນກະທົບເລັກນ້ອຍຕໍ່ຄວາມໄວແລະຄວາມຊົງຈໍາສູງສຸດ.

-g INT ແຍກກຸ່ມການຕີໜ້ອຍສຸດທີ່ຊ່ອງຫວ່າງ INT-bp ຫຼືດົນກວ່ານັ້ນບໍ່ມີ
ການຕີໜ້ອຍສຸດໃດໆ [10000]

-T INT ພື້ນທີ່ໜ້າກາກຢູ່ໃນລຳດັບການສອບຖາມທີ່ມີເກນຄະແນນ SDUST INT; 0 ເພື່ອປິດການໃຊ້ງານ
[0]. SDUST ເປັນສູດການຄິດໄລ່ເພື່ອກໍານົດຄວາມຊັບຊ້ອນຕາມມາທີ່ຕໍ່າ. ມັນ​ບໍ່​ແມ່ນ
ເປີດໃຊ້ໂດຍຄ່າເລີ່ມຕົ້ນ. ຖ້າ SDUST ເປັນທີ່ຕ້ອງການ, ຄ່າລະຫວ່າງ 20 ຫາ 25 ແມ່ນ
ແນະນໍາ. ເກນທີ່ສູງກວ່າຈະປິດບັງລຳດັບໜ້ອຍລົງ.

-S ປະຕິບັດແຜນທີ່ທັງໝົດທຽບກັບທັງໝົດ. ໃນໂຫມດນີ້, ຖ້າຊື່ລໍາດັບຄໍາຖາມແມ່ນ
lexicographically ຂະຫນາດໃຫຍ່ກ່ວາຊື່ລໍາດັບເປົ້າຫມາຍ, hits ລະຫວ່າງເຂົາເຈົ້າ
ຈະຖືກສະກັດກັ້ນ; ຖ້າຊື່ລໍາດັບຄໍາຖາມແມ່ນຄືກັນກັບຊື່ເປົ້າຫມາຍ,
hits ນ້ອຍສຸດເສັ້ນຂວາງຈະຖືກສະກັດກັ້ນ.

-O ຫຼຸດການຕີໜ້ອຍລົງ ຖ້າມັນຢູ່ໄກຈາກ hits ອື່ນໆ (ແບບທົດລອງ). ນີ້
ທາງເລືອກແມ່ນເປັນປະໂຫຍດສໍາລັບການສ້າງແຜນທີ່ chromosomes ຍາວຈາກສອງຊະນິດທີ່ແຕກຕ່າງກັນ.

-x STR ການປ່ຽນແປງຫຼາຍການຕັ້ງຄ່າໂດຍອີງໃສ່ STR [ບໍ່ໄດ້ຕັ້ງ]. ມັນແນະນໍາໃຫ້ສະຫມັກ
ທາງ​ເລືອກ​ນີ້​ກ່ອນ​ທາງ​ເລືອກ​ອື່ນ​, ເຊັ່ນ​ວ່າ​ທາງ​ເລືອກ​ຕໍ່​ໄປ​ນີ້​ອາດ​ຈະ override​
ການ​ຕັ້ງ​ຄ່າ​ຫຼາຍ​ທີ່​ດັດ​ແກ້​ໂດຍ​ທາງ​ເລືອກ​ນີ້​.

ava10k ສໍາລັບ PacBio ຫຼື Oxford Nanopore all-vs-all read map (-Sw5 -L100 -m0).

ການປ້ອນຂໍ້ມູນ / ຜົນຜະລິດ ທາງເລືອກໃນການ
-t INT ຈໍານວນກະທູ້ [3]. Minimap ໃຊ້ຫຼາຍທີ່ສຸດສາມກະທູ້ໃນເວລາເກັບກໍາ
minimizers ໃນລໍາດັບເປົ້າຫມາຍ, ແລະນໍາໃຊ້ເຖິງ INT+1 ກະທູ້ໃນເວລາສ້າງແຜນທີ່ (the
ກະທູ້ພິເສດແມ່ນສໍາລັບ I/O, ເຊິ່ງມັກຈະບໍ່ເຮັດວຽກແລະໃຊ້ເວລາ CPU ຫນ້ອຍ).

-V ພິມໝາຍເລກເວີຊັນເພື່ອ stdout

OUTPUT ຮູບແບບ


Minimap ສົ່ງອອກຕຳແໜ່ງແຜນທີ່ໃນຮູບແບບ Pairwise mApping (PAF). PAF ແມ່ນ TAB-
ຮູບແບບຂໍ້ຄວາມທີ່ຂັ້ນດ້ວຍແຕ່ລະແຖວປະກອບດ້ວຍຢ່າງໜ້ອຍ 12 ຊ່ອງຂໍ້ມູນຕາມທີ່ໄດ້ອະທິບາຍໄວ້ໃນ
ຕາຕະລາງຕໍ່ໄປນີ້:

┌────┬──────────────────────────────────── ───────────────────────── ┐
ທ່ານ Colປະເພດລາຍລະອຽດ
├────┼────────────────────────────────── ───────────────────────── ┤
│ 1 │ string │ Query sequence name │
│ 2 │ int │ ຄວາມຍາວລຳດັບແບບສອບຖາມ │
│ 3 │ int │ Query start coordinate (0-based) │
│ 4 │ int │ ຈຸດປະສານງານທ້າຍແບບສອບຖາມ (0-based) │
│ 5 │ char │ `+' ຖ້າສອບຖາມ ແລະ ເປົ້າໝາຍຢູ່ໃນສາຍດຽວກັນ; `-' ຖ້າກົງກັນຂ້າມ │
│ 6 │ string │ ຊື່ລຳດັບເປົ້າໝາຍ │
│ 7 │ int │ ຄວາມຍາວລຳດັບເປົ້າໝາຍ │
│ 8 │ int │ ຈຸດປະສານງານເປົ້າໝາຍຢູ່ໃນສາຍເດີມ │
│ 9 │ int │ ຈຸດປະສານງານເປົ້າໝາຍຢູ່ໃນສາຍເດີມ │
│ 10 │ int │ ຈຳນວນຖານທີ່ກົງກັນໃນແຜນທີ່ │
│ 11 │ int │ ຖານຕົວເລກ, ລວມທັງຊ່ອງຫວ່າງ, ໃນແຜນທີ່ │
│ 12 │ int │ ຄຸນນະພາບການສ້າງແຜນທີ່ (0-255 ກັບ 255 ສໍາລັບຂາດ) │
└────┴─────────────────────────────────── ───────────────────────── ┘

ເມື່ອ​ການ​ຈັດ​ຕັ້ງ​ມີ​ຢູ່​, ຖັນ 11 ໃຫ້​ຈໍາ​ນວນ​ທັງ​ຫມົດ​ຂອງ​ລໍາ​ດັບ​ທີ່​ກົງ​ກັນ​,
ບໍ່ກົງກັນແລະຊ່ອງຫວ່າງໃນການຈັດຕໍາແຫນ່ງ; ຖັນ 10 ແບ່ງດ້ວຍຖັນ 11 ໃຫ້ການຈັດລໍາດັບ
ຕົວຕົນ. ເນື່ອງຈາກ minimap ບໍ່ໄດ້ສ້າງການຈັດລໍາດັບລາຍລະອຽດ, ສອງຄໍລໍາເຫຼົ່ານີ້ແມ່ນ
ປະມານ. PAF ອາດຈະມີຊ່ອງຂໍ້ມູນເພີ່ມເຕີມໃນລະຫັດທີ່ພິມແບບ SAM
ຮູບແບບ. Minimap ຂຽນຈຳນວນຂອງ minimizer hits ໃນ cluster ໃສ່ cm tag.

ໃຊ້ minimap ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

Linux ຄຳ ສັ່ງ

Ad