ນີ້ແມ່ນຄໍາສັ່ງ miniasm ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
miniasm - de novo assembler ສໍາລັບລໍາດັບອ່ານຍາວ
ສະຫຼຸບສັງລວມ
ຫນ້ອຍ [-b12V] [-m minMatch] [-i ມິນໄອເດັນ] [-s minSpan] [-c minCov] [-o minOvlp] [-h
maxHang] [-I intThres] [-g maxGapDiff] [-d maxBubDist] [-e minUtgSize] [-f ອ່ານໄຟລ໌] [-n
nຮອບ] [-r ອັດຕາສ່ວນຫຼຸດລົງ] [-F ອັດຕາສ່ວນສຸດທ້າຍ] [-p ຂໍ້ມູນຜົນຜະລິດ] mapping.paf > output.gfa
ລາຍລະອຽດ
Miniasm ແມ່ນຕົວປະກອບ de novo ທີ່ອີງໃສ່ OLC ທີ່ໄວຫຼາຍສໍາລັບການອ່ານດົນນານທີ່ມີສຽງດັງ. ມັນໃຊ້ເວລາທັງຫມົດ-vs-
ທັງໝົດອ່ານແຜນທີ່ຕົນເອງໃນຮູບແບບ PAF ເປັນການປ້ອນຂໍ້ມູນ ແລະສົ່ງຜົນການປະກອບກາຟໃນ GFA
ຮູບແບບ. ແຕກຕ່າງຈາກອຸປະກອນປະກອບຕົ້ນຕໍ, miniasm ບໍ່ມີຂັ້ນຕອນທີ່ເປັນເອກະສັນກັນ. ມັນ
ພຽງແຕ່ concatenates ຕ່ອນຂອງລໍາດັບການອ່ານເພື່ອສ້າງລໍາດັບ unitig ສຸດທ້າຍ. ດັ່ງນັ້ນ
ອັດຕາຄວາມຜິດພາດຕໍ່ຖານແມ່ນຄ້າຍຄືກັນກັບການອ່ານວັດສະດຸດິບ.
OPTIONS
ການຄັດເລືອກລ່ວງໜ້າ ທາງເລືອກໃນການ
-m INT ວາງແຜນທີ່ມີໜ້ອຍກວ່າ INT ພື້ນຖານທີ່ກົງກັນ (col10 ໃນ PAF) [100]. ນີ້
ທາງເລືອກມີບົດບາດດຽວກັນກັບ -L ຂອງ minimap.
-s INT ວາງແຜນທີ່ສັ້ນກວ່າ INT-bp [1000]. ທາງເລືອກນີ້ຍັງມີຜົນກະທົບທີສອງ
ຮອບຂອງການກັ່ນຕອງການອ່ານແລະຄວາມຍາວການຊ້ອນກັນຫນ້ອຍທີ່ສຸດ.
-i ລູກລອຍ ໃນລະຫວ່າງການອ່ານການກັ່ນຕອງ, ບໍ່ສົນໃຈການສ້າງແຜນທີ່ກັບ col10/col11 ຂ້າງລຸ່ມນີ້ ລູກລອຍ [0.05]
ແຜນທີ່ທີ່ຖືກລະເລີຍແມ່ນຍັງຖືກໃຊ້ເພື່ອອ່ານການທັບຊ້ອນກັນ.
-c INT ການຄຸ້ມຄອງຫນ້ອຍທີ່ສຸດໂດຍການອ່ານອື່ນໆ [3]. ໃນຮອບທໍາອິດຂອງການກັ່ນຕອງ, miniasm
ຊອກຫາພາກພື້ນທີ່ຍາວທີ່ສຸດກວມເອົາໂດຍ INT ຫຼືອ່ານຫຼາຍກວ່ານັ້ນ. ໃນຮອບທີສອງ, ມັນ
ນອກຈາກນັ້ນ, ຮຽກຮ້ອງໃຫ້ແຕ່ລະພື້ນຖານທີ່ຍັງເຫຼືອຖືກປົກຄຸມດ້ວຍ INT ພື້ນຖານຢ່າງຫນ້ອຍ
minSpan/2 ຈາກທ້າຍຂອງການອ່ານອື່ນໆ.
ການທັບຊ້ອນກັນ ທາງເລືອກໃນການ
-o INT ຄວາມຍາວທັບກັນໜ້ອຍສຸດ [ຄືກັນກັບ minSpan]
-h INT ຄວາມຍາວສູງສຸດຂອງ overhang [1000]. ການ overhang ແມ່ນພາກພື້ນທີ່ບໍ່ມີແຜນທີ່ທີ່ຄວນຈະເປັນ
ແຜນທີ່ໃຫ້ຄວາມທັບຊ້ອນທີ່ແທ້ຈິງຫຼືການບັນຈຸທີ່ແທ້ຈິງ. ຖ້າ overhang ຍາວເກີນໄປ,
ແຜນທີ່ແມ່ນຖືວ່າເປັນການຈັບຄູ່ພາຍໃນ ແລະຈະຖືກລະເລີຍ.
-I ລູກລອຍ ອັດຕາສ່ວນໜ້ອຍສຸດຂອງຄວາມຍາວຂອງການສ້າງແຜນທີ່ຕໍ່ກັບການສ້າງແຜນທີ່ + ຄວາມຍາວ overhang ສໍາລັບການສ້າງແຜນທີ່
ພິຈາລະນາເປັນການຄວບຄຸມຫຼືການທັບຊ້ອນ [0.8]. ທາງເລືອກນີ້ມີບົດບາດຄ້າຍຄືກັນກັບ
-h, ຍົກເວັ້ນວ່າມັນຄວບຄຸມອັດຕາສ່ວນ, ບໍ່ແມ່ນຄວາມຍາວ.
ເສັ້ນສະແດງ ຮູບແບບ ທາງເລືອກໃນການ
-g INT ຄວາມແຕກຕ່າງຊ່ອງຫວ່າງສູງສຸດລະຫວ່າງສອງອ່ານໃນແຜນທີ່ [1000]. ຕົວກໍານົດການນີ້ແມ່ນ
ໃຊ້ພຽງແຕ່ສໍາລັບການຫຼຸດຜ່ອນການຖ່າຍທອດ.
-d INT ໄລຍະການສຳຫຼວດສູງສຸດສຳລັບການປະກົດຕົວຂອງຟອງ [50000]. ຟອງຍາວກວ່າ INT
ຈະບໍ່ຖືກ popped.
-e INT unitig ຖືວ່າເປັນຂະຫນາດນ້ອຍຖ້າມັນປະກອບດ້ວຍຫນ້ອຍກວ່າ INT ອ່ານ [4].
Miniasm ອາດຈະພະຍາຍາມເອົາ unitigs ຂະຫນາດນ້ອຍໃນຂັ້ນຕອນຕ່າງໆ.
-f ເອກະສານ ອ່ານໄຟລ໌ລໍາດັບໃນຮູບແບບ FASTA ຫຼື FASTQ ເພື່ອສ້າງລໍາດັບ unitig
[ null ]. ຖ້າທາງເລືອກນີ້ແມ່ນບໍ່ມີ, miniasm ຜະລິດຜົນຜະລິດ GFA ໂດຍບໍ່ມີການ
ລໍາດັບ.
-r FLOAT1,[FLOAT2]
ອັດຕາສ່ວນການຊ້ອນກັນສູງສຸດ ແລະຕ່ຳສຸດ [0.7,0.5]. ໃຫ້ overlap(v->w) ເປັນການທັບຊ້ອນກັນ
ຄວາມຍາວຂອງຂອບ v->w ແລະ maxovlp(v)=max_w{overlap(v->w)} ເປັນຄວາມຍາວຂອງທີ່ໃຫຍ່ທີ່ສຸດ
ທັບຊ້ອນກັນ. Miniasm drops overlap v->w ຖ້າ overlap(v->w)/maxovlp(v) ຢູ່ລຸ່ມ a
ເກນຖືກຄວບຄຸມໂດຍຕົວເລືອກນີ້. Miniasm ໃຊ້ໄດ້ nຮອບ ຮອບສັ້ນ
ການກໍາຈັດການທັບຊ້ອນກັນໂດຍມີເກນເພີ່ມຂຶ້ນລະຫວ່າງ FLOAT1 ແລະ FLOAT2.
-n INT ຮອບຂອງການຖອນທັບຊ້ອນສັ້ນ [3].
-F ລູກລອຍ ຂອບເຂດອັດຕາສ່ວນການຫຼຸດລົງຂອງການທັບຊ້ອນກັນຫຼັງຈາກການຖອນ unitig ສັ້ນ [0.8]
Miscellaneous ທາງເລືອກໃນການ
-b ຊີ້ໃຫ້ເຫັນວ່າໃນການປ້ອນຂໍ້ມູນ, ການສ້າງແຜນທີ່ດຽວກັນມີແນວໂນ້ມທີ່ຈະໃຫ້ສອງຄັ້ງ
-1 ຂ້າມຮອບທຳອິດຂອງການເລືອກອ່ານກ່ອນການປະກອບ
-2 ຂ້າມຮອບທີສອງຂອງການເລືອກອ່ານກ່ອນການປະກອບ
-p STR ຂໍ້ມູນຜົນຜະລິດແລະຮູບແບບ [ug]. ເປັນໄປໄດ້ STR ຄ່າປະກອບມີ - ນອນ: ຕອບ-
ພື້ນທີ່ອ່ານທີ່ຖືກກັ່ນຕອງໃນຮູບແບບ BED; paf: ແຜນທີ່ລະຫວ່າງຫຼັງການກັ່ນຕອງ
ອ່ານ; sg: ອ່ານກາຟທັບຊ້ອນໃນຮູບແບບ GFA; ug: unitig graph ໃນ GFA
ຮູບແບບ.
-V ພິມໝາຍເລກເວີຊັນເພື່ອ stdout
ປັດໄຈນໍາເຂົ້າ ຮູບແບບ
Miniasm ອ່ານຕຳແໜ່ງແຜນທີ່ໃນຮູບແບບ Pairwise mApping (PAF), ເຊິ່ງເປັນ TAB-
ຮູບແບບຂໍ້ຄວາມທີ່ຂັ້ນດ້ວຍແຕ່ລະແຖວປະກອບດ້ວຍຢ່າງໜ້ອຍ 12 ຊ່ອງຂໍ້ມູນຕາມທີ່ໄດ້ອະທິບາຍໄວ້ໃນ
ຕາຕະລາງຕໍ່ໄປນີ້:
┌────┬──────────────────────────────────── ───────────────────────── ┐
│ທ່ານ Col │ ປະເພດ │ ລາຍລະອຽດ │
├────┼────────────────────────────────── ───────────────────────── ┤
│ 1 │ string │ Query sequence name │
│ 2 │ int │ ຄວາມຍາວລຳດັບແບບສອບຖາມ │
│ 3 │ int │ Query start coordinate (0-based) │
│ 4 │ int │ ຈຸດປະສານງານທ້າຍແບບສອບຖາມ (0-based) │
│ 5 │ char │ `+' ຖ້າສອບຖາມ ແລະ ເປົ້າໝາຍຢູ່ໃນສາຍດຽວກັນ; `-' ຖ້າກົງກັນຂ້າມ │
│ 6 │ string │ ຊື່ລຳດັບເປົ້າໝາຍ │
│ 7 │ int │ ຄວາມຍາວລຳດັບເປົ້າໝາຍ │
│ 8 │ int │ ຈຸດປະສານງານເປົ້າໝາຍຢູ່ໃນສາຍເດີມ │
│ 9 │ int │ ຈຸດປະສານງານເປົ້າໝາຍຢູ່ໃນສາຍເດີມ │
│ 10 │ int │ ຈຳນວນຖານທີ່ກົງກັນໃນແຜນທີ່ │
│ 11 │ int │ ຖານຕົວເລກ, ລວມທັງຊ່ອງຫວ່າງ, ໃນແຜນທີ່ │
│ 12 │ int │ ຄຸນນະພາບການສ້າງແຜນທີ່ (0-255 ກັບ 255 ສໍາລັບຂາດ) │
└────┴─────────────────────────────────── ───────────────────────── ┘
ກະລຸນາເບິ່ງ ຮູບນ້ອຍສຸດ(1) ສໍາລັບລາຍລະອຽດຂອງແຕ່ລະພາກສະຫນາມ.
OUTPUT ຮູບແບບ
Miniasm ສົ່ງອອກການປະກອບໃນຮູບແບບ Graphical Fragment Assembly (GFA). ມັນເປັນ
ຮູບແບບຕົວຂັ້ນ TAB ອີງຕາມເສັ້ນ, ໂດຍມີຕົວອັກສອນນໍາຫນ້າຊີ້ບອກປະເພດຂອງເສັ້ນ.
ຕາຕະລາງຕໍ່ໄປນີ້ໃຫ້ປະເພດເສັ້ນທີ່ໃຊ້ໂດຍ miniasm:
┌─────┬───────────────────────────────────────── ─────────────────────────┐
│ອອນໄລນ໌ │ ຄໍາຄິດຄໍາເຫັນ │ Fixed ທົ່ງນາ │
├─────┼─────────────────────────────────────── ─────────────────────────┤
│ H │ ສ່ວນຫົວ │ N/A │
│ S │ Segment │ segName segSeq │
│ L │ ທັບຊ້ອນ │ segName1 segOri1 segName2 segOri2 ovlpCIGAR │
│ a │ Golden path │ utgName utgStart readName: start-end readOri length │
└─────┴────────────────────────────────────────── ─────────────────────────┘
ໃຊ້ miniasm ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net