ພາສາອັງກິດພາສາຝຣັ່ງແອສປາໂຍນ

Ad


OnWorks favicon

maq - ອອນລາຍໃນຄລາວ

ແລ່ນ maq ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຄໍາສັ່ງ maq ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍສະຖານີເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


Maq - ການສ້າງແຜນທີ່ແລະສະພາແຫ່ງທີ່ມີຄຸນນະພາບ

ສະຫຼຸບສັງລວມ


maq ຄໍາສັ່ງ [ທາງເລືອກໃນການ] ກະທູ້ທີ່

maq.pl ຄໍາສັ່ງ [ທາງເລືອກໃນການ] ກະທູ້ທີ່

ລາຍລະອຽດ


Maq ເປັນ​ຊອບ​ແວ​ທີ່​ສ້າງ​ປະ​ກອບ​ການ​ສ້າງ​ແຜນ​ທີ່​ຈາກ​ການ​ອ່ານ​ສັ້ນ​ທີ່​ສ້າງ​ຂຶ້ນ​ໂດຍ​ການ​ຕໍ່​ໄປ​.
ເຄື່ອງຈັກລໍາດັບການຜະລິດ. ມັນໄດ້ຖືກອອກແບບໂດຍສະເພາະສໍາລັບ Illumina-Solexa 1G Genetic
Analyzer, ແລະມີຫນ້າທີ່ເບື້ອງຕົ້ນເພື່ອຈັດການຂໍ້ມູນ AB SoliD.

ດ້ວຍ Maq ທ່ານສາມາດເຮັດໄດ້:

· ການຈັດວາງໄວ Illumina/SOLiD ອ່ານໄປຫາ genome ອ້າງອີງ. ດ້ວຍຕົວເລືອກເລີ່ມຕົ້ນ, ຫນຶ່ງ
ການອ່ານລ້ານຄູ່ສາມາດຖືກແຜນທີ່ກັບ genome ຂອງມະນຸດໃນເວລາປະມານ 10 ຊົ່ວໂມງ CPU ຫນ້ອຍລົງ
ຄວາມຈຳຫຼາຍກວ່າ 1G.

· ວັດແທກຄວາມເປັນໄປໄດ້ຄວາມຜິດພາດຂອງການຈັດຮຽງຂອງແຕ່ລະບຸກຄົນອ່ານ.

·ໂທຫາ genotypes ເອກະສັນ, ລວມທັງ homozygous ແລະ polymorphisms heterozygous, ກັບ
ຄຸນນະພາບຄວາມເປັນໄປໄດ້ຂອງ Phred ທີ່ຖືກມອບໃຫ້ແຕ່ລະພື້ນຖານ.

·ຊອກຫາ indels ສັ້ນທີ່ມີການອ່ານທ້າຍຄູ່.

·ຊອກຫາການລຶບລ້າງ genomic ຂະຫນາດໃຫຍ່ຢ່າງຖືກຕ້ອງແລະສະຖານທີ່ທີ່ມີການອ່ານຄູ່.

·ຄົ້ນພົບ CNVs ທີ່ມີທ່າແຮງໂດຍການກວດສອບຄວາມເລິກອ່ານ.

· ການ​ປະ​ເມີນ​ຜົນ​ຄວາມ​ຖືກ​ຕ້ອງ​ຂອງ​ຄຸນ​ນະ​ພາບ​ພື້ນ​ຖານ​ວັດ​ຖຸ​ດິບ​ຈາກ​ລໍາ​ດັບ​ແລະ​ການ​ຊ່ວຍ​ເຫຼືອ​ໃນ​ການ​ກວດ​ສອບ​ການ​
ຄວາມ​ຜິດ​ພາດ​ລະ​ບົບ​.

ຢ່າງໃດກໍຕາມ, Maq ສາມາດ ບໍ່:

·ເຮັດ de novo ການປະກອບ. (Maq ພຽງ​ແຕ່​ສາ​ມາດ​ໂທ​ຫາ​ຄວາມ​ເປັນ​ເອ​ກະ​ພາບ​ໂດຍ​ການ​ສ້າງ​ແຜນ​ທີ່​ອ່ານ​ໃຫ້​ເປັນ​ທີ່​ຮູ້​ຈັກ​
ອ້າງອິງ.)

· ແຜນທີ່ສັ້ນອ່ານຕໍ່ຕົນເອງ. (Maq ພຽງແຕ່ສາມາດຊອກຫາການຊ້ອນກັນຢ່າງສົມບູນລະຫວ່າງການອ່ານ.)

· ຈັດຮຽງ capillary ອ່ານ ຫຼື 454 ອ່ານເພື່ອອ້າງອີງ. (Maq ບໍ່ສາມາດຈັດຮຽງອ່ານໄດ້ດົນກວ່າ
63bp.)

MAQ ສາມາດ


ທີ່ສໍາຄັນ ຄໍາສັ່ງ

fasta2bfa maq fasta2bfa in.ref.fasta out.ref.bfa

ປ່ຽນລໍາດັບໃນຮູບແບບ FASTA ເປັນຮູບແບບ BFA ຂອງ Maq (FASTA binary).

fastq2bfq maq fastq2bfq [-n ອ່ານ] in.read.fastq out.read.bfqout.prefix

ປ່ຽນການອ່ານໃນຮູບແບບ FASTQ ເປັນຮູບແບບ BFQ (binary FASTQ) ຂອງ Maq.

ທາງເລືອກ:

-n INT ຈໍານວນການອ່ານຕໍ່ໄຟລ໌ [ບໍ່ໄດ້ລະບຸ]

ແຜນທີ່ maq ແຜນທີ່ [-n nmis] [-a ສູງສຸດ] [-c] [-1 len1] [-2 len2] [-d adap3] [-m ປ່ຽນແປງ]
[-u ບໍ່ມີແຜນທີ່] [-e maxerr] [-M c⎪g] [-N] [-H ທັງໝົດ] [-C ສູງສຸດ] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

ແຜນ​ທີ່​ອ່ານ​ຕາມ​ລໍາ​ດັບ​ກະ​ສານ​ອ້າງ​ອີງ​.

ທາງເລືອກ:

-n INT ຈໍາ​ນວນ​ຂອງ​ຄວາມ​ບໍ່​ກົງ​ກັນ​ສູງ​ສຸດ​ທີ່​ສາ​ມາດ​ພົບ​ໄດ້​ສະ​ເຫມີ [2​]

-a INT ໄລຍະທາງນອກສູງສຸດສຳລັບຄູ່ອ່ານທີ່ຖືກຕ້ອງ [250]

-A INT ໄລຍະຫ່າງສູງສຸດຂອງສອງ RF ຈ່າຍອ່ານ (0 ສໍາລັບປິດການໃຊ້ງານ) [0]

-c ແຜນທີ່ອ່ານຢູ່ໃນພື້ນທີ່ສີ (ສໍາລັບ SoliD ເທົ່ານັ້ນ)

-1 INT ຄວາມຍາວຂອງການອ່ານຄັ້ງທໍາອິດ, 0 ສໍາລັບອັດຕະໂນມັດ [0]

-2 INT ຄວາມຍາວຂອງການອ່ານທີສອງ, 0 ສໍາລັບອັດຕະໂນມັດ [0]

-m ລູກລອຍ ອັດຕາການປ່ຽນແປງລະຫວ່າງລໍາດັບການອ້າງອີງແລະການອ່ານ [0.001]

-d ເອກະສານ ລະບຸໄຟລ໌ທີ່ມີແຖວດຽວຂອງລໍາດັບ 3'-adapter
[null]

-u ເອກະສານ ຖິ້ມການອ່ານທີ່ບໍ່ມີແຜນທີ່ ແລະອ່ານທີ່ບັນຈຸຫຼາຍກວ່າ nmis ບໍ່ກົງກັນກັບ
ໄຟລ໌ແຍກຕ່າງຫາກ [null]

-e INT ເກນຜົນລວມຂອງຄຸນນະພາບພື້ນຖານທີ່ບໍ່ກົງກັນ [70]

-H ເອກະສານ ຖິ້ມການຕີຫຼາຍຄັ້ງ/ທັງໝົດ 01-ບໍ່ກົງກັນກັບ ເອກະສານ [null]

-C INT ຈໍານວນ hits ສູງສຸດທີ່ຈະອອກ. ບໍ່ຈໍາກັດຖ້າໃຫຍ່ກວ່າ 512. [250]

-M c⎪g ໂໝດຈັດຮຽງເມທິເລຊັນ. ທັງຫມົດ C (ຫຼື G) ຢູ່ໃນສາຍຕໍ່ຫນ້າຈະເປັນ
ປ່ຽນເປັນ T (ຫຼື A). ທາງເລືອກນີ້ແມ່ນສໍາລັບການທົດສອບເທົ່ານັ້ນ.

-N ເກັບຮັກສາຕໍາແໜ່ງທີ່ບໍ່ກົງກັນຢູ່ໃນໄຟລ໌ຜົນຜະລິດ out.aln.map. ເມື່ອນີ້
ທາງເລືອກແມ່ນຖືກນໍາໃຊ້, ຄວາມຍາວສູງສຸດທີ່ອະນຸຍາດໃຫ້ອ່ານແມ່ນ 55bp.

ຫມາຍ​ເຫດ​:

* ການອ່ານທ້າຍຄູ່ຄວນຖືກກະກຽມເປັນສອງໄຟລ໌, ຫນຶ່ງສໍາລັບແຕ່ລະຕອນທ້າຍ, ກັບ
ການອ່ານຖືກຈັດຮຽງຢູ່ໃນລໍາດັບດຽວກັນ. ນີ້ຫມາຍຄວາມວ່າ k-th ອ່ານໃນຄັ້ງທໍາອິດ
ໄຟລ໌ແມ່ນປະສົມກັບ k-th ທີ່ອ່ານຢູ່ໃນໄຟລ໌ທີສອງ. ການອ່ານທີ່ສອດຄ້ອງກັນ
ຊື່ຈະຕ້ອງກົງກັນກັບຫາງ `/1' ຫຼື `/2'. ຕົວຢ່າງເຊັ່ນ: a
ຄູ່ຂອງຊື່ທີ່ອ່ານໄດ້ຖືກອະນຸຍາດໃຫ້: `EAS1_1_5_100_200/1' ແລະ
`EAS1_1_5_100_200/2'. ຫາງ `/[12]' ປົກກະຕິແລ້ວແມ່ນສ້າງຂຶ້ນໂດຍ
GAPipeline ເພື່ອຈໍາແນກທັງສອງປາຍໃນຄູ່.

* ຜົນ​ຜະ​ລິດ​ແມ່ນ​ໄຟລ​໌​ຖານ​ສອງ​ບີບ​ອັດ​. ມັນໄດ້ຮັບຜົນກະທົບຈາກການສິ້ນສຸດ.

* ວິທີທີ່ດີທີ່ສຸດທີ່ຈະດໍາເນີນການຄໍາສັ່ງນີ້ແມ່ນເພື່ອໃຫ້ປະມານ 1 ຫາ 3 ລ້ານອ່ານເປັນ
ວັດສະດຸປ້ອນ. ອ່ານຫຼາຍໃຊ້ຄວາມຈຳຫຼາຍ.

* ທາງເລືອກ -n ຄວບຄຸມຄວາມອ່ອນໄຫວຂອງການຈັດວາງ. ໂດຍຄ່າເລີ່ມຕົ້ນ, ຕີກັບ
ບໍ່ກົງກັນສູງສຸດ 2 ອັນສາມາດພົບໄດ້ສະເໝີ. ສູງກວ່າ -n ພົບ hits ຫຼາຍ ແລະ
ປັບປຸງຄວາມຖືກຕ້ອງຂອງຄຸນນະພາບການສ້າງແຜນທີ່. ຢ່າງໃດກໍຕາມ, ນີ້ແມ່ນເຮັດດ້ວຍຄ່າໃຊ້ຈ່າຍ
ຂອງ​ຄວາມ​ໄວ​.

* ການຈັດຮຽງທີ່ມີຄຸນະພາບບໍ່ກົງກັນຫຼາຍອັນຄວນຖືກຍົກເລີກວ່າເປັນຜິດ
ການສອດຄ່ອງຫຼືການປົນເປື້ອນທີ່ເປັນໄປໄດ້. ພຶດຕິກໍານີ້ຖືກຄວບຄຸມໂດຍທາງເລືອກ
-e. ໄດ້ -e ເກນຖືກຄຳນວນພຽງແຕ່ປະມານເພາະຄຸນນະພາບພື້ນຖານ
ຖືກແບ່ງອອກດ້ວຍ 10 ໃນຂັ້ນຕອນທີ່ແນ່ນອນຂອງການສອດຄ່ອງ. ໄດ້ -Q ທາງເລືອກໃນການ
ປະຊຸມ ຄໍາສັ່ງກໍານົດຂອບເຂດທີ່ຊັດເຈນ.

* ຄູ່ຂອງການອ່ານຖືກກ່າວວ່າຖືກຈັບຄູ່ຢ່າງຖືກຕ້ອງຖ້າແລະພຽງແຕ່ຖ້າ
ປະຖົມນິເທດແມ່ນ FR ແລະໄລຍະຫ່າງນອກຂອງຄູ່ແມ່ນບໍ່ໃຫຍ່ກວ່າ
ສູງສຸດ. ບໍ່ມີຂອບເຂດຈໍາກັດກ່ຽວກັບຂະຫນາດໃສ່ຕໍາ່ສຸດທີ່. ການຕັ້ງຄ່ານີ້ແມ່ນ
ກຳນົດໂດຍຂັ້ນຕອນການຈັດຮຽງທ້າຍຄູ່ທີ່ໃຊ້ໃນ Maq. ຮຽກຮ້ອງໃຫ້ ກ
ຂະ​ຫນາດ​ໃສ່​ຕໍາ​່​ສຸດ​ທີ່​ຈະ​ນໍາ​ໄປ​ສູ່​ການ​ຈັດ​ຕໍາ​ແຫນ່ງ​ທີ່​ຜິດ​ພາດ​ກັບ​ສູງ​
ຄຸນນະພາບແຜນທີ່ເກີນຄາດ.

* ໃນ​ປັດ​ຈຸ​ບັນ​, ອ່ານ​ຄູ່​ຈາກ​ຫ້ອງ​ສະ​ຫມຸດ Illumina/Solexa ຍາວ​ໃສ່​ໄດ້​ມີ RF ອ່ານ​
ປະຖົມນິເທດ. ຂະຫນາດໃສ່ສູງສຸດແມ່ນຖືກກໍານົດໂດຍທາງເລືອກ -A. ຢ່າງໃດກໍຕາມ, ຍາວ,
insert library ແມ່ນຍັງປະສົມກັບສ່ວນນ້ອຍໆຂອງການອ່ານຫຍໍ້ເຂົ້າ
ຄູ່ -a ຄວນຖືກຕັ້ງໃຫ້ຖືກຕ້ອງ.

* ບາງຄັ້ງ 5'-end ຫຼືແມ້ກະທັ້ງ 3'-adapter ທັງຫມົດອາດຈະຖືກຈັດລໍາດັບ.
ການສະ ໜອງ -d renders Maq ເພື່ອກໍາຈັດການປົນເປື້ອນຂອງອະແດບເຕີ.

* ໃຫ້ 2 ລ້ານອ່ານເປັນການປ້ອນ, maq ປົກກະຕິແລ້ວໃຊ້ເວລາຫນ່ວຍຄວາມຈໍາ 800MB.

ແຜນຜັງ maq ແຜນຜັງ out.aln.map in.aln1.ແຜນທີ່ in.aln2.ແຜນທີ່ [ ... ]

ຮວມການຈັດຮຽງການອ່ານກຸ່ມເຂົ້າກັນ.

ຫມາຍ​ເຫດ​:

* ໃນທາງທິດສະດີ, ຄໍາສັ່ງນີ້ສາມາດລວມຈໍານວນການຈັດຕໍາແຫນ່ງທີ່ບໍ່ຈໍາກັດ. ຢ່າງໃດກໍຕາມ, ເປັນ
mapmerge ຈະໄດ້ຮັບການອ່ານວັດສະດຸປ້ອນທັງຫມົດໃນເວລາດຽວກັນ, ມັນອາດຈະຕີໄດ້
ຈຳກັດຈຳນວນສູງສຸດຂອງການເປີດໄຟລ໌ທີ່ຕັ້ງໂດຍ OS. ໃນປັດຈຸບັນ, ນີ້
ຕ້ອງໄດ້ຮັບການແກ້ໄຂດ້ວຍຕົນເອງໂດຍ endusers.

* ຄໍາສັ່ງ ແຜນຜັງ ສາມາດໃຊ້ເພື່ອຮວມໄຟລ໌ການຈັດຮຽງທີ່ມີການອ່ານທີ່ແຕກຕ່າງກັນ
ຄວາມຍາວ. ທຸກໆການວິເຄາະຕໍ່ໄປບໍ່ໄດ້ສົມມຸດວ່າຄວາມຍາວຄົງທີ່ອີກຕໍ່ໄປ.

rmdup maq rmdup out.rmdup.map in.ori.ແຜນທີ່

ເອົາຄູ່ທີ່ມີຈຸດປະສານງານນອກທີ່ຄືກັນ. ໃນຫຼັກການ, ຄູ່ກັບ
ຈຸດປະສານງານນອກທີ່ຄືກັນຄວນເກີດຂຶ້ນບໍ່ຄ່ອຍໄດ້. ຢ່າງໃດກໍຕາມ, ເນື່ອງຈາກ
amplification ໃນການກະກຽມຕົວຢ່າງ, ນີ້ເກີດຂຶ້ນເລື້ອຍໆຫຼາຍກ່ວາໂດຍ
ໂອກາດ. ການວິເຄາະພາກປະຕິບັດສະແດງໃຫ້ເຫັນວ່າການຖອນຊ້ໍາກັນຈະຊ່ວຍປັບປຸງ
ຄວາມຖືກຕ້ອງໂດຍລວມຂອງການໂທ SNP.

ປະຊຸມ maq ປະຊຸມ [-sp] [-m ສູງສຸດ] [-Q maxerr] [-r ຮ້ອນ] [-t ຖ່ານຫີນ] [-q minQ] [-N
nHap] out.cns in.ref.bfa in.aln.ແຜນທີ່ 2> out.cns.log

ໂທຫາລໍາດັບຄວາມເຫັນດີຈາກການອ່ານແຜນທີ່.

ທາງເລືອກ:

-t ລູກລອຍ ຄ່າສໍາປະສິດການຂຶ້ນກັບຄວາມຜິດພາດ [0.93]

-r ລູກລອຍ ຊິ້ນສ່ວນຂອງ heterozygotes ໃນບັນດາເວັບໄຊທ໌ທັງຫມົດ [0.001]

-s ເອົາຄຸນນະພາບການສ້າງແຜນທີ່ແບບປາຍດຽວເປັນຄຸນນະພາບການສ້າງແຜນທີ່ສຸດທ້າຍ;
ຖ້າບໍ່ດັ່ງນັ້ນ, ຄຸນນະພາບການສ້າງແຜນທີ່ສິ້ນສຸດທີ່ຈັບຄູ່ຈະຖືກໃຊ້

-p ຍົກເລີກການອ່ານສິ້ນສຸດທີ່ຈັບຄູ່ທີ່ບໍ່ໄດ້ວາງແຜນເປັນຄູ່ທີ່ຖືກຕ້ອງ

-m INT ຈໍາ​ນວນ​ສູງ​ສຸດ​ຂອງ​ຄວາມ​ຜິດ​ພາດ​ທີ່​ອະ​ນຸ​ຍາດ​ໃຫ້​ສໍາ​ລັບ​ການ​ອ່ານ​ທີ່​ຈະ​ນໍາ​ໃຊ້​ໃນ​
ການ​ຮຽກ​ຮ້ອງ​ເປັນ​ເອ​ກະ​ພາບ [7​]

-Q INT ຜົນລວມທີ່ອະນຸຍາດສູງສຸດຂອງຄ່າຄຸນນະພາບຂອງຖານທີ່ບໍ່ກົງກັນ [60]

-q INT ຄຸນນະພາບການສ້າງແຜນທີ່ຂັ້ນຕ່ໍາອະນຸຍາດໃຫ້ອ່ານເພື່ອນໍາໃຊ້ເປັນເອກະສັນກັນ
ໂທ [0​]

-N INT ຈຳນວນ haplotypes ໃນສະນຸກເກີ (>=2) [2]

ຫມາຍ​ເຫດ​:

* ທາງເລືອກ -Q ກໍານົດຂອບເຂດຈໍາກັດກ່ຽວກັບຜົນລວມສູງສຸດຂອງຄຸນນະພາບພື້ນຖານທີ່ບໍ່ກົງກັນ.
ການອ່ານທີ່ມີຄຸນະພາບບໍ່ກົງກັນຫຼາຍອັນຄວນຖືກຍົກເລີກ.

* ທາງເລືອກ -N ກໍານົດຈໍານວນຂອງ haplotypes ໃນສະນຸກເກີ. ມັນໄດ້ຖືກອອກແບບສໍາລັບ
resequing ຂອງຕົວຢ່າງໂດຍການລວມເອົາຫຼາຍສາຍພັນ / ບຸກຄົນຮ່ວມກັນ. ສໍາລັບ
diploid genome resequencing, ທາງເລືອກນີ້ເທົ່າກັບ 2.

glfgen maq glfgen [-sp] [-m ສູງສຸດ] [-Q maxerr] [-r ຮ້ອນ] [-t ຖ່ານຫີນ] [-q minQ] [-N
nHap] out.cns in.ref.bfa in.aln.ແຜນທີ່ 2> out.cns.log

ຄິດໄລ່ຄວາມເປັນໄປໄດ້ຂອງບັນທຶກສໍາລັບທຸກ genotypes ແລະເກັບຮັກສາຜົນໄດ້ຮັບໃນຮູບແບບ GLF
(ຮູບແບບ Genotyping Likelihood). ກະລຸນາກວດເບິ່ງເວັບໄຊທ໌ MAQ ສໍາລັບລາຍລະອຽດ
ລາຍ​ລະ​ອຽດ​ຂອງ​ຮູບ​ແບບ​ໄຟລ​໌​ແລະ​ອຸ​ປະ​ກອນ​ທີ່​ກ່ຽວ​ຂ້ອງ​.

indelpe maq indelpe in.ref.bfa in.aln.ແຜນທີ່ > out.indelpe

ໂທຫາ indels ທີ່ສອດຄ່ອງຈາກການອ່ານສິ້ນສຸດທີ່ຈັບຄູ່. ຜົນຜະລິດແມ່ນ TAB delimited ກັບ
ແຕ່ລະເສັ້ນປະກອບດ້ວຍໂຄໂມໂຊມ, ຕໍາແຫນ່ງເລີ່ມຕົ້ນ, ປະເພດຂອງ indel, ຈໍານວນ
ຂອງການອ່ານໃນທົ່ວ indel, ຂະຫນາດຂອງ indel ແລະ nucleotides ແຊກ / ລຶບ
(ແຍກດ້ວຍຈໍ້າສອງເມັດ), ຈໍານວນຂອງ indels ຢູ່ໃນເສັ້ນ reverse, ຈໍານວນຂອງ indels
ຢູ່ເທິງເສັ້ນ, 5' ລໍາດັບຂ້າງຫນ້າຂອງ indel, 3' ລໍາດັບຕໍ່ໄປນີ້
indel, ຈໍານວນການອ່ານທີ່ສອດຄ່ອງກັນໂດຍບໍ່ມີ indels ແລະສາມຖັນເພີ່ມເຕີມ
ສໍາລັບການກັ່ນຕອງ.

ຢູ່ທີ່ຖັນທີ 3, ປະເພດຂອງ indel, ດາວສະແດງວ່າ indel ໄດ້ຖືກຢືນຢັນ
ໂດຍການອ່ານຈາກທັງສອງ strands, ບວກຫມາຍຄວາມວ່າ indel ຖືກຕີໂດຍການອ່ານຢ່າງຫນ້ອຍສອງຄັ້ງ
ແຕ່ຈາກ strand ດຽວກັນ, ລົບສະແດງໃຫ້ເຫັນ indel ແມ່ນພົບເຫັນພຽງແຕ່ຫນຶ່ງອ່ານ,
ແລະຈຸດ ໝາຍ ຄວາມວ່າ indel ແມ່ນໃກ້ກັບ indel ອື່ນເກີນໄປແລະຖືກກັ່ນຕອງອອກ.

ຜູ້ໃຊ້ໄດ້ຖືກແນະນໍາໃຫ້ດໍາເນີນການຜ່ານ 'maq.pl indelpe' ເພື່ອແກ້ໄຂຈໍານວນຂອງ
ອ່ານແຜນທີ່ໂດຍບໍ່ມີ indels. ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ, ເບິ່ງ 'maq.pl indelpe'
ສ່ວນ.

ອິນເດລໂຊອາ maq ອິນເດລໂຊອາ in.ref.bfa in.aln.ແຜນທີ່ > out.indelsoa

ໂທຫາ indels homozygous ທີ່ມີທ່າແຮງແລະຈຸດແຕກແຍກໂດຍການກວດສອບຄວາມຜິດປົກກະຕິ
ຮູບແບບການຈັດວາງຮອບ indels ແລະຈຸດແຕກ. ຜົນຜະລິດແມ່ນ TAB
delimited ກັບແຕ່ລະເສັ້ນປະກອບດ້ວຍໂຄໂມໂຊມ, ການປະສານງານໂດຍປະມານ,
ຄວາມຍາວຂອງພາກພື້ນທີ່ຜິດປົກກະຕິ, ຈໍານວນຂອງການອ່ານແຜນທີ່ໃນທົ່ວຕໍາແຫນ່ງ,
ຈໍານວນຂອງການອ່ານຢູ່ເບື້ອງຊ້າຍມືຂອງຕໍາແຫນ່ງແລະຈໍານວນຂອງການອ່ານສຸດ
ເບື້ອງຂວາ. ຖັນສຸດທ້າຍສາມາດຖືກລະເລີຍ.

ຜົນຜະລິດມີຜົນບວກທີ່ບໍ່ຖືກຕ້ອງຈໍານວນຫຼາຍ. ການກັ່ນຕອງທີ່ແນະນໍາອາດຈະເປັນ:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

ໃຫ້ສັງເກດວ່າຄໍາສັ່ງນີ້ບໍ່ໄດ້ມີຈຸດປະສົງທີ່ຈະເປັນເຄື່ອງກວດຈັບ indel ທີ່ຖືກຕ້ອງ, ແຕ່
ສ່ວນຫຼາຍແມ່ນຊ່ວຍຫຼີກເວັ້ນບາງຂໍ້ດີທີ່ບໍ່ຖືກຕ້ອງໃນການໂທຫາການທົດແທນ. ໃນ
ນອກ​ຈາກ​ນັ້ນ​, ມັນ​ເຮັດ​ວຽກ​ພຽງ​ແຕ່​ໄດ້​ຮັບ​ຄວາມ​ເລິກ​ເລິກ (~40X ສໍາ​ລັບ​ການ​ຍົກ​ຕົວ​ຢ່າງ​)​; ຖ້າບໍ່ດັ່ງນັ້ນ
ອັດຕາລົບທີ່ບໍ່ຖືກຕ້ອງຈະສູງຫຼາຍ.

ຮູບແບບ ການແປງ

sol2sanger maq sol2sanger in.sol.fastq out.sanger.fastq

ປ່ຽນ Solexa FASTQ ເປັນຮູບແບບມາດຕະຖານ/Sanger FASTQ.

bfq2fastq maq bfq2fastq in.read.bfq out.read.fastq

ປ່ຽນຮູບແບບ BFQ ຂອງ Maq ໃຫ້ເປັນຮູບແບບ FASTQ ມາດຕະຖານ.

ແຜນທີ່2maq maq ແຜນທີ່2maq in.mapass2.map out.maq.map

ປ່ຽນຮູບແບບແຜນທີ່ຂອງ mapass2 ທີ່ລ້າສະໄໝໄປເປັນຮູບແບບແຜນທີ່ຂອງ Maq. ຮູບແບບເກົ່າເຮັດ
ບໍ່ມີຊື່ທີ່ອ່ານ.

ຂໍ້ມູນຂ່າວສານ ການຂຸດຄົ້ນ

ແຜນທີ່ maq ແຜນທີ່ [-bN] in.aln.ແຜນທີ່ > out.aln.txt

ສະ​ແດງ​ການ​ຈັດ​ການ​ອ່ານ​ໃນ​ຂໍ້​ຄວາມ​ທໍາ​ມະ​ດາ​. ສໍາລັບການອ່ານທີ່ສອດຄ່ອງກ່ອນ Smith-
ການ​ຈັດ​ຕັ້ງ Waterman​, ແຕ່​ລະ​ເສັ້ນ​ປະ​ກອບ​ດ້ວຍ​ຊື່​ອ່ານ​, chromosome​, ຕໍາ​ແຫນ່ງ​,
strand, ໃສ່ຂະຫນາດຈາກ coorniates ພາຍນອກຂອງຄູ່, ທຸງຄູ່, ແຜນທີ່
ຄຸນ​ນະ​ພາບ​, ຄຸນ​ນະ​ພາບ​ການ​ສ້າງ​ແຜນ​ທີ່​ທີ່​ສິ້ນ​ສຸດ​ດຽວ​, ຄຸນ​ນະ​ພາບ​ການ​ສ້າງ​ແຜນ​ທີ່​ທາງ​ເລືອກ​, ຈໍາ​ນວນ​ຂອງ​
ບໍ່ກົງກັນຂອງການຕີທີ່ດີທີ່ສຸດ, ຜົນລວມຂອງຄຸນນະພາບຂອງຖານທີ່ບໍ່ກົງກັນທີ່ດີທີ່ສຸດ
ຕີ, ຈຳນວນການຕີ 0-ບໍ່ກົງກັນຂອງ 24bp ທຳອິດ, ຈຳນວນການຕີ 1-ບໍ່ກົງກັນຂອງ
24bp ທໍາອິດກ່ຽວກັບການອ້າງອິງ, ຄວາມຍາວຂອງການອ່ານ, ອ່ານລໍາດັບແລະຂອງມັນ
ຄຸນນະພາບ. ຄຸນນະພາບການສ້າງແຜນທີ່ທາງເລືອກສະເຫມີເທົ່າກັບຄຸນນະພາບການສ້າງແຜນທີ່ຖ້າ
ອ່ານບໍ່ໄດ້ຈັບຄູ່. ຖ້າການອ່ານຖືກຈັບຄູ່, ມັນເທົ່າກັບແຜນທີ່ນ້ອຍກວ່າ
ຄຸນະພາບຂອງສອງສົ້ນ. ຄຸນນະພາບການສ້າງແຜນທີ່ທາງເລືອກນີ້ແມ່ນຕົວຈິງແລ້ວ
ຄຸນນະພາບແຜນທີ່ຂອງຄູ່ຜິດປົກກະຕິ.

ຖັນທີຫ້າ, ທຸງຄູ່, ເປັນທຸງທີ່ບິດເບືອນ. ຕ່ໍາກວ່າ 4 ບິດຂອງມັນໃຫ້
ທິດທາງ: 1 ຫຍໍ້ມາຈາກ FF, 2 ສໍາລັບ FR, 4 ສໍາລັບ RF, ແລະ 8 ສໍາລັບ RR, ເຊິ່ງ FR ຫມາຍຄວາມວ່າ
ວ່າການອ່ານທີ່ມີຈຸດປະສານງານທີ່ນ້ອຍກວ່າແມ່ນຢູ່ໃນເສັ້ນທາງຂ້າງຫນ້າ, ແລະຄູ່ຂອງມັນແມ່ນ
ຢູ່ໃນເສັ້ນປີ້ນກັບກັນ. ພຽງແຕ່ FR ແມ່ນອະນຸຍາດໃຫ້ສໍາລັບຄູ່ທີ່ຖືກຕ້ອງ. ບິດທີ່ສູງຂຶ້ນ
ຂອງທຸງນີ້ໃຫ້ຂໍ້ມູນເພີ່ມເຕີມ. ຖ້າຄູ່ພົບຄູ່ສຸດທ້າຍ
ຄວາມຕ້ອງການ, 16 ຈະຖືກກໍານົດ. ຖ້າການອ່ານທັງສອງຖືກສ້າງແຜນທີ່ແຕກຕ່າງກັນ
ໂຄໂມໂຊມ, 32 ຈະຖືກກໍານົດ. ຖ້າການອ່ານອັນໃດອັນໜຶ່ງໃນສອງອັນບໍ່ສາມາດຕັ້ງແຜນທີ່ທັງໝົດໄດ້,
64 ຈະຖືກກໍານົດ. ທຸງຂອງຄູ່ທີ່ຖືກຕ້ອງສະເໝີເທົ່າກັບ 18.

ສໍາລັບການອ່ານທີ່ສອດຄ່ອງກັບການຈັດຕໍາແຫນ່ງ Smith-Waterman ຫຼັງຈາກນັ້ນ, ທຸງແມ່ນ
ສະເໝີ 130. ແຖວໜຶ່ງປະກອບດ້ວຍຊື່ອ່ານ, ໂຄໂມໂຊມ, ຕຳແໜ່ງ, ສາຍ, ແຊກ
ຂະໜາດ, ທຸງ (ສະເໝີ 130), ຕຳແໜ່ງຂອງ indel ເທິງເຄື່ອງອ່ານ (0 ຖ້າບໍ່ມີ indel),
ຄວາມຍາວຂອງ indels (ບວກສໍາລັບການແຊກແລະລົບສໍາລັບການລຶບ),
ຄຸນ​ນະ​ພາບ​ການ​ສ້າງ​ແຜນ​ທີ່​ຂອງ​ການ​ຫາ​ຄູ່​ຂອງ​ຕົນ​, ຈໍາ​ນວນ​ຂອງ​ການ​ບໍ່​ກົງ​ກັນ​ຂອງ​ການ​ຕີ​ທີ່​ດີ​ທີ່​ສຸດ​, ຜົນ​ລວມ​ຂອງ​
ຄຸນ​ນະ​ພາບ​ຂອງ​ຖານ​ທີ່​ບໍ່​ກົງ​ກັນ​ຂອງ​ການ​ຕີ​ທີ່​ດີ​ທີ່​ສຸດ​, ສອງ​ສູນ​, ຄວາມ​ຍາວ​ຂອງ​ການ​ອ່ານ​,
ອ່ານລໍາດັບແລະຄຸນນະພາບຂອງມັນ. ຄູ່ຂອງການອ່ານ 130 ທຸງສະເຫມີໄດ້ຮັບ a
ທຸງ 18.

ທຸງ 192 ຊີ້ບອກວ່າການອ່ານບໍ່ໄດ້ເຮັດແຜນທີ່ ແຕ່ຄູ່ຂອງມັນໄດ້ຖືກເຮັດແຜນທີ່. ສໍາລັບການດັ່ງກ່າວ
ຄູ່ອ່ານ, ຫນຶ່ງອ່ານມີທຸງ 64 ແລະອີກຄູ່ຫນຶ່ງມີ 192.

ທາງເລືອກ:

-b ບໍ່ສະແດງລໍາດັບການອ່ານແລະຄຸນນະພາບ

-N ສະແດງຕໍາແຫນ່ງທີ່ຄວາມບໍ່ກົງກັນເກີດຂື້ນ. ທຸງນີ້ໃຊ້ໄດ້ເທົ່ານັ້ນ
ດ້ວຍໄຟລ໌ .map ທີ່ສ້າງຂຶ້ນໂດຍ 'maq map -N'.

ກວດເບິ່ງແຜນທີ່ maq ກວດເບິ່ງແຜນທີ່ [-s] [-m ສູງສຸດ] [-q minQ] in.ref.bfa in.aln.ແຜນທີ່ > out.mapcheck

ອ່ານ​ການ​ກວດ​ສອບ​ຄຸນ​ນະ​ພາບ​. mapcheck ທໍາອິດລາຍງານອົງປະກອບແລະຄວາມເລິກຂອງ
ກະສານອ້າງອີງ. ຫຼັງຈາກນັ້ນ, ມີແບບຟອມ. ຖັນທໍາອິດຊີ້ໃຫ້ເຫັນເຖິງ
ຕໍາແຫນ່ງກ່ຽວກັບການອ່ານ. ປະຕິບັດຕາມສີ່ຖັນທີ່ສະແດງໃຫ້ເຫັນ nucleotide
ອົງປະກອບ, ອັດຕາການທົດແທນລະຫວ່າງການອ້າງອີງແລະການອ່ານຈະຖືກມອບໃຫ້.
ອັດຕາເຫຼົ່ານີ້ ແລະຕົວເລກໃນຖັນຕໍ່ໄປນີ້ຖືກປັບຂະໜາດເປັນ 999 ແລະ
ປັດເປັນຈຳນວນເຕັມທີ່ໃກ້ທີ່ສຸດ. ກຸ່ມຕໍ່ໄປຂອງຖັນສະແດງໃຫ້ເຫັນການແຈກຢາຍຂອງ
ຄຸນ​ນະ​ພາບ​ພື້ນ​ຖານ​ໃນ​ໄລ​ຍະ​ການ​ອ່ານ​ຢູ່​ໃນ​ໄລ​ຍະ​ຄຸນ​ນະ​ພາບ​ຂອງ 10. ການ​ສູນ​ເສຍ​ຄຸນ​ນະ​ພາບ​
ປົກກະຕິແລ້ວສາມາດສັງເກດເຫັນໄດ້, ຊຶ່ງຫມາຍຄວາມວ່າພື້ນຖານໃນຕອນທ້າຍຂອງການອ່ານແມ່ນຫນ້ອຍ
ຖືກຕ້ອງ. ກຸ່ມສຸດທ້າຍຂອງຄໍລໍານໍາສະເຫນີສ່ວນຫນຶ່ງຂອງການທົດແທນສໍາລັບ
ອ່ານພື້ນຖານໃນຊ່ວງເວລາທີ່ມີຄຸນນະພາບ. ນີ້ວັດແທກຄວາມຖືກຕ້ອງຂອງຄຸນນະພາບພື້ນຖານ
ການ​ຄາດ​ຄະ​ເນ​. ທີ່ເຫມາະສົມ, ພວກເຮົາຄາດວ່າຈະເຫັນ 1 ໃນ 3? ຖັນ, 10 ໃນ 2? ຖັນ
ແລະ 100 ໃນ 1? ຖັນ.

ທາງເລືອກ:

-s ເອົາຄຸນນະພາບການສ້າງແຜນທີ່ຕອນທ້າຍອັນດຽວເປັນຄຸນນະພາບການສ້າງແຜນທີ່ສຸດທ້າຍ

-m INT ຈໍານວນ mismatahces ສູງສຸດທີ່ອະນຸຍາດໃຫ້ອ່ານຖືກນັບ [4]

-q INT ຄຸນ​ນະ​ພາບ​ການ​ເຮັດ​ແຜນ​ທີ່​ຕໍາ​່​ສຸດ​ທີ່​ອະ​ນຸ​ຍາດ​ໃຫ້​ສໍາ​ລັບ​ການ​ອ່ານ​ທີ່​ຈະ​ຖືກ​ນັບ [30​]

ກະຕ່າ maq ກະຕ່າ [-spvP] [-m ສູງສຸດ] [-Q maxerr] [-q minQ] [-l sitefile] in.ref.bfa
in.aln.ແຜນທີ່ > out.pileup

ສະແດງການຈັດຮຽງໃນຮູບແບບຂໍ້ຄວາມ 'pileup'. ແຕ່ລະສາຍປະກອບດ້ວຍ
ໂຄໂມໂຊມ, ຕຳແໜ່ງ, ພື້ນຖານອ້າງອີງ, ຄວາມເລິກ ແລະພື້ນຖານການອ່ານທີ່ປົກຄຸມ
ຕໍາ​ແຫນ່ງ​ນີ້​. ຖ້າ -v ຖືກເພີ່ມໃສ່ເສັ້ນຄໍາສັ່ງ, ຄຸນນະພາບພື້ນຖານແລະການສ້າງແຜນທີ່
ຄຸນ​ນະ​ພາບ​ຈະ​ໄດ້​ຮັບ​ການ​ນໍາ​ສະ​ເຫນີ​ຢູ່​ໃນ​ຖັນ​ທີ​ຫົກ​ແລະ​ທີ​ເຈັດ​ຕາມ​ລໍາ​ດັບ​.

ຖັນທີຫ້າເລີ່ມຕົ້ນດ້ວຍ `@' ສະເໝີ. ໃນຖັນນີ້, ອ່ານພື້ນຖານຄືກັນ
ການອ້າງອີງແມ່ນສະແດງຢູ່ໃນເຄື່ອງໝາຍຈຸດ `,' ຫຼືຈຸດ `.', ແລະອ່ານຖານທີ່ແຕກຕ່າງ
ຈາກການອ້າງອີງໃນຕົວອັກສອນ. ເຄື່ອງໝາຍຈຸດ ຫຼືຕົວພິມໃຫຍ່ຊີ້ບອກວ່າຖານ
ມາຈາກການອ່ານທີ່ສອດຄ່ອງກັນຢູ່ດ້ານໜ້າ, ໃນຂະນະທີ່ຈຸດ ຫຼື ຕົວພິມນ້ອຍຢູ່ເທິງ
ສາຍປີ້ນກັບກັນ.

ຄໍາສັ່ງນີ້ແມ່ນສໍາລັບຜູ້ໃຊ້ທີ່ຕ້ອງການພັດທະນາຜູ້ໂທ SNP ຂອງຕົນເອງ.

ທາງເລືອກ:

-s ເອົາຄຸນນະພາບການສ້າງແຜນທີ່ຕອນທ້າຍອັນດຽວເປັນຄຸນນະພາບການສ້າງແຜນທີ່ສຸດທ້າຍ

-p ຍົກເລີກການອ່ານທ້າຍທີ່ຈັບຄູ່ທີ່ບໍ່ໄດ້ວາງແຜນເປັນຄູ່ທີ່ຖືກຕ້ອງ

-v ເອົາຂໍ້ມູນ verbose ລວມທັງຄຸນນະພາບພື້ນຖານແລະການສ້າງແຜນທີ່
ຄຸນນະພາບ

-m INT ຈໍາ​ນວນ​ສູງ​ສຸດ​ຂອງ​ຄວາມ​ບໍ່​ກົງ​ກັນ​ທີ່​ອະ​ນຸ​ຍາດ​ໃຫ້​ສໍາ​ລັບ​ການ​ອ່ານ​ທີ່​ຈະ​ນໍາ​ໃຊ້ [7​]

-Q INT ຈຳນວນສູງສຸດທີ່ອະນຸຍາດຂອງຄ່າຄຸນນະພາບທີ່ບໍ່ກົງກັນ [60]

-q INT ຄຸນ​ນະ​ພາບ​ການ​ສ້າງ​ແຜນ​ທີ່​ຕໍາ​່​ສຸດ​ທີ່​ອະ​ນຸ​ຍາດ​ໃຫ້​ສໍາ​ລັບ​ການ​ອ່ານ​ທີ່​ຈະ​ນໍາ​ໃຊ້ [0​]

-l ເອກະສານ ໄຟລ໌ທີ່ບັນຈຸສະຖານທີ່ທີ່ຂີ້ເຫຍື້ອຈະຖືກພິມອອກ. ໃນ​ນີ້
ຍື່ນຄໍລໍາທໍາອິດໃຫ້ຊື່ຂອງເອກະສານອ້າງອີງແລະທີສອງ
ພິກັດ. ຖັນເພີ່ມເຕີມຈະຖືກລະເລີຍ. [null]

-P ຍັງອອກຕໍາແຫນ່ງພື້ນຖານກ່ຽວກັບການອ່ານ

cns2fq maq cns2fq [-Q minMapQ] [-n minNeiQ] [-d ຄວາມເລິກຕໍ່າສຸດ] [-D ຄວາມເລິກສູງສຸດ] in.cns >
out.cns.fastq

ສະກັດລໍາດັບຄວາມເຫັນດີນໍາໃນຮູບແບບ FASTQ. ໃນເສັ້ນລໍາດັບ, ພື້ນຖານ
ໃນກໍລະນີຕ່ໍາແມ່ນຊ້ໍາກັນຫຼືບໍ່ມີການຄຸ້ມຄອງພຽງພໍ; ຖານ
ໃນຕົວພິມໃຫຍ່ຊີ້ບອກເຂດທີ່ SNPs ສາມາດຖືກເອີ້ນຢ່າງຫນ້າເຊື່ອຖື. ໃນ
ເສັ້ນຄຸນນະພາບ, ASCII ຂອງຕົວອັກສອນລົບ 33 ໃຫ້ຄຸນນະພາບ PHRED.

ທາງເລືອກ:

-Q INT ຄຸນ​ນະ​ພາບ​ການ​ເຮັດ​ແຜນ​ທີ່​ຕໍາ​່​ສຸດ​ທີ່ [40​]

-d INT ຄວາມ​ເລິກ​ການ​ອ່ານ​ຕໍາ​່​ສຸດ​ທີ່ [3​]

-n INT ຄຸນນະພາບໃກ້ຄຽງຕໍາ່ສຸດທີ່ [20]

-D INT dpeth ອ່ານສູງສຸດ. >=255 ບໍ່ຈຳກັດ. [255]

cns2snp maq cns2snp in.cns > out.snp

ສະກັດສະຖານທີ່ SNP. ແຕ່ລະສາຍປະກອບດ້ວຍໂຄໂມໂຊມ, ຕໍາແຫນ່ງ, ຖານອ້າງອີງ,
ພື້ນຖານຄວາມເຫັນດີເຫັນພ້ອມ, ຄຸນນະພາບຄວາມເຫັນດີເຫັນພ້ອມຂອງ Phred, ອ່ານຄວາມເລິກ, ຈໍານວນສະເລ່ຍຂອງ
hits ຂອງການອ່ານກວມເອົາຕໍາແຫນ່ງນີ້, ຄຸນນະພາບແຜນທີ່ສູງສຸດຂອງການອ່ານ
ກວມເອົາຕໍາແຫນ່ງ, ຄຸນນະພາບຄວາມເຫັນດີນໍາຕໍາ່ສຸດທີ່ໃນ 3bp flanking
ພາກພື້ນໃນແຕ່ລະດ້ານຂອງເວັບໄຊທ໌ (6bp ໃນຈໍານວນທັງຫມົດ), ການໂທທີ່ດີທີ່ສຸດທີສອງ, ບັນທຶກ
ອັດຕາສ່ວນຄວາມເປັນໄປໄດ້ຂອງການໂທທີ່ດີທີ່ສຸດທີສອງແລະທີສາມທີ່ດີທີ່ສຸດ, ແລະທີສາມທີ່ດີທີ່ສຸດ
ໂທຫາ.

ຖັນທີ 5 ແມ່ນເງື່ອນໄຂຫຼັກເມື່ອທ່ານຕັດສິນຄວາມໜ້າເຊື່ອຖືຂອງ SNP.
ຢ່າງໃດກໍຕາມ, ຍ້ອນວ່າຄຸນນະພາບນີ້ຖືກຄິດໄລ່ພຽງແຕ່ສົມມຸດວ່າເວັບໄຊທ໌ເປັນເອກະລາດ, ທ່ານ
ຄວນພິຈາລະນາຖັນອື່ນເພື່ອຮັບການໂທ SNP ທີ່ຖືກຕ້ອງກວ່າ. ສະຄຣິບ
ຄໍາສັ່ງ `maq.pl SNPfilter' ຖືກອອກແບບມາສໍາລັບການນີ້ (ເບິ່ງຂ້າງລຸ່ມນີ້).

ຖັນທີ 7 ສະແດງເຖິງວ່າເວັບໄຊດັ່ງກ່າວຕົກຢູ່ໃນພື້ນທີ່ທີ່ຊໍ້າຊ້ອນຫຼືບໍ່. ຖ້າບໍ່ມີ
ອ່ານ​ປົກ​ຫຸ້ມ​ຂອງ​ເວັບ​ໄຊ​ສາ​ມາດ​ໄດ້​ຮັບ​ການ​ສ້າງ​ແຜນ​ທີ່​ທີ່​ມີ​ຄຸນ​ນະ​ພາບ​ການ​ສ້າງ​ແຜນ​ທີ່​ສູງ​, flanking ໄດ້​
ພາກ​ພື້ນ​ແມ່ນ​ເປັນ​ໄປ​ໄດ້​ຊ​້​ໍາ​ຫຼື​ຂາດ​ການ​ອ່ານ​ທີ່​ດີ​. SNP ຢູ່ໃນເວັບໄຊດັ່ງກ່າວ
ປົກກະຕິແລ້ວບໍ່ຫນ້າເຊື່ອຖື.

ຖັນທີ 8 ປະມານໃຫ້ຕົວເລກສໍາເນົາຂອງພາກພື້ນ flanking ໃນ
genome ອ້າງອີງ. ໃນກໍລະນີຫຼາຍທີ່ສຸດ, ຕົວເລກນີ້ເຂົ້າຫາ 1.00, ຊຶ່ງຫມາຍຄວາມວ່າ
ພາກພື້ນແມ່ນກ່ຽວກັບການເປັນເອກະລັກ. ບາງຄັ້ງທ່ານອາດຈະເຫັນຄວາມເລິກອ່ານທີ່ບໍ່ແມ່ນສູນແຕ່ 0.00 ຢູ່
ຖັນທີ 7. ນີ້ຊີ້ໃຫ້ເຫັນວ່າການອ່ານທັງຫມົດທີ່ກວມເອົາຕໍາແຫນ່ງມີຢູ່
ຢ່າງໜ້ອຍສອງອັນທີ່ບໍ່ກົງກັນ. Maq ພຽງແຕ່ນັບຈໍານວນການຕີ 0- ແລະ 1- ບໍ່ກົງກັນກັບ
ກະສານອ້າງອີງ. ນີ້ແມ່ນຍ້ອນບັນຫາດ້ານວິຊາການທີ່ສັບສົນ.

ຖັນທີ 9 ໃຫ້ຄຸນນະພາບໃກ້ຄຽງ. ການກັ່ນຕອງຢູ່ໃນຖັນນີ້ຍັງ
ຕ້ອງການເພື່ອໃຫ້ໄດ້ຮັບ SNPs ທີ່ເຊື່ອຖືໄດ້. ຄວາມຄິດນີ້ແມ່ນໄດ້ຮັບການດົນໃຈໂດຍ NQS, ເຖິງແມ່ນວ່າ NQS ແມ່ນ
ໃນເບື້ອງຕົ້ນໄດ້ອອກແບບສໍາລັບການອ່ານດຽວແທນທີ່ຈະເປັນເອກະສັນ.

cns2view maq cns2view in.cns > out.view

ສະແດງຂໍ້ມູນລະອຽດຢູ່ທຸກສະຖານທີ່. ຮູບແບບຜົນຜະລິດແມ່ນຄືກັນກັບ
cns2snp ລາຍງານ

cns2ref maq cns2ref in.cns > out.ref.fasta

ສະກັດລໍາດັບການອ້າງອີງ.

cns2win maq cns2win [-w winsize] [-c ] [-b ເລີ່ມຕົ້ນ] [-e ໃນຕອນທ້າຍ] [-q minQ] in.cns >
out.win

ສະກັດຂໍ້ມູນໂດຍສະເລ່ຍຢູ່ໃນປ່ອງຢ້ຽມ tilling. ຜົນ​ຜະ​ລິດ​ແມ່ນ TAB delimited,
ຊຶ່ງ​ປະ​ກອບ​ດ້ວຍ​ຊື່​ກະ​ສານ​ອ້າງ​ອີງ​, ການ​ປະ​ສານ​ງານ​ແບ່ງ​ໂດຍ 1,000,000​, ອັດ​ຕາ SNP​,
ອັດຕາຄວາມຮ້ອນ, ຄວາມເລິກອ່ານດິບ, ຄວາມເລິກອ່ານໃນພາກພື້ນທີ່ເປັນເອກະລັກ, ໄດ້
ຈໍານວນສະເລ່ຍຂອງ hits ຂອງການອ່ານຢູ່ໃນປ່ອງຢ້ຽມແລະເປີເຊັນ GC.

ທາງເລືອກ:

-w INT ຂະຫນາດຂອງປ່ອງຢ້ຽມ [1000]

-c STR ລຳດັບອ້າງອີງປາຍທາງ; ຖ້າບໍ່ດັ່ງນັ້ນການອ້າງອິງທັງຫມົດຈະຖືກນໍາໃຊ້
[null]

-b INT ຕໍາແຫນ່ງເລີ່ມຕົ້ນ, 0 ໂດຍບໍ່ມີຂໍ້ຈໍາກັດ [0]

-e INT ຕຳແໜ່ງສິ້ນສຸດ, 0 ໂດຍບໍ່ມີຂໍ້ຈຳກັດ [0]

-q INT ຄຸນ​ນະ​ພາບ​ເປັນ​ເອ​ກະ​ພາບ​ຕໍາ​່​ສຸດ​ທີ່​ຂອງ​ເວັບ​ໄຊ​ທີ່​ຈະ​ນໍາ​ໃຊ້ [0​]

simulation ທີ່ກ່ຽວຂ້ອງ

ປອມ maq ປອມ [-r ປ່ຽນແປງ] [-R ອິນເດລຟຣາກ] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Random ແນະນໍາການທົດແທນແລະ indels ກັບການອ້າງອີງ. ການທົດແທນແລະ
sinlge base-pair indels ສາມາດເພີ່ມໄດ້.

ທາງເລືອກ:

-r ລູກລອຍ ອັດ​ຕາ​ການ​ປ່ຽນ​ແປງ [0.001​]

-R ລູກລອຍ ສ່ວນຫນຶ່ງຂອງການກາຍພັນທີ່ຈະເປັນ indels [0.1]

simutrain maq simutrain out.simupars.dat in.read.fastq

ຕົວກໍານົດການຄາດຄະເນ / ລົດໄຟສໍາລັບການຈໍາລອງການອ່ານ.

ຈຳ ລອງ maq ຈຳ ລອງ [-d ຂະໜາດ] [-s stdev] [-N nອ່ານ] [-1 ອ່ານLen1] [-2 ອ່ານLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

ຈຳລອງການອ່ານຕອນທ້າຍທີ່ຈັບຄູ່. ໄຟລ໌ in.simupars.dat ກໍານົດຄວາມຍາວຂອງການອ່ານແລະ
ການ​ແຜ່​ກະ​ຈາຍ​ຄຸນ​ນະ​ພາບ​. ມັນຖືກສ້າງຂຶ້ນຈາກ simutrain, ຫຼືສາມາດດາວໂຫຼດໄດ້ຈາກ
ເວັບໄຊທ໌ Maq. ໃນໄຟລ໌ອ່ານຜົນຜະລິດ, ຊື່ອ່ານປະກອບດ້ວຍເອກະສານອ້າງອີງ
ຊື່ລໍາດັບແລະຈຸດປະສານງານພາຍນອກຂອງຄູ່ຂອງການອ່ານຈໍາລອງ. ໂດຍ
ຄ່າເລີ່ມຕົ້ນ, ຈຳ ລອງ ຖືວ່າການອ່ານມາຈາກລໍາດັບ diploid ທີ່ສ້າງຂຶ້ນ
ໂດຍການເພີ່ມສອງຊຸດການກາຍພັນທີ່ແຕກຕ່າງກັນ, ລວມທັງ indels ຖານຄູ່ຫນຶ່ງ, ກັບ
in.ref.fasta.

ທາງເລືອກ:

-d INT ຄ່າສະເລ່ຍຂອງໄລຍະຫ່າງນອກຂອງຂະຫນາດໃສ່ [170]

-s INT ການບ່ຽງເບນມາດຕະຖານຂອງຂະໜາດແຊກ [20]

-N INT ຈໍານວນຄູ່ຂອງການອ່ານທີ່ຈະສ້າງ [1000000]

-1 INT ຄວາມຍາວຂອງການອ່ານຄັ້ງທໍາອິດ [ກໍານົດໂດຍ in.simupars.dat]

-2 INT ຄວາມຍາວຂອງການອ່ານທີສອງ [ຕັ້ງໂດຍ in.simupars.dat]

-r ລູກລອຍ ອັດ​ຕາ​ການ​ປ່ຽນ​ແປງ [0.001​]

-R ລູກລອຍ ສ່ວນຂອງ 1bp indels [0.1]

-h ເພີ່ມການກາຍພັນທັງໝົດໃສ່ in.ref.fasta ແລະສ້າງການອ່ານຈາກອັນດຽວ
ລໍາດັບທີ່ປ່ຽນແປງ (ຮູບແບບ haploid)

ຫມາຍ​ເຫດ​:

* ການອ່ານທີ່ສ້າງຂຶ້ນຈາກຄໍາສັ່ງນີ້ແມ່ນເອກະລາດ, ເຊິ່ງ deviates ຈາກ
ຄວາມຈິງ. ໃນ​ຂະ​ນະ​ທີ່​ການ​ປະ​ເມີນ​ຜົນ​ສອດ​ຄ່ອງ​ແມ່ນ​ໄດ້​ຮັບ​ຜົນ​ກະ​ທົບ​ຫນ້ອຍ​ຈາກ​ນີ້​, ການ​ປະ​ເມີນ​ຜົນ​ກ່ຽວ​ກັບ​ການ​
ການໂທ SNP ຄວນດໍາເນີນການດ້ວຍຄວາມລະມັດລະວັງ. ການຂຶ້ນກັບຄວາມຜິດພາດອາດຈະເປັນຫນຶ່ງໃນ
ສາເຫດຕົ້ນຕໍຂອງການໂທ SNP ທີ່ບໍ່ຖືກຕ້ອງ.

simustat maq simustat in.simu-aln.map > out.simustat

ປະເມີນຄຸນນະພາບການສ້າງແຜນທີ່ຈາກການອ່ານແບບຈຳລອງ.

ແຂງ ທີ່ກ່ຽວຂ້ອງ

fasta2csfa maq fasta2csfa in.nucl-ref.fasta > out.colour-ref.fasta

ປ່ຽນ nucleotide FASTA ເປັນ FASTA ທີ່ມີລະຫັດສີ. ທຸງ -c ຫຼັງຈາກນັ້ນ, ຄວນໄດ້ຮັບການນໍາໃຊ້
to ແຜນທີ່ ຄໍາສັ່ງ. ໃນຜົນໄດ້ຮັບ, ຕົວອັກສອນ 'A' ຫຍໍ້ມາຈາກສີ 0, `C' ສໍາລັບ 1, `G'
ສໍາລັບ 2 ແລະ 'T' ສໍາລັບ 3. ແຕ່ລະລໍາດັບໃນຜົນໄດ້ຮັບແມ່ນ 1bp ສັ້ນກວ່າການປ້ອນຂໍ້ມູນ.

csmap2nt maq csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

ປ່ຽນການຈັດຮຽງສີເປັນການຈັດຮຽງ nucleotide. ວັດສະດຸປ້ອນ in.ref.nt.bfa ເປັນ
ໄຟລ໌ອ້າງອີງ FASTA nucleotide binary. ມັນຕ້ອງສອດຄ່ອງກັບໄຟລ໌ຕົ້ນສະບັບ
ເຊິ່ງການອ້າງອີງສີຖືກປ່ຽນ. ຄວາມເຫັນດີເຫັນພ້ອມຂອງ Nucleotide ສາມາດເອີ້ນວ່າ
ຈາກການຈັດລໍາດັບຜົນໄດ້ຮັບ.

ອື່ນ/ຂັ້ນສູງ ຄໍາສັ່ງ

ແຜນທີ່ຍ່ອຍ maq ແຜນທີ່ຍ່ອຍ [-q minMapQ] [-Q maxSumErr] [-m ສູງສຸດMM] [-p] out.map in.ແຜນທີ່

ການກັ່ນຕອງການຈັດຕໍາແຫນ່ງທີ່ບໍ່ດີໃນ in.ແຜນທີ່. ຕົວເລືອກແຖວຄໍາສັ່ງຖືກອະທິບາຍຢູ່ໃນ
`ປະຊຸມ' ຄໍາ​ສັ່ງ​.

eland2maq maq eland2maq [-q defqual] out.map in.list in.eland

ປ່ຽນການຈັດຮຽງ eland ເປັນຮູບແບບ .map ຂອງ maq. ໄຟລ໌ in.list ປະກອບດ້ວຍ
ຊື່ລໍາດັບທີ່ປາກົດຢູ່ໃນຖັນທີເຈັດຂອງໄຟລ໌ການຈັດຕໍາແຫນ່ງ eland
in.eland ແລະຊື່ທີ່ທ່ານຄາດວ່າຈະເຫັນໃນການຈັດຕໍາແຫນ່ງ maq. ຕໍ່ໄປນີ້ແມ່ນເປັນ
ຍົກຕົວຢ່າງ:

cX.fa chrX
c1.fa chr1
c2.fa chr2

ຖ້າທ່ານກໍາລັງຈັດລໍາດັບການອ່ານໃນຫຼາຍໆຊຸດໂດຍໃຊ້ eland, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະ
ໃຊ້ຄືກັນ in.list ສໍາລັບການປ່ຽນໃຈເຫລື້ອມໃສ. ນອກຈາກນັ້ນ, maq ຈະໂຫລດທັງຫມົດ
ການຈັດຮຽງແລະຈັດຮຽງພວກມັນຢູ່ໃນຫນ່ວຍຄວາມຈໍາ. ຖ້າຫາກວ່າທ່ານໄດ້ concatenate eland ຫຼາຍ
ຜົນ​ໄດ້​ຮັບ​ເຂົ້າ​ໄປ​ໃນ​ຫນຶ່ງ​ໄຟລ​໌ huge​, ທ່ານ​ຄວນ​ຈະ​ແຍກ​ອອກ​ເປັນ​ໄຟລ​໌​ຂະ​ຫນາດ​ນ້ອຍ​ເພື່ອ​
ປ້ອງກັນບໍ່ໃຫ້ maq ກິນຄວາມຊົງຈໍາເຄື່ອງທັງຫມົດຂອງທ່ານ.

ຄໍາສັ່ງນີ້ມີຈຸດປະສົງເພື່ອສະແດງໃຫ້ເຫັນການສອດຄ່ອງ Eland ໃນ Maqview. ຍ້ອນວ່າບໍ່ມີຄຸນນະພາບ
ຂໍ້ມູນທີ່ມີຢູ່, ໄຟລ໌ການຈັດຕໍາແຫນ່ງ maq ຜົນໄດ້ຮັບບໍ່ຄວນຖືກນໍາໃຊ້
ເພື່ອໂທຫາ genotypes ທີ່ເປັນເອກະສັນກັນ.

ສົ່ງອອກ 2maq maq ສົ່ງອອກ 2maq [-1 ອ່ານ 1 ເລນ] [-2 ອ່ານ 2 ເລນ] [-a maxdist] [-n] out.map in.list
in.ສົ່ງອອກ

ປ່ຽນຮູບແບບການສົ່ງອອກຂອງ Illumina ເປັນ Maq's .ແຜນທີ່ ຮູບແບບ. ຮູບແບບການສົ່ງອອກແມ່ນຮູບແບບໃຫມ່
ຮູບແບບການຈັດຮຽງຕັ້ງແຕ່ SolxaPipeline-0.3.0 ເຊິ່ງຍັງຄິດໄລ່ການສ້າງແຜນທີ່
ຄຸນນະພາບເຊັ່ນ maq. ໄຟລ໌ຜົນໄດ້ຮັບສາມາດຖືກນໍາໃຊ້ເພື່ອໂທຫາ genotypes ເອກະສັນ
ເນື່ອງຈາກຂໍ້ມູນທີ່ຈໍາເປັນສ່ວນໃຫຍ່ແມ່ນມີໃຫ້ maq ເພື່ອເຮັດສິ່ງນີ້ຢ່າງຖືກຕ້ອງ.

ທາງເລືອກ:

-1 INT ຄວາມ​ຍາວ​ຂອງ​ການ​ອ່ານ​ຄັ້ງ​ທໍາ​ອິດ [0​]

-2 INT ຄວາມ​ຍາວ​ຂອງ​ການ​ອ່ານ​ຄັ້ງ​ທີ​ສອງ [0​]

-a INT ໄລຍະທາງນອກສູງສຸດສຳລັບຄູ່ອ່ານທີ່ຖືກຕ້ອງ [250]

-n ຮັກສາການອ່ານທີ່ມີການກັ່ນຕອງ

MAQ-PERL ສາມາດ


ການສາທິດ maq.pl ການສາທິດ [-h] [-s] [-N nຄູ່] [-d outDir] in.fasta in.simudat

ສະ​ແດງ​ໃຫ້​ເຫັນ​ການ​ນໍາ​ໃຊ້​ maq ແລະ​ຕົວ​ອັກ​ສອນ​ຂອງ​ຕົນ​. ຄໍາສັ່ງນີ້ຈະ
ຈຳລອງການອ່ານຈາກໄຟລ໌ FASTA in.fasta. ຄວາມຍາວຂອງລໍາດັບແລະຄຸນນະພາບ
ຖືກກໍານົດໂດຍ in.simudat ເຊິ່ງຜະລິດຈາກ maq simutrain ຫຼືສາມາດຈະ
ດາວໂຫຼດຈາກເວັບໄຊທ໌ Maq. ການອ່ານແບບຈຳລອງຈະຖືກນຳມາແຜນທີ່
maq.pl ແລ່ນງ່າຍ. ຄວາມຖືກຕ້ອງຂອງການຈັດວາງແມ່ນຖືກປະເມີນໂດຍ maq simustat, ການ
ຄວາມຖືກຕ້ອງເປັນເອກະສັນກັນໂດຍ maq simucns, ແລະຄວາມຖືກຕ້ອງຂອງ SNP ໂດຍ maq_eval.pl.

ໂດຍຄ່າເລີ່ມຕົ້ນ, ການອ່ານສິ້ນສຸດທີ່ຈັບຄູ່ຈະຖືກຈໍາລອງແລະລໍາດັບ diploid ຈະເປັນ
ສ້າງຂຶ້ນຈາກການປ້ອນໂດຍການເພີ່ມການກາຍພັນກັບປະເພດ haploid. ແຊກ
ຂະຫນາດແລະອັດຕາການກາຍພັນແມ່ນຖືກຄວບຄຸມໂດຍ maq ຈຳ ລອງ.

ທາງເລືອກ:

-h ຈໍາລອງລໍາດັບ haploid ແທນທີ່ຈະເປັນລໍາດັບ diploid

-s ໃຊ້ໂໝດສົ້ນດຽວເພື່ອຈັດຮຽງການອ່ານແທນໂໝດຄູ່

-N INT ຈໍານວນຄູ່ຂອງການອ່ານທີ່ຈະຈໍາລອງ [1000000]

-d DIR ໄດເລກະທໍລີຜົນຜະລິດ [maqdemo]

ຫມາຍ​ເຫດ​:

* ໄຟລ​໌​ຜົນ​ຜະ​ລິດ​ຈາກ​ maq_eval.pl ບໍ່​ໄດ້​ຮັບ​ການ​ເອ​ກະ​ສານ​, ແຕ່​ວ່າ​ທ່ານ​ອາດ​ຈະ​ເຮັດ​ໃຫ້​
ການຄາດເດົາທີ່ດີຢູ່ໃນບາງໄຟລ໌ເຫຼົ່ານີ້.

* ຄໍາສັ່ງນີ້ພຽງແຕ່ສະແດງໃຫ້ເຫັນການນໍາໃຊ້ maq suite. ຄວາມຖືກຕ້ອງຂອງຕົວຈິງ
ຂໍ້ມູນແມ່ນເກືອບສະເຫມີຕ່ໍາກວ່າສິ່ງທີ່ທ່ານເຫັນຈາກການຈໍາລອງອັນບໍລິສຸດ.

ແລ່ນງ່າຍ maq.pl ແລ່ນງ່າຍ [-1 ອ່ານ 1 ເລນ] [-d out.dir] [-n nອ່ານ] [-A 3 ຕົວແປງສັນຍານ] [-e minDep]
[-q minCnsQ] [-p] [-2 ອ່ານ 2 ເລນ] [-a ສູງສຸດທີ່ເຄຍ] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

ວິເຄາະທໍ່ສໍາລັບ genomes ຂະຫນາດນ້ອຍ. ຄໍາສັ່ງ Easyrun ຈະດໍາເນີນການຫຼາຍທີ່ສຸດຂອງການວິເຄາະ
ປະຕິບັດໃນ maq. ໂດຍຄ່າເລີ່ມຕົ້ນ, ແລ່ນງ່າຍ ຖືວ່າການປ້ອນຂໍ້ມູນທັງໝົດໃນລຳດັບການອ່ານ
ໄຟລ​໌​ແມ່ນ​ດຽວ​ທີ່​ສຸດ​ແລະ​ເປັນ​ເອ​ກະ​ລາດ​; ເມື່ອ​ໃດ​ -p ຖືກກໍານົດ, ສອງລໍາດັບອ່ານ
ໄຟລ໌ຕ້ອງການ, ຫນຶ່ງສໍາລັບແຕ່ລະທ້າຍ.

ຫຼາຍໄຟລ໌ຈະຖືກສ້າງຂື້ນໃນ out.dir, ໃນບັນດາໄຟລ໌ຕໍ່ໄປນີ້ແມ່ນ
ຜົນ​ຜະ​ລິດ​ທີ່​ສໍາ​ຄັນ​:

cns.final.snp ການໂທ SNP ສຸດທ້າຍທີ່ມີຄຸນນະພາບຕ່ໍາຖືກກັ່ນຕອງອອກ

cns.fq ລຳດັບຄວາມເຫັນດີເຫັນພ້ອມ ແລະຄຸນນະພາບໃນຮູບແບບ FASTQ

ທາງເລືອກ:

-d DIR ລາຍການຜົນຜະລິດ [easyrun]

-n INT ຈໍານວນການອ່ານ / ຄູ່ໃນຫນຶ່ງ batch ຂອງການຈັດຕໍາແຫນ່ງ [2000000]

-S ນໍາ​ໃຊ້​ການ​ແບ່ງ​ປັນ​ການ​ອ່ານ​ຂອງ indels ສັ້ນ (ບາງ​ທີ​ຊ້າ​ຫຼາຍ​)

-N INT ຈຳນວນ haplotypes/strains ໃນສະນຸກເກີ (>=2) [2]

-A ເອກະສານ ໄຟລ໌ສໍາລັບ 3'-ອະແດບເຕີ. ໄຟລ໌ຄວນມີແຖວດຽວຂອງລໍາດັບ
[null]

-1 INT ຄວາມຍາວຂອງການອ່ານຄັ້ງທໍາອິດ, 0 ສໍາລັບອັດຕະໂນມັດ [0]

-e INT ຄວາມເລິກອ່ານຕໍາ່ສຸດທີ່ຈໍາເປັນຕ້ອງໂທຫາ SNP (ສໍາລັບ SNPfilter) [3]

-q INT ຄຸນນະພາບການເຫັນດີຂັ້ນຕ່ໍາສໍາລັບ SNPs ໃນ cns.final.snp [30]

-p ສະຫຼັບໄປຫາໂໝດການຈັດຮຽງທ້າຍທີ່ຈັບຄູ່ແລ້ວ

-2 INT ຄວາມຍາວຂອງທີສອງອ່ານເມື່ອ -p ຖືກ​ນໍາ​ໃຊ້ [0​]

-a INT ຂະຫນາດໃສ່ສູງສຸດໃນເວລາທີ່ -p ຖືກ​ນໍາ​ໃຊ້ [250​]

ຫມາຍເຫດ:

* ສໍາລັບ SNP ໂທຫາຕົວຢ່າງລວມ, ຜູ້ໃຊ້ຄວນຕັ້ງໃຫ້ຖືກຕ້ອງ-N'ເຊັ່ນດຽວກັນກັບ
`-E 0 '.

* ໄຟລ໌ປ້ອນຂໍ້ມູນສາມາດເປັນຮູບແບບຖານສອງຂອງ maq. maq.pl ອັດຕະໂນມັດຈະກວດພົບ
ຮູບ​ແບບ​ໄຟລ​໌​.

SNPfilter maq.pl SNPfilter [-d minDep] [-D ສູງສຸດທີ່ເຄຍ] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s ຄະແນນຕໍ່າສຸດ] [-m
ສູງສຸດຂ້າມ] [-a] [-N ສູງສຸດ WinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

ກົດລະບຽບອອກ SNPs ທີ່ຖືກຄຸ້ມຄອງໂດຍການອ່ານຈໍານວນຫນ້ອຍ (ລະບຸໂດຍ -d), ໂດຍຈໍານວນຫຼາຍເກີນໄປ
ອ່ານ (ລະບຸໂດຍ -D), ໃກ້ (ລະບຸໂດຍ -w) ກັບ indel ທີ່ມີທ່າແຮງ, ຫຼຸດລົງ
ໃນເຂດພື້ນທີ່ທີ່ອາດຈະເກີດຂຶ້ນຊ້ຳໆ (ລັກສະນະໂດຍ -Q), ຫຼືມີຄຸນນະພາບຕ່ໍາ
ຖານທີ່ໃກ້ຄຽງ (ລະບຸໂດຍ -n) ຖ້າຫາກວ່າ ສູງສຸດ WinSNP ຫຼືຫຼາຍກວ່ານັ້ນ SNPs ປາກົດຢູ່ໃນອັນໃດນຶ່ງ
densWinSize ປ່ອງຢ້ຽມ, ພວກເຂົາຍັງຈະຖືກກັ່ນຕອງອອກຮ່ວມກັນ.

ທາງເລືອກ:

-d INT ຄວາມເລິກອ່ານຕໍາ່ສຸດທີ່ຈໍາເປັນຕ້ອງໂທຫາ SNP [3]

-D INT ຄວາມເລິກອ່ານສູງສຸດທີ່ຕ້ອງການເພື່ອໂທຫາ SNP (<255, ຖ້າບໍ່ດັ່ງນັ້ນຈະຖືກລະເລີຍ)
[256]

-Q INT ຕ້ອງການຄຸນນະພາບການສ້າງແຜນທີ່ສູງສຸດຂອງການອ່ານທີ່ກວມເອົາ SNP [40]

-q INT ຄຸນ​ນະ​ພາບ​ເປັນ​ເອ​ກະ​ພາບ​ຕໍາ​່​ສຸດ​ທີ່ [20​]

-n INT ຄຸນ​ນະ​ພາບ​ການ​ເປັນ​ເອ​ກະ​ພາບ​ຢູ່​ໃກ້​ຄຽງ​ຕໍາ​່​ສຸດ​ທີ່ [20​]

-w INT ຂະຫນາດຂອງປ່ອງຢ້ຽມປະມານ indels ທີ່ມີທ່າແຮງ. SNPs ທີ່ໃກ້ຊິດ
to indels ຈະຖືກສະກັດກັ້ນ [3]

-F ເອກະສານ ໄດ້ indelpe ຜົນຜະລິດ [null]

-f ເອກະສານ ໄດ້ ອິນເດລໂຊອາ ຜົນຜະລິດ [null]

-s INT ຄະແນນຕໍ່າສຸດສໍາລັບ soa-indel ທີ່ຈະພິຈາລະນາ [3]

-m INT ຈໍານວນການອ່ານສູງສຸດທີ່ສາມາດສ້າງແຜນທີ່ໃນທົ່ວ soa-indel [1]

-a ການກັ່ນຕອງທາງເລືອກສໍາລັບການຈັດວາງປາຍດຽວ

indelpe maq.pl indelpe in.indelpe > out.indelpe

ແກ້ໄຂຈໍານວນການອ່ານທີ່ເຮັດແຜນທີ່ໂດຍບໍ່ມີ indels ສໍາລັບສັນຍາ homopolymer. ນີ້
ຄໍາສັ່ງດັດແກ້ 4th, 10th ແລະສາມຖັນສຸດທ້າຍຂອງ in.indelpe ແລະ
ຜົນໄດ້ຮັບໃນ out.indelpe. ຫຼັງຈາກການແກ້ໄຂ, ຕໍ່ໄປນີ້ ງຸ່ມ
ຄໍາສັ່ງໃຫ້ indels homozygous putative:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

ແລະຕໍ່ໄປນີ້ເຮັດໃຫ້ heterozygotes:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

ກະລຸນາສັງເກດວ່ານີ້ indelpe ຄໍາສັ່ງພຽງແຕ່ປະຕິບັດກົດລະບຽບ heuristic ຫຼາຍ.
ມັນບໍ່ຖືກຕ້ອງສໍາລັບການແລ່ນ homopolymer ທີ່ບໍ່ສະອາດ ຫຼື di-nucleotide/triplet
ຊ້ຳ. ດັ່ງນັ້ນ, ສອງຄໍາສັ່ງ awk ພຽງແຕ່ໃຫ້ປະມານ hom/het
indels.

ຕົວຢ່າງ


· script Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· ຄໍາສັ່ງທີ່ສໍາຄັນທີ່ຢູ່ເບື້ອງຫລັງ easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
maq map part1.map ref.bfa part1.bfq ;
maq map part2.map ref.bfa part2.bfq ;
maq mapmerge aln.map part1.map part2.map;
maq ປະກອບ cns.cns ref.bfa aln.map;

ໃຊ້ maq ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

  • 1
    ສາຍແຮ່
    ສາຍແຮ່
    ໂຄງການເສັ້ນທາງໄດ້ຖືກຍ້າຍໄປ
    https://strace.io. strace is a
    ການວິນິດໄສ, debugging ແລະຄໍາແນະນໍາ
    userspace tracer ສໍາລັບ Linux. ມັນຖືກນໍາໃຊ້
    ຕິດ​ຕາມ​ກວດ​ກາ ...
    ດາວ​ໂຫຼດ​ຕິດ​ຕາມ​
  • 2
    gMKVEExtractGUI
    gMKVEExtractGUI
    GUI ສໍາລັບຜົນປະໂຫຍດ mkvextract (ສ່ວນຫນຶ່ງຂອງ
    MKVToolNix​) ທີ່​ປະ​ກອບ​ສ່ວນ​ຫຼາຍ (ຖ້າ​ຫາກ​ວ່າ​
    ບໍ່ແມ່ນທັງຫມົດ) ການເຮັດວຽກຂອງ mkvextract ແລະ
    mkvinfo ຜົນປະໂຫຍດ. ຂຽນໃນ C#NET 4.0,...
    ດາວໂຫລດ gMKVEExtractGUI
  • 3
    ຫໍສະໝຸດ JasperReports
    ຫໍສະໝຸດ JasperReports
    ຫໍສະຫມຸດ JasperReports ແມ່ນ
    ແຫຼ່ງເປີດທີ່ນິຍົມທີ່ສຸດໃນໂລກ
    ທາງທຸລະກິດແລະການລາຍງານ
    ເຄື່ອງຈັກ. ມັນຖືກຂຽນທັງຫມົດໃນ Java
    ແລະ​ມັນ​ສາ​ມາດ ...
    ດາວໂຫລດ JasperReports Library
  • 4
    ປຶ້ມ Frappe
    ປຶ້ມ Frappe
    Frappe Books ເປັນແຫຼ່ງຟຣີ ແລະເປີດ
    ຊອບ​ແວ​ການ​ຮັກ​ສາ​ປື້ມ​ບັນ​ທຶກ desktop ວ່າ​
    ງ່າຍ​ດາຍ​ແລະ​ດີ​ອອກ​ແບບ​ທີ່​ຈະ​ນໍາ​ໃຊ້​ໂດຍ​
    ທຸລະກິດຂະໜາດນ້ອຍ ແລະນັກອິດສະລະ. ມັນ...
    ດາວໂຫລດປື້ມ Frappe
  • 5
    Python ຕົວເລກ
    Python ຕົວເລກ
    ຂ່າວ: NumPy 1.11.2 ເປັນການປ່ອຍຄັ້ງສຸດທ້າຍ
    ທີ່ຈະເຮັດໃນ sourceforge. ລໍ້
    ສໍາລັບ Windows, Mac, ແລະ Linux ເຊັ່ນດຽວກັນກັບ
    ການແຈກຢາຍແຫຼ່ງທີ່ເກັບໄວ້ໃນແຟ້ມສາມາດເປັນສີ່...
    ດາວໂຫລດ Numerical Python
  • 6
    CMU Sphinx
    CMU Sphinx
    CMUSphinx ເປັນລໍາໂພງເອກະລາດຂະຫນາດໃຫຍ່
    ການຮັບຮູ້ສຽງເວົ້າຢ່າງຕໍ່ເນື່ອງຂອງຄໍາສັບ
    ປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດແບບ BSD. ມັນ​ແມ່ນ
    ຍັງເປັນການເກັບກໍາຂອງເຄື່ອງມືແຫຼ່ງເປີດ ...
    ດາວໂຫລດ CMU Sphinx
  • ເພີ່ມເຕີມ »

Linux ຄຳ ສັ່ງ

Ad