ນີ້ແມ່ນຄໍາສັ່ງ vsearch ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
vsearch — ການກວດສອບ chimera, ການຈັດກຸ່ມ, dereplication, ຫນ້າກາກ, ສອດຄ່ອງຄູ່,
ການຊອກຫາ, shuffling ແລະການຈັດລຽງຂອງ amplicons ຈາກໂຄງການ metagenomic.
ສະຫຼຸບສັງລວມ
ການກວດສອບ Chimera:
vsearch --uchime_denovo ໄວໄຟ (--chimeras | --nonchimeras | --uchimealns |
--uchimeout) ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]
vsearch --uchime_ref ໄວໄຟ (--chimeras | --nonchimeras | --uchimealns |
--uchimeout) ໄຟລ໌ອອກ --db ໄວໄຟ [ທາງເລືອກໃນການ]
ກຸ່ມ:
vsearch (--cluster_fast | --cluster_size | --cluster_smallmem) ໄວໄຟ (--alnout
| --blast6out | --centroids | --ກຸ່ມ | --msaout | --samout | --uc | --ຜູ້ໃຊ້ອອກ)
ໄຟລ໌ອອກ --id ທີ່ແທ້ຈິງ [ທາງເລືອກໃນການ]
ຊໍ້າຊ້ອນ:
vsearch --derep_fullength ໄວໄຟ (--ຜົນຜະລິດ | --uc) ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]
ໜ້າກາກ:
vsearch -- maskfasta ໄວໄຟ -- ຜົນຜະລິດ ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]
ການຈັດຮຽງຄູ່:
vsearch --allpairs_global ໄວໄຟ (--alnout | --blast6out | --ກົງກັນ |
--ບໍ່ກົງກັນ | --samout | --uc | --ຜູ້ໃຊ້ອອກ) ໄຟລ໌ອອກ (--ຍອມຮັບ | --id ທີ່ແທ້ຈິງ)
[ທາງເລືອກໃນການ]
ການຄົ້ນຫາ:
vsearch --usearch_global ໄວໄຟ --db ໄວໄຟ (--alnout | --blast6out |
--samout | --uc | --ຜູ້ໃຊ້ອອກ) ໄຟລ໌ອອກ --id ທີ່ແທ້ຈິງ [ທາງເລືອກໃນການ]
ການສະຫຼັບ:
vsearch --ສະຫຼັບ ໄວໄຟ -- ຜົນຜະລິດ ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]
ການຈັດຮຽງ:
vsearch (--sortbylength | --sortbysize) ໄວໄຟ -- ຜົນຜະລິດ ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]
ລາຍລະອຽດ
ການສຶກສາຄວາມຫຼາກຫຼາຍຂອງໂມເລກຸນດ້ານສິ່ງແວດລ້ອມ ຫຼືທາງຄລີນິກ ໄດ້ສ້າງ amplicons ຂະໜາດໃຫຍ່
(ເຊັ່ນ: ລໍາດັບ SSU-rRNA) ທີ່ຕ້ອງໄດ້ຮັບການກວດກາສໍາລັບ chimeras, dereplicated, masked,
ຈັດຮຽງ, ຊອກຫາ, ຈັດກຸ່ມ ຫຼືປຽບທຽບກັບລໍາດັບອ້າງອີງ. ຈຸດປະສົງຂອງ vsearch ແມ່ນເພື່ອ
ສະເໜີໃຫ້ເຄື່ອງມືແຫຼ່ງເປີດທັງໝົດໃນໜຶ່ງດຽວເພື່ອປະຕິບັດວຽກງານເຫຼົ່ານີ້, ໂດຍໃຊ້ສູດການຄິດໄລ່ທີ່ດີທີ່ສຸດ
ການປະຕິບັດແລະການຂຸດຄົ້ນທ່າແຮງອັນເຕັມທີ່ຂອງຄອມພິວເຕີທີ່ທັນສະໄຫມ, ດັ່ງນັ້ນການສະຫນອງໄວ
ແລະການປະມວນຜົນຂໍ້ມູນທີ່ຖືກຕ້ອງ.
ການປຽບທຽບລໍາດັບ nucleotide ແມ່ນຢູ່ໃນຫຼັກຂອງ vsearch. ເພື່ອເລັ່ງການປຽບທຽບ, vsearch
ປະຕິບັດການປະຕິບັດທີ່ໄວທີ່ສຸດຂອງ Needleman-Wunsch algorithm, ເຮັດໃຫ້ການນໍາໃຊ້
ຂອງ Streaming SIMD Extensions (SSE2) ຂອງ CPU x86-64 ທີ່ທັນສະໄຫມ. ຖ້າຄໍາແນະນໍາ SSE2 ແມ່ນ
ບໍ່ສາມາດໃຊ້ໄດ້, vsearch ອອກດ້ວຍຂໍ້ຄວາມສະແດງຂໍ້ຜິດພາດ. ສໍາລັບການປຽບທຽບທີ່ກ່ຽວຂ້ອງກັບລໍາດັບ
ຍາວກວ່າ 5,000 nucleotides, vsearch ໃຊ້ວິທີການຈັດຮຽງທີ່ຊ້າລົງກັບໜ່ວຍຄວາມຈຳທີ່ນ້ອຍກວ່າ
ຄວາມຕ້ອງການ.
ການປ້ອນຂໍ້ມູນ
vsearch ການປ້ອນຂໍ້ມູນແມ່ນໄຟລ໌ fasta ທີ່ມີລໍາດັບ nucleotide ໜຶ່ງ ຫຼືຫຼາຍອັນ. ສໍາລັບແຕ່ລະຄົນ
ລຳດັບ, ຕົວລະບຸລຳດັບແມ່ນກຳນົດເປັນສະຕຣິງທີ່ປະກອບດ້ວຍລະຫວ່າງ ">"
ສັນຍາລັກແລະຊ່ອງທໍາອິດ, ຫຼືທ້າຍຂອງເສັ້ນ, ອັນໃດກໍຕາມມາກ່ອນ. ນອກຈາກນັ້ນ,
ຖ້າເສັ້ນເລີ່ມຕົ້ນດ້ວຍ ">[;]size=integer;label", ມີ ">label;size=integer;ປ້າຍກຳກັບ" ຫຼື
ສິ້ນສຸດດ້ວຍ ">label;size=integer[;]", vsearch ຈະເອົາຮູບແບບ [;]size=integer[;]
ຈາກສ່ວນຫົວ ແລະຕີຄວາມໝາຍ integer ເປັນຈໍານວນຂອງການປະກົດຕົວ (ຫຼືອຸດົມສົມບູນ) ຂອງ
ລໍາດັບໃນການສຶກສາ. ຂໍ້ມູນທີ່ອຸດົມສົມບູນນັ້ນຖືກນໍາໃຊ້ຫຼືສ້າງຂື້ນໃນລະຫວ່າງ chimera
ການຊອກຄົ້ນຫາ, ການຈັດກຸ່ມ, dereplication, ການຄັດເລືອກແລະການຊອກຫາ.
ລໍາດັບ nucleotide ຖືກກໍານົດເປັນສາຍຂອງສັນຍາລັກ IUPAC (ACGTURYSWKMDBHVN),
ເລີ່ມຕົ້ນຫຼັງຈາກສິ້ນສຸດຂອງແຖວຕົວລະບຸ ແລະສິ້ນສຸດກ່ອນແຖວຕົວລະບຸຕໍ່ໄປ,
ຫຼືທ້າຍໄຟລ໌. vsearch ງຽບໆບໍ່ສົນໃຈຕົວອັກສອນ ascii 9 ຫາ 13, ແລະອອກດ້ວຍ an
ຂໍ້ຄວາມຜິດພາດຖ້າຫາກວ່າຕົວອັກສອນ ascii 0 ຫາ 8, 14 ຫາ 31, "." ຫຼື "-" ມີຢູ່. ອື່ນໆທັງໝົດ
ຕົວອັກສອນ ascii ຫຼື non-ascii ຖືກຖອດອອກ ແລະຖືກຈົ່ມໃນຄຳເຕືອນທີ່ບໍ່ປິດກັ້ນ
ຂໍ້ຄວາມ.
vsearch ການປະຕິບັດງານແມ່ນບໍ່ມີຕົວພິມນ້ອຍ, ຍົກເວັ້ນເມື່ອການປິດບັງໜ້າອັດອ່ອນຖືກເປີດໃຊ້ງານ. ເມື່ອໃຊ້
clustering, masking ຫຼື searching commands, case is important ຖ້າ soft masking ຖືກນໍາໃຊ້.
Soft masking ຖືກກໍານົດດ້ວຍຕົວເລືອກ "--dbmask soft" (ສໍາລັບການຊອກຫາ) ຫຼື "--qmask.
soft" (ສໍາລັບການຄົ້ນຫາ, clustering ແລະ masking). ເມື່ອນໍາໃຊ້ soft masking, ຕົວອັກສອນຕົວພິມນ້ອຍ
ຊີ້ບອກສັນຍາລັກໃສ່ໜ້າກາກ, ໃນຂະນະທີ່ຕົວພິມໃຫຍ່ສະແດງເຖິງສັນຍາລັກປົກກະຕິ. ສັນຍາລັກໃສ່ໜ້າກາກ
ບໍ່ເຄີຍລວມຢູ່ໃນເອກະລັກ k-mers ນໍາໃຊ້ໃນການຊອກຫາ. ໃນເວລາທີ່ soft masking ບໍ່ແມ່ນ
ເປີດໃຊ້, ຕົວອັກສອນທັງໝົດຖືກປ່ຽນເປັນຕົວພິມໃຫຍ່ພາຍໃນ ແລະໃຊ້ໃນໄຟລ໌ຜົນໄດ້ຮັບ.
ເມື່ອປຽບທຽບລໍາດັບໃນລະຫວ່າງການກວດພົບ chimera, dereplication, ຄົ້ນຫາແລະ
ການຈັດກຸ່ມ, T ແລະ U ແມ່ນຖືວ່າຄືກັນ, ໂດຍບໍ່ສົນເລື່ອງຂອງພວກມັນ. ຖ້າສອງສັນຍາລັກແມ່ນ
ບໍ່ຄືກັນ, ການຈັດຮຽງຂອງພວກມັນຈະເຮັດໃຫ້ຄະແນນບໍ່ກົງກັນທາງລົບ (ຄ່າເລີ່ມຕົ້ນ -4),
ຍົກເວັ້ນແຕ່ວ່າຫນຶ່ງຫຼືທັງສອງຂອງສັນຍາລັກແມ່ນບໍ່ຊັດເຈນ (RYSWKMDBHVN) ໃນກໍລະນີທີ່ຄະແນນ
ແມ່ນສູນ. ການຈັດຮຽງຂອງສອງສັນຍາລັກທີ່ບໍ່ຊັດເຈນຄືກັນ (ເຊັ່ນ: R vs R) ຍັງໄດ້ຮັບຄະແນນ
ຂອງສູນ.
vsearch ສາມາດໄດ້ຮັບການສັງລວມເພື່ອຍອມຮັບໄຟລ໌ fasta compressed ເປັນການປ້ອນຂໍ້ມູນ (gz ແລະ bzip2
ຮູບແບບ). ໃນທາງກົງກັນຂ້າມ, ໄຟລ໌ພິເສດເຊັ່ນ: ທໍ່, ທໍ່ທີ່ມີຊື່, ຫຼືເຕົ້າສຽບບໍ່ສາມາດເປັນ
ໃຊ້ເປັນການປ້ອນຂໍ້ມູນ. ເພື່ອນໍາສະເຫນີຕົວຊີ້ວັດຄວາມຄືບຫນ້າ, vsearch ຕ້ອງການເພື່ອຊອກຫາທີ່ສຸດຂອງ
ຊື່ເອກະສານ ເພື່ອຊອກຫາຄວາມຍາວຂອງມັນ. ດັ່ງນັ້ນ, ຊື່ເອກະສານ ຕ້ອງເປັນໄຟລ໌ປົກກະຕິ, ບໍ່ແມ່ນການຖ່າຍທອດ.
ທາງເລືອກໃນການ
vsearch ຮັບຮູ້ຕົວເລືອກແຖວຄໍາສັ່ງຈໍານວນຫລາຍ. ສໍາລັບການນໍາທາງທີ່ງ່າຍຂຶ້ນ, ທາງເລືອກ
ຖືກຈັດກຸ່ມຢູ່ລຸ່ມນີ້ຕາມຫົວຂໍ້ (ການຊອກຄົ້ນຫາchimera, clustering, dereplication, masking,
shuffling, ຄັດ, ແລະຊອກຫາ). ພວກເຮົາເລີ່ມຕົ້ນດ້ວຍທາງເລືອກທົ່ວໄປທີ່ນໍາໃຊ້ກັບທຸກຄົນ
ຫົວຂໍ້.
ທາງເລືອກທົ່ວໄປ:
--fasta_width ໃນທາງບວກ integer
ໄຟລ໌ Fasta ຜະລິດໂດຍ vsearch ຖືກຫໍ່ (ລໍາດັບແມ່ນຂຽນໃສ່
ສາຍຂອງ integer nucleotides, 80 ໂດຍຄ່າເລີ່ມຕົ້ນ). ຕັ້ງຄ່ານັ້ນເປັນ 0 ຫາ
ກໍາຈັດການຫໍ່.
- ຊ່ວຍ ສະແດງການຊ່ວຍເຫຼືອສັ້ນໆ ແລະອອກ.
--ບັນທຶກ ຊື່ເອກະສານ
ຂຽນຂໍ້ຄວາມໃສ່ໄຟລ໌ບັນທຶກທີ່ລະບຸ. ຂໍ້ມູນລາຍລັກອັກສອນປະກອບມີ
ຮຸ່ນຂອງໂປຼແກຼມ, ຈໍານວນຫນ່ວຍຄວາມຈໍາທີ່ມີຢູ່, ຈໍານວນແກນແລະຄໍາສັ່ງ
ຕົວເລືອກສາຍ. ເວລາເລີ່ມຕົ້ນແລະສໍາເລັດຮູບໄດ້ຖືກບັນທຶກໄວ້ເຊັ່ນດຽວກັນ
ເວລາຜ່ານໄປ. ຈໍານວນສູງສຸດຂອງຫນ່ວຍຄວາມຈໍາທີ່ບໍລິໂພກແມ່ນລວມ. ໄດ້
ຄໍາສັ່ງທີ່ແຕກຕ່າງກັນປົກກະຕິແລ້ວຈະຂຽນບາງຂໍ້ມູນກ່ຽວກັບຂອງເຂົາເຈົ້າ
ຜົນໄດ້ຮັບ. ຂໍ້ຄວາມທີ່ເປັນອັນຕະລາຍ, ການເຕືອນໄພແລະຂໍ້ມູນຂ່າວສານແມ່ນຂຽນ.
-- ຄວາມຍາວສູງສຸດ ໃນທາງບວກ integer
ທັງຫມົດ vsearch ການດໍາເນີນງານຈະຍົກເລີກລໍາດັບຂອງຄວາມຍາວເທົ່າກັບຫຼືຫຼາຍກວ່ານັ້ນ
ກ່ວາ integer (50,000 nucleotides ໂດຍຄ່າເລີ່ມຕົ້ນ).
--minseqlength ໃນທາງບວກ integer
ທັງຫມົດ vsearch ການດໍາເນີນງານຈະຍົກເລີກລໍາດັບຂອງຄວາມຍາວຂະຫນາດນ້ອຍກວ່າ
integer (1 nucleotide ໂດຍຄ່າເລີ່ມຕົ້ນສໍາລັບການຈັດລຽງຫຼື shuffling, 32 nucleotides
ສໍາລັບການຈັດກຸ່ມ, dereplication ຫຼືການຊອກຫາ).
--notrunclabels
ຢ່າຕັດປ້າຍກຳກັບຕາມລຳດັບຢູ່ບ່ອນທຳອິດ, ໃຫ້ໃຊ້ສ່ວນຫົວເຕັມ
ໄຟລ໌ຜົນຜະລິດ.
--ງຽບ ສະກັດກັ້ນຜົນຜະລິດທັງຫມົດເພື່ອ stdout ແລະ stdout ຍົກເວັ້ນສໍາລັບການເຕືອນໄພແລະຄວາມຕາຍ
ຂໍ້ຄວາມຜິດພາດ.
- ການປ່ຽນແປງ
ຂໍ້ມູນສະບັບອອກແລະອອກ.
ທາງເລືອກການກວດສອບ Chimera:
ການກວດຫາ Chimera ແມ່ນອີງໃສ່ຟັງຊັນການໃຫ້ຄະແນນທີ່ຄວບຄຸມໂດຍຫ້າທາງເລືອກ (--dn,
--mindiffs, --mindiv, --minh, --xn). ລໍາດັບແມ່ນຈັດຮຽງທໍາອິດໂດຍການຫຼຸດລົງ
ຄວາມອຸດົມສົມບູນ (ຖ້າມີ), ແລະປຽບທຽບກັບພວກມັນ ບວກ strand ເທົ່ານັ້ນ (ກໍລະນີ
insensitive).
In de novo ຮູບແບບ, ການປ້ອນຂໍ້ມູນໄຟລ໌ fasta ຄວນນໍາສະເຫນີຄໍາອະທິບາຍທີ່ອຸດົມສົມບູນ (ແບບ
[;]ຂະຫນາດ=integer[;] ໃນຫົວ fasta). ຄໍາສັ່ງປ້ອນຂໍ້ມູນມີອິດທິພົນຕໍ່ chimera
ການກວດພົບ, ດັ່ງນັ້ນພວກເຮົາແນະນໍາໃຫ້ຈັດລໍາດັບໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນ (ຄ່າເລີ່ມຕົ້ນຂອງ
--derep_fullength ຄໍາສັ່ງ). ຖ້າຊຸດລໍາດັບຂອງທ່ານຕ້ອງການຈັດຮຽງ, ກະລຸນາເບິ່ງ
ຄໍາສັ່ງ --sortbysize ໃນພາກການຈັດລຽງ.
--abskew ທີ່ແທ້ຈິງ
ເມື່ອໃຊ້ --uchime_denovo, skew ອຸດົມສົມບູນຖືກນໍາໃຊ້ເພື່ອຈໍາແນກໃນ
ການຈັດຮຽງ 3 ທາງວ່າ ລຳດັບໃດເປັນຕົວຈີງ ແລະ ອັນໃດແມ່ນພໍ່ແມ່.
ສົມມຸດຕິຖານແມ່ນວ່າ chimeras ປາກົດຕໍ່ມາໃນການຂະຫຍາຍ PCR
ຂະບວນການແລະດັ່ງນັ້ນຈຶ່ງມີຄວາມອຸດົມສົມບູນຫນ້ອຍກວ່າພໍ່ແມ່ຂອງພວກເຂົາ. ຄ່າເລີ່ມຕົ້ນ
ຄ່າແມ່ນ 2.0, ຊຶ່ງຫມາຍຄວາມວ່າພໍ່ແມ່ຄວນຈະມີຢ່າງຫນ້ອຍ 2 ເທົ່າ
ອຸດົມສົມບູນກ່ວາ chimera ຂອງເຂົາເຈົ້າ. ຄ່າບວກໃດໆທີ່ໃຫຍ່ກວ່າ 1.0 ສາມາດເປັນໄດ້
ໃຊ້ແລ້ວ.
--ຄວາມກວ້າງຂວາງ ໃນທາງບວກ integer
ຄວາມກວ້າງຂອງການຈັດຮຽງ 3 ທາງໃນ --uchimealns output. ຄ່າເລີ່ມຕົ້ນແມ່ນ
80. ຕັ້ງເປັນ 0 ເພື່ອກໍາຈັດການຫໍ່.
--chimeras ຊື່ເອກະສານ
ຜົນຜະລິດລໍາດັບ chimeric ກັບ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta. ຄໍາສັ່ງຜົນຜະລິດອາດຈະ
ແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
--db ຊື່ເອກະສານ
ເມື່ອໃຊ້ --uchime_ref, ກວດຫາ chimeras ໂດຍໃຊ້ fasta-formatted
ລຳດັບການອ້າງອີງທີ່ມີຢູ່ໃນ ຊື່ເອກະສານ. ລໍາດັບອ້າງອີງແມ່ນສົມມຸດ
ຈະບໍ່ມີ chimera. Chimeras ຈະບໍ່ຖືກກວດພົບຖ້າພໍ່ແມ່ຂອງພວກເຂົາ (ຫຼື
ພີ່ນ້ອງໃກ້ຊິດພຽງພໍ) ບໍ່ມີຢູ່ໃນຖານຂໍ້ມູນ.
--dn ທີ່ແທ້ຈິງ
ບໍ່ມີການນັບຄະແນນສຽງ pseudo-count (ພາລາມິເຕີ n ໃນຫນ້າທີ່ການໃຫ້ຄະແນນ chimera)
(ຄ່າເລີ່ມຕົ້ນແມ່ນ 1.4).
-- ສະຕິ ໃນທາງບວກ integer
ຈໍານວນຄວາມແຕກຕ່າງຂັ້ນຕ່ໍາຕໍ່ສ່ວນ (ຄ່າເລີ່ມຕົ້ນແມ່ນ 3).
--ໃຈ ທີ່ແທ້ຈິງ
ຄວາມແຕກຕ່າງຂັ້ນຕ່ຳຈາກພໍ່ແມ່ທີ່ໃກ້ຄຽງທີ່ສຸດ (ຄ່າເລີ່ມຕົ້ນແມ່ນ 0.8).
--ນາທີ ທີ່ແທ້ຈິງ
ຄະແນນຕໍ່າສຸດ (ຊ). ການເພີ່ມມູນຄ່ານີ້ມັກຈະຫຼຸດລົງຈໍານວນຂອງ
ບວກທີ່ບໍ່ຖືກຕ້ອງແລະຫຼຸດຜ່ອນຄວາມອ່ອນໄຫວ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 0.28, ແລະ
ຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0 ລວມແມ່ນຍອມຮັບ.
--nonchimeras ຊື່ເອກະສານ
ສົ່ງອອກລໍາດັບທີ່ບໍ່ແມ່ນchimeric ໄປຫາ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta. ຄໍາສັ່ງອອກ
ອາດຈະແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
--ຕົນເອງ ເມື່ອໃຊ້ --uchime_ref, ບໍ່ສົນໃຈລໍາດັບອ້າງອີງເມື່ອປ້າຍຊື່ຂອງມັນ
ກົງກັບປ້າຍກຳກັບຂອງລຳດັບການສອບຖາມ (ເປັນປະໂຫຍດເພື່ອປະເມີນຄ່າບວກ
ອັດຕາໃນລໍາດັບອ້າງອີງ).
--selfid ເມື່ອໃຊ້ --uchime_ref, ບໍ່ສົນໃຈລໍາດັບອ້າງອີງເມື່ອ nucleotide ຂອງມັນ
ລໍາດັບແມ່ນຄືກັນຢ່າງເຂັ້ມງວດກັບລໍາດັບການສອບຖາມ.
-- ກະທູ້ ໃນທາງບວກ integer
ຈໍານວນກະທູ້ຄອມພິວເຕີ້ທີ່ໃຊ້ (1 ຫາ 256) ດ້ວຍ --uchime_ref. ໄດ້
ຈໍານວນຂອງ threads ຄວນຫນ້ອຍຫຼືເທົ່າກັບຈໍານວນຂອງ CPU ທີ່ມີຢູ່
ຫຼັກ. ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຕົວຫນຶ່ງ
thread ຕໍ່ຫຼັກເຫດຜົນ.
--uchime_denovo ຊື່ເອກະສານ
ກວດພົບ chimeras ທີ່ມີຢູ່ໃນຮູບແບບ fasta ຊື່ເອກະສານ, ໂດຍບໍ່ມີການພາຍນອກ
ການອ້າງອີງ (ie de novo). ຈັດລໍາດັບອັດຕະໂນມັດໃນ ຊື່ເອກະສານ by
ຫຼຸດລົງຄວາມອຸດົມສົມບູນລ່ວງໜ້າ (ເບິ່ງລາຍລະອຽດໃນພາກການຈັດຮຽງ).
ບໍ່ຮອງຮັບ Multithreading.
--uchime_ref ຊື່ເອກະສານ
ກວດພົບ chimeras ທີ່ມີຢູ່ໃນຮູບແບບ fasta ຊື່ເອກະສານ ໂດຍການປຽບທຽບພວກມັນ
ດ້ວຍລໍາດັບອ້າງອີງ (ທາງເລືອກ --db). Multithreading ແມ່ນສະຫນັບສະຫນູນ.
--uchimealns ຊື່ເອກະສານ
ຂຽນການຈັດຮຽງທົ່ວໂລກ 3 ທາງ (parentA, parentB, chimera) ຫາ ຊື່ເອກະສານ
ໂດຍໃຊ້ຮູບແບບທີ່ມະນຸດສາມາດອ່ານໄດ້. ໃຊ້ --alignwidth ເພື່ອແກ້ໄຂການຈັດຮຽງ
ຄວາມຍາວ. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
--uchimeout ຊື່ເອກະສານ
ຂຽນຜົນການກວດສອບ chimera ໃສ່ ຊື່ເອກະສານ ການນໍາໃຊ້ແຖບ uchime ແຍກ
ຮູບແບບຂອງ 18 ຊ່ອງຂໍ້ມູນ (ເບິ່ງລາຍການຂ້າງລຸ່ມນີ້). ໃຊ້ --uchimeout5 ເພື່ອໃຊ້ຮູບແບບ
ເຂົ້າກັນໄດ້ກັບ usearch v5 ແລະຮຸ່ນກ່ອນຫນ້າ. ລໍາດັບຜົນຜະລິດແຖວອາດຈະ
ແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
1. ຄະແນນ: ຄະແນນທີ່ສູງຂຶ້ນຫມາຍເຖິງການຈັດຕໍາແໜ່ງຂອງ chimeric ທີ່ເປັນໄປໄດ້.
2. Q: query sequence label.
3. A: parent A ປ້າຍລໍາດັບ.
4. B: ປ້າຍແມ່ B ລໍາດັບ.
5. T: ປ້າຍກຳກັບລຳດັບຂອງພໍ່ແມ່ເທິງສຸດ (ເຊັ່ນ: ປ້າຍກຳກັບແມ່ທີ່ຄ້າຍຄືກັບ
ສອບຖາມ). ຊ່ອງຂໍ້ມູນນັ້ນຖືກເອົາອອກເມື່ອໃຊ້ --uchimeout5.
6. idQM: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະຕົວແບບ (M)
ກໍ່ສ້າງເປັນສ່ວນຫນຶ່ງຂອງພໍ່ແມ່ A ແລະສ່ວນຫນຶ່ງຂອງພໍ່ແມ່ B.
7. idQA: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະພໍ່ແມ່ A.
8. idQB: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະພໍ່ແມ່ B.
9. idAB: ອັດຕາສ່ວນຄວາມຄ້າຍຄືກັນຂອງພໍ່ແມ່ A ແລະພໍ່ແມ່ B.
10. idQT: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະແມ່ເທິງ (T).
11. LY: ແມ່ນແລ້ວ votes ໃນສ່ວນຊ້າຍຂອງຕົວແບບ.
12. LN: ບໍ່ມີຄະແນນສຽງຢູ່ໃນສ່ວນຊ້າຍຂອງຕົວແບບ.
13. LA: ງົດການລົງຄະແນນສຽງໃນສ່ວນຊ້າຍຂອງຕົວແບບ.
14. RY: ແມ່ນແລ້ວລົງຄະແນນສຽງຢູ່ໃນສ່ວນທີ່ຖືກຕ້ອງຂອງຕົວແບບ.
15. RN: ບໍ່ມີຄະແນນສຽງຢູ່ໃນສ່ວນທີ່ຖືກຕ້ອງຂອງຕົວແບບ.
16. RA: ງົດການລົງຄະແນນສຽງໃນສ່ວນທີ່ຖືກຕ້ອງຂອງຕົວແບບ.
17. div: divergence, ກໍານົດເປັນ (idQM - idQT).
18. YN: ການສອບຖາມແມ່ນ chimeric (Y), ຫຼືບໍ່ແມ່ນ (N), ຫຼືເປັນກໍລະນີເສັ້ນຊາຍແດນ.
(?).
--uchimeout5
ເມື່ອໃຊ້ --uchimeout, ຂຽນຜົນການກວດສອບ chimera ໂດຍໃຊ້ແຖບ-
ຮູບແບບທີ່ແຍກອອກຂອງ 17 ຊ່ອງຂໍ້ມູນ (ລົງພາກສະຫນາມທີ 5 ຂອງ --uchimeout),
ເຂົ້າກັນໄດ້ກັບ usearch ຮຸ່ນ 5 ແລະຮຸ່ນກ່ອນຫນ້າ.
--xn ທີ່ແທ້ຈິງ
ບໍ່ມີນ້ຳໜັກການລົງຄະແນນ (ພາຣາມິເຕີເບຕ້າໃນຟັງຊັນການໃຫ້ຄະແນນ) (ຄ່າເລີ່ມຕົ້ນແມ່ນ
8.0).
ຕົວເລືອກການຈັດກຸ່ມ:
vsearch ປະຕິບັດຂັ້ນຕອນວິທີການຈັດກຸ່ມດາວແບບດຽວ, greedy, ຄ້າຍຄືກັນກັບ
algorithms ປະຕິບັດໃນ usearch, DNAclust ແລະ sumaclust ຕົວຢ່າງ. ສຳຄັນ
ພາລາມິເຕີແມ່ນເກນການຈັດກຸ່ມທົ່ວໂລກ (--id) ແລະຕົວຕົນຄູ່
ຄໍານິຍາມ (--iddef).
--centroids ຊື່ເອກະສານ
ຜົນຜະລິດ cluster centroid sequences to ຊື່ເອກະສານ, ໃນຮູບແບບ fasta. ໄດ້
centroid ແມ່ນລໍາດັບທີ່ seeded ກຸ່ມ (ເຊັ່ນ: ລໍາດັບທໍາອິດ
ຂອງກຸ່ມ).
--cluster_fast ຊື່ເອກະສານ
ຈັດກຸ່ມລໍາດັບ fasta ໃນ ຊື່ເອກະສານ, ປະຕິບັດອັດຕະໂນມັດ a
ຈັດຮຽງໂດຍການຫຼຸດຄວາມຍາວຂອງລຳດັບໄວ້ກ່ອນ.
--cluster_size ຊື່ເອກະສານ
ຈັດກຸ່ມລໍາດັບ fasta ໃນ ຊື່ເອກະສານ, ປະຕິບັດອັດຕະໂນມັດ a
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນຂອງລໍາດັບກ່ອນລ່ວງຫນ້າ.
--cluster_smallmem ຊື່ເອກະສານ
ຈັດກຸ່ມລໍາດັບ fasta ໃນ ຊື່ເອກະສານ ໂດຍບໍ່ມີການດັດແປງອັດຕະໂນມັດ
ຄໍາສັ່ງຂອງເຂົາເຈົ້າລ່ວງຫນ້າ. ລໍາດັບຄາດວ່າຈະຖືກຈັດຮຽງໂດຍການຫຼຸດລົງ
ຄວາມຍາວຂອງລໍາດັບ, ເວັ້ນເສຍແຕ່ --usersort ຖືກນໍາໃຊ້.
-- ກຸ່ມ string
ສົ່ງແຕ່ລະກຸ່ມໄປຫາໄຟລ໌ fasta ແຍກຕ່າງຫາກໂດຍໃຊ້ຄໍານໍາຫນ້າ string ແລະ
ticker (0, 1, 2, ແລະອື່ນໆ) ເພື່ອສ້າງເສັ້ນທາງແລະຊື່ໄຟລ໌.
--consout ຊື່ເອກະສານ
ຜົນໄດ້ຮັບການລໍາດັບຄວາມເຫັນດີຂອງກຸ່ມເພື່ອ ຊື່ເອກະສານ. ສໍາລັບແຕ່ລະກຸ່ມ, ກ
ການຈັດຕັ້ງຫຼາຍຢ່າງແມ່ນໄດ້ຮັບການຄິດໄລ່, ແລະລໍາດັບຄວາມເຫັນດີເປັນການກໍ່ສ້າງໂດຍ
ເອົາສັນຍາລັກສ່ວນໃຫຍ່ (nucleotide ຫຼືຊ່ອງຫວ່າງ) ຈາກແຕ່ລະຖັນຂອງ
ການຈັດວາງ. ຖັນທີ່ມີຊ່ອງຫວ່າງສ່ວນໃຫຍ່ຖືກຂ້າມ, ຍົກເວັ້ນ
ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ.
--id ທີ່ແທ້ຈິງ
ຢ່າເພີ່ມເປົ້າໝາຍໃສ່ກຸ່ມ ຖ້າຕົວຕົນຄູ່ກັບ the
centroid ແມ່ນຕ່ໍາກວ່າ ທີ່ແທ້ຈິງ (ລວມມູນຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0). ໄດ້
ຕົວຕົນຄູ່ແມ່ນຖືກກໍານົດເປັນຈໍານວນ (ຄໍລໍາທີ່ກົງກັນ) /
(ຄວາມຍາວການຈັດຮຽງ - ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ). ຄໍານິຍາມນັ້ນສາມາດແກ້ໄຂໄດ້ໂດຍ
--iddef.
--iddef 0|1|2|3|4
ປ່ຽນຄຳນິຍາມຕົວຕົນຄູ່ທີ່ໃຊ້ໃນ --id. ຄ່າທີ່ຍອມຮັບແມ່ນ:
0. CD-HIT ຄໍານິຍາມ: (ຄໍລໍາທີ່ກົງກັນ) / (ລໍາດັບສັ້ນທີ່ສຸດ
ຄວາມຍາວ).
1. ແກ້ໄຂໄລຍະຫ່າງ: (ຄໍລໍາທີ່ກົງກັນ) / (ຄວາມຍາວການຈັດຕໍາແຫນ່ງ).
2. ແກ້ໄຂໄລຍະຫ່າງບໍ່ລວມຊ່ອງຫວ່າງຢູ່ປາຍຍອດ (ຄືກັນກັບ --id).
3. ນິຍາມຫ້ອງທົດລອງຊີວະວິທະຍາທາງທະເລນັບແຕ່ລະຊ່ອງຫວ່າງທີ່ຂະຫຍາຍອອກ
(ພາຍໃນ ຫຼື terminal) ເປັນຄວາມແຕກຕ່າງດຽວ: 1.0 -
[(ບໍ່ກົງກັນ + ຊ່ອງຫວ່າງ)/(ຄວາມຍາວຂອງລຳດັບທີ່ຍາວທີ່ສຸດ)]
4. ຄໍານິຍາມ BLAST, ເທົ່າກັບ --iddef 2 ໃນບໍລິບົດຂອງ
ການຈັດລຽງຄູ່ທົ່ວໂລກ.
--msaout ຊື່ເອກະສານ
ສົ່ງຜົນການຈັດລຽງລຳດັບຫຼາຍອັນ ແລະລຳດັບຄວາມເຫັນດີເຫັນພ້ອມສຳລັບແຕ່ລະຄົນ
cluster ກັບ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta. ລຳດັບຄວາມເຫັນດີເຫັນພ້ອມ
ກໍ່ສ້າງໂດຍການເອົາສັນຍາລັກສ່ວນໃຫຍ່ (nucleotide ຫຼືຊ່ອງຫວ່າງ) ຈາກແຕ່ລະຄົນ
ຖັນຂອງການຈັດວາງ. ຖັນທີ່ມີຊ່ອງຫວ່າງສ່ວນໃຫຍ່ເປັນ
ຂ້າມ, ຍົກເວັ້ນຊ່ອງຫວ່າງຢູ່ປາຍຍອດ.
--qmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
ເຮັດເລື້ມຄືນແບບງ່າຍໆ ແລະໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໃນລຳດັບໂດຍໃຊ້ ຝຸ່ນ
ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none). ຄໍາເຕືອນ, ໃນເວລາທີ່ການນໍາໃຊ້ ອ່ອນໆ
ການປິດບັງ, ການສ້າງກຸ່ມກາຍເປັນຕົວພິມນ້ອຍໃຫຍ່. ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ຫນ້າກາກໂດຍໃຊ້
ຝຸ່ນ.
--ຂະຫນາດ ຄໍານຶງເຖິງຄໍາບັນຍາຍອຸດົມສົມບູນທີ່ມີຢູ່ໃນ fasta ວັດສະດຸປ້ອນ
ໄຟລ໌ (ຊອກຫາຮູບແບບ "[>;]size=integer[;]" ໃນຫົວລໍາດັບ).
--ຂະຫນາດ
ເພີ່ມຄໍາອະທິບາຍຄວາມອຸດົມສົມບູນກັບໄຟລ໌ fasta ຜົນຜະລິດ (ເພີ່ມຮູບແບບ
";ຂະໜາດ=integer;" to sequence headers) ຖ້າ --sizein ຖືກລະບຸ, ຄວາມອຸດົມສົມບູນ
ຄໍາອະທິບາຍປະກອບໄດ້ຖືກລາຍງານໄປຫາໄຟລ໌ຜົນຜະລິດ, ແລະແຕ່ລະກຸ່ມ centroid
ໄດ້ ຮັບ ມູນ ຄ່າ ອຸ ດົມ ສົມ ບູນ ໃຫມ່ ທີ່ ສອດ ຄ້ອງ ກັນ ກັບ ອຸ ດົມ ສົມ ບູນ ທັງ ຫມົດ ຂອງ
amplicons ລວມຢູ່ໃນກຸ່ມ (--centroids ທາງເລືອກ). ຖ້າ --sizein ບໍ່ແມ່ນ
ລະບຸໄວ້, ຄວາມອຸດົມສົມບູນຂອງວັດສະດຸປ້ອນແມ່ນຕັ້ງເປັນ 1 ສໍາລັບ amplicons, ແລະຕົວເລກ
ຂອງ amplicons ຕໍ່ cluster ສໍາລັບ centroids.
--strand ບວກ|ທັງສອງ
ເມື່ອປຽບທຽບລໍາດັບກັບເມັດກຸ່ມ, ໃຫ້ກວດເບິ່ງ ບວກ strand ເທົ່ານັ້ນ
(ຄ່າເລີ່ມຕົ້ນ) ຫຼືກວດສອບ ທັງສອງ ສາຍ.
-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.
--uc ຊື່ເອກະສານ
Output clustering ຜົນໄດ້ຮັບໃນ ຊື່ເອກະສານ ການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື ucust. ສໍາລັບ
ລາຍລະອຽດຂອງຮູບແບບ, ເບິ່ງ
<http://www.drive5.com/usearch/manual/ucout.html>.
-- ຜູ້ໃຊ້
ເມື່ອໃຊ້ --cluster_smallmem, ອະນຸຍາດໃຫ້ມີການປ້ອນຂໍ້ມູນຕາມລໍາດັບ, ບໍ່ພຽງແຕ່ a
ການຫຼຸດຜ່ອນຄວາມຍາວສັ່ງ.
ຕົວເລືອກການຊອກຫາສ່ວນໃຫຍ່ຍັງໃຊ້ກັບການຈັດກຸ່ມ:
--alnout, --blast6out, --fastapairs, --matched, --notmatched, --maxaccept,
--maxreject, --samout, --userout, --userfields, ການກັ່ນຕອງຄະແນນ, ຊ່ອງຫວ່າງ
ການລົງໂທດ, ຫນ້າກາກ. (ເບິ່ງພາກຄົ້ນຫາ).
ທາງເລືອກໃນການຊໍ້າຊ້ອນ:
--derep_fullength ຊື່ເອກະສານ
ຮວມລໍາດັບທີ່ຄືກັນຢ່າງເຂັ້ມງວດທີ່ມີຢູ່ໃນ ຊື່ເອກະສານ. ຄືກັນ
ລໍາດັບແມ່ນຖືກກໍານົດວ່າມີຄວາມຍາວດຽວກັນແລະສາຍດຽວກັນຂອງ
nucleotides (case insensitive, T ແລະ U ຖືກພິຈາລະນາຄືກັນ).
--maxuniquesize ໃນທາງບວກ integer
ຍົກເລີກລໍາດັບທີ່ມີມູນຄ່າອຸດົມສົມບູນຫຼາຍກ່ວາ integer.
-- ຫຍໍ້ ໃນທາງບວກ integer
ຍົກເລີກລໍາດັບທີ່ມີມູນຄ່າຄວາມອຸດົມສົມບູນນ້ອຍກວ່າ integer.
-- ຜົນຜະລິດ ຊື່ເອກະສານ
ຂຽນລໍາດັບ dereplicated ກັບ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta ແລະຈັດຮຽງ
ໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນ. ລໍາດັບທີ່ຄືກັນໄດ້ຮັບສ່ວນຫົວຂອງ
ລໍາດັບທໍາອິດຂອງກຸ່ມຂອງພວກເຂົາ. ຖ້າ --sizeout ຖືກນໍາໃຊ້, ຈໍານວນຂອງ
ການປະກົດຕົວ (ເຊັ່ນຄວາມອຸດົມສົມບູນ) ຂອງແຕ່ລະລໍາດັບແມ່ນຊີ້ໃຫ້ເຫັນໃນຕອນທ້າຍຂອງ
ສ່ວນຫົວ fasta ຂອງພວກເຂົາໂດຍໃຊ້ຮູບແບບ ";size=integer;".
--ຂະຫນາດ ຄໍານຶງເຖິງຄໍາບັນຍາຍອຸດົມສົມບູນທີ່ມີຢູ່ໃນ fasta ວັດສະດຸປ້ອນ
ໄຟລ໌ (ຊອກຫາຮູບແບບ "[>;]size=integer[;]" ໃນຫົວລໍາດັບ).
--ຂະຫນາດ
ຕື່ມການປະກອບຄໍາບັນຍາຍໃສ່ໄຟລ໌ fasta ຜົນຜະລິດ (ເພີ່ມຮູບແບບ
";ຂະໜາດ=integer;" to sequence headers) ຖ້າ --sizein ຖືກລະບຸ, ແຕ່ລະ
ລໍາດັບເປັນເອກະລັກໄດ້ຮັບມູນຄ່າຄວາມອຸດົມສົມບູນໃຫມ່ທີ່ສອດຄ້ອງກັນກັບຈໍານວນທັງຫມົດຂອງມັນ
ຄວາມອຸດົມສົມບູນ (ຜົນລວມຂອງຄວາມອຸດົມສົມບູນຂອງການປະກົດຕົວຂອງມັນ). ຖ້າ --sizein ບໍ່ແມ່ນ
ລະບຸໄວ້, ຄວາມອຸດົມສົມບູນຂອງວັດສະດຸປ້ອນແມ່ນຕັ້ງເປັນ 1, ແລະແຕ່ລະລໍາດັບທີ່ເປັນເອກະລັກ
ໄດ້ຮັບມູນຄ່າຄວາມອຸດົມສົມບູນໃຫມ່ທີ່ສອດຄ່ອງກັບຈໍານວນການປະກົດຕົວຂອງມັນ
ໃນໄຟລ໌ປ້ອນຂໍ້ມູນ.
--strand ບວກ|ທັງສອງ
ໃນເວລາທີ່ຊອກຫາລໍາດັບທີ່ຄ້າຍຄືກັນຢ່າງເຂັ້ມງວດ, ໃຫ້ກວດເບິ່ງ ບວກ ຫາດຊາຍ
ພຽງແຕ່ (ຄ່າເລີ່ມຕົ້ນ) ຫຼືກວດເບິ່ງ ທັງສອງ ສາຍ.
--topn ໃນທາງບວກ integer
ຜົນຜະລິດພຽງແຕ່ດ້ານເທິງ integer ລໍາດັບ (ເຊັ່ນ: ອຸດົມສົມບູນທີ່ສຸດ).
--uc ຊື່ເອກະສານ
Output dereplication ສົ່ງຜົນໃຫ້ ຊື່ເອກະສານ ການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື ucust. ສໍາລັບ
ລາຍລະອຽດຂອງຮູບແບບ, ເບິ່ງ
<http://www.drive5.com/usearch/manual/ucout.html>. ໃນສະພາບການຂອງ
dereplication, ທາງເລືອກ --uc_allhits ບໍ່ມີຜົນຕໍ່ຜົນຜະລິດ --uc.
ຕົວເລືອກການໃສ່ຜ້າອັດດັງ:
ລຳດັບການປ້ອນຂໍ້ມູນສາມາດປະກອບດ້ວຍນິວຄລີໂອທີດຕົວນ້ອຍ ຫຼືຕົວພິມໃຫຍ່. ຕົວພິມນ້ອຍ
nucleotides ຖືກຕັ້ງໄວ້ຢ່າງງຽບໆເປັນຕົວພິມໃຫຍ່ກ່ອນໜ້າກາກ, ເວັ້ນເສຍແຕ່ວ່າ --qmask ອ່ອນລົງ
ທາງເລືອກແມ່ນຖືກນໍາໃຊ້. ນີ້ແມ່ນຜົນໄດ້ຮັບຂອງທາງເລືອກຫນ້າກາກປະສົມປະສານ -qmask (ຫຼື
--dbmask ສໍາລັບລໍາດັບຖານຂໍ້ມູນ) ແລະ --hardmask, ສົມມຸດວ່າແຕ່ລະລໍາດັບການປ້ອນຂໍ້ມູນ
ມີທັງ nucleotides ໂຕພິມນ້ອຍ ແລະຕົວພິມໃຫຍ່:
qmask ການປະຕິບັດ hardmask
────────────────────────────────────────── ───────────────────
none off ບໍ່ມີຫນ້າກາກ, ສັນຍາລັກທັງຫມົດເປັນຕົວພິມໃຫຍ່
none on no masking, ສັນຍາລັກທັງຫມົດເປັນຕົວພິມໃຫຍ່
ຂີ້ຝຸ່ນປິດໜ້າກາກ ສັນຍາລັກຕົວພິມນ້ອຍ, ໂຕພິມໃຫຍ່
ຂີ້ຝຸ່ນໃສ່ສັນຍາລັກໃສ່ຫນ້າກາກໄດ້ປ່ຽນເປັນ Ns, ຄົນອື່ນພິມຕົວພິມໃຫຍ່
ສັນຍາລັກຕົວພິມນ້ອຍຖືກປິດບັງ, ບໍ່ມີການປ່ຽນແປງກໍລະນີ
ສັນຍາລັກຕົວພິມນ້ອຍໃສ່ໜ້າກາກ ແລະປ່ຽນເປັນ Ns
-- ໜ້າກາກ
ເຮັດໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໂດຍການປ່ຽນພວກມັນດ້ວຍ Ns ແທນການຕັ້ງຄ່າ
ໃຫ້ເຂົາເຈົ້າເປັນກໍລະນີຕ່ໍາ.
-- maskfasta ຊື່ເອກະສານ
Mask ການເຮັດເລື້ມຄືນແບບງ່າຍດາຍແລະພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນຕ່ໍາໃນລໍາດັບທີ່ມີຢູ່ໃນ
ຊື່ເອກະສານ. ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ຫນ້າກາກໂດຍໃຊ້ ຝຸ່ນ (ໃຊ້ --qmask ເພື່ອດັດແປງ
ພຶດຕິກໍາ).
-- ຜົນຜະລິດ ຊື່ເອກະສານ
ຂຽນລໍາດັບຫນ້າກາກໃສ່ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta.
--qmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
ເຮັດເລື້ມຄືນແບບງ່າຍໆ ແລະໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໃນລຳດັບໂດຍໃຊ້ ຝຸ່ນ
ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none). ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ໜ້າກາກ
ການນໍາໃຊ້ ຝຸ່ນ.
-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.
ຕົວເລືອກການຈັດຮຽງຄູ່:
ຜົນໄດ້ຮັບຂອງ n * (n - 1) / 2 ການຈັດຮຽງຄູ່ແມ່ນຂຽນໃສ່ຜົນໄດ້ຮັບ
ໄຟລ໌ທີ່ລະບຸດ້ວຍ --alnout, --blast6out, --fastapairs --matched, --notmatched,
--samout, --uc ຫຼື --userout (ເບິ່ງພາກຄົ້ນຫາຂ້າງລຸ່ມນີ້). ລະບຸວ່າ
--acceptall ທາງເລືອກທີ່ຈະສົ່ງຜົນຜະລິດການວາງຄູ່ທັງຫມົດ, ຫຼືລະບຸລະດັບຕົວຕົນ
ດ້ວຍ --id ເພື່ອຍົກເລີກການຈັດຮຽງທີ່ອ່ອນແອ. ທາງເລືອກອື່ນໆທີ່ຍອມຮັບ / ປະຕິເສດ (ເບິ່ງ
ການຊອກຫາທາງເລືອກຂ້າງລຸ່ມນີ້) ອາດຈະຖືກນໍາໃຊ້ເຊັ່ນກັນ. ລໍາດັບແມ່ນສອດຄ່ອງຢູ່ໃນຂອງພວກເຂົາ ບວກ
strand ເທົ່ານັ້ນ.
--ຍອມຮັບທັງໝົດ
ຂຽນຜົນໄດ້ຮັບຂອງການຈັດລໍາດັບທັງຫມົດເພື່ອຜົນຜະລິດໄຟລ໌. ຕົວເລືອກນີ້ລົບລ້າງ
ທາງເລືອກທີ່ຍອມຮັບ / ປະຕິເສດອື່ນໆ (ລວມທັງ --id).
--allpairs_global ຊື່ເອກະສານ
ປະຕິບັດການຈັດຮຽງຄູ່ທົ່ວໂລກທີ່ດີທີ່ສຸດຂອງທຸກລໍາດັບຂອງ fasta ທັງຫມົດ
ບັນຈຸຢູ່ໃນ ຊື່ເອກະສານ. ຄໍາສັ່ງນີ້ແມ່ນຫຼາຍກະທູ້.
--id ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັບຄູ່ຕາມລຳດັບຖ້າຕົວຕົນຂອງຄູ່ແມ່ນຕໍ່າກວ່າ ທີ່ແທ້ຈິງ
(ລວມມູນຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0).
-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.
ຕົວເລືອກການຊອກຫາ:
--alnout ຊື່ເອກະສານ
ຂຽນການຈັດຮຽງທົ່ວໂລກເປັນຄູ່ກັບ ຊື່ເອກະສານ ການນໍາໃຊ້ທີ່ມະນຸດອ່ານໄດ້
ຮູບແບບ. ໃຊ້ --rowlen ເພື່ອແກ້ໄຂຄວາມຍາວການຈັດຮຽງ. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນ
ເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
--blast6 ອອກ ຊື່ເອກະສານ
ຂຽນຜົນການຄົ້ນຫາໃສ່ ຊື່ເອກະສານ ການນໍາໃຊ້ຮູບແບບທີ່ແຍກອອກເປັນແຖບຄ້າຍຄື blast
ຂອງສິບສອງຊ່ອງຂໍ້ມູນ (ລາຍການຂ້າງລຸ່ມນີ້), ມີຫນຶ່ງແຖວຕໍ່ການຈັບຄູ່ເປົ້າຫມາຍຄໍາຖາມ
(ຫຼືຂາດການຈັບຄູ່ຖ້າ --output_no_hits ຖືກໃຊ້). ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນ
ເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້. ຜົນຜະລິດທີ່ຄ້າຍຄືກັນສາມາດໄດ້ຮັບດ້ວຍ --userout
ຊື່ເອກະສານ ແລະ --userfields
query+target+id+alnlen+miss+opens+qlo+qhi+tlo+thi+value+bits. ສົມບູນ
ບັນຊີລາຍຊື່ແລະຄໍາອະທິບາຍແມ່ນມີຢູ່ໃນພາກ "Userfields" ຂອງເລື່ອງນີ້
ຄູ່ມື.
1. query: ປ້າຍສອບຖາມ.
2. ເປົ້າຫມາຍ: target (ລໍາດັບຖານຂໍ້ມູນ) ປ້າຍຊື່. ພາກສະຫນາມແມ່ນຕັ້ງເປັນ
"*" ຖ້າບໍ່ມີການສອດຄ່ອງ.
3. id: ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ
100.0). ຕົວຕົນສ່ວນຮ້ອຍແມ່ນຖືກກໍານົດເປັນ 100 * (ກົງກັນ
columns) / (ຄວາມຍາວການຈັດລໍາດັບ - ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ). ເບິ່ງຊ່ອງຂໍ້ມູນ id0
ກັບ id4 ສໍາລັບຄໍານິຍາມອື່ນໆ.
4. ແອນເລນ: ຄວາມຍາວຂອງການຈັດຮຽງເປົ້າໝາຍແບບສອບຖາມ (ຈຳນວນ
ຖັນ). ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການຈັດຮຽງ.
5. ຄືກັນ: ຈຳນວນບໍ່ກົງກັນໃນການຈັດຮຽງ (ສູນ ຫຼື ບວກ
ຄ່າຈໍານວນເຕັມ).
6. ເປີດ: ຈຳນວນຖັນທີ່ບັນຈຸຊ່ອງຫວ່າງເປີດ (ສູນ ຫຼື
ຄ່າຈຳນວນເຕັມບວກ).
7. qlo: nucleotide ທໍາອິດຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າຫມາຍ.
ເທົ່າກັບ 1 ສະເໝີ ຖ້າມີການຈັດຮຽງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.
8. qhi: nucleotide ສຸດທ້າຍຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າໝາຍ.
ສະເໝີກັບຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ພາກສະຫນາມ
ຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການສອດຄ່ອງ.
9. ດິນ: nucleotide ທຳອິດຂອງເປົ້າໝາຍທີ່ສອດຄ່ອງກັບແບບສອບຖາມ.
ເທົ່າກັບ 1 ສະເໝີ ຖ້າມີການຈັດຮຽງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.
10. ທ: nucleotide ສຸດທ້າຍຂອງເປົ້າໝາຍທີ່ສອດຄ່ອງກັບການສອບຖາມ.
ສະເໝີກັບຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ພາກສະຫນາມ
ຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການສອດຄ່ອງ.
11. ການປະເມີນຜົນ: expectancy-value (ບໍ່ຄຳນວນສຳລັບ nucleotide
ການຈັດວາງ). ຕັ້ງເປັນ -1 ສະເໝີ.
12. bits: ຄະແນນບິດ (ບໍ່ໄດ້ຄິດໄລ່ສໍາລັບການຈັດລໍາດັບ nucleotide).
ຕັ້ງເປັນ 0 ສະເໝີ.
--db ຊື່ເອກະສານ
ປຽບທຽບລໍາດັບການສອບຖາມ (ລະບຸດ້ວຍ --usearch_global) ກັບ fasta-
ລຳດັບເປົ້າໝາຍທີ່ມີຮູບແບບຢູ່ໃນ ຊື່ເອກະສານ, ການນໍາໃຊ້ຄູ່ທົ່ວໂລກ
ການຈັດວາງ.
--dbmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
ໃສ່ໜ້າກາກການຊໍ້າຄືນແບບງ່າຍດາຍ ແລະ ພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໃນຖານຂໍ້ມູນເປົ້າໝາຍ
ລໍາດັບການນໍາໃຊ້ ຝຸ່ນ ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none).
ຄໍາເຕືອນ, ໃນເວລາທີ່ການນໍາໃຊ້ ອ່ອນໆ ການປິດບັງຄຳສັ່ງການຊອກຫາກາຍເປັນຕົວພິມນ້ອຍໃຫຍ່.
ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ຫນ້າກາກໂດຍໃຊ້ ຝຸ່ນ.
--dbmatched ຊື່ເອກະສານ
ຂຽນລໍາດັບເປົ້າຫມາຍຖານຂໍ້ມູນທີ່ກົງກັນຢ່າງຫນ້ອຍຫນຶ່ງລໍາດັບການສອບຖາມກັບ
ຊື່ເອກະສານ, ໃນຮູບແບບ fasta. ຖ້າຫາກວ່າທາງເລືອກ --sizeout ຖືກນໍາໃຊ້, ຈໍານວນຂອງ
ຄໍາຖາມທີ່ກົງກັບແຕ່ລະລໍາດັບເປົ້າຫມາຍແມ່ນຊີ້ໃຫ້ເຫັນໂດຍໃຊ້ຮູບແບບ
";ຂະໜາດ=integer;".
--dbnotmatched ຊື່ເອກະສານ
ຂຽນລໍາດັບເປົ້າຫມາຍຂອງຖານຂໍ້ມູນທີ່ບໍ່ກົງກັນກັບລໍາດັບການສອບຖາມກັບ ຊື່ເອກະສານ,
ໃນຮູບແບບ fasta.
--fastapairs ຊື່ເອກະສານ
ຂຽນການຈັດລຽງແບບຄູ່ຂອງການສອບຖາມແລະລໍາດັບເປົ້າຫມາຍໄປຫາ ຊື່ເອກະສານ, ໃນ
ຮູບແບບ fasta.
--fulldp ທາງເລືອກ Dummy ສໍາລັບຄວາມເຂົ້າກັນໄດ້ກັບ usearch. ເພື່ອເພີ່ມປະສິດທິພາບການຊອກຫາ
ຄວາມອ່ອນໄຫວ, vsearch ໃຊ້ 8-way 16-bit SIMD vectorized full dynamic
ຂັ້ນຕອນການດໍາເນີນໂຄງການ (Needleman-Wunsch), ບໍ່ວ່າຈະເປັນຫຼືບໍ່ --fulldp ແມ່ນ
ລະບຸ.
--gapext string
ກໍານົດການລົງໂທດສໍາລັບການຂະຫຍາຍຊ່ອງຫວ່າງ. ເບິ່ງ --gapopen ສໍາລັບສະບັບສົມບູນ
ລາຍລະອຽດຂອງລະບົບການປະກາດການລົງໂທດ. ຄ່າເລີ່ມຕົ້ນແມ່ນເພື່ອ
ເລີ່ມຕົ້ນຊ່ອງຫວ່າງຫົກຂະຫຍາຍການລົງໂທດໂດຍໃຊ້ການລົງໂທດຂອງ 2 ສໍາລັບ
ການຂະຫຍາຍຊ່ອງຫວ່າງພາຍໃນແລະການລົງໂທດຂອງ 1 ສໍາລັບການຂະຫຍາຍຊ່ອງຫວ່າງຢູ່ປາຍຍອດ, ໃນ
ທັງການສອບຖາມ ແລະລໍາດັບເປົ້າໝາຍ (ເຊັ່ນ: 2I/1E).
--gapopen string
ກໍານົດການລົງໂທດສໍາລັບການເປີດຊ່ອງຫວ່າງ. ການເປີດຊ່ອງຫວ່າງສາມາດເກີດຂຶ້ນໃນຫົກທີ່ແຕກຕ່າງກັນ
ສະພາບການ: ໃນການສອບຖາມ (Q) ຫຼືໃນລໍາດັບເປົ້າຫມາຍ (T), ຢູ່ເບື້ອງຊ້າຍ (L)
ຫຼືຂວາ (R) ທີ່ສຸດຂອງລໍາດັບ, ຫຼືພາຍໃນລໍາດັບ (I).
ສັນຍາລັກລໍາດັບ (Q ແລະ T) ສາມາດຖືກລວມເຂົ້າກັບສັນຍາລັກສະຖານທີ່ (L, I,
ແລະ R), ແລະຄ່າຕົວເລກເພື່ອປະກາດການລົງໂທດສໍາລັບຄວາມເປັນໄປໄດ້ທັງຫມົດ
ສະພາບການ: aQL/bQI/cQR/dTL/eTI/fTR, ບ່ອນທີ່ abcdef ເປັນສູນ ຫຼືບວກ
ຈຳນວນເຕັມ, ແລະ "/" ຖືກໃຊ້ເປັນຕົວແຍກ.
ເພື່ອເຮັດໃຫ້ການປະກາດງ່າຍຂຶ້ນ, ສັນຍາລັກສະຖານທີ່ (L, I, ແລະ R) ສາມາດເປັນ
ປະສົມປະສານ, ສັນຍາລັກ (E) ສາມາດຖືກນໍາໃຊ້ເພື່ອປິ່ນປົວທັງສອງ extremities (L ແລະ R)
ເທົ່າທຽມກັນ, ແລະສັນຍາລັກ Q ແລະ T ສາມາດຖືກຍົກເລີກເພື່ອປະຕິບັດການສອບຖາມແລະເປົ້າຫມາຍ
ລໍາດັບເທົ່າທຽມກັນ. ຕົວຢ່າງ, ຄ່າເລີ່ມຕົ້ນແມ່ນການປະກາດການລົງໂທດ 20
ສໍາລັບການເປີດຊ່ອງຫວ່າງພາຍໃນແລະການລົງໂທດຂອງ 2 ສໍາລັບການເປີດຊ່ອງຫວ່າງຢູ່ປາຍຍອດ
(ຊ້າຍ ຫຼື ຂວາ), ທັງໃນແບບສອບຖາມ ແລະລໍາດັບເປົ້າໝາຍ (ເຊັ່ນ: 20I/2E). ຖ້າພຽງແຕ່
ຄ່າຕົວເລກແມ່ນໃຫ້, ໂດຍບໍ່ມີລໍາດັບຫຼືສັນຍາລັກສະຖານທີ່, ຫຼັງຈາກນັ້ນ
ການລົງໂທດແມ່ນໃຊ້ກັບການເປີດຊ່ອງຫວ່າງທັງໝົດ. ເພື່ອຫ້າມການເປີດຊ່ອງຫວ່າງ, ກ
ມູນຄ່າການລົງໂທດທີ່ບໍ່ມີຂອບເຂດສາມາດຖືກປະກາດດ້ວຍສັນຍາລັກ "*". ການນໍາໃຊ້ vsearch
ໃນຖານະເປັນການຈັດວາງເຄິ່ງໂລກ, ການລົງໂທດ null ສາມາດຖືກນໍາໃຊ້ກັບຊ້າຍ (L) ຫຼື
right (R) ຊ່ອງຫວ່າງ.
vsearch ສະເຫມີເລີ່ມຕົ້ນການລົງໂທດການເປີດຊ່ອງຫວ່າງຫົກໂດຍໃຊ້ຄ່າເລີ່ມຕົ້ນ
ພາລາມິເຕີ (20I/2E). ຫຼັງຈາກນັ້ນ, ຜູ້ໃຊ້ແມ່ນບໍ່ເສຍຄ່າເພື່ອປະກາດພຽງແຕ່ຄ່າ
ລາວ/ນາງຕ້ອງການແກ້ໄຂ. ໄດ້ string ຖືກສະແກນຈາກຊ້າຍຫາຂວາ, ຍອມຮັບ
ສັນຍາລັກແມ່ນ (0123456789/LIREQT*), ແລະຄ່າຫຼັງຈາກນັ້ນໄດ້ແທນທີ່ກ່ອນຫນ້ານີ້
ຄ່າ.
ກະລຸນາສັງເກດວ່າ vsearch, ກົງກັນຂ້າມກັບ usearch, ພຽງແຕ່ອະນຸຍາດໃຫ້ຊ່ອງຫວ່າງ integer
ການລົງໂທດ. ເນື່ອງຈາກວ່າການລົງໂທດຊ່ອງຫວ່າງຕ່ໍາສຸດແມ່ນ 0.5 ໂດຍຄ່າເລີ່ມຕົ້ນໃນ usearch,
ຄະແນນເລີ່ມຕົ້ນທັງໝົດແລະການລົງໂທດຊ່ອງຫວ່າງໃນ vsearch ໄດ້ຖືກເພີ່ມຂຶ້ນສອງເທົ່າ
ຮັກສາການລົງໂທດທຽບເທົ່າ ແລະສ້າງການສອດຄ່ອງກັນ.
-- ໜ້າກາກ
ເຮັດໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໂດຍການປ່ຽນພວກມັນດ້ວຍ Ns ແທນການຕັ້ງຄ່າ
ໃຫ້ເຂົາເຈົ້າເປັນກໍລະນີຕ່ໍາ. ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ, ກະລຸນາເບິ່ງພາກ Masking.
--id ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັບຄູ່ຕາມລຳດັບຖ້າຕົວຕົນຂອງຄູ່ແມ່ນຕໍ່າກວ່າ ທີ່ແທ້ຈິງ
(ລວມມູນຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0). ຂະບວນການຄົ້ນຫາຈັດລຽງເປົ້າຫມາຍ
ລໍາດັບໂດຍການຫຼຸດລົງຈໍານວນຂອງ k-mers ພວກເຂົາເຈົ້າມີຢູ່ໃນທົ່ວໄປກັບ
ລໍາດັບການສອບຖາມ, ການນໍາໃຊ້ຂໍ້ມູນນັ້ນເປັນຕົວແທນສໍາລັບຄວາມຄ້າຍຄືກັນຂອງລໍາດັບ.
ການກັ່ນຕອງທາງສ່ວນຫນ້າທີ່ມີປະສິດຕິພາບນັ້ນຍັງຈະປ້ອງກັນການສອດຄ່ອງຄູ່ກັບ
ການຈັບຄູ່ເປົ້າຫມາຍທີ່ອ່ອນແອ, ເນື່ອງຈາກວ່າມັນຈໍາເປັນຕ້ອງມີຢ່າງຫນ້ອຍ 6 ແບ່ງປັນ k-mers ກັບ
ເລີ່ມການຈັດຮຽງຄູ່, ແລະຢ່າງໜ້ອຍໜຶ່ງໃນທຸກໆ 16 k-mers ຈາກ
ການສອບຖາມຕ້ອງການກົງກັບເປົ້າຫມາຍ. ດັ່ງນັ້ນ, ການນໍາໃຊ້ຄ່າຕ່ໍາກວ່າ
--id 0.5 ບໍ່ມີແນວໂນ້ມທີ່ຈະຈັບເປົ້າຫມາຍທີ່ກົງກັນທີ່ອ່ອນແອກວ່າ. ໄດ້
pairwise ຕົວຕົນແມ່ນໂດຍຄ່າເລີ່ມຕົ້ນກໍານົດເປັນຈໍານວນຂອງ (ການຈັບຄູ່
columns) / (ຄວາມຍາວການຈັດຕໍາແຫນ່ງ - ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ). ຄໍານິຍາມນັ້ນສາມາດເປັນ
ດັດແກ້ໂດຍ --iddef.
--iddef 0|1|2|3|4
ປ່ຽນຄຳນິຍາມຕົວຕົນຄູ່ທີ່ໃຊ້ໃນ --id. ຄ່າທີ່ຍອມຮັບແມ່ນ:
0. CD-HIT ຄໍານິຍາມ: (ຄໍລໍາທີ່ກົງກັນ) / (ລໍາດັບສັ້ນທີ່ສຸດ
ຄວາມຍາວ).
1. ແກ້ໄຂໄລຍະຫ່າງ: (ຄໍລໍາທີ່ກົງກັນ) / (ຄວາມຍາວການຈັດຕໍາແຫນ່ງ).
2. ແກ້ໄຂໄລຍະຫ່າງບໍ່ລວມຊ່ອງຫວ່າງຢູ່ປາຍຍອດ (ຄືກັນກັບ --id).
3. ນິຍາມຫ້ອງທົດລອງຊີວະວິທະຍາທາງທະເລນັບແຕ່ລະຊ່ອງຫວ່າງທີ່ຂະຫຍາຍອອກ
(ພາຍໃນ ຫຼື terminal) ເປັນຄວາມແຕກຕ່າງດຽວ: 1.0 -
[(ບໍ່ກົງກັນ + ຊ່ອງຫວ່າງ)/(ຄວາມຍາວຂອງລຳດັບທີ່ຍາວທີ່ສຸດ)]
4. ຄໍານິຍາມ BLAST, ເທົ່າກັບ --iddef 2 ໃນບໍລິບົດຂອງ
ການຈັດລຽງຄູ່ທົ່ວໂລກ.
ທາງເລືອກ --userfields ຍອມຮັບຊ່ອງຂໍ້ມູນ id0 ກັບ id4, ນອກເຫນືອໄປຈາກ
id ພາກສະຫນາມ, ເພື່ອລາຍງານຄ່າຕົວຕົນຄູ່ທີ່ສອດຄ້ອງກັນກັບ
ຄໍານິຍາມທີ່ແຕກຕ່າງກັນ.
--idprefix ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າທໍາອິດ integer nucleotides ຂອງເປົ້າຫມາຍ
ບໍ່ກົງກັບຄໍາຖາມ.
--idsuffix ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າອັນສຸດທ້າຍ integer nucleotides ຂອງເປົ້າຫມາຍເຮັດ
ບໍ່ກົງກັບແບບສອບຖາມ.
-- ຊ້າຍ
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບ ຖ້າການຈັດຮຽງຄູ່ເລີ່ມຕົ້ນດ້ວຍຊ່ອງຫວ່າງ.
--ການແຂ່ງຂັນ integer
ຄະແນນທີ່ຖືກມອບໝາຍໃຫ້ກົງກັນ (ເຊັ່ນ: nucleotides ຄືກັນ) ໃນຄູ່
ການຈັດວາງ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 2.
--ກົງກັນ ຊື່ເອກະສານ
ຂຽນລໍາດັບການສອບຖາມທີ່ກົງກັບລໍາດັບເປົ້າຫມາຍຂອງຖານຂໍ້ມູນກັບ ຊື່ເອກະສານ, ໃນ
ຮູບແບບ fasta.
-- ສູງສຸດທີ່ຍອມຮັບ ໃນທາງບວກ integer
ຈໍານວນ hits ສູງສຸດທີ່ຈະຍອມຮັບກ່ອນທີ່ຈະຢຸດການຄົ້ນຫາ. ຄ່າເລີ່ມຕົ້ນ
ຄ່າແມ່ນ 1. ທາງເລືອກນີ້ເຮັດວຽກຄູ່ກັບ --maxrejects. ການຄົ້ນຫາ
ຂະບວນການຈັດລຽງລໍາດັບເປົ້າຫມາຍໂດຍການຫຼຸດລົງຈໍານວນຂອງ k-mers ພວກເຂົາເຈົ້າມີຢູ່ໃນ
ທົ່ວໄປກັບລໍາດັບການສອບຖາມ, ການນໍາໃຊ້ຂໍ້ມູນນັ້ນເປັນຕົວແທນສໍາລັບ
ລໍາດັບຄວາມຄ້າຍຄືກັນ. ຫຼັງຈາກການຈັດຕໍາແຫນ່ງຄູ່, ຖ້າເປົ້າຫມາຍທໍາອິດ
ລໍາດັບຜ່ານເງື່ອນໄຂການຍອມຮັບ, ມັນຖືກຍອມຮັບວ່າເປັນຕີທີ່ດີທີ່ສຸດແລະ
ຂະບວນການຄົ້ນຫາຢຸດເຊົາສໍາລັບການສອບຖາມນັ້ນ. ຖ້າ --maxaccepts ຖືກຕັ້ງເປັນ a
ມູນຄ່າທີ່ສູງຂຶ້ນ, hits ຫຼາຍໄດ້ຮັບການຍອມຮັບ. ຖ້າ --maxaccepts ແລະ --maxrejects ແມ່ນ
ທັງສອງຕັ້ງເປັນ 0, ຖານຂໍ້ມູນຄົບຖ້ວນແມ່ນຊອກຫາ.
--maxdiffs ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າການຈັດຮຽງມີຢ່າງໜ້ອຍ integer
ການປ່ຽນແທນ, ການແຊກ ຫຼື ການລຶບ.
--maxgaps ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າການຈັດຮຽງມີຢ່າງໜ້ອຍ integer
ແຊກ ຫຼື ລຶບ.
--maxhits ໃນທາງບວກ integer
ຈໍານວນ hits ສູງສຸດທີ່ຈະສະແດງເມື່ອການຄົ້ນຫາຖືກຢຸດເຊົາ ( hits ແມ່ນ
ຈັດຮຽງຕາມຕົວຕົນທີ່ຫຼຸດລົງ). ບໍ່ຈໍາກັດໂດຍຄ່າເລີ່ມຕົ້ນ. ທາງເລືອກນັ້ນນຳໃຊ້
ເຖິງ --alnout, --blast6out, --fastapairs, --samout, --uc, ຫຼື --userout
ໄຟລ໌ຜົນຜະລິດ.
--maxid ທີ່ແທ້ຈິງ
ປະຕິເສດລໍາດັບທີ່ກົງກັນຖ້າອັດຕາສ່ວນຂອງຕົວຕົນລະຫວ່າງສອງ
ລໍາດັບແມ່ນໃຫຍ່ກວ່າ ທີ່ແທ້ຈິງ.
--maxqsize ໃນທາງບວກ integer
ປະຕິເສດລໍາດັບການສອບຖາມທີ່ມີຄວາມອຸດົມສົມບູນຫຼາຍກ່ວາ integer.
--maxqt ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບການສອບຖາມ/ເປົ້າໝາຍແມ່ນໃຫຍ່ກວ່າ ທີ່ແທ້ຈິງ.
--ການປະຕິເສດສູງສຸດ ໃນທາງບວກ integer
ຈຳນວນສູງສຸດຂອງລຳດັບເປົ້າໝາຍທີ່ບໍ່ກົງກັນທີ່ຈະພິຈາລະນາກ່ອນ
ການຢຸດການຄົ້ນຫາ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 32. ຕົວເລືອກນີ້ເຮັດວຽກເປັນຄູ່
ກັບ --maxaccepts. ຂະບວນການຄົ້ນຫາຈັດລໍາດັບລໍາດັບເປົ້າຫມາຍໂດຍການຫຼຸດລົງ
ຈໍານວນຂອງ k-mers ເຂົາເຈົ້າມີຢູ່ຮ່ວມກັນກັບລໍາດັບການສອບຖາມ, ການນໍາໃຊ້ທີ່
ຂໍ້ມູນເປັນຕົວແທນສໍາລັບຄວາມຄ້າຍຄືກັນຂອງລໍາດັບ. ຫຼັງຈາກການຈັດຮຽງຄູ່,
ຖ້າບໍ່ມີ 32 ລຳດັບທຳອິດທີ່ກວດສອບໄດ້ຜ່ານການຍອມຮັບ
ເງື່ອນໄຂ, ຂະບວນການຄົ້ນຫາຢຸດເຊົາສໍາລັບການສອບຖາມນັ້ນ (ບໍ່ມີການຕີ). ຖ້າ
--maxrejects ຖືກຕັ້ງເປັນມູນຄ່າທີ່ສູງກວ່າ, ລໍາດັບເປົ້າຫມາຍຫຼາຍຂຶ້ນ
ພິຈາລະນາ. ຖ້າ --maxaccepts ແລະ --maxrejects ທັງສອງຖືກຕັ້ງເປັນ 0, the
ຖານຂໍ້ມູນທີ່ສົມບູນໄດ້ຖືກຄົ້ນຫາ.
-- ຂະຫນາດສູງສຸດ ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມອຸດົມສົມບູນແບບສອບຖາມ/ເປົ້າໝາຍແມ່ນຫຼາຍກວ່າ ທີ່ແທ້ຈິງ.
--maxsl ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບທີ່ສັ້ນກວ່າ/ຍາວກວ່ານັ້ນຫຼາຍກວ່າ ທີ່ແທ້ຈິງ.
--maxsubs ໃນທາງບວກ integer
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບຖ້າການຈັດຮຽງຄູ່ມີຫຼາຍກວ່າ
integer ການທົດແທນ.
--ກາງ ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັບຄູ່ລໍາດັບຖ້າອັດຕາສ່ວນຂອງຕົວຕົນຕໍ່າກວ່າ ທີ່ແທ້ຈິງ
(ບໍ່ສົນໃຈຊ່ອງຫວ່າງທັງໝົດ, ພາຍໃນ ແລະ terminal).
--mincols ໃນທາງບວກ integer
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບຖ້າຄວາມຍາວການຈັດຮຽງສັ້ນກວ່າ integer.
--minqt ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບການສອບຖາມ/ເປົ້າໝາຍຕໍ່າກວ່າ ທີ່ແທ້ຈິງ.
-- ຫຍໍ້ ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມອຸດົມສົມບູນແບບສອບຖາມ/ເປົ້າໝາຍຕໍ່າກວ່າ ທີ່ແທ້ຈິງ.
--ນາທີ ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບທີ່ສັ້ນກວ່າ/ຍາວກວ່າຕໍ່າກວ່າ ທີ່ແທ້ຈິງ.
--mintsize ໃນທາງບວກ integer
ປະຕິເສດລໍາດັບເປົ້າຫມາຍທີ່ມີຄວາມອຸດົມສົມບູນຕ່ໍາກວ່າ integer.
--ບໍ່ກົງກັນ integer
ຄະແນນທີ່ຖືກມອບໝາຍໃຫ້ບໍ່ກົງກັນ (ເຊັ່ນ: nucleotides ທີ່ແຕກຕ່າງກັນ) ໃນຄູ່
ການຈັດວາງ. ຄ່າເລີ່ມຕົ້ນແມ່ນ -4.
--ບໍ່ກົງກັນ ຊື່ເອກະສານ
ຂຽນລໍາດັບການສອບຖາມທີ່ບໍ່ກົງກັບລໍາດັບເປົ້າຫມາຍຂອງຖານຂໍ້ມູນກັບ ຊື່ເອກະສານ,
ໃນຮູບແບບ fasta.
--output_no_hits
ຂຽນຄໍາຖາມທີ່ກົງກັນແລະບໍ່ກົງກັນກັບ --alnout, --blast6out,
--samout ຫຼື --userout ໄຟລ໌ຜົນຜະລິດ (--uc ແລະ --uc_allhits ໄຟລ໌ຜົນຜະລິດ
ມີລັກສະນະແບບສອບຖາມທີ່ບໍ່ກົງກັນສະເໝີ). ຄຳຖາມທີ່ບໍ່ກົງກັນແມ່ນຕິດປ້າຍກຳກັບ
"ບໍ່ມີ hits" ໃນໄຟລ໌ --alnout.
--qmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
Mask ການຊໍ້າຄືນແບບງ່າຍດາຍ ແລະພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນຕໍ່າໃນລໍາດັບການສອບຖາມໂດຍໃຊ້
ໄດ້ ຝຸ່ນ ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none). ຄໍາເຕືອນ, ເມື່ອ
ການນໍາໃຊ້ ອ່ອນໆ ການປິດບັງຄຳສັ່ງການຊອກຫາກາຍເປັນຕົວພິມນ້ອຍໃຫຍ່. ຄ່າເລີ່ມຕົ້ນແມ່ນ
ການນໍາໃຊ້ຫນ້າກາກ ຝຸ່ນ.
--query_cov ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າຫາກວ່າສ່ວນຫນຶ່ງຂອງການສອບຖາມທີ່ສອດຄ່ອງກັບລໍາດັບເປົ້າຫມາຍແມ່ນ
ຕ່ໍາກວ່າ ທີ່ແທ້ຈິງ. ການຄຸ້ມຄອງການສອບຖາມແມ່ນຄໍານວນເປັນ (ການແຂ່ງຂັນ + ບໍ່ກົງກັນ)
/ ຄວາມຍາວລໍາດັບຄໍາຖາມ. ຊ່ອງຫວ່າງພາຍໃນ ຫຼື terminal ບໍ່ໄດ້ຖືກປະຕິບັດ
ບັນຊີ.
-- ຖືກຕ້ອງ
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບຖ້າການຈັດຮຽງຄູ່ຈົບລົງດ້ວຍຊ່ອງຫວ່າງ.
--rowlen ໃນທາງບວກ integer
ຄວາມກວ້າງຂອງເສັ້ນການຈັດຮຽງໃນ --alnout output. ຄ່າເລີ່ມຕົ້ນແມ່ນ 64. ກໍານົດ
ເຖິງ 0 ເພື່ອກໍາຈັດການຫໍ່.
--samout ຊື່ເອກະສານ
ຂຽນຜົນໄດ້ຮັບການຈັດຕໍາແຫນ່ງ ຊື່ເອກະສານ ໃນຮູບແບບ SAM. ສໍາລັບຄໍາອະທິບາຍ
ຂອງຮູບແບບ, ເບິ່ງ . ຄໍາສັ່ງອອກ
ອາດຈະແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
--ຕົນເອງ ປະຕິເສດການຈັບຄູ່ຕາມລຳດັບຫາກຄຳຊອກຫາ ແລະປ້າຍກຳກັບເປົ້າໝາຍແມ່ນຄືກັນ.
--selfid ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າການສອບຖາມແລະລໍາດັບເປົ້າຫມາຍຢ່າງເຂັ້ມງວດ
ຄືກັນ.
--ຂະຫນາດ
ຕື່ມການອະທິບາຍຄວາມອຸດົມສົມບູນໃຫ້ກັບຜົນໄດ້ຮັບຂອງທາງເລືອກ --dbmatched (ການນໍາໃຊ້
ຮູບແບບ ";ຂະຫນາດ =integer;"), ເພື່ອລາຍງານຈໍານວນຂອງການສອບຖາມທີ່
ກົງກັບແຕ່ລະເປົ້າໝາຍ.
--strand ບວກ|ທັງສອງ
ເມື່ອຊອກຫາລໍາດັບທີ່ຄ້າຍຄືກັນ, ໃຫ້ກວດເບິ່ງ ບວກ strand ເທົ່ານັ້ນ (ຄ່າເລີ່ມຕົ້ນ)
ຫລືກວດເບິ່ງ ທັງສອງ ສາຍ.
--target_cov ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າສ່ວນຫນຶ່ງຂອງລໍາດັບເປົ້າຫມາຍສອດຄ່ອງ
ກັບລໍາດັບການສອບຖາມແມ່ນຕ່ໍາກວ່າ ທີ່ແທ້ຈິງ. ການຄຸ້ມຄອງເປົ້າຫມາຍແມ່ນຄໍານວນ
as (ກົງກັນ + ບໍ່ກົງກັນ) / ຄວາມຍາວລໍາດັບເປົ້າຫມາຍ. ພາຍໃນ ຫຼື terminal
ຊ່ອງຫວ່າງບໍ່ໄດ້ຖືກພິຈາລະນາ.
-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.
--top_hits_only
ສົ່ງອອກພຽງແຕ່ hits ທີ່ມີອັດຕາສ່ວນສູງສຸດຂອງຕົວຕົນທີ່ມີ
ສອບຖາມ.
--uc ຊື່ເອກະສານ
ຜົນໄດ້ຮັບການຊອກຫາຜົນໄດ້ຮັບໃນ ຊື່ເອກະສານ ການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື ucust. ສໍາລັບ
ລາຍລະອຽດຂອງຮູບແບບ, ເບິ່ງ
<http://www.drive5.com/usearch/manual/ucout.html>. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນ
ເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.
--uc_allhits
ເມື່ອໃຊ້ທາງເລືອກ --uc, ສະແດງ hits ທັງຫມົດ, ບໍ່ພຽງແຕ່ hit top ສໍາລັບແຕ່ລະຄົນ
ສອບຖາມ.
--usearch_global ຊື່ເອກະສານ
ປຽບທຽບລຳດັບເປົ້າໝາຍ (--db) ກັບລຳດັບການສອບຖາມທີ່ມີຮູບແບບໄວ.
ບັນຈຸຢູ່ໃນ ຊື່ເອກະສານ, ການນໍາໃຊ້ການຈັດຕໍາແຫນ່ງຄູ່ທົ່ວໂລກ.
--ເຂດຜູ້ໃຊ້ string
ເມື່ອໃຊ້ --userout, ເລືອກ ແລະສັ່ງຊ່ອງຂໍ້ມູນທີ່ຂຽນໃສ່ຜົນໄດ້ຮັບ
ໄຟລ໌. ຊ່ອງຂໍ້ມູນຖືກແຍກອອກດ້ວຍ "+" (ເຊັ່ນ: query+target+id). ເບິ່ງ
ພາກສ່ວນ "Userfields" ສໍາລັບບັນຊີລາຍຊື່ເຕັມຂອງຊ່ອງຂໍ້ມູນ.
--ຜູ້ໃຊ້ ຊື່ເອກະສານ
ຂຽນຜົນໄດ້ຮັບທີ່ແຍກແທັບທີ່ກໍານົດໂດຍຜູ້ໃຊ້ໄປຫາ ຊື່ເອກະສານ. ເລືອກທົ່ງນາ
ກັບທາງເລືອກ --userfields. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນໃນເວລາທີ່ການນໍາໃຊ້ຫຼາຍ
ກະທູ້. ຖ້າ --userfields ຫວ່າງເປົ່າ ຫຼືບໍ່ມີຢູ່, ຊື່ເອກະສານ ແມ່ນຫວ່າງເປົ່າ.
--weak_id ທີ່ແທ້ຈິງ
ສະແດງຍອດນິຍົມທີ່ມີສ່ວນຮ້ອຍຂອງຕົວຕົນຢ່າງໜ້ອຍ ທີ່ແທ້ຈິງ, ໂດຍບໍ່ມີການ
ຢຸດການຄົ້ນຫາ. ການຄົ້ນຫາແບບປົກກະຕິຈະຢຸດທັນທີທີ່ຍອດນິຍົມພຽງພໍ
ພົບ (ຕາມທີ່ກຳນົດໂດຍ --maxaccepts, --maxrejects, ແລະ --id). ເປັນ --weak_id
ລາຍງານການຕີທີ່ອ່ອນແອທີ່ບໍ່ໄດ້ຫັກອອກຈາກ --maxaccepts, ສູງ --id ຄ່າ
ສາມາດນໍາໃຊ້ໄດ້, ດັ່ງນັ້ນການຮັກສາທັງຄວາມໄວແລະຄວາມອ່ອນໄຫວ. ຕາມເຫດຜົນ, ທີ່ແທ້ຈິງ
ຕ້ອງນ້ອຍກວ່າຄ່າທີ່ລະບຸໂດຍ --id.
-- ຄວາມຍາວຂອງຄໍາສັບ ໃນທາງບວກ integer
ຄວາມຍາວຂອງຄໍາສັບ (ie k-mers) ສໍາລັບການດັດສະນີຖານຂໍ້ມູນ. ຂອບເຂດຂອງຄວາມເປັນໄປໄດ້
ຄ່າໄປຈາກ 3 ຫາ 15, ແຕ່ຄ່າທີ່ຢູ່ໃກ້ 8 ແມ່ນແນະນຳໂດຍທົ່ວໄປ.
ຄໍາສັບທີ່ຍາວກວ່າອາດຈະຫຼຸດຜ່ອນຄວາມອ່ອນໄຫວສໍາລັບຄວາມຄ້າຍຄືກັນທີ່ອ່ອນແອ, ແຕ່ສາມາດເຮັດໄດ້
ເພີ່ມຄວາມຖືກຕ້ອງ. ໃນທາງກົງກັນຂ້າມ, ຄໍາສັບທີ່ສັ້ນກວ່າອາດຈະເພີ່ມຂຶ້ນ
ຄວາມອ່ອນໄຫວ, ແຕ່ສາມາດຫຼຸດຜ່ອນຄວາມຖືກຕ້ອງ. ເວລາຄິດໄລ່ໂດຍທົ່ວໄປຈະ
ເພີ່ມຂຶ້ນດ້ວຍຄໍາທີ່ສັ້ນກວ່າແລະຫຼຸດລົງດ້ວຍຄໍາທີ່ຍາວກວ່າ. ຄວາມຊົງຈໍາ
ຄວາມຕ້ອງການສໍາລັບສ່ວນຫນຶ່ງຂອງດັດຊະນີເພີ່ມຂຶ້ນດ້ວຍປັດໃຈ 4 ໃນແຕ່ລະຄັ້ງ
ຄວາມຍາວຂອງຄໍາສັບເພີ່ມຂຶ້ນຫນຶ່ງ nucleotide, ແລະໂດຍທົ່ວໄປແລ້ວນີ້ຈະກາຍເປັນ
ທີ່ສໍາຄັນສໍາລັບຄໍາຍາວ (12 ຫຼືຫຼາຍກວ່ານັ້ນ). ຄ່າເລີ່ມຕົ້ນແມ່ນ 8.
ຕົວເລືອກການສະຫຼັບ:
-- ຜົນຜະລິດ ຊື່ເອກະສານ
ຂຽນລໍາດັບ shuffled ກັບ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta.
-- ແກ່ນ ໃນທາງບວກ integer
ໃນເວລາທີ່ shuffling ຄໍາສັ່ງລໍາດັບ, ການນໍາໃຊ້ integer ເປັນເມັດ. ແກ່ນທີ່ໄດ້ຮັບຈະ
ສະເຫມີຜະລິດຄໍາສັ່ງຜົນຜະລິດດຽວກັນ (ທີ່ເປັນປະໂຫຍດສໍາລັບການຈໍາລອງ). ຕັ້ງເປັນ 0
ເພື່ອໃຊ້ເມັດພັນແບບສຸ່ມ (ພຶດຕິກຳເລີ່ມຕົ້ນ).
--ສະຫຼັບ ຊື່ເອກະສານ
Pseudo-random shuffle ລໍາດັບຂອງລໍາດັບທີ່ມີຢູ່ໃນ ຊື່ເອກະສານ.
--topn ໃນທາງບວກ integer
ຜົນຜະລິດພຽງແຕ່ດ້ານເທິງ integer ລໍາດັບ.
ຕົວເລືອກການຈັດຮຽງ:
ລາຍການ Fasta ຖືກຈັດຮຽງໂດຍການຫຼຸດຄວາມອຸດົມສົມບູນ (--sortbysize) ຫຼືຄວາມຍາວຕາມລໍາດັບ.
(--sortbylength). ເພື່ອໃຫ້ໄດ້ຮັບຄໍາສັ່ງການຈັດລຽງທີ່ຫມັ້ນຄົງ, ສາຍພົວພັນໄດ້ຖືກຈັດຮຽງໂດຍການຫຼຸດລົງ
ຄວາມອຸດົມສົມບູນ ແລະປ້າຍກຳກັບທີ່ເພີ່ມຂຶ້ນຕາມລຳດັບ alpha-numerical (--sortbylength), ຫຼືພຽງແຕ່ໂດຍ
ປ້າຍກຳກັບເພີ່ມລຳດັບ alpha-numerical (--sortbysize). ການຈັດຮຽງປ້າຍຊື່ສົມມຸດວ່າ
ລໍາດັບທັງຫມົດມີປ້າຍທີ່ເປັນເອກະລັກ. ດຽວກັນໃຊ້ກັບການຈັດລຽງອັດຕະໂນມັດ
ປະຕິບັດໃນລະຫວ່າງການກວດສອບ chimera (--uchime_denovo), dereplication
(--derep_fulllength), ແລະກຸ່ມ (--cluster_fast ແລະ --cluster_size).
--ຂະໜາດສູງສຸດ ໃນທາງບວກ integer
ເມື່ອໃຊ້ --sortbysize, ຍົກເລີກການຈັດລໍາດັບທີ່ມີມູນຄ່າຄວາມອຸດົມສົມບູນຫຼາຍກວ່າ
ກ່ວາ integer.
--ຂະໜາດນ້ອຍ ໃນທາງບວກ integer
ເມື່ອໃຊ້ --sortbysize, ຍົກເລີກລໍາດັບທີ່ມີມູນຄ່າຄວາມອຸດົມສົມບູນນ້ອຍລົງ
ກ່ວາ integer.
-- ຜົນຜະລິດ ຊື່ເອກະສານ
ຂຽນລໍາດັບການຄັດເລືອກ ຊື່ເອກະສານ, ໃນຮູບແບບ fasta.
-- ປ້າຍຊື່ string
ລຳດັບ Relabel ໂດຍໃຊ້ຄຳນຳໜ້າ string ແລະ ticker (1, 2, 3, ແລະອື່ນໆ) ໄປ
ສ້າງຫົວຂໍ້ໃຫມ່. ໃຊ້ --sizeout ເພື່ອອະນຸລັກຄວາມອຸດົມສົມບູນ
ຄຳ ອະທິບາຍ.
--ຂະຫນາດ
ໃນເວລາທີ່ການນໍາໃຊ້ --relabel, ລາຍງານບັນຍາຍອຸດົມສົມບູນກັບຜົນຜະລິດ fasta
ໄຟລ໌ (ໃຊ້ຮູບແບບ "; ຂະຫນາດ =integer;").
--sortbylength ຊື່ເອກະສານ
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມຍາວຂອງລໍາດັບທີ່ມີຢູ່ໃນ ຊື່ເອກະສານ. ເບິ່ງ
ທາງເລືອກທົ່ວໄປ --minseqlength ແລະ --maxseqlength ເພື່ອລົບລ້າງສັ້ນແລະ
ລໍາດັບຍາວ.
--sortbysize ຊື່ເອກະສານ
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນຂອງລໍາດັບທີ່ມີຢູ່ໃນ ຊື່ເອກະສານ (ໄດ້
ຮູບແບບ "[>;] ຂະຫນາດ =integer[;]" ຕ້ອງມີ) ເບິ່ງຕົວເລືອກ
--minsize ແລະ --maxsize ເພື່ອກໍາຈັດລໍາດັບທີ່ຫາຍາກແລະເດັ່ນ.
--topn ໃນທາງບວກ integer
ຜົນຜະລິດພຽງແຕ່ດ້ານເທິງ integer ລໍາດັບ (ເຊັ່ນ: ຍາວທີ່ສຸດຫຼືຫຼາຍທີ່ສຸດ
ອຸດົມສົມບູນ).
Userfields (ຊ່ອງຂໍ້ມູນທີ່ຍອມຮັບໂດຍທາງເລືອກ --userfields):
ອັນ ພິມສະຕຣິງຂອງ M (match), D (ລຶບ, ເຊັ່ນ: ຊ່ອງຫວ່າງໃນການສອບຖາມ) ແລະ I.
(ໃສ່, ເຊັ່ນ: ຊ່ອງຫວ່າງໃນເປົ້າຫມາຍ) ເປັນຕົວແທນຂອງການຈັດຕໍາແຫນ່ງຄູ່.
ຊ່ອງຫວ່າງເປົ່າຖ້າບໍ່ມີການຈັດຮຽງ.
ແອນເລນ ພິມຄວາມຍາວຂອງການຈັດລໍາດັບເປົ້າໝາຍແບບສອບຖາມ (ຈໍານວນຖັນ). ໄດ້
ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການຈັດຮຽງ.
bits ຄະແນນບິດ (ບໍ່ໄດ້ຄິດໄລ່ສໍາລັບການສອດຄ່ອງ nucleotide). ຕັ້ງເປັນ 0 ສະເໝີ.
ລົມ ການເປັນຕົວແທນແບບຫຍໍ້ຂອງການຈັດຮຽງຄູ່ໂດຍໃຊ້ຮູບແບບ CIGAR
(Compact Idiosyncratic Gapped Alignment Report): M (match), D (ການລຶບ)
ແລະຂ້ອຍ (ໃສ່). ຊ່ອງຫວ່າງເປົ່າຖ້າບໍ່ມີການຈັດຮຽງ.
ການປະເມີນຜົນ E-value (ບໍ່ໄດ້ຄິດໄລ່ສໍາລັບການສອດຄ່ອງ nucleotide). ຕັ້ງເປັນ -1 ສະເໝີ.
exts ຈຳນວນຖັນທີ່ມີສ່ວນຂະຫຍາຍຊ່ອງຫວ່າງ (ສູນ ຫຼືຈຳນວນເຕັມບວກ
ມູນຄ່າ).
ຊ່ອງຫວ່າງ ຈຳນວນຖັນທີ່ມີຊ່ອງຫວ່າງ (ຄ່າສູນ ຫຼືຈຳນວນເຕັມບວກ).
id ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0). ໄດ້
ຕົວຕົນສ່ວນຮ້ອຍແມ່ນຖືກກໍານົດເປັນ 100 * (ຄໍລໍາທີ່ກົງກັນ) / (ການຈັດຕໍາແຫນ່ງ
length - terminal ຊ່ອງຫວ່າງ).
id0 CD-HIT ຄໍານິຍາມຂອງອັດຕາສ່ວນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່
0.0 ຫາ 100.0) ໂດຍໃຊ້ຄວາມຍາວຂອງລໍາດັບສັ້ນທີ່ສຸດໃນຄູ່
alignment as denominator: 100 * (ກົງກັນຖັນ) / (ລໍາດັບສັ້ນທີ່ສຸດ
ຄວາມຍາວ).
id1 ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0) ແມ່ນ
ກໍານົດເປັນໄລຍະການແກ້ໄຂ: 100 * (ຄໍລໍາທີ່ກົງກັນ) / (ການຈັດຕໍາແຫນ່ງ
ຄວາມຍາວ).
id2 ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0) ແມ່ນ
ກໍານົດເປັນໄລຍະການແກ້ໄຂ, ບໍ່ລວມຊ່ອງຫວ່າງ terminal. id2 ພາກສະຫນາມແມ່ນເປັນ
ນາມແຝງສໍາລັບ ID ພາກສະຫນາມ.
id3 Marine Biological Lab ນິຍາມອັດຕາສ່ວນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງ
ຕັ້ງແຕ່ 0.0 ຫາ 100.0), ການນັບແຕ່ລະຊ່ອງຫວ່າງທີ່ຂະຫຍາຍອອກ (ພາຍໃນ ຫຼື
terminal) ເປັນຄວາມແຕກຕ່າງດຽວແລະນໍາໃຊ້ຄວາມຍາວຂອງຄວາມຍາວທີ່ສຸດ
sequence in the pairwise alignment as ໂຕຫານ: 100 * (1.0 - .
[(ບໍ່ກົງກັນ + ຊ່ອງຫວ່າງ) / (ຄວາມຍາວຂອງລໍາດັບທີ່ຍາວທີ່ສຸດ)]).
id4 ຄໍານິຍາມ BLAST ຂອງອັດຕາສ່ວນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່
0.0 ຫາ 100.0), ທຽບເທົ່າກັບ --iddef 2 ໃນບໍລິບົດຂອງຄູ່ຄູ່ທົ່ວໂລກ
ການຈັດວາງ.
ids ຈໍານວນຂອງການກົງກັນໃນການຈັດຕໍາແຫນ່ງ (ສູນຫຼືຄ່າຈໍານວນເຕັມບວກ).
ຄືກັນ ຈໍານວນຂອງບໍ່ກົງກັນໃນການຈັດຕໍາແຫນ່ງ (ສູນຫຼືຄ່າຈໍານວນເຕັມບວກ).
ເປີດ ຈຳນວນຖັນທີ່ບັນຈຸຊ່ອງຫວ່າງເປີດ (ສູນ ຫຼືຈຳນວນເຕັມບວກ
ມູນຄ່າ).
ຄູ່ ຈໍານວນຂອງຖັນທີ່ມີພຽງແຕ່ nucleotides. ມູນຄ່ານັ້ນກົງກັບ
ຄວາມຍາວຂອງການຈັດຮຽງລົບຖັນທີ່ມີຊ່ອງຫວ່າງ (ສູນ ຫຼື
ຄ່າຈຳນວນເຕັມບວກ).
pctgaps ຈໍານວນຄໍລໍາທີ່ມີຊ່ອງຫວ່າງສະແດງອອກເປັນເປີເຊັນຂອງ
ຄວາມຍາວການຈັດຮຽງ (ຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0).
pctpv ເປີເຊັນຂອງຖັນບວກ. ເມື່ອເຮັດວຽກກັບລໍາດັບ nucleotide,
ນີ້ແມ່ນເທົ່າກັບອັດຕາສ່ວນຂອງການແຂ່ງຂັນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່
0.0 ເຖິງ 100.0).
pv ຈຳນວນຖັນບວກ. ເມື່ອເຮັດວຽກກັບລໍາດັບ nucleotide, ນີ້
ເທົ່າກັບຈໍານວນທີ່ກົງກັນ (ຄ່າສູນ ຫຼືຄ່າເລກບວກ).
qcov ແຕ່ສ່ວນຫນຶ່ງຂອງລໍາດັບການສອບຖາມທີ່ສອດຄ່ອງກັບລໍາດັບເປົ້າຫມາຍ
(ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0). ການຄຸ້ມຄອງແບບສອບຖາມໄດ້ຖືກຄິດໄລ່ເປັນ
100.0 * (ກົງກັນ + ບໍ່ກົງກັນ) / ຄວາມຍາວລໍາດັບການສອບຖາມ. ພາຍໃນ ຫຼື
ຊ່ອງຫວ່າງຢູ່ປາຍຍອດບໍ່ໄດ້ຖືກພິຈາລະນາ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0.0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.
qframe ຂອບແບບສອບຖາມ (-3 ຫາ +3). ພາກສະຫນາມນັ້ນພຽງແຕ່ກ່ຽວຂ້ອງກັບລໍາດັບລະຫັດແລະແມ່ນ
ບໍ່ໄດ້ຄິດໄລ່ໂດຍ vsearch. ຕັ້ງເປັນ +0 ສະເໝີ.
qhi nucleotide ສຸດທ້າຍຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າໝາຍ. ສະເຫມີເທົ່າກັບ
ຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີ
ການຈັດວາງ.
qihi nucleotide ສຸດທ້າຍຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າໝາຍ (ບໍ່ສົນໃຈ terminal
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.
ກີໂລ nucleotide ທໍາອິດຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າຫມາຍ (ບໍ່ສົນໃຈເບື້ອງຕົ້ນ
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.
ql ຄວາມຍາວລຳດັບແບບສອບຖາມ (ຄ່າຈຳນວນເຕັມບວກ). ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າ
ບໍ່ມີການສອດຄ່ອງ.
qlo nucleotide ທໍາອິດຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າຫມາຍ. ສະເຫມີເທົ່າກັບ 1
ຖ້າມີການສອດຄ່ອງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.
qrow ພິມລໍາດັບຂອງພາກສ່ວນການສອບຖາມຕາມທີ່ເຫັນໃນການຈັດຮຽງຄູ່
(ເຊັ່ນ: ການໃສ່ຊ່ອງຫວ່າງຖ້າຕ້ອງການ). ພື້ນທີ່ຫວ່າງເປົ່າຖ້າບໍ່ມີ
ການຈັດວາງ.
qs ຄວາມຍາວສ່ວນການສອບຖາມ. ເທົ່າກັບຄວາມຍາວຂອງລຳດັບການສອບຖາມສະເໝີ.
qstrand Query strand orientation (+ ຫຼື - ສໍາລັບລໍາດັບ nucleotide). ຊ່ອງຫວ່າງຖ້າ
ບໍ່ມີການສອດຄ່ອງ.
query ປ້າຍສອບຖາມ.
ວັດຖຸດິບ ຄະແນນການຈັດຮຽງວັດຖຸດິບ (ຄ່າລົບ, null ຫຼືຄ່າເລກບວກ). ຄະແນນ
ແມ່ນຜົນລວມຂອງລາງວັນການແຂ່ງຂັນລົບການລົງໂທດທີ່ບໍ່ກົງກັນ, ການເປີດຊ່ອງຫວ່າງ ແລະຊ່ອງຫວ່າງ
ສ່ວນຂະຫຍາຍ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການຈັດຮຽງ.
ເປົ້າຫມາຍ ປ້າຍກຳກັບ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ "*" ຖ້າບໍ່ມີການຈັດຮຽງ.
tcov ຊິ້ນສ່ວນຂອງລໍາດັບເປົ້າຫມາຍທີ່ສອດຄ່ອງກັບລໍາດັບການສອບຖາມ
(ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0). ການຄຸ້ມຄອງເປົ້າຫມາຍແມ່ນຄິດໄລ່ເປັນ
100.0 * (ກົງກັນ + ບໍ່ກົງກັນ) / ຄວາມຍາວຂອງລໍາດັບເປົ້າຫມາຍ. ພາຍໃນ ຫຼື
ຊ່ອງຫວ່າງຢູ່ປາຍຍອດບໍ່ໄດ້ຖືກພິຈາລະນາ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0.0 ຖ້າ
ບໍ່ມີການສອດຄ່ອງ.
ຂອບຮູບ ຂອບເປົ້າໝາຍ (-3 ຫາ +3). ພາກສະຫນາມນັ້ນພຽງແຕ່ກ່ຽວຂ້ອງກັບລໍາດັບລະຫັດແລະແມ່ນ
ບໍ່ໄດ້ຄິດໄລ່ໂດຍ vsearch. ຕັ້ງເປັນ +0 ສະເໝີ.
ທ nucleotide ສຸດທ້າຍຂອງເປົ້າໝາຍສອດຄ່ອງກັບການສອບຖາມ. ສະເຫມີເທົ່າກັບ
ຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີ
ການຈັດວາງ.
ທິຮິ nucleotide ສຸດທ້າຍຂອງເປົ້າຫມາຍສອດຄ່ອງກັບການສອບຖາມ (ລະເລີຍ terminal
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.
linden nucleotide ທໍາອິດຂອງເປົ້າຫມາຍທີ່ສອດຄ່ອງກັບການສອບຖາມ (ບໍ່ສົນໃຈເບື້ອງຕົ້ນ
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.
tl ຄວາມຍາວລຳດັບເປົ້າໝາຍ (ຄ່າຈຳນວນເຕັມບວກ). ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າ
ບໍ່ມີການສອດຄ່ອງ.
ດິນ nucleotide ທໍາອິດຂອງເປົ້າຫມາຍສອດຄ່ອງກັບການສອບຖາມ. ສະເຫມີເທົ່າກັບ 1
ຖ້າມີການສອດຄ່ອງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.
ດອກໄມ້ ພິມລໍາດັບຂອງພາກສ່ວນເປົ້າຫມາຍດັ່ງທີ່ເຫັນຢູ່ໃນການຈັດຕໍາແຫນ່ງຄູ່
(ເຊັ່ນ: ການໃສ່ຊ່ອງຫວ່າງຖ້າຕ້ອງການ). ພື້ນທີ່ຫວ່າງເປົ່າຖ້າບໍ່ມີ
ການຈັດວາງ.
ts ຄວາມຍາວສ່ວນເປົ້າໝາຍ. ເທົ່າກັບຄວາມຍາວຂອງລຳດັບເປົ້າໝາຍສະເໝີ. ພາກສະຫນາມ
ຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການສອດຄ່ອງ.
tstrand ທິດທາງຂອງເສັ້ນເປົ້າໝາຍ (+ ຫຼື - ສໍາລັບລໍາດັບ nucleotide). ຕັ້ງເປັນ
"+", ດັ່ງນັ້ນການຈັບຄູ່ strand reverse ມີ tstrand "+" ແລະ qstrand "-". ຫວ່າງເປົ່າ
ພາກສະຫນາມຖ້າບໍ່ມີການຈັດຕໍາແຫນ່ງ.
ເຈດຕະນາ ການປ່ຽນແປງ
ຖ້າທ່ານເປັນຜູ້ໃຊ້ usearch, ຈຸດປະສົງຂອງພວກເຮົາແມ່ນເພື່ອເຮັດໃຫ້ທ່ານມີຄວາມຮູ້ສຶກຢູ່ເຮືອນ. ນັ້ນຄືເຫດຜົນ vsearch
ໄດ້ຖືກອອກແບບເພື່ອປະຕິບັດຕົວຄືກັບ usearch, ໃນບາງຂອບເຂດ. ເຊັ່ນດຽວກັນກັບຊອບແວສະລັບສັບຊ້ອນໃດກໍ່ຕາມ, usearch ແມ່ນ
ບໍ່ບໍ່ເສຍຄ່າຈາກ quirks ແລະຄວາມບໍ່ສອດຄ່ອງ. ພວກເຮົາຕັດສິນໃຈທີ່ຈະບໍ່ແຜ່ພັນບາງສ່ວນຂອງພວກເຂົາ, ແລະ
ເພື່ອຄວາມໂປ່ງໃສທີ່ສົມບູນ, ເພື່ອບັນທຶກການປ່ຽນແປງໂດຍເຈດຕະນາທີ່ພວກເຮົາໄດ້ເຮັດຢູ່ທີ່ນີ້.
ໃນລະຫວ່າງການຄົ້ນຫາທີ່ມີ usearch, ໃນເວລາທີ່ການນໍາໃຊ້ທາງເລືອກ --blast6out ແລະ --output_no_hits, ສໍາລັບການ
queries with no match the number of fields report is 13, where it should be 12. ນີ້ແມ່ນ
ແກ້ໄຂໃນ vsearch.
ຂໍ້ມູນດິບຂອງທາງເລືອກ --userfields ບໍ່ແມ່ນຂໍ້ມູນໃນ usearch. ອັນນີ້ຖືກແກ້ໄຂ
in vsearch.
ທົ່ງນາ qlo, qhi, tlo, thi ໃນປັດຈຸບັນມີຄູ່ຮ່ວມງານ (qilo, qihi, tilo, tihi) ລາຍງານ.
ການຈັດຮຽງພິກັດບໍ່ສົນໃຈຊ່ອງຫວ່າງຢູ່ປາຍຍອດ.
ໃນ usearch, ເມື່ອໃຊ້ຕົວເລືອກ --output_no_hits, ຄໍາຖາມທີ່ບໍ່ໄດ້ຮັບຄໍາທີ່ກົງກັນແມ່ນ
ລາຍງານໃນໄຟລ໌ blast6out, ແຕ່ບໍ່ແມ່ນຢູ່ໃນໄຟລ໌ຜົນຜະລິດການຈັດລໍາດັບ. ນີ້ແມ່ນການແກ້ໄຂໃນ
vsearch.
vsearch ແນະນຳຄຳສັ່ງ --cluster_size ໃໝ່ທີ່ຈັດຮຽງລຳດັບໂດຍການຫຼຸດ
ຄວາມອຸດົມສົມບູນກ່ອນທີ່ຈະເປັນກຸ່ມ.
vsearch reintroduces --iddef ທາງເລືອກຄູ່ຄໍານິຍາມຕົວຕົນທີ່ຖືກລຶບອອກ
ຈາກ usearch.
vsearch ຂະຫຍາຍຕົວເລືອກ --topn ເພື່ອຈັດຮຽງຄໍາສັ່ງ.
vsearch ຂະຫຍາຍຕົວເລືອກ --sizein ໄປຫາ dereplication (--derep_fulllength) ແລະ clustering
(--cluster_fast).
vsearch ປະຕິບັດຕໍ່ T ແລະ U ເປັນ nucleotides ດຽວກັນໃນລະຫວ່າງການ dereplication.
vsearch ການຈັດລຽງແມ່ນສະຖຽນລະພາບໂດຍການນໍາໃຊ້ລໍາດັບຄວາມອຸດົມສົມບູນຫຼືລໍາດັບປ້າຍຊື່ເປັນ
ກະແຈສຳຮອງ ຫຼື ຂັ້ນສາມ.
ລັດຖະບານ
vsearch ແນະນໍາທາງເລືອກໃຫມ່ທີ່ບໍ່ມີຢູ່ໃນ usearch 7. ພວກເຂົາເຈົ້າໄດ້ຖືກອະທິບາຍຢູ່ໃນ
ພາກສ່ວນ "ຕົວເລືອກ" ຂອງຄູ່ມືນີ້. ນີ້ແມ່ນບັນຊີລາຍຊື່ສັ້ນ:
- ຄວາມກວ້າງຂວາງ (ການກວດສອບchimera)
- cluster_size (ກຸ່ມ)
- fasta_width (ທາງເລືອກທົ່ວໄປ)
- iddef (ການຈັດກຸ່ມ, ສອດຄ່ອງຄູ່, ການຊອກຫາ)
- ຂະຫນາດໃຫ້ສູງສຸດ (dereplication)
- shuffle (ສະຫຼັບ)
ຕົວຢ່າງ
ຈັດລຽງລຳດັບທັງໝົດໃນຖານຂໍ້ມູນເຊິ່ງກັນແລະກັນ ແລະອອກຜົນການຈັດຮຽງຄູ່ທັງໝົດ:
vsearch --allpairs_global database.fas --alnout results.aln --ຍອມຮັບທັງໝົດ
ກວດເບິ່ງການປະກົດຕົວຂອງ chimeras (de novo); ພໍ່ແມ່ຄວນຈະມີຢ່າງຫນ້ອຍ 1.5 ເທົ່າ
ອຸດົມສົມບູນກວ່າ chimeras. ຜົນຜະລິດລໍາດັບທີ່ບໍ່ແມ່ນchimeric ໃນຮູບແບບ fasta (ບໍ່ມີການຫໍ່):
vsearch --uchime_denovo queries.fas --nonchimeras results.fas --fasta_width 0
--abskew 1.5
Cluster ທີ່ມີເກນຄວາມຄ້າຍຄືກັນ 97%, ລວບລວມ cluster centroids, ແລະຂຽນ cluster
ລາຍລະອຽດການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື uclust:
vsearch --cluster_fast queries.fas --id 0.97 --centroids centroids.fas --uc
clusters.uc
Dereplicate ລໍາດັບທີ່ມີຢູ່ໃນ queries.fas, ຄໍານຶງເຖິງຄວາມອຸດົມສົມບູນ
ຂໍ້ມູນທີ່ມີຢູ່ແລ້ວ, ຂຽນລໍາດັບ unwrapped ກັບຜົນຜະລິດທີ່ມີອຸດົມສົມບູນໃຫມ່
ຂໍ້ມູນ, ຍົກເລີກການລໍາດັບທັງຫມົດທີ່ມີອຸດົມສົມບູນຂອງ 1:
vsearch --derep_fullength queries.fas -- ຜົນຜະລິດ queries_masked.fas --ຂະຫນາດ
--sizeout --fasta_width 0 --minuniquesize 2
Mask ການຊໍ້າຄືນແບບງ່າຍໆ ແລະ ພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນຕໍ່າຢູ່ໃນໄຟລ໌ fasta ວັດສະດຸປ້ອນ (ເຂດທີ່ໜ້າກາກແມ່ນ
ຕົວພິມນ້ອຍ), ແລະຂຽນຜົນໄດ້ຮັບໃສ່ໄຟລ໌ຜົນຜະລິດ:
vsearch -- maskfasta queries.fas -- ຜົນຜະລິດ queries_masked.fas --qmask ຂີ້ຝຸ່ນ
ຄົ້ນຫາແບບສອບຖາມໃນຖານຂໍ້ມູນອ້າງອິງ, ໂດຍມີເກນຄວາມຄ້າຍຄືກັນ 80%, ເອົາ terminal
ຊ່ອງຫວ່າງເຂົ້າໃນບັນຊີເມື່ອຄິດໄລ່ຄວາມຄ້າຍຄືກັນຄູ່:
vsearch --usearch_global queries.fas --db references.fas --alnout results.aln --id
0.8 --iddef 1
ຄົ້ນຫາຊຸດຂໍ້ມູນຕາມລໍາດັບຕໍ່ຕ້ານຕົວມັນເອງ (ບໍ່ສົນໃຈຕົນເອງ hits), ໄດ້ຮັບການແຂ່ງຂັນທັງຫມົດທີ່ມີຢ່າງຫນ້ອຍ
60% ຕົວຕົນ, ແລະເກັບກໍາຜົນໄດ້ຮັບໃນຮູບແບບທີ່ແຍກແທັບແທັບລະເບີດ:
vsearch --usearch_global queries.fas --db queries.fas --id 0.6 --self --blast6out
results.blast6 --maxaccepts 0 --maxrejects 0
ສະຫຼັບໄຟລ໌ fasta ການປ້ອນຂໍ້ມູນ (ປ່ຽນລໍາດັບຂອງລໍາດັບ) ໃນຮູບແບບທີ່ເຮັດຊ້ໍາໄດ້
(ແກ່ນຄົງທີ່), ແລະຂຽນລໍາດັບ fasta ທີ່ບໍ່ຫໍ່ໃສ່ໄຟລ໌ຜົນຜະລິດ:
vsearch --ສະຫຼັບ queries.fas -- ຜົນຜະລິດ queries_shuffled.fas --ແກ່ນ 13 --fasta_width
0
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນຂອງລໍາດັບທີ່ມີຢູ່ໃນ queries.fas (ໂດຍໃຊ້
"ຂະຫນາດ=integer" ຂໍ້ມູນ), relabel ລໍາດັບໃນຂະນະທີ່ຮັກສາຄວາມອຸດົມສົມບູນ
ຂໍ້ມູນ (ດ້ວຍ --sizeout), ຮັກສາພຽງແຕ່ລໍາດັບທີ່ມີຄວາມອຸດົມສົມບູນເທົ່າກັບຫຼືຫຼາຍກວ່ານັ້ນ
ຫຼາຍກວ່າ 2:
vsearch --sortbysize queries.fas -- ຜົນຜະລິດ queries_sorted.fas --relabel ຕົວຢ່າງA_
--sizeout --ຂະໜາດນ້ອຍ 2
AUTHORS
ການປະຕິບັດໂດຍ Torbjørn Rognes ແລະ Tomás Flouri, ເອກະສານໂດຍ Frédéric Mahé.
ການລາຍງານ ບັກ
ສົ່ງຄໍາແນະນໍາແລະບົດລາຍງານ bug ທີ່ , ສົ່ງ ກ
ດຶງຄໍາຮ້ອງສະຫມັກ , ຫຼືປະກອບເປັນມິດຫຼື
curmudgeont e-mail ກັບ Torbjørn Rognestorognes@ifi.uio.no>.
ການແຜ່ກະຈາຍ
ລະຫັດແຫຼ່ງແລະຖານສອງແມ່ນມີຢູ່ .
COPYRIGHT
ສະຫງວນລິຂະສິດ (C) 2014, 2015 Torbjørn Rognes, Frédéric Mahé ແລະ Tomás Flouri.
ໂຄງການນີ້ແມ່ນຊອບແວຟຣີ: ທ່ານສາມາດແຈກຢາຍມັນແລະ / ຫຼືປັບປຸງແກ້ໄຂມັນພາຍໃຕ້ເງື່ອນໄຂຂອງ
ໃບອະນຸຍາດສາທາລະນະທົ່ວໄປຂອງ GNU Affero ທີ່ຈັດພີມມາໂດຍມູນນິທິຊອບແວຟຣີ, ບໍ່ວ່າຈະ
ສະບັບ 3 ຂອງໃບອະນຸຍາດ, ຫຼືສະບັບຕໍ່ມາ.
ໂຄງການນີ້ໄດ້ຖືກແຈກຢາຍໂດຍຫວັງວ່າມັນຈະເປັນປະໂຫຍດ, ແຕ່ບໍ່ມີການຮັບປະກັນໃດໆ;
ໂດຍບໍ່ມີການຮັບປະກັນທາງດ້ານການຄ້າ ຫຼືຄວາມສອດຄ່ອງສໍາລັບຈຸດປະສົງສະເພາະ.
ເບິ່ງໃບອະນຸຍາດສາທາລະນະທົ່ວໄປ GNU Affero ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ.
ທ່ານຄວນໄດ້ຮັບສໍາເນົາຂອງໃບອະນຸຍາດສາທາລະນະທົ່ວໄປ GNU Affero ພ້ອມກັບສິ່ງນີ້
ໂຄງການ. ຖ້າບໍ່, ເບິ່ງhttp://www.gnu.org/licenses/>.
vsearch ລວມມີລະຫັດຈາກໂຄງການ CityHash ຂອງ Google ໂດຍ Geoff Pike ແລະ Jyrki Alakuijala,
ສະຫນອງບາງຫນ້າທີ່ hash ທີ່ດີເລີດທີ່ມີຢູ່ພາຍໃຕ້ໃບອະນຸຍາດ MIT.
vsearch ລວມມີລະຫັດທີ່ມາຈາກ Tatusov ແລະໂຄງການ DUST ຂອງ Lipman ທີ່ຢູ່ໃນສາທາລະນະ
ໂດເມນ.
vsearch binaries ອາດຈະປະກອບມີລະຫັດຈາກຫ້ອງສະຫມຸດ zlib, ລິຂະສິດ Jean-Loup Gailly ແລະ
Mark Adler.
vsearch binary ອາດຈະປະກອບມີລະຫັດຈາກຫ້ອງສະຫມຸດ bzip2, ລິຂະສິດ Julian R. Seward.
ໃຊ້ vsearch ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net