vsearch - ອອນລາຍໃນຄລາວ

ນີ້ແມ່ນຄໍາສັ່ງ vsearch ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


vsearch — ການ​ກວດ​ສອບ chimera​, ການ​ຈັດ​ກຸ່ມ​, dereplication​, ຫນ້າ​ກາກ​, ສອດ​ຄ່ອງ​ຄູ່​,
ການ​ຊອກ​ຫາ​, shuffling ແລະ​ການ​ຈັດ​ລຽງ​ຂອງ amplicons ຈາກ​ໂຄງ​ການ metagenomic​.

ສະຫຼຸບສັງລວມ


ການ​ກວດ​ສອບ Chimera​:
vsearch --uchime_denovo ໄວໄຟ (--chimeras | --nonchimeras | --uchimealns |
--uchimeout) ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]

vsearch --uchime_ref ໄວໄຟ (--chimeras | --nonchimeras | --uchimealns |
--uchimeout) ໄຟລ໌ອອກ --db ໄວໄຟ [ທາງເລືອກໃນການ]

ກຸ່ມ:
vsearch (--cluster_fast | --cluster_size | --cluster_smallmem) ໄວໄຟ (--alnout
| --blast6out | --centroids | --ກຸ່ມ | --msaout | --samout | --uc | --ຜູ້​ໃຊ້​ອອກ​)
ໄຟລ໌ອອກ --id ທີ່ແທ້ຈິງ [ທາງເລືອກໃນການ]

ຊໍ້າຊ້ອນ:
vsearch --derep_fullength ໄວໄຟ (--ຜົນຜະລິດ | --uc) ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]

ໜ້າກາກ:
vsearch -- maskfasta ໄວໄຟ -- ຜົນຜະລິດ ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]

ການຈັດຮຽງຄູ່:
vsearch --allpairs_global ໄວໄຟ (--alnout | --blast6out | --ກົງກັນ |
--ບໍ່ກົງກັນ | --samout | --uc | --ຜູ້​ໃຊ້​ອອກ​) ໄຟລ໌ອອກ (--ຍອມຮັບ | --id ທີ່ແທ້ຈິງ)
[ທາງເລືອກໃນການ]

ການຄົ້ນຫາ:
vsearch --usearch_global ໄວໄຟ --db ໄວໄຟ (--alnout | --blast6out |
--samout | --uc | --ຜູ້​ໃຊ້​ອອກ​) ໄຟລ໌ອອກ --id ທີ່ແທ້ຈິງ [ທາງເລືອກໃນການ]

ການສະຫຼັບ:
vsearch --ສະຫຼັບ ໄວໄຟ -- ຜົນຜະລິດ ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]

ການຈັດຮຽງ:
vsearch (--sortbylength | --sortbysize) ໄວໄຟ -- ຜົນຜະລິດ ໄຟລ໌ອອກ [ທາງເລືອກໃນການ]

ລາຍລະອຽດ


ການສຶກສາຄວາມຫຼາກຫຼາຍຂອງໂມເລກຸນດ້ານສິ່ງແວດລ້ອມ ຫຼືທາງຄລີນິກ ໄດ້ສ້າງ amplicons ຂະໜາດໃຫຍ່
(ເຊັ່ນ: ລໍາດັບ SSU-rRNA) ທີ່ຕ້ອງໄດ້ຮັບການກວດກາສໍາລັບ chimeras, dereplicated, masked,
ຈັດຮຽງ, ຊອກຫາ, ຈັດກຸ່ມ ຫຼືປຽບທຽບກັບລໍາດັບອ້າງອີງ. ຈຸດ​ປະ​ສົງ​ຂອງ​ vsearch ແມ່ນເພື່ອ
ສະເໜີໃຫ້ເຄື່ອງມືແຫຼ່ງເປີດທັງໝົດໃນໜຶ່ງດຽວເພື່ອປະຕິບັດວຽກງານເຫຼົ່ານີ້, ໂດຍໃຊ້ສູດການຄິດໄລ່ທີ່ດີທີ່ສຸດ
ການປະຕິບັດແລະການຂຸດຄົ້ນທ່າແຮງອັນເຕັມທີ່ຂອງຄອມພິວເຕີທີ່ທັນສະໄຫມ, ດັ່ງນັ້ນການສະຫນອງໄວ
ແລະການປະມວນຜົນຂໍ້ມູນທີ່ຖືກຕ້ອງ.

ການປຽບທຽບລໍາດັບ nucleotide ແມ່ນຢູ່ໃນຫຼັກຂອງ vsearch. ເພື່ອເລັ່ງການປຽບທຽບ, vsearch
ປະຕິບັດການປະຕິບັດທີ່ໄວທີ່ສຸດຂອງ Needleman-Wunsch algorithm, ເຮັດໃຫ້ການນໍາໃຊ້
ຂອງ Streaming SIMD Extensions (SSE2) ຂອງ CPU x86-64 ທີ່ທັນສະໄຫມ. ຖ້າຄໍາແນະນໍາ SSE2 ແມ່ນ
ບໍ່​ສາ​ມາດ​ໃຊ້​ໄດ້, vsearch ອອກດ້ວຍຂໍ້ຄວາມສະແດງຂໍ້ຜິດພາດ. ສໍາລັບການປຽບທຽບທີ່ກ່ຽວຂ້ອງກັບລໍາດັບ
ຍາວກວ່າ 5,000 nucleotides, vsearch ໃຊ້ວິທີການຈັດຮຽງທີ່ຊ້າລົງກັບໜ່ວຍຄວາມຈຳທີ່ນ້ອຍກວ່າ
ຄວາມຕ້ອງການ.

ການປ້ອນຂໍ້ມູນ
vsearch ການປ້ອນຂໍ້ມູນແມ່ນໄຟລ໌ fasta ທີ່ມີລໍາດັບ nucleotide ໜຶ່ງ ຫຼືຫຼາຍອັນ. ສໍາລັບແຕ່ລະຄົນ
ລຳດັບ, ຕົວລະບຸລຳດັບແມ່ນກຳນົດເປັນສະຕຣິງທີ່ປະກອບດ້ວຍລະຫວ່າງ ">"
ສັນ​ຍາ​ລັກ​ແລະ​ຊ່ອງ​ທໍາ​ອິດ​, ຫຼື​ທ້າຍ​ຂອງ​ເສັ້ນ​, ອັນ​ໃດ​ກໍ​ຕາມ​ມາ​ກ່ອນ​. ນອກຈາກນັ້ນ,
ຖ້າເສັ້ນເລີ່ມຕົ້ນດ້ວຍ ">[;]size=integer;label", ມີ ">label;size=integer;ປ້າຍກຳກັບ" ຫຼື
ສິ້ນສຸດດ້ວຍ ">label;size=integer[;]", vsearch ຈະເອົາຮູບແບບ [;]size=integer[;]
ຈາກສ່ວນຫົວ ແລະຕີຄວາມໝາຍ integer ເປັນຈໍານວນຂອງການປະກົດຕົວ (ຫຼືອຸດົມສົມບູນ) ຂອງ
ລໍາດັບໃນການສຶກສາ. ຂໍ້ມູນທີ່ອຸດົມສົມບູນນັ້ນຖືກນໍາໃຊ້ຫຼືສ້າງຂື້ນໃນລະຫວ່າງ chimera
ການ​ຊອກ​ຄົ້ນ​ຫາ​, ການ​ຈັດ​ກຸ່ມ​, dereplication​, ການ​ຄັດ​ເລືອກ​ແລະ​ການ​ຊອກ​ຫາ​.

ລໍາດັບ nucleotide ຖືກກໍານົດເປັນສາຍຂອງສັນຍາລັກ IUPAC (ACGTURYSWKMDBHVN),
ເລີ່ມຕົ້ນຫຼັງຈາກສິ້ນສຸດຂອງແຖວຕົວລະບຸ ແລະສິ້ນສຸດກ່ອນແຖວຕົວລະບຸຕໍ່ໄປ,
ຫຼືທ້າຍໄຟລ໌. vsearch ງຽບໆບໍ່ສົນໃຈຕົວອັກສອນ ascii 9 ຫາ 13, ແລະອອກດ້ວຍ an
ຂໍ້​ຄວາມ​ຜິດ​ພາດ​ຖ້າ​ຫາກ​ວ່າ​ຕົວ​ອັກ​ສອນ ascii 0 ຫາ 8​, 14 ຫາ 31​, "." ຫຼື "-" ມີຢູ່. ອື່ນໆທັງໝົດ
ຕົວອັກສອນ ascii ຫຼື non-ascii ຖືກຖອດອອກ ແລະຖືກຈົ່ມໃນຄຳເຕືອນທີ່ບໍ່ປິດກັ້ນ
ຂໍ້ຄວາມ.

vsearch ການປະຕິບັດງານແມ່ນບໍ່ມີຕົວພິມນ້ອຍ, ຍົກເວັ້ນເມື່ອການປິດບັງໜ້າອັດອ່ອນຖືກເປີດໃຊ້ງານ. ເມື່ອໃຊ້
clustering, masking ຫຼື searching commands, case is important ຖ້າ soft masking ຖືກນໍາໃຊ້.
Soft masking ຖືກກໍານົດດ້ວຍຕົວເລືອກ "--dbmask soft" (ສໍາລັບການຊອກຫາ) ຫຼື "--qmask.
soft" (ສໍາລັບການຄົ້ນຫາ, clustering ແລະ masking). ເມື່ອນໍາໃຊ້ soft masking, ຕົວອັກສອນຕົວພິມນ້ອຍ
ຊີ້ບອກສັນຍາລັກໃສ່ໜ້າກາກ, ໃນຂະນະທີ່ຕົວພິມໃຫຍ່ສະແດງເຖິງສັນຍາລັກປົກກະຕິ. ສັນຍາລັກໃສ່ໜ້າກາກ
ບໍ່​ເຄີຍ​ລວມ​ຢູ່​ໃນ​ເອ​ກະ​ລັກ​ k-mers ນໍາ​ໃຊ້​ໃນ​ການ​ຊອກ​ຫາ​. ໃນເວລາທີ່ soft masking ບໍ່ແມ່ນ
ເປີດໃຊ້, ຕົວອັກສອນທັງໝົດຖືກປ່ຽນເປັນຕົວພິມໃຫຍ່ພາຍໃນ ແລະໃຊ້ໃນໄຟລ໌ຜົນໄດ້ຮັບ.

ເມື່ອປຽບທຽບລໍາດັບໃນລະຫວ່າງການກວດພົບ chimera, dereplication, ຄົ້ນຫາແລະ
ການຈັດກຸ່ມ, T ແລະ U ແມ່ນຖືວ່າຄືກັນ, ໂດຍບໍ່ສົນເລື່ອງຂອງພວກມັນ. ຖ້າສອງສັນຍາລັກແມ່ນ
ບໍ່ຄືກັນ, ການຈັດຮຽງຂອງພວກມັນຈະເຮັດໃຫ້ຄະແນນບໍ່ກົງກັນທາງລົບ (ຄ່າເລີ່ມຕົ້ນ -4),
ຍົກ​ເວັ້ນ​ແຕ່​ວ່າ​ຫນຶ່ງ​ຫຼື​ທັງ​ສອງ​ຂອງ​ສັນ​ຍາ​ລັກ​ແມ່ນ​ບໍ່​ຊັດ​ເຈນ (RYSWKMDBHVN​) ໃນ​ກໍ​ລະ​ນີ​ທີ່​ຄະ​ແນນ
ແມ່ນສູນ. ການຈັດຮຽງຂອງສອງສັນຍາລັກທີ່ບໍ່ຊັດເຈນຄືກັນ (ເຊັ່ນ: R vs R) ຍັງໄດ້ຮັບຄະແນນ
ຂອງສູນ.

vsearch ສາ​ມາດ​ໄດ້​ຮັບ​ການ​ສັງ​ລວມ​ເພື່ອ​ຍອມ​ຮັບ​ໄຟລ​໌ fasta compressed ເປັນ​ການ​ປ້ອນ​ຂໍ້​ມູນ (gz ແລະ bzip2
ຮູບແບບ). ໃນທາງກົງກັນຂ້າມ, ໄຟລ໌ພິເສດເຊັ່ນ: ທໍ່, ທໍ່ທີ່ມີຊື່, ຫຼືເຕົ້າສຽບບໍ່ສາມາດເປັນ
ໃຊ້ເປັນການປ້ອນຂໍ້ມູນ. ເພື່ອນໍາສະເຫນີຕົວຊີ້ວັດຄວາມຄືບຫນ້າ, vsearch ຕ້ອງ​ການ​ເພື່ອ​ຊອກ​ຫາ​ທີ່​ສຸດ​ຂອງ​
ຊື່​ເອ​ກະ​ສານ ເພື່ອຊອກຫາຄວາມຍາວຂອງມັນ. ດັ່ງນັ້ນ, ຊື່​ເອ​ກະ​ສານ ຕ້ອງເປັນໄຟລ໌ປົກກະຕິ, ບໍ່ແມ່ນການຖ່າຍທອດ.

ທາງເລືອກໃນການ
vsearch ຮັບຮູ້ຕົວເລືອກແຖວຄໍາສັ່ງຈໍານວນຫລາຍ. ສໍາລັບການນໍາທາງທີ່ງ່າຍຂຶ້ນ, ທາງເລືອກ
ຖືກຈັດກຸ່ມຢູ່ລຸ່ມນີ້ຕາມຫົວຂໍ້ (ການຊອກຄົ້ນຫາchimera, clustering, dereplication, masking,
shuffling, ຄັດ, ແລະຊອກຫາ). ພວກເຮົາເລີ່ມຕົ້ນດ້ວຍທາງເລືອກທົ່ວໄປທີ່ນໍາໃຊ້ກັບທຸກຄົນ
ຫົວຂໍ້.

ທາງເລືອກທົ່ວໄປ:

--fasta_width ໃນທາງບວກ integer
ໄຟລ໌ Fasta ຜະລິດໂດຍ vsearch ຖືກຫໍ່ (ລໍາດັບແມ່ນຂຽນໃສ່
ສາຍຂອງ integer nucleotides, 80 ໂດຍຄ່າເລີ່ມຕົ້ນ). ຕັ້ງຄ່ານັ້ນເປັນ 0 ຫາ
ກໍາຈັດການຫໍ່.

- ຊ່ວຍ ສະແດງການຊ່ວຍເຫຼືອສັ້ນໆ ແລະອອກ.

--ບັນທຶກ ຊື່​ເອ​ກະ​ສານ
ຂຽນຂໍ້ຄວາມໃສ່ໄຟລ໌ບັນທຶກທີ່ລະບຸ. ຂໍ້ມູນລາຍລັກອັກສອນປະກອບມີ
ຮຸ່ນຂອງໂປຼແກຼມ, ຈໍານວນຫນ່ວຍຄວາມຈໍາທີ່ມີຢູ່, ຈໍານວນແກນແລະຄໍາສັ່ງ
ຕົວເລືອກສາຍ. ເວລາເລີ່ມຕົ້ນແລະສໍາເລັດຮູບໄດ້ຖືກບັນທຶກໄວ້ເຊັ່ນດຽວກັນ
ເວລາຜ່ານໄປ. ຈໍານວນສູງສຸດຂອງຫນ່ວຍຄວາມຈໍາທີ່ບໍລິໂພກແມ່ນລວມ. ໄດ້
ຄໍາສັ່ງທີ່ແຕກຕ່າງກັນປົກກະຕິແລ້ວຈະຂຽນບາງຂໍ້ມູນກ່ຽວກັບຂອງເຂົາເຈົ້າ
ຜົນໄດ້ຮັບ. ຂໍ້ຄວາມທີ່ເປັນອັນຕະລາຍ, ການເຕືອນໄພແລະຂໍ້ມູນຂ່າວສານແມ່ນຂຽນ.

-- ຄວາມຍາວສູງສຸດ ໃນທາງບວກ integer
ທັງຫມົດ vsearch ການດໍາເນີນງານຈະຍົກເລີກລໍາດັບຂອງຄວາມຍາວເທົ່າກັບຫຼືຫຼາຍກວ່ານັ້ນ
ກ່ວາ integer (50,000 nucleotides ໂດຍຄ່າເລີ່ມຕົ້ນ).

--minseqlength ໃນທາງບວກ integer
ທັງຫມົດ vsearch ການດໍາເນີນງານຈະຍົກເລີກລໍາດັບຂອງຄວາມຍາວຂະຫນາດນ້ອຍກວ່າ
integer (1 nucleotide ໂດຍຄ່າເລີ່ມຕົ້ນສໍາລັບການຈັດລຽງຫຼື shuffling, 32 nucleotides
ສໍາລັບການຈັດກຸ່ມ, dereplication ຫຼືການຊອກຫາ).

--notrunclabels
ຢ່າຕັດປ້າຍກຳກັບຕາມລຳດັບຢູ່ບ່ອນທຳອິດ, ໃຫ້ໃຊ້ສ່ວນຫົວເຕັມ
ໄຟລ໌ຜົນຜະລິດ.

--ງຽບ ສະກັດກັ້ນຜົນຜະລິດທັງຫມົດເພື່ອ stdout ແລະ stdout ຍົກເວັ້ນສໍາລັບການເຕືອນໄພແລະຄວາມຕາຍ
ຂໍ້ຄວາມຜິດພາດ.

- ການປ່ຽນແປງ
ຂໍ້ມູນສະບັບອອກແລະອອກ.

ທາງ​ເລືອກ​ການ​ກວດ​ສອບ Chimera​:

ການກວດຫາ Chimera ແມ່ນອີງໃສ່ຟັງຊັນການໃຫ້ຄະແນນທີ່ຄວບຄຸມໂດຍຫ້າທາງເລືອກ (--dn,
--mindiffs, --mindiv, --minh, --xn). ລໍາດັບແມ່ນຈັດຮຽງທໍາອິດໂດຍການຫຼຸດລົງ
ຄວາມອຸດົມສົມບູນ (ຖ້າມີ), ແລະປຽບທຽບກັບພວກມັນ ບວກ strand ເທົ່ານັ້ນ (ກໍລະນີ
insensitive).

In de novo ຮູບ​ແບບ​, ການ​ປ້ອນ​ຂໍ້​ມູນ​ໄຟລ​໌ fasta ຄວນ​ນໍາ​ສະ​ເຫນີ​ຄໍາ​ອະ​ທິ​ບາຍ​ທີ່​ອຸ​ດົມ​ສົມ​ບູນ (ແບບ​
[;]ຂະຫນາດ=integer[;] ໃນ​ຫົວ fasta). ຄໍາສັ່ງປ້ອນຂໍ້ມູນມີອິດທິພົນຕໍ່ chimera
ການກວດພົບ, ດັ່ງນັ້ນພວກເຮົາແນະນໍາໃຫ້ຈັດລໍາດັບໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນ (ຄ່າເລີ່ມຕົ້ນຂອງ
--derep_fullength ຄໍາສັ່ງ). ຖ້າຊຸດລໍາດັບຂອງທ່ານຕ້ອງການຈັດຮຽງ, ກະລຸນາເບິ່ງ
ຄໍາສັ່ງ --sortbysize ໃນພາກການຈັດລຽງ.

--abskew ທີ່ແທ້ຈິງ
ເມື່ອໃຊ້ --uchime_denovo, skew ອຸດົມສົມບູນຖືກນໍາໃຊ້ເພື່ອຈໍາແນກໃນ
ການຈັດຮຽງ 3 ທາງວ່າ ລຳດັບໃດເປັນຕົວຈີງ ແລະ ອັນໃດແມ່ນພໍ່ແມ່.
ສົມມຸດຕິຖານແມ່ນວ່າ chimeras ປາກົດຕໍ່ມາໃນການຂະຫຍາຍ PCR
ຂະບວນການແລະດັ່ງນັ້ນຈຶ່ງມີຄວາມອຸດົມສົມບູນຫນ້ອຍກວ່າພໍ່ແມ່ຂອງພວກເຂົາ. ຄ່າເລີ່ມຕົ້ນ
ຄ່າແມ່ນ 2.0, ຊຶ່ງຫມາຍຄວາມວ່າພໍ່ແມ່ຄວນຈະມີຢ່າງຫນ້ອຍ 2 ເທົ່າ
ອຸດົມສົມບູນກ່ວາ chimera ຂອງເຂົາເຈົ້າ. ຄ່າບວກໃດໆທີ່ໃຫຍ່ກວ່າ 1.0 ສາມາດເປັນໄດ້
ໃຊ້ແລ້ວ.

--ຄວາມ​ກວ້າງ​ຂວາງ ໃນທາງບວກ integer
ຄວາມກວ້າງຂອງການຈັດຮຽງ 3 ທາງໃນ --uchimealns output. ຄ່າເລີ່ມຕົ້ນແມ່ນ
80. ຕັ້ງເປັນ 0 ເພື່ອກໍາຈັດການຫໍ່.

--chimeras ຊື່​ເອ​ກະ​ສານ
ຜົນຜະລິດລໍາດັບ chimeric ກັບ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta. ຄໍາສັ່ງຜົນຜະລິດອາດຈະ
ແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

--db ຊື່​ເອ​ກະ​ສານ
ເມື່ອໃຊ້ --uchime_ref, ກວດຫາ chimeras ໂດຍໃຊ້ fasta-formatted
ລຳດັບການອ້າງອີງທີ່ມີຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ. ລໍາດັບອ້າງອີງແມ່ນສົມມຸດ
ຈະບໍ່ມີ chimera. Chimeras ຈະບໍ່ຖືກກວດພົບຖ້າພໍ່ແມ່ຂອງພວກເຂົາ (ຫຼື
ພີ່ນ້ອງໃກ້ຊິດພຽງພໍ) ບໍ່ມີຢູ່ໃນຖານຂໍ້ມູນ.

--dn ທີ່ແທ້ຈິງ
ບໍ່ມີການນັບຄະແນນສຽງ pseudo-count (ພາລາມິເຕີ n ໃນ​ຫນ້າ​ທີ່​ການ​ໃຫ້​ຄະ​ແນນ chimera​)
(ຄ່າເລີ່ມຕົ້ນແມ່ນ 1.4).

-- ສະຕິ ໃນທາງບວກ integer
ຈໍານວນຄວາມແຕກຕ່າງຂັ້ນຕ່ໍາຕໍ່ສ່ວນ (ຄ່າເລີ່ມຕົ້ນແມ່ນ 3).

--ໃຈ ທີ່ແທ້ຈິງ
ຄວາມແຕກຕ່າງຂັ້ນຕ່ຳຈາກພໍ່ແມ່ທີ່ໃກ້ຄຽງທີ່ສຸດ (ຄ່າເລີ່ມຕົ້ນແມ່ນ 0.8).

--ນາທີ ທີ່ແທ້ຈິງ
ຄະແນນຕໍ່າສຸດ (ຊ). ການເພີ່ມມູນຄ່ານີ້ມັກຈະຫຼຸດລົງຈໍານວນຂອງ
ບວກທີ່ບໍ່ຖືກຕ້ອງແລະຫຼຸດຜ່ອນຄວາມອ່ອນໄຫວ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 0.28, ແລະ
ຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0 ລວມແມ່ນຍອມຮັບ.

--nonchimeras ຊື່​ເອ​ກະ​ສານ
ສົ່ງອອກລໍາດັບທີ່ບໍ່ແມ່ນchimeric ໄປຫາ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta. ຄໍາສັ່ງອອກ
ອາດຈະແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

--ຕົນເອງ ເມື່ອໃຊ້ --uchime_ref, ບໍ່ສົນໃຈລໍາດັບອ້າງອີງເມື່ອປ້າຍຊື່ຂອງມັນ
ກົງກັບປ້າຍກຳກັບຂອງລຳດັບການສອບຖາມ (ເປັນປະໂຫຍດເພື່ອປະເມີນຄ່າບວກ
ອັດຕາໃນລໍາດັບອ້າງອີງ).

--selfid ເມື່ອໃຊ້ --uchime_ref, ບໍ່ສົນໃຈລໍາດັບອ້າງອີງເມື່ອ nucleotide ຂອງມັນ
ລໍາດັບແມ່ນຄືກັນຢ່າງເຂັ້ມງວດກັບລໍາດັບການສອບຖາມ.

-- ກະທູ້ ໃນທາງບວກ integer
ຈໍານວນກະທູ້ຄອມພິວເຕີ້ທີ່ໃຊ້ (1 ຫາ 256) ດ້ວຍ --uchime_ref. ໄດ້
ຈໍານວນຂອງ threads ຄວນຫນ້ອຍຫຼືເທົ່າກັບຈໍານວນຂອງ CPU ທີ່ມີຢູ່
ຫຼັກ. ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຕົວຫນຶ່ງ
thread ຕໍ່ຫຼັກເຫດຜົນ.

--uchime_denovo ຊື່​ເອ​ກະ​ສານ
ກວດພົບ chimeras ທີ່ມີຢູ່ໃນຮູບແບບ fasta ຊື່​ເອ​ກະ​ສານ, ໂດຍບໍ່ມີການພາຍນອກ
ການອ້າງອີງ (ie de novo). ຈັດລໍາດັບອັດຕະໂນມັດໃນ ຊື່​ເອ​ກະ​ສານ by
ຫຼຸດລົງຄວາມອຸດົມສົມບູນລ່ວງໜ້າ (ເບິ່ງລາຍລະອຽດໃນພາກການຈັດຮຽງ).
ບໍ່ຮອງຮັບ Multithreading.

--uchime_ref ຊື່​ເອ​ກະ​ສານ
ກວດພົບ chimeras ທີ່ມີຢູ່ໃນຮູບແບບ fasta ຊື່​ເອ​ກະ​ສານ ໂດຍການປຽບທຽບພວກມັນ
ດ້ວຍລໍາດັບອ້າງອີງ (ທາງເລືອກ --db). Multithreading ແມ່ນສະຫນັບສະຫນູນ.

--uchimealns ຊື່​ເອ​ກະ​ສານ
ຂຽນການຈັດຮຽງທົ່ວໂລກ 3 ທາງ (parentA, parentB, chimera) ຫາ ຊື່​ເອ​ກະ​ສານ
ໂດຍໃຊ້ຮູບແບບທີ່ມະນຸດສາມາດອ່ານໄດ້. ໃຊ້ --alignwidth ເພື່ອແກ້ໄຂການຈັດຮຽງ
ຄວາມຍາວ. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

--uchimeout ຊື່​ເອ​ກະ​ສານ
ຂຽນຜົນການກວດສອບ chimera ໃສ່ ຊື່​ເອ​ກະ​ສານ ການນໍາໃຊ້ແຖບ uchime ແຍກ
ຮູບແບບຂອງ 18 ຊ່ອງຂໍ້ມູນ (ເບິ່ງລາຍການຂ້າງລຸ່ມນີ້). ໃຊ້ --uchimeout5 ເພື່ອໃຊ້ຮູບແບບ
ເຂົ້າກັນໄດ້ກັບ usearch v5 ແລະຮຸ່ນກ່ອນຫນ້າ. ລໍາດັບຜົນຜະລິດແຖວອາດຈະ
ແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

1. ຄະແນນ: ຄະແນນທີ່ສູງຂຶ້ນຫມາຍເຖິງການຈັດຕໍາແໜ່ງຂອງ chimeric ທີ່ເປັນໄປໄດ້.

2. Q: query sequence label.

3. A: parent A ປ້າຍລໍາດັບ.

4. B: ປ້າຍແມ່ B ລໍາດັບ.

5. T: ປ້າຍກຳກັບລຳດັບຂອງພໍ່ແມ່ເທິງສຸດ (ເຊັ່ນ: ປ້າຍກຳກັບແມ່ທີ່ຄ້າຍຄືກັບ
ສອບຖາມ). ຊ່ອງຂໍ້ມູນນັ້ນຖືກເອົາອອກເມື່ອໃຊ້ --uchimeout5.

6. idQM: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະຕົວແບບ (M)
ກໍ່ສ້າງເປັນສ່ວນຫນຶ່ງຂອງພໍ່ແມ່ A ແລະສ່ວນຫນຶ່ງຂອງພໍ່ແມ່ B.

7. idQA: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະພໍ່ແມ່ A.

8. idQB: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະພໍ່ແມ່ B.

9. idAB: ອັດຕາສ່ວນຄວາມຄ້າຍຄືກັນຂອງພໍ່ແມ່ A ແລະພໍ່ແມ່ B.

10. idQT: ເປີເຊັນຂອງຄວາມຄ້າຍຄືກັນຂອງການສອບຖາມ (Q) ແລະແມ່ເທິງ (T).

11. LY: ແມ່ນແລ້ວ votes ໃນສ່ວນຊ້າຍຂອງຕົວແບບ.

12. LN: ບໍ່ມີຄະແນນສຽງຢູ່ໃນສ່ວນຊ້າຍຂອງຕົວແບບ.

13. LA: ງົດການລົງຄະແນນສຽງໃນສ່ວນຊ້າຍຂອງຕົວແບບ.

14. RY: ແມ່ນແລ້ວລົງຄະແນນສຽງຢູ່ໃນສ່ວນທີ່ຖືກຕ້ອງຂອງຕົວແບບ.

15. RN: ບໍ່ມີຄະແນນສຽງຢູ່ໃນສ່ວນທີ່ຖືກຕ້ອງຂອງຕົວແບບ.

16. RA: ງົດການລົງຄະແນນສຽງໃນສ່ວນທີ່ຖືກຕ້ອງຂອງຕົວແບບ.

17. div: divergence, ກໍານົດເປັນ (idQM - idQT).

18. YN: ການສອບຖາມແມ່ນ chimeric (Y), ຫຼືບໍ່ແມ່ນ (N), ຫຼືເປັນກໍລະນີເສັ້ນຊາຍແດນ.
(?).

--uchimeout5
ເມື່ອໃຊ້ --uchimeout, ຂຽນຜົນການກວດສອບ chimera ໂດຍໃຊ້ແຖບ-
ຮູບ​ແບບ​ທີ່​ແຍກ​ອອກ​ຂອງ 17 ຊ່ອງ​ຂໍ້​ມູນ (ລົງ​ພາກ​ສະ​ຫນາມ​ທີ 5 ຂອງ --uchimeout​)​,
ເຂົ້າກັນໄດ້ກັບ usearch ຮຸ່ນ 5 ແລະຮຸ່ນກ່ອນຫນ້າ.

--xn ທີ່ແທ້ຈິງ
ບໍ່ມີນ້ຳໜັກການລົງຄະແນນ (ພາຣາມິເຕີເບຕ້າໃນຟັງຊັນການໃຫ້ຄະແນນ) (ຄ່າເລີ່ມຕົ້ນແມ່ນ
8.0).

ຕົວເລືອກການຈັດກຸ່ມ:

vsearch ປະຕິບັດຂັ້ນຕອນວິທີການຈັດກຸ່ມດາວແບບດຽວ, greedy, ຄ້າຍຄືກັນກັບ
algorithms ປະຕິບັດໃນ usearch, DNAclust ແລະ sumaclust ຕົວຢ່າງ. ສຳຄັນ
ພາລາມິເຕີແມ່ນເກນການຈັດກຸ່ມທົ່ວໂລກ (--id) ແລະຕົວຕົນຄູ່
ຄໍານິຍາມ (--iddef).

--centroids ຊື່​ເອ​ກະ​ສານ
ຜົນ​ຜະ​ລິດ cluster centroid sequences to ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta. ໄດ້
centroid ແມ່ນລໍາດັບທີ່ seeded ກຸ່ມ (ເຊັ່ນ: ລໍາດັບທໍາອິດ
ຂອງກຸ່ມ).

--cluster_fast ຊື່​ເອ​ກະ​ສານ
ຈັດກຸ່ມລໍາດັບ fasta ໃນ ຊື່​ເອ​ກະ​ສານ, ປະຕິບັດອັດຕະໂນມັດ a
ຈັດຮຽງໂດຍການຫຼຸດຄວາມຍາວຂອງລຳດັບໄວ້ກ່ອນ.

--cluster_size ຊື່​ເອ​ກະ​ສານ
ຈັດກຸ່ມລໍາດັບ fasta ໃນ ຊື່​ເອ​ກະ​ສານ, ປະຕິບັດອັດຕະໂນມັດ a
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນຂອງລໍາດັບກ່ອນລ່ວງຫນ້າ.

--cluster_smallmem ຊື່​ເອ​ກະ​ສານ
ຈັດກຸ່ມລໍາດັບ fasta ໃນ ຊື່​ເອ​ກະ​ສານ ໂດຍບໍ່ມີການດັດແປງອັດຕະໂນມັດ
ຄໍາສັ່ງຂອງເຂົາເຈົ້າລ່ວງຫນ້າ. ລໍາດັບຄາດວ່າຈະຖືກຈັດຮຽງໂດຍການຫຼຸດລົງ
ຄວາມຍາວຂອງລໍາດັບ, ເວັ້ນເສຍແຕ່ --usersort ຖືກນໍາໃຊ້.

-- ກຸ່ມ string
ສົ່ງແຕ່ລະກຸ່ມໄປຫາໄຟລ໌ fasta ແຍກຕ່າງຫາກໂດຍໃຊ້ຄໍານໍາຫນ້າ string ແລະ
ticker (0, 1, 2, ແລະອື່ນໆ) ເພື່ອສ້າງເສັ້ນທາງແລະຊື່ໄຟລ໌.

--consout ຊື່​ເອ​ກະ​ສານ
ຜົນ​ໄດ້​ຮັບ​ການ​ລໍາ​ດັບ​ຄວາມ​ເຫັນ​ດີ​ຂອງ​ກຸ່ມ​ເພື່ອ ຊື່​ເອ​ກະ​ສານ. ສໍາລັບແຕ່ລະກຸ່ມ, ກ
ການ​ຈັດ​ຕັ້ງ​ຫຼາຍ​ຢ່າງ​ແມ່ນ​ໄດ້​ຮັບ​ການ​ຄິດ​ໄລ່​, ແລະ​ລໍາ​ດັບ​ຄວາມ​ເຫັນ​ດີ​ເປັນ​ການ​ກໍ່​ສ້າງ​ໂດຍ​
ເອົາສັນຍາລັກສ່ວນໃຫຍ່ (nucleotide ຫຼືຊ່ອງຫວ່າງ) ຈາກແຕ່ລະຖັນຂອງ
ການຈັດວາງ. ຖັນທີ່ມີຊ່ອງຫວ່າງສ່ວນໃຫຍ່ຖືກຂ້າມ, ຍົກເວັ້ນ
ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ.

--id ທີ່ແທ້ຈິງ
ຢ່າເພີ່ມເປົ້າໝາຍໃສ່ກຸ່ມ ຖ້າຕົວຕົນຄູ່ກັບ the
centroid ແມ່ນຕ່ໍາກວ່າ ທີ່ແທ້ຈິງ (ລວມມູນຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0). ໄດ້
ຕົວຕົນຄູ່ແມ່ນຖືກກໍານົດເປັນຈໍານວນ (ຄໍລໍາທີ່ກົງກັນ) /
(ຄວາມຍາວການຈັດຮຽງ - ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ). ຄໍານິຍາມນັ້ນສາມາດແກ້ໄຂໄດ້ໂດຍ
--iddef.

--iddef 0|1|2|3|4
ປ່ຽນຄຳນິຍາມຕົວຕົນຄູ່ທີ່ໃຊ້ໃນ --id. ຄ່າທີ່ຍອມຮັບແມ່ນ:

0. CD-HIT ຄໍານິຍາມ: (ຄໍລໍາທີ່ກົງກັນ) / (ລໍາດັບສັ້ນທີ່ສຸດ
ຄວາມຍາວ).

1. ແກ້ໄຂໄລຍະຫ່າງ: (ຄໍລໍາທີ່ກົງກັນ) / (ຄວາມຍາວການຈັດຕໍາແຫນ່ງ).

2. ແກ້ໄຂໄລຍະຫ່າງບໍ່ລວມຊ່ອງຫວ່າງຢູ່ປາຍຍອດ (ຄືກັນກັບ --id).

3. ນິຍາມຫ້ອງທົດລອງຊີວະວິທະຍາທາງທະເລນັບແຕ່ລະຊ່ອງຫວ່າງທີ່ຂະຫຍາຍອອກ
(ພາຍໃນ ຫຼື terminal) ເປັນຄວາມແຕກຕ່າງດຽວ: 1.0 -
[(ບໍ່ກົງກັນ + ຊ່ອງຫວ່າງ)/(ຄວາມຍາວຂອງລຳດັບທີ່ຍາວທີ່ສຸດ)]

4. ຄໍານິຍາມ BLAST, ເທົ່າກັບ --iddef 2 ໃນບໍລິບົດຂອງ
ການຈັດລຽງຄູ່ທົ່ວໂລກ.

--msaout ຊື່​ເອ​ກະ​ສານ
ສົ່ງຜົນການຈັດລຽງລຳດັບຫຼາຍອັນ ແລະລຳດັບຄວາມເຫັນດີເຫັນພ້ອມສຳລັບແຕ່ລະຄົນ
cluster ກັບ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta. ລຳດັບຄວາມເຫັນດີເຫັນພ້ອມ
ກໍ່ສ້າງໂດຍການເອົາສັນຍາລັກສ່ວນໃຫຍ່ (nucleotide ຫຼືຊ່ອງຫວ່າງ) ຈາກແຕ່ລະຄົນ
ຖັນຂອງການຈັດວາງ. ຖັນທີ່ມີຊ່ອງຫວ່າງສ່ວນໃຫຍ່ເປັນ
ຂ້າມ, ຍົກເວັ້ນຊ່ອງຫວ່າງຢູ່ປາຍຍອດ.

--qmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
ເຮັດເລື້ມຄືນແບບງ່າຍໆ ແລະໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໃນລຳດັບໂດຍໃຊ້ ຝຸ່ນ
ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none). ຄໍາ​ເຕືອນ​, ໃນ​ເວ​ລາ​ທີ່​ການ​ນໍາ​ໃຊ້​ ອ່ອນໆ
ການປິດບັງ, ການສ້າງກຸ່ມກາຍເປັນຕົວພິມນ້ອຍໃຫຍ່. ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ຫນ້າກາກໂດຍໃຊ້
ຝຸ່ນ.

--ຂະຫນາດ ຄໍານຶງເຖິງຄໍາບັນຍາຍອຸດົມສົມບູນທີ່ມີຢູ່ໃນ fasta ວັດສະດຸປ້ອນ
ໄຟລ໌ (ຊອກຫາຮູບແບບ "[>;]size=integer[;]" ໃນ​ຫົວ​ລໍາ​ດັບ).

--ຂະຫນາດ
ເພີ່ມ​ຄໍາ​ອະ​ທິ​ບາຍ​ຄວາມ​ອຸ​ດົມ​ສົມ​ບູນ​ກັບ​ໄຟລ​໌ fasta ຜົນ​ຜະ​ລິດ (ເພີ່ມ​ຮູບ​ແບບ​
";ຂະໜາດ=integer;" to sequence headers) ຖ້າ --sizein ຖືກລະບຸ, ຄວາມອຸດົມສົມບູນ
ຄໍາອະທິບາຍປະກອບໄດ້ຖືກລາຍງານໄປຫາໄຟລ໌ຜົນຜະລິດ, ແລະແຕ່ລະກຸ່ມ centroid
ໄດ້ ຮັບ ມູນ ຄ່າ ອຸ ດົມ ສົມ ບູນ ໃຫມ່ ທີ່ ສອດ ຄ້ອງ ກັນ ກັບ ອຸ ດົມ ສົມ ບູນ ທັງ ຫມົດ ຂອງ
amplicons ລວມຢູ່ໃນກຸ່ມ (--centroids ທາງເລືອກ). ຖ້າ --sizein ບໍ່ແມ່ນ
ລະບຸໄວ້, ຄວາມອຸດົມສົມບູນຂອງວັດສະດຸປ້ອນແມ່ນຕັ້ງເປັນ 1 ສໍາລັບ amplicons, ແລະຕົວເລກ
ຂອງ amplicons ຕໍ່ cluster ສໍາລັບ centroids.

--strand ບວກ|ທັງສອງ
ເມື່ອປຽບທຽບລໍາດັບກັບເມັດກຸ່ມ, ໃຫ້ກວດເບິ່ງ ບວກ strand ເທົ່ານັ້ນ
(ຄ່າເລີ່ມຕົ້ນ) ຫຼືກວດສອບ ທັງສອງ ສາຍ.

-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.

--uc ຊື່​ເອ​ກະ​ສານ
Output clustering ຜົນໄດ້ຮັບໃນ ຊື່​ເອ​ກະ​ສານ ການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື ucust. ສໍາ​ລັບ
ລາຍ​ລະ​ອຽດ​ຂອງ​ຮູບ​ແບບ​, ເບິ່ງ​
<http://www.drive5.com/usearch/manual/ucout.html>.

-- ຜູ້ໃຊ້
ເມື່ອໃຊ້ --cluster_smallmem, ອະນຸຍາດໃຫ້ມີການປ້ອນຂໍ້ມູນຕາມລໍາດັບ, ບໍ່ພຽງແຕ່ a
ການ​ຫຼຸດ​ຜ່ອນ​ຄວາມ​ຍາວ​ສັ່ງ​.

ຕົວເລືອກການຊອກຫາສ່ວນໃຫຍ່ຍັງໃຊ້ກັບການຈັດກຸ່ມ:
--alnout, --blast6out, --fastapairs, --matched, --notmatched, --maxaccept,
--maxreject, --samout, --userout, --userfields, ການກັ່ນຕອງຄະແນນ, ຊ່ອງຫວ່າງ
ການລົງໂທດ, ຫນ້າກາກ. (ເບິ່ງພາກຄົ້ນຫາ).

ທາງເລືອກໃນການຊໍ້າຊ້ອນ:

--derep_fullength ຊື່​ເອ​ກະ​ສານ
ຮວມລໍາດັບທີ່ຄືກັນຢ່າງເຂັ້ມງວດທີ່ມີຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ. ຄືກັນ
ລໍາດັບແມ່ນຖືກກໍານົດວ່າມີຄວາມຍາວດຽວກັນແລະສາຍດຽວກັນຂອງ
nucleotides (case insensitive, T ແລະ U ຖືກພິຈາລະນາຄືກັນ).

--maxuniquesize ໃນທາງບວກ integer
ຍົກເລີກລໍາດັບທີ່ມີມູນຄ່າອຸດົມສົມບູນຫຼາຍກ່ວາ integer.

-- ຫຍໍ້ ໃນທາງບວກ integer
ຍົກເລີກລໍາດັບທີ່ມີມູນຄ່າຄວາມອຸດົມສົມບູນນ້ອຍກວ່າ integer.

-- ຜົນຜະລິດ ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບ dereplicated ກັບ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta ແລະຈັດຮຽງ
ໂດຍ​ການ​ຫຼຸດ​ລົງ​ຄວາມ​ອຸ​ດົມ​ສົມ​ບູນ​. ລໍາດັບທີ່ຄືກັນໄດ້ຮັບສ່ວນຫົວຂອງ
ລໍາດັບທໍາອິດຂອງກຸ່ມຂອງພວກເຂົາ. ຖ້າ --sizeout ຖືກນໍາໃຊ້, ຈໍານວນຂອງ
ການປະກົດຕົວ (ເຊັ່ນຄວາມອຸດົມສົມບູນ) ຂອງແຕ່ລະລໍາດັບແມ່ນຊີ້ໃຫ້ເຫັນໃນຕອນທ້າຍຂອງ
ສ່ວນຫົວ fasta ຂອງພວກເຂົາໂດຍໃຊ້ຮູບແບບ ";size=integer;".

--ຂະຫນາດ ຄໍານຶງເຖິງຄໍາບັນຍາຍອຸດົມສົມບູນທີ່ມີຢູ່ໃນ fasta ວັດສະດຸປ້ອນ
ໄຟລ໌ (ຊອກຫາຮູບແບບ "[>;]size=integer[;]" ໃນ​ຫົວ​ລໍາ​ດັບ).

--ຂະຫນາດ
ຕື່ມການປະກອບຄໍາບັນຍາຍໃສ່ໄຟລ໌ fasta ຜົນຜະລິດ (ເພີ່ມຮູບແບບ
";ຂະໜາດ=integer;" to sequence headers) ຖ້າ --sizein ຖືກລະບຸ, ແຕ່ລະ
ລໍາດັບເປັນເອກະລັກໄດ້ຮັບມູນຄ່າຄວາມອຸດົມສົມບູນໃຫມ່ທີ່ສອດຄ້ອງກັນກັບຈໍານວນທັງຫມົດຂອງມັນ
ຄວາມອຸດົມສົມບູນ (ຜົນລວມຂອງຄວາມອຸດົມສົມບູນຂອງການປະກົດຕົວຂອງມັນ). ຖ້າ --sizein ບໍ່ແມ່ນ
ລະບຸໄວ້, ຄວາມອຸດົມສົມບູນຂອງວັດສະດຸປ້ອນແມ່ນຕັ້ງເປັນ 1, ແລະແຕ່ລະລໍາດັບທີ່ເປັນເອກະລັກ
ໄດ້ຮັບມູນຄ່າຄວາມອຸດົມສົມບູນໃຫມ່ທີ່ສອດຄ່ອງກັບຈໍານວນການປະກົດຕົວຂອງມັນ
ໃນ​ໄຟລ​໌​ປ້ອນ​ຂໍ້​ມູນ​.

--strand ບວກ|ທັງສອງ
ໃນ​ເວ​ລາ​ທີ່​ຊອກ​ຫາ​ລໍາ​ດັບ​ທີ່​ຄ້າຍ​ຄື​ກັນ​ຢ່າງ​ເຂັ້ມ​ງວດ​, ໃຫ້​ກວດ​ເບິ່ງ​ ບວກ ຫາດຊາຍ
ພຽງແຕ່ (ຄ່າເລີ່ມຕົ້ນ) ຫຼືກວດເບິ່ງ ທັງສອງ ສາຍ.

--topn ໃນທາງບວກ integer
ຜົນຜະລິດພຽງແຕ່ດ້ານເທິງ integer ລໍາດັບ (ເຊັ່ນ: ອຸດົມສົມບູນທີ່ສຸດ).

--uc ຊື່​ເອ​ກະ​ສານ
Output dereplication ສົ່ງຜົນໃຫ້ ຊື່​ເອ​ກະ​ສານ ການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື ucust. ສໍາ​ລັບ
ລາຍ​ລະ​ອຽດ​ຂອງ​ຮູບ​ແບບ​, ເບິ່ງ​
<http://www.drive5.com/usearch/manual/ucout.html>. ໃນສະພາບການຂອງ
dereplication, ທາງເລືອກ --uc_allhits ບໍ່ມີຜົນຕໍ່ຜົນຜະລິດ --uc.

ຕົວເລືອກການໃສ່ຜ້າອັດດັງ:

ລຳດັບການປ້ອນຂໍ້ມູນສາມາດປະກອບດ້ວຍນິວຄລີໂອທີດຕົວນ້ອຍ ຫຼືຕົວພິມໃຫຍ່. ຕົວພິມນ້ອຍ
nucleotides ຖືກຕັ້ງໄວ້ຢ່າງງຽບໆເປັນຕົວພິມໃຫຍ່ກ່ອນໜ້າກາກ, ເວັ້ນເສຍແຕ່ວ່າ --qmask ອ່ອນລົງ
ທາງເລືອກແມ່ນຖືກນໍາໃຊ້. ນີ້ແມ່ນຜົນໄດ້ຮັບຂອງທາງເລືອກຫນ້າກາກປະສົມປະສານ -qmask (ຫຼື
--dbmask ສໍາລັບລໍາດັບຖານຂໍ້ມູນ) ແລະ --hardmask, ສົມມຸດວ່າແຕ່ລະລໍາດັບການປ້ອນຂໍ້ມູນ
ມີທັງ nucleotides ໂຕພິມນ້ອຍ ແລະຕົວພິມໃຫຍ່:

qmask ການປະຕິບັດ hardmask
────────────────────────────────────────── ───────────────────
none off ບໍ່ມີຫນ້າກາກ, ສັນຍາລັກທັງຫມົດເປັນຕົວພິມໃຫຍ່
none on no masking, ສັນຍາລັກທັງຫມົດເປັນຕົວພິມໃຫຍ່
ຂີ້ຝຸ່ນປິດໜ້າກາກ ສັນຍາລັກຕົວພິມນ້ອຍ, ໂຕພິມໃຫຍ່
ຂີ້ຝຸ່ນໃສ່ສັນຍາລັກໃສ່ຫນ້າກາກໄດ້ປ່ຽນເປັນ Ns, ຄົນອື່ນພິມຕົວພິມໃຫຍ່
ສັນຍາລັກຕົວພິມນ້ອຍຖືກປິດບັງ, ບໍ່ມີການປ່ຽນແປງກໍລະນີ
ສັນຍາລັກຕົວພິມນ້ອຍໃສ່ໜ້າກາກ ແລະປ່ຽນເປັນ Ns

-- ໜ້າກາກ
ເຮັດໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໂດຍການປ່ຽນພວກມັນດ້ວຍ Ns ແທນການຕັ້ງຄ່າ
ໃຫ້ເຂົາເຈົ້າເປັນກໍລະນີຕ່ໍາ.

-- maskfasta ຊື່​ເອ​ກະ​ສານ
Mask ການເຮັດເລື້ມຄືນແບບງ່າຍດາຍແລະພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນຕ່ໍາໃນລໍາດັບທີ່ມີຢູ່ໃນ
ຊື່​ເອ​ກະ​ສານ. ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ຫນ້າກາກໂດຍໃຊ້ ຝຸ່ນ (ໃຊ້ --qmask ເພື່ອດັດແປງ
ພຶດຕິກໍາ).

-- ຜົນຜະລິດ ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບຫນ້າກາກໃສ່ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta.

--qmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
ເຮັດເລື້ມຄືນແບບງ່າຍໆ ແລະໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໃນລຳດັບໂດຍໃຊ້ ຝຸ່ນ
ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none). ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ໜ້າກາກ
ການນໍາໃຊ້ ຝຸ່ນ.

-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.

ຕົວເລືອກການຈັດຮຽງຄູ່:

ຜົນໄດ້ຮັບຂອງ n * (n - 1) / 2 ການຈັດຮຽງຄູ່ແມ່ນຂຽນໃສ່ຜົນໄດ້ຮັບ
ໄຟລ໌ທີ່ລະບຸດ້ວຍ --alnout, --blast6out, --fastapairs --matched, --notmatched,
--samout, --uc ຫຼື --userout (ເບິ່ງພາກຄົ້ນຫາຂ້າງລຸ່ມນີ້). ລະບຸວ່າ
--acceptall ທາງ​ເລືອກ​ທີ່​ຈະ​ສົ່ງ​ຜົນ​ຜະ​ລິດ​ການ​ວາງ​ຄູ່​ທັງ​ຫມົດ​, ຫຼື​ລະ​ບຸ​ລະ​ດັບ​ຕົວ​ຕົນ​
ດ້ວຍ --id ເພື່ອຍົກເລີກການຈັດຮຽງທີ່ອ່ອນແອ. ທາງເລືອກອື່ນໆທີ່ຍອມຮັບ / ປະຕິເສດ (ເບິ່ງ
ການຊອກຫາທາງເລືອກຂ້າງລຸ່ມນີ້) ອາດຈະຖືກນໍາໃຊ້ເຊັ່ນກັນ. ລໍາດັບແມ່ນສອດຄ່ອງຢູ່ໃນຂອງພວກເຂົາ ບວກ
strand ເທົ່ານັ້ນ.

--ຍອມຮັບທັງໝົດ
ຂຽນຜົນໄດ້ຮັບຂອງການຈັດລໍາດັບທັງຫມົດເພື່ອຜົນຜະລິດໄຟລ໌. ຕົວເລືອກນີ້ລົບລ້າງ
ທາງເລືອກທີ່ຍອມຮັບ / ປະຕິເສດອື່ນໆ (ລວມທັງ --id).

--allpairs_global ຊື່​ເອ​ກະ​ສານ
ປະຕິບັດການຈັດຮຽງຄູ່ທົ່ວໂລກທີ່ດີທີ່ສຸດຂອງທຸກລໍາດັບຂອງ fasta ທັງຫມົດ
ບັນຈຸຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ. ຄໍາສັ່ງນີ້ແມ່ນຫຼາຍກະທູ້.

--id ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັບຄູ່ຕາມລຳດັບຖ້າຕົວຕົນຂອງຄູ່ແມ່ນຕໍ່າກວ່າ ທີ່ແທ້ຈິງ
(ລວມມູນຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0).

-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.

ຕົວເລືອກການຊອກຫາ:

--alnout ຊື່​ເອ​ກະ​ສານ
ຂຽນການຈັດຮຽງທົ່ວໂລກເປັນຄູ່ກັບ ຊື່​ເອ​ກະ​ສານ ການ​ນໍາ​ໃຊ້​ທີ່​ມະ​ນຸດ​ອ່ານ​ໄດ້​
ຮູບແບບ. ໃຊ້ --rowlen ເພື່ອແກ້ໄຂຄວາມຍາວການຈັດຮຽງ. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນ
ເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

--blast6 ອອກ ຊື່​ເອ​ກະ​ສານ
ຂຽນຜົນການຄົ້ນຫາໃສ່ ຊື່​ເອ​ກະ​ສານ ການ​ນໍາ​ໃຊ້​ຮູບ​ແບບ​ທີ່​ແຍກ​ອອກ​ເປັນ​ແຖບ​ຄ້າຍ​ຄື blast​
ຂອງສິບສອງຊ່ອງຂໍ້ມູນ (ລາຍການຂ້າງລຸ່ມນີ້), ມີຫນຶ່ງແຖວຕໍ່ການຈັບຄູ່ເປົ້າຫມາຍຄໍາຖາມ
(ຫຼືຂາດການຈັບຄູ່ຖ້າ --output_no_hits ຖືກໃຊ້). ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນ
ເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້. ຜົນຜະລິດທີ່ຄ້າຍຄືກັນສາມາດໄດ້ຮັບດ້ວຍ --userout
ຊື່​ເອ​ກະ​ສານ ແລະ --userfields
query+target+id+alnlen+miss+opens+qlo+qhi+tlo+thi+value+bits. ສົມບູນ
ບັນຊີລາຍຊື່ແລະຄໍາອະທິບາຍແມ່ນມີຢູ່ໃນພາກ "Userfields" ຂອງເລື່ອງນີ້
ຄູ່ມື.

1. query: ປ້າຍສອບຖາມ.

2. ເປົ້າ​ຫມາຍ: target (ລໍາດັບຖານຂໍ້ມູນ) ປ້າຍຊື່. ພາກສະຫນາມແມ່ນຕັ້ງເປັນ
"*" ຖ້າບໍ່ມີການສອດຄ່ອງ.

3. id: ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ
100.0). ຕົວຕົນສ່ວນຮ້ອຍແມ່ນຖືກກໍານົດເປັນ 100 * (ກົງກັນ
columns) / (ຄວາມຍາວການຈັດລໍາດັບ - ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ). ເບິ່ງຊ່ອງຂໍ້ມູນ id0
ກັບ id4 ສໍາລັບຄໍານິຍາມອື່ນໆ.

4. ແອນເລນ: ຄວາມຍາວຂອງການຈັດຮຽງເປົ້າໝາຍແບບສອບຖາມ (ຈຳນວນ
ຖັນ). ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການຈັດຮຽງ.

5. ຄືກັນ: ຈຳນວນບໍ່ກົງກັນໃນການຈັດຮຽງ (ສູນ ຫຼື ບວກ
ຄ່າຈໍານວນເຕັມ).

6. ເປີດ: ຈຳນວນຖັນທີ່ບັນຈຸຊ່ອງຫວ່າງເປີດ (ສູນ ຫຼື
ຄ່າຈຳນວນເຕັມບວກ).

7. qlo: nucleotide ທໍາອິດຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າຫມາຍ.
ເທົ່າກັບ 1 ສະເໝີ ຖ້າມີການຈັດຮຽງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.

8. qhi: nucleotide ສຸດທ້າຍຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າໝາຍ.
ສະເໝີກັບຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ພາກສະຫນາມ
ຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການສອດຄ່ອງ.

9. ດິນ: nucleotide ທຳອິດຂອງເປົ້າໝາຍທີ່ສອດຄ່ອງກັບແບບສອບຖາມ.
ເທົ່າກັບ 1 ສະເໝີ ຖ້າມີການຈັດຮຽງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.

10​. : nucleotide ສຸດທ້າຍຂອງເປົ້າໝາຍທີ່ສອດຄ່ອງກັບການສອບຖາມ.
ສະເໝີກັບຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ພາກສະຫນາມ
ຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການສອດຄ່ອງ.

11​. ການປະເມີນຜົນ: expectancy-value (ບໍ່ຄຳນວນສຳລັບ nucleotide
ການຈັດວາງ). ຕັ້ງເປັນ -1 ສະເໝີ.

12​. bits: ຄະແນນບິດ (ບໍ່ໄດ້ຄິດໄລ່ສໍາລັບການຈັດລໍາດັບ nucleotide).
ຕັ້ງເປັນ 0 ສະເໝີ.

--db ຊື່​ເອ​ກະ​ສານ
ປຽບທຽບລໍາດັບການສອບຖາມ (ລະບຸດ້ວຍ --usearch_global) ກັບ fasta-
ລຳດັບເປົ້າໝາຍທີ່ມີຮູບແບບຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ, ການນໍາໃຊ້ຄູ່ທົ່ວໂລກ
ການຈັດວາງ.

--dbmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
ໃສ່ໜ້າກາກການຊໍ້າຄືນແບບງ່າຍດາຍ ແລະ ພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໃນຖານຂໍ້ມູນເປົ້າໝາຍ
ລໍາດັບການນໍາໃຊ້ ຝຸ່ນ ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none).
ຄໍາ​ເຕືອນ​, ໃນ​ເວ​ລາ​ທີ່​ການ​ນໍາ​ໃຊ້​ ອ່ອນໆ ການປິດບັງຄຳສັ່ງການຊອກຫາກາຍເປັນຕົວພິມນ້ອຍໃຫຍ່.
ຄ່າເລີ່ມຕົ້ນແມ່ນການໃສ່ຫນ້າກາກໂດຍໃຊ້ ຝຸ່ນ.

--dbmatched ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບເປົ້າຫມາຍຖານຂໍ້ມູນທີ່ກົງກັນຢ່າງຫນ້ອຍຫນຶ່ງລໍາດັບການສອບຖາມກັບ
ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta. ຖ້າຫາກວ່າທາງເລືອກ --sizeout ຖືກນໍາໃຊ້, ຈໍານວນຂອງ
ຄໍາຖາມທີ່ກົງກັບແຕ່ລະລໍາດັບເປົ້າຫມາຍແມ່ນຊີ້ໃຫ້ເຫັນໂດຍໃຊ້ຮູບແບບ
";ຂະໜາດ=integer;".

--dbnotmatched ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບເປົ້າຫມາຍຂອງຖານຂໍ້ມູນທີ່ບໍ່ກົງກັນກັບລໍາດັບການສອບຖາມກັບ ຊື່​ເອ​ກະ​ສານ,
ໃນຮູບແບບ fasta.

--fastapairs ຊື່​ເອ​ກະ​ສານ
ຂຽນການຈັດລຽງແບບຄູ່ຂອງການສອບຖາມແລະລໍາດັບເປົ້າຫມາຍໄປຫາ ຊື່​ເອ​ກະ​ສານ, ໃນ
ຮູບແບບ fasta.

--fulldp ທາງເລືອກ Dummy ສໍາລັບຄວາມເຂົ້າກັນໄດ້ກັບ usearch. ເພື່ອເພີ່ມປະສິດທິພາບການຊອກຫາ
ຄວາມອ່ອນໄຫວ, vsearch ໃຊ້ 8-way 16-bit SIMD vectorized full dynamic
ຂັ້ນຕອນການດໍາເນີນໂຄງການ (Needleman-Wunsch), ບໍ່ວ່າຈະເປັນຫຼືບໍ່ --fulldp ແມ່ນ
ລະບຸ.

--gapext string
ກໍານົດການລົງໂທດສໍາລັບການຂະຫຍາຍຊ່ອງຫວ່າງ. ເບິ່ງ --gapopen ສໍາລັບສະບັບສົມບູນ
ລາຍລະອຽດຂອງລະບົບການປະກາດການລົງໂທດ. ຄ່າເລີ່ມຕົ້ນແມ່ນເພື່ອ
ເລີ່ມຕົ້ນຊ່ອງຫວ່າງຫົກຂະຫຍາຍການລົງໂທດໂດຍໃຊ້ການລົງໂທດຂອງ 2 ສໍາລັບ
ການຂະຫຍາຍຊ່ອງຫວ່າງພາຍໃນແລະການລົງໂທດຂອງ 1 ສໍາລັບການຂະຫຍາຍຊ່ອງຫວ່າງຢູ່ປາຍຍອດ, ໃນ
ທັງການສອບຖາມ ແລະລໍາດັບເປົ້າໝາຍ (ເຊັ່ນ: 2I/1E).

--gapopen string
ກໍານົດການລົງໂທດສໍາລັບການເປີດຊ່ອງຫວ່າງ. ການເປີດຊ່ອງຫວ່າງສາມາດເກີດຂຶ້ນໃນຫົກທີ່ແຕກຕ່າງກັນ
ສະພາບການ: ໃນການສອບຖາມ (Q) ຫຼືໃນລໍາດັບເປົ້າຫມາຍ (T), ຢູ່ເບື້ອງຊ້າຍ (L)
ຫຼືຂວາ (R) ທີ່ສຸດຂອງລໍາດັບ, ຫຼືພາຍໃນລໍາດັບ (I).
ສັນຍາລັກລໍາດັບ (Q ແລະ T) ສາມາດຖືກລວມເຂົ້າກັບສັນຍາລັກສະຖານທີ່ (L, I,
ແລະ R), ແລະຄ່າຕົວເລກເພື່ອປະກາດການລົງໂທດສໍາລັບຄວາມເປັນໄປໄດ້ທັງຫມົດ
ສະພາບການ: aQL/bQI/cQR/dTL/eTI/fTR, ບ່ອນທີ່ abcdef ເປັນສູນ ຫຼືບວກ
ຈຳນວນເຕັມ, ແລະ "/" ຖືກໃຊ້ເປັນຕົວແຍກ.
ເພື່ອເຮັດໃຫ້ການປະກາດງ່າຍຂຶ້ນ, ສັນຍາລັກສະຖານທີ່ (L, I, ແລະ R) ສາມາດເປັນ
ປະສົມປະສານ, ສັນຍາລັກ (E) ສາມາດຖືກນໍາໃຊ້ເພື່ອປິ່ນປົວທັງສອງ extremities (L ແລະ R)
ເທົ່າທຽມກັນ, ແລະສັນຍາລັກ Q ແລະ T ສາມາດຖືກຍົກເລີກເພື່ອປະຕິບັດການສອບຖາມແລະເປົ້າຫມາຍ
ລໍາດັບເທົ່າທຽມກັນ. ຕົວຢ່າງ, ຄ່າເລີ່ມຕົ້ນແມ່ນການປະກາດການລົງໂທດ 20
ສໍາລັບການເປີດຊ່ອງຫວ່າງພາຍໃນແລະການລົງໂທດຂອງ 2 ສໍາລັບການເປີດຊ່ອງຫວ່າງຢູ່ປາຍຍອດ
(ຊ້າຍ ຫຼື ຂວາ), ທັງໃນແບບສອບຖາມ ແລະລໍາດັບເປົ້າໝາຍ (ເຊັ່ນ: 20I/2E). ຖ້າພຽງແຕ່
ຄ່າຕົວເລກແມ່ນໃຫ້, ໂດຍບໍ່ມີລໍາດັບຫຼືສັນຍາລັກສະຖານທີ່, ຫຼັງຈາກນັ້ນ
ການລົງໂທດແມ່ນໃຊ້ກັບການເປີດຊ່ອງຫວ່າງທັງໝົດ. ເພື່ອຫ້າມການເປີດຊ່ອງຫວ່າງ, ກ
ມູນຄ່າການລົງໂທດທີ່ບໍ່ມີຂອບເຂດສາມາດຖືກປະກາດດ້ວຍສັນຍາລັກ "*". ການນໍາໃຊ້ vsearch
ໃນ​ຖາ​ນະ​ເປັນ​ການ​ຈັດ​ວາງ​ເຄິ່ງ​ໂລກ​, ການ​ລົງ​ໂທດ null ສາ​ມາດ​ຖືກ​ນໍາ​ໃຊ້​ກັບ​ຊ້າຍ (L​) ຫຼື
right (R) ຊ່ອງຫວ່າງ.
vsearch ສະເຫມີເລີ່ມຕົ້ນການລົງໂທດການເປີດຊ່ອງຫວ່າງຫົກໂດຍໃຊ້ຄ່າເລີ່ມຕົ້ນ
ພາລາມິເຕີ (20I/2E). ຫຼັງຈາກນັ້ນ, ຜູ້ໃຊ້ແມ່ນບໍ່ເສຍຄ່າເພື່ອປະກາດພຽງແຕ່ຄ່າ
ລາວ/ນາງຕ້ອງການແກ້ໄຂ. ໄດ້ string ຖືກສະແກນຈາກຊ້າຍຫາຂວາ, ຍອມຮັບ
ສັນ​ຍາ​ລັກ​ແມ່ນ (0123456789/LIREQT*), ແລະ​ຄ່າ​ຫຼັງ​ຈາກ​ນັ້ນ​ໄດ້​ແທນ​ທີ່​ກ່ອນ​ຫນ້າ​ນີ້
ຄ່າ.
ກະລຸນາສັງເກດວ່າ vsearch, ກົງກັນຂ້າມກັບ usearch, ພຽງແຕ່ອະນຸຍາດໃຫ້ຊ່ອງຫວ່າງ integer
ການລົງໂທດ. ເນື່ອງຈາກວ່າການລົງໂທດຊ່ອງຫວ່າງຕ່ໍາສຸດແມ່ນ 0.5 ໂດຍຄ່າເລີ່ມຕົ້ນໃນ usearch,
ຄະແນນເລີ່ມຕົ້ນທັງໝົດແລະການລົງໂທດຊ່ອງຫວ່າງໃນ vsearch ໄດ້ຖືກເພີ່ມຂຶ້ນສອງເທົ່າ
ຮັກສາການລົງໂທດທຽບເທົ່າ ແລະສ້າງການສອດຄ່ອງກັນ.

-- ໜ້າກາກ
ເຮັດໜ້າກາກເຂດທີ່ມີຄວາມຊັບຊ້ອນໜ້ອຍໂດຍການປ່ຽນພວກມັນດ້ວຍ Ns ແທນການຕັ້ງຄ່າ
ໃຫ້ເຂົາເຈົ້າເປັນກໍລະນີຕ່ໍາ. ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ, ກະລຸນາເບິ່ງພາກ Masking.

--id ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັບຄູ່ຕາມລຳດັບຖ້າຕົວຕົນຂອງຄູ່ແມ່ນຕໍ່າກວ່າ ທີ່ແທ້ຈິງ
(ລວມມູນຄ່າຕັ້ງແຕ່ 0.0 ຫາ 1.0). ຂະບວນການຄົ້ນຫາຈັດລຽງເປົ້າຫມາຍ
ລໍາດັບໂດຍການຫຼຸດລົງຈໍານວນຂອງ k-mers ພວກ​ເຂົາ​ເຈົ້າ​ມີ​ຢູ່​ໃນ​ທົ່ວ​ໄປ​ກັບ​
ລໍາດັບການສອບຖາມ, ການນໍາໃຊ້ຂໍ້ມູນນັ້ນເປັນຕົວແທນສໍາລັບຄວາມຄ້າຍຄືກັນຂອງລໍາດັບ.
ການກັ່ນຕອງທາງສ່ວນຫນ້າທີ່ມີປະສິດຕິພາບນັ້ນຍັງຈະປ້ອງກັນການສອດຄ່ອງຄູ່ກັບ
ການຈັບຄູ່ເປົ້າຫມາຍທີ່ອ່ອນແອ, ເນື່ອງຈາກວ່າມັນຈໍາເປັນຕ້ອງມີຢ່າງຫນ້ອຍ 6 ແບ່ງປັນ k-mers ກັບ
ເລີ່ມການຈັດຮຽງຄູ່, ແລະຢ່າງໜ້ອຍໜຶ່ງໃນທຸກໆ 16 k-mers ຈາກ
ການສອບຖາມຕ້ອງການກົງກັບເປົ້າຫມາຍ. ດັ່ງນັ້ນ, ການນໍາໃຊ້ຄ່າຕ່ໍາກວ່າ
--id 0.5 ບໍ່ມີແນວໂນ້ມທີ່ຈະຈັບເປົ້າຫມາຍທີ່ກົງກັນທີ່ອ່ອນແອກວ່າ. ໄດ້
pairwise ຕົວຕົນແມ່ນໂດຍຄ່າເລີ່ມຕົ້ນກໍານົດເປັນຈໍານວນຂອງ (ການຈັບຄູ່
columns) / (ຄວາມຍາວການຈັດຕໍາແຫນ່ງ - ຊ່ອງຫວ່າງຢູ່ປາຍຍອດ). ຄໍານິຍາມນັ້ນສາມາດເປັນ
ດັດແກ້ໂດຍ --iddef.

--iddef 0|1|2|3|4
ປ່ຽນຄຳນິຍາມຕົວຕົນຄູ່ທີ່ໃຊ້ໃນ --id. ຄ່າທີ່ຍອມຮັບແມ່ນ:

0. CD-HIT ຄໍານິຍາມ: (ຄໍລໍາທີ່ກົງກັນ) / (ລໍາດັບສັ້ນທີ່ສຸດ
ຄວາມຍາວ).

1. ແກ້ໄຂໄລຍະຫ່າງ: (ຄໍລໍາທີ່ກົງກັນ) / (ຄວາມຍາວການຈັດຕໍາແຫນ່ງ).

2. ແກ້ໄຂໄລຍະຫ່າງບໍ່ລວມຊ່ອງຫວ່າງຢູ່ປາຍຍອດ (ຄືກັນກັບ --id).

3. ນິຍາມຫ້ອງທົດລອງຊີວະວິທະຍາທາງທະເລນັບແຕ່ລະຊ່ອງຫວ່າງທີ່ຂະຫຍາຍອອກ
(ພາຍໃນ ຫຼື terminal) ເປັນຄວາມແຕກຕ່າງດຽວ: 1.0 -
[(ບໍ່ກົງກັນ + ຊ່ອງຫວ່າງ)/(ຄວາມຍາວຂອງລຳດັບທີ່ຍາວທີ່ສຸດ)]

4. ຄໍານິຍາມ BLAST, ເທົ່າກັບ --iddef 2 ໃນບໍລິບົດຂອງ
ການຈັດລຽງຄູ່ທົ່ວໂລກ.

ທາງເລືອກ --userfields ຍອມຮັບຊ່ອງຂໍ້ມູນ id0 ກັບ id4, ນອກເຫນືອໄປຈາກ
id ພາກສະຫນາມ, ເພື່ອລາຍງານຄ່າຕົວຕົນຄູ່ທີ່ສອດຄ້ອງກັນກັບ
ຄໍານິຍາມທີ່ແຕກຕ່າງກັນ.

--idprefix ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າທໍາອິດ integer nucleotides ຂອງເປົ້າຫມາຍ
ບໍ່ກົງກັບຄໍາຖາມ.

--idsuffix ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າອັນສຸດທ້າຍ integer nucleotides ຂອງເປົ້າຫມາຍເຮັດ
ບໍ່ກົງກັບແບບສອບຖາມ.

-- ຊ້າຍ
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບ ຖ້າການຈັດຮຽງຄູ່ເລີ່ມຕົ້ນດ້ວຍຊ່ອງຫວ່າງ.

--ການແຂ່ງຂັນ integer
ຄະແນນທີ່ຖືກມອບໝາຍໃຫ້ກົງກັນ (ເຊັ່ນ: nucleotides ຄືກັນ) ໃນຄູ່
ການຈັດວາງ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 2.

--ກົງກັນ ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບການສອບຖາມທີ່ກົງກັບລໍາດັບເປົ້າຫມາຍຂອງຖານຂໍ້ມູນກັບ ຊື່​ເອ​ກະ​ສານ, ໃນ
ຮູບແບບ fasta.

-- ສູງສຸດທີ່ຍອມຮັບ ໃນທາງບວກ integer
ຈໍານວນ hits ສູງສຸດທີ່ຈະຍອມຮັບກ່ອນທີ່ຈະຢຸດການຄົ້ນຫາ. ຄ່າເລີ່ມຕົ້ນ
ຄ່າແມ່ນ 1. ທາງເລືອກນີ້ເຮັດວຽກຄູ່ກັບ --maxrejects. ການຄົ້ນຫາ
ຂະ​ບວນ​ການ​ຈັດ​ລຽງ​ລໍາ​ດັບ​ເປົ້າ​ຫມາຍ​ໂດຍ​ການ​ຫຼຸດ​ລົງ​ຈໍາ​ນວນ​ຂອງ​ k-mers ພວກ​ເຂົາ​ເຈົ້າ​ມີ​ຢູ່​ໃນ​
ທົ່ວໄປກັບລໍາດັບການສອບຖາມ, ການນໍາໃຊ້ຂໍ້ມູນນັ້ນເປັນຕົວແທນສໍາລັບ
ລໍາດັບຄວາມຄ້າຍຄືກັນ. ຫຼັງຈາກການຈັດຕໍາແຫນ່ງຄູ່, ຖ້າເປົ້າຫມາຍທໍາອິດ
ລໍາດັບຜ່ານເງື່ອນໄຂການຍອມຮັບ, ມັນຖືກຍອມຮັບວ່າເປັນຕີທີ່ດີທີ່ສຸດແລະ
ຂະບວນການຄົ້ນຫາຢຸດເຊົາສໍາລັບການສອບຖາມນັ້ນ. ຖ້າ --maxaccepts ຖືກຕັ້ງເປັນ a
ມູນຄ່າທີ່ສູງຂຶ້ນ, hits ຫຼາຍໄດ້ຮັບການຍອມຮັບ. ຖ້າ --maxaccepts ແລະ --maxrejects ແມ່ນ
ທັງສອງຕັ້ງເປັນ 0, ຖານຂໍ້ມູນຄົບຖ້ວນແມ່ນຊອກຫາ.

--maxdiffs ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າການຈັດຮຽງມີຢ່າງໜ້ອຍ integer
ການປ່ຽນແທນ, ການແຊກ ຫຼື ການລຶບ.

--maxgaps ໃນທາງບວກ integer
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າການຈັດຮຽງມີຢ່າງໜ້ອຍ integer
ແຊກ ຫຼື ລຶບ.

--maxhits ໃນທາງບວກ integer
ຈໍານວນ hits ສູງສຸດທີ່ຈະສະແດງເມື່ອການຄົ້ນຫາຖືກຢຸດເຊົາ ( hits ແມ່ນ
ຈັດຮຽງຕາມຕົວຕົນທີ່ຫຼຸດລົງ). ບໍ່ຈໍາກັດໂດຍຄ່າເລີ່ມຕົ້ນ. ທາງເລືອກນັ້ນນຳໃຊ້
ເຖິງ --alnout, --blast6out, --fastapairs, --samout, --uc, ຫຼື --userout
ໄຟລ໌ຜົນຜະລິດ.

--maxid ທີ່ແທ້ຈິງ
ປະຕິເສດລໍາດັບທີ່ກົງກັນຖ້າອັດຕາສ່ວນຂອງຕົວຕົນລະຫວ່າງສອງ
ລໍາດັບແມ່ນໃຫຍ່ກວ່າ ທີ່ແທ້ຈິງ.

--maxqsize ໃນທາງບວກ integer
ປະຕິເສດລໍາດັບການສອບຖາມທີ່ມີຄວາມອຸດົມສົມບູນຫຼາຍກ່ວາ integer.

--maxqt ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບການສອບຖາມ/ເປົ້າໝາຍແມ່ນໃຫຍ່ກວ່າ ທີ່ແທ້ຈິງ.

--ການປະຕິເສດສູງສຸດ ໃນທາງບວກ integer
ຈຳນວນສູງສຸດຂອງລຳດັບເປົ້າໝາຍທີ່ບໍ່ກົງກັນທີ່ຈະພິຈາລະນາກ່ອນ
ການຢຸດການຄົ້ນຫາ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 32. ຕົວເລືອກນີ້ເຮັດວຽກເປັນຄູ່
ກັບ --maxaccepts. ຂະບວນການຄົ້ນຫາຈັດລໍາດັບລໍາດັບເປົ້າຫມາຍໂດຍການຫຼຸດລົງ
ຈໍານວນຂອງ k-mers ເຂົາເຈົ້າມີຢູ່ຮ່ວມກັນກັບລໍາດັບການສອບຖາມ, ການນໍາໃຊ້ທີ່
ຂໍ້ມູນເປັນຕົວແທນສໍາລັບຄວາມຄ້າຍຄືກັນຂອງລໍາດັບ. ຫຼັງຈາກການຈັດຮຽງຄູ່,
ຖ້າບໍ່ມີ 32 ລຳດັບທຳອິດທີ່ກວດສອບໄດ້ຜ່ານການຍອມຮັບ
ເງື່ອນໄຂ, ຂະບວນການຄົ້ນຫາຢຸດເຊົາສໍາລັບການສອບຖາມນັ້ນ (ບໍ່ມີການຕີ). ຖ້າ
--maxrejects ຖືກຕັ້ງເປັນມູນຄ່າທີ່ສູງກວ່າ, ລໍາດັບເປົ້າຫມາຍຫຼາຍຂຶ້ນ
ພິຈາລະນາ. ຖ້າ --maxaccepts ແລະ --maxrejects ທັງສອງຖືກຕັ້ງເປັນ 0, the
ຖານຂໍ້ມູນທີ່ສົມບູນໄດ້ຖືກຄົ້ນຫາ.

-- ຂະຫນາດສູງສຸດ ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມອຸດົມສົມບູນແບບສອບຖາມ/ເປົ້າໝາຍແມ່ນຫຼາຍກວ່າ ທີ່ແທ້ຈິງ.

--maxsl ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບທີ່ສັ້ນກວ່າ/ຍາວກວ່ານັ້ນຫຼາຍກວ່າ ທີ່ແທ້ຈິງ.

--maxsubs ໃນທາງບວກ integer
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບຖ້າການຈັດຮຽງຄູ່ມີຫຼາຍກວ່າ
integer ການທົດແທນ.

--ກາງ ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັບຄູ່ລໍາດັບຖ້າອັດຕາສ່ວນຂອງຕົວຕົນຕໍ່າກວ່າ ທີ່ແທ້ຈິງ
(ບໍ່ສົນໃຈຊ່ອງຫວ່າງທັງໝົດ, ພາຍໃນ ແລະ terminal).

--mincols ໃນທາງບວກ integer
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບຖ້າຄວາມຍາວການຈັດຮຽງສັ້ນກວ່າ integer.

--minqt ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບການສອບຖາມ/ເປົ້າໝາຍຕໍ່າກວ່າ ທີ່ແທ້ຈິງ.

-- ຫຍໍ້ ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມອຸດົມສົມບູນແບບສອບຖາມ/ເປົ້າໝາຍຕໍ່າກວ່າ ທີ່ແທ້ຈິງ.

--ນາທີ ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າອັດຕາສ່ວນຄວາມຍາວຂອງລຳດັບທີ່ສັ້ນກວ່າ/ຍາວກວ່າຕໍ່າກວ່າ ທີ່ແທ້ຈິງ.

--mintsize ໃນທາງບວກ integer
ປະຕິເສດລໍາດັບເປົ້າຫມາຍທີ່ມີຄວາມອຸດົມສົມບູນຕ່ໍາກວ່າ integer.

--ບໍ່ກົງກັນ integer
ຄະແນນທີ່ຖືກມອບໝາຍໃຫ້ບໍ່ກົງກັນ (ເຊັ່ນ: nucleotides ທີ່ແຕກຕ່າງກັນ) ໃນຄູ່
ການຈັດວາງ. ຄ່າເລີ່ມຕົ້ນແມ່ນ -4.

--ບໍ່ກົງກັນ ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບການສອບຖາມທີ່ບໍ່ກົງກັບລໍາດັບເປົ້າຫມາຍຂອງຖານຂໍ້ມູນກັບ ຊື່​ເອ​ກະ​ສານ,
ໃນຮູບແບບ fasta.

--output_no_hits
ຂຽນຄໍາຖາມທີ່ກົງກັນແລະບໍ່ກົງກັນກັບ --alnout, --blast6out,
--samout ຫຼື --userout ໄຟລ໌ຜົນຜະລິດ (--uc ແລະ --uc_allhits ໄຟລ໌ຜົນຜະລິດ
ມີລັກສະນະແບບສອບຖາມທີ່ບໍ່ກົງກັນສະເໝີ). ຄຳຖາມທີ່ບໍ່ກົງກັນແມ່ນຕິດປ້າຍກຳກັບ
"ບໍ່ມີ hits" ໃນໄຟລ໌ --alnout.

--qmask ບໍ່ມີ|ຂີ້ຝຸ່ນ|ອ່ອນ
Mask ການຊໍ້າຄືນແບບງ່າຍດາຍ ແລະພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນຕໍ່າໃນລໍາດັບການສອບຖາມໂດຍໃຊ້
ໄດ້ ຝຸ່ນ ຫຼື ອ່ອນໆ ສູດການຄິດໄລ່, ຫຼືຫ້າມປິດບັງ (none). ຄໍາເຕືອນ, ເມື່ອ
ການນໍາໃຊ້ ອ່ອນໆ ການປິດບັງຄຳສັ່ງການຊອກຫາກາຍເປັນຕົວພິມນ້ອຍໃຫຍ່. ຄ່າເລີ່ມຕົ້ນແມ່ນ
ການ​ນໍາ​ໃຊ້​ຫນ້າ​ກາກ​ ຝຸ່ນ.

--query_cov ທີ່ແທ້ຈິງ
ປະຕິເສດຖ້າຫາກວ່າສ່ວນຫນຶ່ງຂອງການສອບຖາມທີ່ສອດຄ່ອງກັບລໍາດັບເປົ້າຫມາຍແມ່ນ
ຕ່ໍາກວ່າ ທີ່ແທ້ຈິງ. ການ​ຄຸ້ມ​ຄອງ​ການ​ສອບ​ຖາມ​ແມ່ນ​ຄໍາ​ນວນ​ເປັນ (ການ​ແຂ່ງ​ຂັນ + ບໍ່​ກົງ​ກັນ​)
/ ຄວາມຍາວລໍາດັບຄໍາຖາມ. ຊ່ອງຫວ່າງພາຍໃນ ຫຼື terminal ບໍ່ໄດ້ຖືກປະຕິບັດ
ບັນຊີ.

-- ຖືກຕ້ອງ
ປະຕິເສດການຈັບຄູ່ຕາມລໍາດັບຖ້າການຈັດຮຽງຄູ່ຈົບລົງດ້ວຍຊ່ອງຫວ່າງ.

--rowlen ໃນທາງບວກ integer
ຄວາມກວ້າງຂອງເສັ້ນການຈັດຮຽງໃນ --alnout output. ຄ່າເລີ່ມຕົ້ນແມ່ນ 64. ກໍານົດ
ເຖິງ 0 ເພື່ອກໍາຈັດການຫໍ່.

--samout ຊື່​ເອ​ກະ​ສານ
ຂຽນຜົນໄດ້ຮັບການຈັດຕໍາແຫນ່ງ ຊື່​ເອ​ກະ​ສານ ໃນຮູບແບບ SAM. ສໍາລັບຄໍາອະທິບາຍ
ຂອງ​ຮູບ​ແບບ​, ເບິ່ງ​ . ຄໍາສັ່ງອອກ
ອາດຈະແຕກຕ່າງກັນເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

--ຕົນເອງ ປະຕິເສດການຈັບຄູ່ຕາມລຳດັບຫາກຄຳຊອກຫາ ແລະປ້າຍກຳກັບເປົ້າໝາຍແມ່ນຄືກັນ.

--selfid ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າການສອບຖາມແລະລໍາດັບເປົ້າຫມາຍຢ່າງເຂັ້ມງວດ
ຄືກັນ.

--ຂະຫນາດ
ຕື່ມການອະທິບາຍຄວາມອຸດົມສົມບູນໃຫ້ກັບຜົນໄດ້ຮັບຂອງທາງເລືອກ --dbmatched (ການນໍາໃຊ້
ຮູບແບບ ";ຂະຫນາດ =integer;"), ເພື່ອລາຍງານຈໍານວນຂອງການສອບຖາມທີ່
ກົງກັບແຕ່ລະເປົ້າໝາຍ.

--strand ບວກ|ທັງສອງ
ເມື່ອຊອກຫາລໍາດັບທີ່ຄ້າຍຄືກັນ, ໃຫ້ກວດເບິ່ງ ບວກ strand ເທົ່ານັ້ນ (ຄ່າເລີ່ມຕົ້ນ)
ຫລືກວດເບິ່ງ ທັງສອງ ສາຍ.

--target_cov ທີ່ແທ້ຈິງ
ປະຕິເສດການຈັດລໍາດັບທີ່ກົງກັນຖ້າສ່ວນຫນຶ່ງຂອງລໍາດັບເປົ້າຫມາຍສອດຄ່ອງ
ກັບລໍາດັບການສອບຖາມແມ່ນຕ່ໍາກວ່າ ທີ່ແທ້ຈິງ. ການ​ຄຸ້ມ​ຄອງ​ເປົ້າ​ຫມາຍ​ແມ່ນ​ຄໍາ​ນວນ​
as (ກົງກັນ + ບໍ່ກົງກັນ) / ຄວາມຍາວລໍາດັບເປົ້າຫມາຍ. ພາຍໃນ ຫຼື terminal
ຊ່ອງຫວ່າງບໍ່ໄດ້ຖືກພິຈາລະນາ.

-- ກະທູ້ ໃນທາງບວກ integer
ຈຳນວນກະທູ້ຄຳນວນທີ່ຈະໃຊ້ (1 ຫາ 256). ຈໍານວນຂອງກະທູ້
ຄວນໜ້ອຍກວ່າ ຫຼືເທົ່າກັບຈຳນວນຂອງ CPU cores ທີ່ມີຢູ່. ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນການນໍາໃຊ້ຊັບພະຍາກອນທີ່ມີຢູ່ທັງຫມົດແລະເປີດຫນຶ່ງຫົວຂໍ້ຕໍ່
ຫຼັກເຫດຜົນ.

--top_hits_only
ສົ່ງອອກພຽງແຕ່ hits ທີ່ມີອັດຕາສ່ວນສູງສຸດຂອງຕົວຕົນທີ່ມີ
ສອບຖາມ.

--uc ຊື່​ເອ​ກະ​ສານ
ຜົນໄດ້ຮັບການຊອກຫາຜົນໄດ້ຮັບໃນ ຊື່​ເອ​ກະ​ສານ ການນໍາໃຊ້ຮູບແບບທີ່ຄ້າຍຄື ucust. ສໍາ​ລັບ
ລາຍ​ລະ​ອຽດ​ຂອງ​ຮູບ​ແບບ​, ເບິ່ງ​
<http://www.drive5.com/usearch/manual/ucout.html>. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນ
ເມື່ອໃຊ້ຫຼາຍຫົວຂໍ້.

--uc_allhits
ເມື່ອໃຊ້ທາງເລືອກ --uc, ສະແດງ hits ທັງຫມົດ, ບໍ່ພຽງແຕ່ hit top ສໍາລັບແຕ່ລະຄົນ
ສອບຖາມ.

--usearch_global ຊື່​ເອ​ກະ​ສານ
ປຽບທຽບລຳດັບເປົ້າໝາຍ (--db) ກັບລຳດັບການສອບຖາມທີ່ມີຮູບແບບໄວ.
ບັນຈຸຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ, ການນໍາໃຊ້ການຈັດຕໍາແຫນ່ງຄູ່ທົ່ວໂລກ.

--ເຂດຜູ້ໃຊ້ string
ເມື່ອໃຊ້ --userout, ເລືອກ ແລະສັ່ງຊ່ອງຂໍ້ມູນທີ່ຂຽນໃສ່ຜົນໄດ້ຮັບ
ໄຟລ໌. ຊ່ອງຂໍ້ມູນຖືກແຍກອອກດ້ວຍ "+" (ເຊັ່ນ: query+target+id). ເບິ່ງ
ພາກສ່ວນ "Userfields" ສໍາລັບບັນຊີລາຍຊື່ເຕັມຂອງຊ່ອງຂໍ້ມູນ.

--ຜູ້​ໃຊ້ ຊື່​ເອ​ກະ​ສານ
ຂຽນຜົນໄດ້ຮັບທີ່ແຍກແທັບທີ່ກໍານົດໂດຍຜູ້ໃຊ້ໄປຫາ ຊື່​ເອ​ກະ​ສານ. ເລືອກທົ່ງນາ
ກັບທາງເລືອກ --userfields. ຄໍາສັ່ງຜົນຜະລິດອາດຈະແຕກຕ່າງກັນໃນເວລາທີ່ການນໍາໃຊ້ຫຼາຍ
ກະທູ້. ຖ້າ --userfields ຫວ່າງເປົ່າ ຫຼືບໍ່ມີຢູ່, ຊື່​ເອ​ກະ​ສານ ແມ່ນຫວ່າງເປົ່າ.

--weak_id ທີ່ແທ້ຈິງ
ສະແດງຍອດນິຍົມທີ່ມີສ່ວນຮ້ອຍຂອງຕົວຕົນຢ່າງໜ້ອຍ ທີ່ແທ້ຈິງ, ໂດຍບໍ່ມີການ
ຢຸດການຄົ້ນຫາ. ການຄົ້ນຫາແບບປົກກະຕິຈະຢຸດທັນທີທີ່ຍອດນິຍົມພຽງພໍ
ພົບ (ຕາມທີ່ກຳນົດໂດຍ --maxaccepts, --maxrejects, ແລະ --id). ເປັນ --weak_id
ລາຍງານການຕີທີ່ອ່ອນແອທີ່ບໍ່ໄດ້ຫັກອອກຈາກ --maxaccepts, ສູງ --id ຄ່າ
ສາມາດນໍາໃຊ້ໄດ້, ດັ່ງນັ້ນການຮັກສາທັງຄວາມໄວແລະຄວາມອ່ອນໄຫວ. ຕາມເຫດຜົນ, ທີ່ແທ້ຈິງ
ຕ້ອງນ້ອຍກວ່າຄ່າທີ່ລະບຸໂດຍ --id.

-- ຄວາມຍາວຂອງຄໍາສັບ ໃນທາງບວກ integer
ຄວາມຍາວຂອງຄໍາສັບ (ie k-mers) ສໍາລັບການດັດສະນີຖານຂໍ້ມູນ. ຂອບເຂດຂອງຄວາມເປັນໄປໄດ້
ຄ່າໄປຈາກ 3 ຫາ 15, ແຕ່ຄ່າທີ່ຢູ່ໃກ້ 8 ແມ່ນແນະນຳໂດຍທົ່ວໄປ.
ຄໍາສັບທີ່ຍາວກວ່າອາດຈະຫຼຸດຜ່ອນຄວາມອ່ອນໄຫວສໍາລັບຄວາມຄ້າຍຄືກັນທີ່ອ່ອນແອ, ແຕ່ສາມາດເຮັດໄດ້
ເພີ່ມ​ຄວາມ​ຖືກ​ຕ້ອງ​. ໃນທາງກົງກັນຂ້າມ, ຄໍາສັບທີ່ສັ້ນກວ່າອາດຈະເພີ່ມຂຶ້ນ
ຄວາມອ່ອນໄຫວ, ແຕ່ສາມາດຫຼຸດຜ່ອນຄວາມຖືກຕ້ອງ. ເວລາຄິດໄລ່ໂດຍທົ່ວໄປຈະ
ເພີ່ມຂຶ້ນດ້ວຍຄໍາທີ່ສັ້ນກວ່າແລະຫຼຸດລົງດ້ວຍຄໍາທີ່ຍາວກວ່າ. ຄວາມຊົງຈໍາ
ຄວາມຕ້ອງການສໍາລັບສ່ວນຫນຶ່ງຂອງດັດຊະນີເພີ່ມຂຶ້ນດ້ວຍປັດໃຈ 4 ໃນແຕ່ລະຄັ້ງ
ຄວາມຍາວຂອງຄໍາສັບເພີ່ມຂຶ້ນຫນຶ່ງ nucleotide, ແລະໂດຍທົ່ວໄປແລ້ວນີ້ຈະກາຍເປັນ
ທີ່ສໍາຄັນສໍາລັບຄໍາຍາວ (12 ຫຼືຫຼາຍກວ່ານັ້ນ). ຄ່າເລີ່ມຕົ້ນແມ່ນ 8.

ຕົວເລືອກການສະຫຼັບ:

-- ຜົນຜະລິດ ຊື່​ເອ​ກະ​ສານ
ຂຽນລໍາດັບ shuffled ກັບ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta.

-- ແກ່ນ ໃນທາງບວກ integer
ໃນ​ເວ​ລາ​ທີ່ shuffling ຄໍາ​ສັ່ງ​ລໍາ​ດັບ​, ການ​ນໍາ​ໃຊ້​ integer ເປັນເມັດ. ແກ່ນ​ທີ່​ໄດ້​ຮັບ​ຈະ​
ສະເຫມີຜະລິດຄໍາສັ່ງຜົນຜະລິດດຽວກັນ (ທີ່ເປັນປະໂຫຍດສໍາລັບການຈໍາລອງ). ຕັ້ງເປັນ 0
ເພື່ອໃຊ້ເມັດພັນແບບສຸ່ມ (ພຶດຕິກຳເລີ່ມຕົ້ນ).

--ສະຫຼັບ ຊື່​ເອ​ກະ​ສານ
Pseudo-random shuffle ລໍາດັບຂອງລໍາດັບທີ່ມີຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ.

--topn ໃນທາງບວກ integer
ຜົນຜະລິດພຽງແຕ່ດ້ານເທິງ integer ລໍາດັບ.

ຕົວເລືອກການຈັດຮຽງ:
ລາຍການ Fasta ຖືກຈັດຮຽງໂດຍການຫຼຸດຄວາມອຸດົມສົມບູນ (--sortbysize) ຫຼືຄວາມຍາວຕາມລໍາດັບ.
(--sortbylength). ເພື່ອໃຫ້ໄດ້ຮັບຄໍາສັ່ງການຈັດລຽງທີ່ຫມັ້ນຄົງ, ສາຍພົວພັນໄດ້ຖືກຈັດຮຽງໂດຍການຫຼຸດລົງ
ຄວາມອຸດົມສົມບູນ ແລະປ້າຍກຳກັບທີ່ເພີ່ມຂຶ້ນຕາມລຳດັບ alpha-numerical (--sortbylength), ຫຼືພຽງແຕ່ໂດຍ
ປ້າຍກຳກັບເພີ່ມລຳດັບ alpha-numerical (--sortbysize). ການຈັດຮຽງປ້າຍຊື່ສົມມຸດວ່າ
ລໍາດັບທັງຫມົດມີປ້າຍທີ່ເປັນເອກະລັກ. ດຽວກັນໃຊ້ກັບການຈັດລຽງອັດຕະໂນມັດ
ປະຕິບັດໃນລະຫວ່າງການກວດສອບ chimera (--uchime_denovo), dereplication
(--derep_fulllength), ແລະກຸ່ມ (--cluster_fast ແລະ --cluster_size).

--ຂະໜາດສູງສຸດ ໃນທາງບວກ integer
ເມື່ອໃຊ້ --sortbysize, ຍົກເລີກການຈັດລໍາດັບທີ່ມີມູນຄ່າຄວາມອຸດົມສົມບູນຫຼາຍກວ່າ
ກ່ວາ integer.

--ຂະໜາດນ້ອຍ ໃນທາງບວກ integer
ເມື່ອໃຊ້ --sortbysize, ຍົກເລີກລໍາດັບທີ່ມີມູນຄ່າຄວາມອຸດົມສົມບູນນ້ອຍລົງ
ກ່ວາ integer.

-- ຜົນຜະລິດ ຊື່​ເອ​ກະ​ສານ
ຂຽນ​ລໍາ​ດັບ​ການ​ຄັດ​ເລືອກ​ ຊື່​ເອ​ກະ​ສານ, ໃນຮູບແບບ fasta.

-- ປ້າຍຊື່ string
ລຳດັບ Relabel ໂດຍໃຊ້ຄຳນຳໜ້າ string ແລະ ticker (1, 2, 3, ແລະອື່ນໆ) ໄປ
ສ້າງ​ຫົວ​ຂໍ້​ໃຫມ່​. ໃຊ້ --sizeout ເພື່ອອະນຸລັກຄວາມອຸດົມສົມບູນ
ຄຳ ອະທິບາຍ.

--ຂະຫນາດ
ໃນ​ເວ​ລາ​ທີ່​ການ​ນໍາ​ໃຊ້ --relabel​, ລາຍ​ງານ​ບັນ​ຍາຍ​ອຸ​ດົມ​ສົມ​ບູນ​ກັບ​ຜົນ​ຜະ​ລິດ fasta​
ໄຟລ໌ (ໃຊ້ຮູບແບບ "; ຂະຫນາດ =integer;").

--sortbylength ຊື່​ເອ​ກະ​ສານ
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມຍາວຂອງລໍາດັບທີ່ມີຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ. ເບິ່ງ
ທາງເລືອກທົ່ວໄປ --minseqlength ແລະ --maxseqlength ເພື່ອລົບລ້າງສັ້ນແລະ
ລໍາດັບຍາວ.

--sortbysize ຊື່​ເອ​ກະ​ສານ
ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນຂອງລໍາດັບທີ່ມີຢູ່ໃນ ຊື່​ເອ​ກະ​ສານ (ໄດ້
ຮູບແບບ "[>;] ຂະຫນາດ =integer[;]" ຕ້ອງມີ) ເບິ່ງຕົວເລືອກ
--minsize ແລະ --maxsize ເພື່ອກໍາຈັດລໍາດັບທີ່ຫາຍາກແລະເດັ່ນ.

--topn ໃນທາງບວກ integer
ຜົນຜະລິດພຽງແຕ່ດ້ານເທິງ integer ລໍາດັບ (ເຊັ່ນ: ຍາວທີ່ສຸດຫຼືຫຼາຍທີ່ສຸດ
ອຸ​ດົມ​ສົມ​ບູນ).

Userfields (ຊ່ອງຂໍ້ມູນທີ່ຍອມຮັບໂດຍທາງເລືອກ --userfields):

ອັນ ພິມສະຕຣິງຂອງ M (match), D (ລຶບ, ເຊັ່ນ: ຊ່ອງຫວ່າງໃນການສອບຖາມ) ແລະ I.
(ໃສ່, ເຊັ່ນ: ຊ່ອງຫວ່າງໃນເປົ້າຫມາຍ) ເປັນຕົວແທນຂອງການຈັດຕໍາແຫນ່ງຄູ່.
ຊ່ອງຫວ່າງເປົ່າຖ້າບໍ່ມີການຈັດຮຽງ.

ແອນເລນ ພິມຄວາມຍາວຂອງການຈັດລໍາດັບເປົ້າໝາຍແບບສອບຖາມ (ຈໍານວນຖັນ). ໄດ້
ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການຈັດຮຽງ.

bits ຄະແນນບິດ (ບໍ່ໄດ້ຄິດໄລ່ສໍາລັບການສອດຄ່ອງ nucleotide). ຕັ້ງເປັນ 0 ສະເໝີ.

ລົມ ການເປັນຕົວແທນແບບຫຍໍ້ຂອງການຈັດຮຽງຄູ່ໂດຍໃຊ້ຮູບແບບ CIGAR
(Compact Idiosyncratic Gapped Alignment Report): M (match), D (ການລຶບ)
ແລະຂ້ອຍ (ໃສ່). ຊ່ອງຫວ່າງເປົ່າຖ້າບໍ່ມີການຈັດຮຽງ.

ການປະເມີນຜົນ E-value (ບໍ່ໄດ້ຄິດໄລ່ສໍາລັບການສອດຄ່ອງ nucleotide). ຕັ້ງເປັນ -1 ສະເໝີ.

exts ຈຳນວນຖັນທີ່ມີສ່ວນຂະຫຍາຍຊ່ອງຫວ່າງ (ສູນ ຫຼືຈຳນວນເຕັມບວກ
ມູນຄ່າ).

ຊ່ອງຫວ່າງ ຈຳນວນຖັນທີ່ມີຊ່ອງຫວ່າງ (ຄ່າສູນ ຫຼືຈຳນວນເຕັມບວກ).

id ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0). ໄດ້
ຕົວຕົນສ່ວນຮ້ອຍແມ່ນຖືກກໍານົດເປັນ 100 * (ຄໍລໍາທີ່ກົງກັນ) / (ການຈັດຕໍາແຫນ່ງ
length - terminal ຊ່ອງຫວ່າງ).

id0 CD-HIT ຄໍານິຍາມຂອງອັດຕາສ່ວນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່
0.0 ຫາ 100.0) ໂດຍໃຊ້ຄວາມຍາວຂອງລໍາດັບສັ້ນທີ່ສຸດໃນຄູ່
alignment as denominator: 100 * (ກົງກັນຖັນ) / (ລໍາດັບສັ້ນທີ່ສຸດ
ຄວາມຍາວ).

id1 ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0) ແມ່ນ
ກໍານົດເປັນໄລຍະການແກ້ໄຂ: 100 * (ຄໍລໍາທີ່ກົງກັນ) / (ການຈັດຕໍາແຫນ່ງ
ຄວາມຍາວ).

id2 ເປີເຊັນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0) ແມ່ນ
ກໍານົດເປັນໄລຍະການແກ້ໄຂ, ບໍ່ລວມຊ່ອງຫວ່າງ terminal. id2 ພາກສະຫນາມແມ່ນເປັນ
ນາມແຝງສໍາລັບ ID ພາກສະຫນາມ.

id3 Marine Biological Lab ນິຍາມອັດຕາສ່ວນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງ
ຕັ້ງແຕ່ 0.0 ຫາ 100.0), ການນັບແຕ່ລະຊ່ອງຫວ່າງທີ່ຂະຫຍາຍອອກ (ພາຍໃນ ຫຼື
terminal) ເປັນຄວາມແຕກຕ່າງດຽວແລະນໍາໃຊ້ຄວາມຍາວຂອງຄວາມຍາວທີ່ສຸດ
sequence in the pairwise alignment as ໂຕຫານ: 100 * (1.0 - .
[(ບໍ່ກົງກັນ + ຊ່ອງຫວ່າງ) / (ຄວາມຍາວຂອງລໍາດັບທີ່ຍາວທີ່ສຸດ)]).

id4 ຄໍານິຍາມ BLAST ຂອງອັດຕາສ່ວນຂອງຕົວຕົນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່
0.0 ຫາ 100.0), ທຽບເທົ່າກັບ --iddef 2 ໃນບໍລິບົດຂອງຄູ່ຄູ່ທົ່ວໂລກ
ການຈັດວາງ.

ids ຈໍາ​ນວນ​ຂອງ​ການ​ກົງ​ກັນ​ໃນ​ການ​ຈັດ​ຕໍາ​ແຫນ່ງ (ສູນ​ຫຼື​ຄ່າ​ຈໍາ​ນວນ​ເຕັມ​ບວກ​)​.

ຄືກັນ ຈໍາ​ນວນ​ຂອງ​ບໍ່​ກົງ​ກັນ​ໃນ​ການ​ຈັດ​ຕໍາ​ແຫນ່ງ (ສູນ​ຫຼື​ຄ່າ​ຈໍາ​ນວນ​ເຕັມ​ບວກ​)​.

ເປີດ ຈຳນວນຖັນທີ່ບັນຈຸຊ່ອງຫວ່າງເປີດ (ສູນ ຫຼືຈຳນວນເຕັມບວກ
ມູນຄ່າ).

ຄູ່ ຈໍາ​ນວນ​ຂອງ​ຖັນ​ທີ່​ມີ​ພຽງ​ແຕ່ nucleotides​. ມູນຄ່ານັ້ນກົງກັບ
ຄວາມຍາວຂອງການຈັດຮຽງລົບຖັນທີ່ມີຊ່ອງຫວ່າງ (ສູນ ຫຼື
ຄ່າຈຳນວນເຕັມບວກ).

pctgaps ຈໍານວນຄໍລໍາທີ່ມີຊ່ອງຫວ່າງສະແດງອອກເປັນເປີເຊັນຂອງ
ຄວາມຍາວການຈັດຮຽງ (ຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0).

pctpv ເປີເຊັນຂອງຖັນບວກ. ເມື່ອເຮັດວຽກກັບລໍາດັບ nucleotide,
ນີ້ແມ່ນເທົ່າກັບອັດຕາສ່ວນຂອງການແຂ່ງຂັນ (ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່
0.0 ເຖິງ 100.0).

pv ຈຳນວນຖັນບວກ. ເມື່ອເຮັດວຽກກັບລໍາດັບ nucleotide, ນີ້
ເທົ່າກັບຈໍານວນທີ່ກົງກັນ (ຄ່າສູນ ຫຼືຄ່າເລກບວກ).

qcov ແຕ່ສ່ວນຫນຶ່ງຂອງລໍາດັບການສອບຖາມທີ່ສອດຄ່ອງກັບລໍາດັບເປົ້າຫມາຍ
(ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0). ການຄຸ້ມຄອງແບບສອບຖາມໄດ້ຖືກຄິດໄລ່ເປັນ
100.0 * (ກົງກັນ + ບໍ່ກົງກັນ) / ຄວາມຍາວລໍາດັບການສອບຖາມ. ພາຍໃນ ຫຼື
ຊ່ອງຫວ່າງຢູ່ປາຍຍອດບໍ່ໄດ້ຖືກພິຈາລະນາ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0.0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.

qframe ຂອບແບບສອບຖາມ (-3 ຫາ +3). ພາກສະຫນາມນັ້ນພຽງແຕ່ກ່ຽວຂ້ອງກັບລໍາດັບລະຫັດແລະແມ່ນ
ບໍ່ໄດ້ຄິດໄລ່ໂດຍ vsearch. ຕັ້ງເປັນ +0 ສະເໝີ.

qhi nucleotide ສຸດທ້າຍຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າໝາຍ. ສະເຫມີເທົ່າກັບ
ຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີ
ການຈັດວາງ.

qihi nucleotide ສຸດທ້າຍຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າໝາຍ (ບໍ່ສົນໃຈ terminal
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.

ກີໂລ nucleotide ທໍາອິດຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າຫມາຍ (ບໍ່ສົນໃຈເບື້ອງຕົ້ນ
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.

ql ຄວາມຍາວລຳດັບແບບສອບຖາມ (ຄ່າຈຳນວນເຕັມບວກ). ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າ
ບໍ່ມີການສອດຄ່ອງ.

qlo nucleotide ທໍາອິດຂອງການສອບຖາມສອດຄ່ອງກັບເປົ້າຫມາຍ. ສະເຫມີເທົ່າກັບ 1
ຖ້າມີການສອດຄ່ອງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.

qrow ພິມລໍາດັບຂອງພາກສ່ວນການສອບຖາມຕາມທີ່ເຫັນໃນການຈັດຮຽງຄູ່
(ເຊັ່ນ: ການໃສ່ຊ່ອງຫວ່າງຖ້າຕ້ອງການ). ພື້ນທີ່ຫວ່າງເປົ່າຖ້າບໍ່ມີ
ການຈັດວາງ.

qs ຄວາມຍາວສ່ວນການສອບຖາມ. ເທົ່າກັບຄວາມຍາວຂອງລຳດັບການສອບຖາມສະເໝີ.

qstrand Query strand orientation (+ ຫຼື - ສໍາລັບລໍາດັບ nucleotide). ຊ່ອງຫວ່າງຖ້າ
ບໍ່ມີການສອດຄ່ອງ.

query ປ້າຍສອບຖາມ.

ວັດຖຸດິບ ຄະແນນການຈັດຮຽງວັດຖຸດິບ (ຄ່າລົບ, null ຫຼືຄ່າເລກບວກ). ຄະ​ແນນ
ແມ່ນຜົນລວມຂອງລາງວັນການແຂ່ງຂັນລົບການລົງໂທດທີ່ບໍ່ກົງກັນ, ການເປີດຊ່ອງຫວ່າງ ແລະຊ່ອງຫວ່າງ
ສ່ວນຂະຫຍາຍ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການຈັດຮຽງ.

ເປົ້າ​ຫມາຍ ປ້າຍກຳກັບ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ "*" ຖ້າບໍ່ມີການຈັດຮຽງ.

tcov ຊິ້ນສ່ວນຂອງລໍາດັບເປົ້າຫມາຍທີ່ສອດຄ່ອງກັບລໍາດັບການສອບຖາມ
(ມູນຄ່າທີ່ແທ້ຈິງຕັ້ງແຕ່ 0.0 ຫາ 100.0). ການຄຸ້ມຄອງເປົ້າຫມາຍແມ່ນຄິດໄລ່ເປັນ
100.0 * (ກົງກັນ + ບໍ່ກົງກັນ) / ຄວາມຍາວຂອງລໍາດັບເປົ້າຫມາຍ. ພາຍໃນ ຫຼື
ຊ່ອງຫວ່າງຢູ່ປາຍຍອດບໍ່ໄດ້ຖືກພິຈາລະນາ. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0.0 ຖ້າ
ບໍ່ມີການສອດຄ່ອງ.

ຂອບຮູບ ຂອບເປົ້າໝາຍ (-3 ຫາ +3). ພາກສະຫນາມນັ້ນພຽງແຕ່ກ່ຽວຂ້ອງກັບລໍາດັບລະຫັດແລະແມ່ນ
ບໍ່ໄດ້ຄິດໄລ່ໂດຍ vsearch. ຕັ້ງເປັນ +0 ສະເໝີ.

nucleotide ສຸດທ້າຍຂອງເປົ້າໝາຍສອດຄ່ອງກັບການສອບຖາມ. ສະເຫມີເທົ່າກັບ
ຄວາມຍາວຂອງການຈັດຮຽງຄູ່. ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີ
ການຈັດວາງ.

ທິຮິ nucleotide ສຸດ​ທ້າຍ​ຂອງ​ເປົ້າ​ຫມາຍ​ສອດ​ຄ່ອງ​ກັບ​ການ​ສອບ​ຖາມ (ລະ​ເລີຍ terminal
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.

linden nucleotide ທໍາອິດຂອງເປົ້າຫມາຍທີ່ສອດຄ່ອງກັບການສອບຖາມ (ບໍ່ສົນໃຈເບື້ອງຕົ້ນ
ຊ່ອງຫວ່າງ). ໝາຍເລກນິວຄລີໂອທີນເລີ່ມຈາກ 1. ພາກສະຫນາມຖືກຕັ້ງເປັນ 0 ຖ້າມີ
ແມ່ນບໍ່ສອດຄ່ອງ.

tl ຄວາມຍາວລຳດັບເປົ້າໝາຍ (ຄ່າຈຳນວນເຕັມບວກ). ຊ່ອງຂໍ້ມູນຖືກຕັ້ງເປັນ 0 ຖ້າ
ບໍ່ມີການສອດຄ່ອງ.

ດິນ nucleotide ທໍາອິດຂອງເປົ້າຫມາຍສອດຄ່ອງກັບການສອບຖາມ. ສະເຫມີເທົ່າກັບ 1
ຖ້າມີການສອດຄ່ອງ, 0 ຖ້າບໍ່ດັ່ງນັ້ນ.

ດອກໄມ້ ພິມລໍາດັບຂອງພາກສ່ວນເປົ້າຫມາຍດັ່ງທີ່ເຫັນຢູ່ໃນການຈັດຕໍາແຫນ່ງຄູ່
(ເຊັ່ນ: ການໃສ່ຊ່ອງຫວ່າງຖ້າຕ້ອງການ). ພື້ນທີ່ຫວ່າງເປົ່າຖ້າບໍ່ມີ
ການຈັດວາງ.

ts ຄວາມຍາວສ່ວນເປົ້າໝາຍ. ເທົ່າກັບຄວາມຍາວຂອງລຳດັບເປົ້າໝາຍສະເໝີ. ພາກສະຫນາມ
ຖືກຕັ້ງເປັນ 0 ຖ້າບໍ່ມີການສອດຄ່ອງ.

tstrand ທິດທາງຂອງເສັ້ນເປົ້າໝາຍ (+ ຫຼື - ສໍາລັບລໍາດັບ nucleotide). ຕັ້ງເປັນ
"+", ດັ່ງນັ້ນການຈັບຄູ່ strand reverse ມີ tstrand "+" ແລະ qstrand "-". ຫວ່າງເປົ່າ
ພາກສະຫນາມຖ້າບໍ່ມີການຈັດຕໍາແຫນ່ງ.

ເຈດຕະນາ ການປ່ຽນແປງ


ຖ້າທ່ານເປັນຜູ້ໃຊ້ usearch, ຈຸດປະສົງຂອງພວກເຮົາແມ່ນເພື່ອເຮັດໃຫ້ທ່ານມີຄວາມຮູ້ສຶກຢູ່ເຮືອນ. ນັ້ນຄືເຫດຜົນ vsearch
ໄດ້ຖືກອອກແບບເພື່ອປະຕິບັດຕົວຄືກັບ usearch, ໃນບາງຂອບເຂດ. ເຊັ່ນດຽວກັນກັບຊອບແວສະລັບສັບຊ້ອນໃດກໍ່ຕາມ, usearch ແມ່ນ
ບໍ່ບໍ່ເສຍຄ່າຈາກ quirks ແລະຄວາມບໍ່ສອດຄ່ອງ. ພວກເຮົາຕັດສິນໃຈທີ່ຈະບໍ່ແຜ່ພັນບາງສ່ວນຂອງພວກເຂົາ, ແລະ
ເພື່ອຄວາມໂປ່ງໃສທີ່ສົມບູນ, ເພື່ອບັນທຶກການປ່ຽນແປງໂດຍເຈດຕະນາທີ່ພວກເຮົາໄດ້ເຮັດຢູ່ທີ່ນີ້.

ໃນ​ລະ​ຫວ່າງ​ການ​ຄົ້ນ​ຫາ​ທີ່​ມີ usearch​, ໃນ​ເວ​ລາ​ທີ່​ການ​ນໍາ​ໃຊ້​ທາງ​ເລືອກ --blast6out ແລະ --output_no_hits​, ສໍາ​ລັບ​ການ​
queries with no match the number of fields report is 13, where it should be 12. ນີ້ແມ່ນ
ແກ້​ໄຂ​ໃນ vsearch.

ຂໍ້ມູນດິບຂອງທາງເລືອກ --userfields ບໍ່ແມ່ນຂໍ້ມູນໃນ usearch. ອັນນີ້ຖືກແກ້ໄຂ
in vsearch.

ທົ່ງນາ qlo, qhi, tlo, thi ໃນປັດຈຸບັນມີຄູ່ຮ່ວມງານ (qilo, qihi, tilo, tihi) ລາຍງານ.
ການຈັດຮຽງພິກັດບໍ່ສົນໃຈຊ່ອງຫວ່າງຢູ່ປາຍຍອດ.

ໃນ usearch, ເມື່ອໃຊ້ຕົວເລືອກ --output_no_hits, ຄໍາຖາມທີ່ບໍ່ໄດ້ຮັບຄໍາທີ່ກົງກັນແມ່ນ
ລາຍງານໃນໄຟລ໌ blast6out, ແຕ່ບໍ່ແມ່ນຢູ່ໃນໄຟລ໌ຜົນຜະລິດການຈັດລໍາດັບ. ນີ້ແມ່ນການແກ້ໄຂໃນ
vsearch.

vsearch ແນະນຳຄຳສັ່ງ --cluster_size ໃໝ່ທີ່ຈັດຮຽງລຳດັບໂດຍການຫຼຸດ
ຄວາມອຸດົມສົມບູນກ່ອນທີ່ຈະເປັນກຸ່ມ.

vsearch reintroduces --iddef ທາງເລືອກຄູ່ຄໍານິຍາມຕົວຕົນທີ່ຖືກລຶບອອກ
ຈາກ usearch.

vsearch ຂະຫຍາຍຕົວເລືອກ --topn ເພື່ອຈັດຮຽງຄໍາສັ່ງ.

vsearch ຂະຫຍາຍຕົວເລືອກ --sizein ໄປຫາ dereplication (--derep_fulllength) ແລະ clustering
(--cluster_fast).

vsearch ປະຕິບັດຕໍ່ T ແລະ U ເປັນ nucleotides ດຽວກັນໃນລະຫວ່າງການ dereplication.

vsearch ການຈັດລຽງແມ່ນສະຖຽນລະພາບໂດຍການນໍາໃຊ້ລໍາດັບຄວາມອຸດົມສົມບູນຫຼືລໍາດັບປ້າຍຊື່ເປັນ
ກະແຈສຳຮອງ ຫຼື ຂັ້ນສາມ.

ລັດຖະບານ


vsearch ແນະນໍາທາງເລືອກໃຫມ່ທີ່ບໍ່ມີຢູ່ໃນ usearch 7. ພວກເຂົາເຈົ້າໄດ້ຖືກອະທິບາຍຢູ່ໃນ
ພາກສ່ວນ "ຕົວເລືອກ" ຂອງຄູ່ມືນີ້. ນີ້ແມ່ນບັນຊີລາຍຊື່ສັ້ນ:

- ຄວາມ​ກວ້າງ​ຂວາງ (ການ​ກວດ​ສອບchimera​)

- cluster_size (ກຸ່ມ​)

- fasta_width (ທາງ​ເລືອກ​ທົ່ວ​ໄປ​)

- iddef (ການ​ຈັດ​ກຸ່ມ​, ສອດ​ຄ່ອງ​ຄູ່​, ການ​ຊອກ​ຫາ​)

- ຂະ​ຫນາດ​ໃຫ້​ສູງ​ສຸດ (dereplication​)

- shuffle (ສະ​ຫຼັບ​)

ຕົວຢ່າງ


ຈັດລຽງລຳດັບທັງໝົດໃນຖານຂໍ້ມູນເຊິ່ງກັນແລະກັນ ແລະອອກຜົນການຈັດຮຽງຄູ່ທັງໝົດ:

vsearch --allpairs_global database.fas --alnout results.aln --ຍອມຮັບທັງໝົດ

ກວດເບິ່ງການປະກົດຕົວຂອງ chimeras (de novo); ພໍ່ແມ່ຄວນຈະມີຢ່າງຫນ້ອຍ 1.5 ເທົ່າ
ອຸດົມສົມບູນກວ່າ chimeras. ຜົນຜະລິດລໍາດັບທີ່ບໍ່ແມ່ນchimeric ໃນຮູບແບບ fasta (ບໍ່ມີການຫໍ່):

vsearch --uchime_denovo queries.fas --nonchimeras results.fas --fasta_width 0
--abskew 1.5

Cluster ທີ່ມີເກນຄວາມຄ້າຍຄືກັນ 97%, ລວບລວມ cluster centroids, ແລະຂຽນ cluster
ລາຍ​ລະ​ອຽດ​ການ​ນໍາ​ໃຊ້​ຮູບ​ແບບ​ທີ່​ຄ້າຍ​ຄື uclust​:

vsearch --cluster_fast queries.fas --id 0.97 --centroids centroids.fas --uc
clusters.uc

Dereplicate ລໍາດັບທີ່ມີຢູ່ໃນ queries.fas, ຄໍານຶງເຖິງຄວາມອຸດົມສົມບູນ
ຂໍ້​ມູນ​ທີ່​ມີ​ຢູ່​ແລ້ວ​, ຂຽນ​ລໍາ​ດັບ unwrapped ກັບ​ຜົນ​ຜະ​ລິດ​ທີ່​ມີ​ອຸ​ດົມ​ສົມ​ບູນ​ໃຫມ່​
ຂໍ້​ມູນ​, ຍົກ​ເລີກ​ການ​ລໍາ​ດັບ​ທັງ​ຫມົດ​ທີ່​ມີ​ອຸ​ດົມ​ສົມ​ບູນ​ຂອງ 1​:

vsearch --derep_fullength queries.fas -- ຜົນຜະລິດ queries_masked.fas --ຂະຫນາດ
--sizeout --fasta_width 0 --minuniquesize 2

Mask ການຊໍ້າຄືນແບບງ່າຍໆ ແລະ ພາກພື້ນທີ່ມີຄວາມຊັບຊ້ອນຕໍ່າຢູ່ໃນໄຟລ໌ fasta ວັດສະດຸປ້ອນ (ເຂດທີ່ໜ້າກາກແມ່ນ
ຕົວພິມນ້ອຍ), ແລະຂຽນຜົນໄດ້ຮັບໃສ່ໄຟລ໌ຜົນຜະລິດ:

vsearch -- maskfasta queries.fas -- ຜົນຜະລິດ queries_masked.fas --qmask ຂີ້ຝຸ່ນ

ຄົ້ນຫາແບບສອບຖາມໃນຖານຂໍ້ມູນອ້າງອິງ, ໂດຍມີເກນຄວາມຄ້າຍຄືກັນ 80%, ເອົາ terminal
ຊ່ອງຫວ່າງເຂົ້າໃນບັນຊີເມື່ອຄິດໄລ່ຄວາມຄ້າຍຄືກັນຄູ່:

vsearch --usearch_global queries.fas --db references.fas --alnout results.aln --id
0.8 --iddef 1

ຄົ້ນ​ຫາ​ຊຸດ​ຂໍ້​ມູນ​ຕາມ​ລໍາ​ດັບ​ຕໍ່​ຕ້ານ​ຕົວ​ມັນ​ເອງ (ບໍ່​ສົນ​ໃຈ​ຕົນ​ເອງ hits​)​, ໄດ້​ຮັບ​ການ​ແຂ່ງ​ຂັນ​ທັງ​ຫມົດ​ທີ່​ມີ​ຢ່າງ​ຫນ້ອຍ​
60% ຕົວຕົນ, ແລະເກັບກໍາຜົນໄດ້ຮັບໃນຮູບແບບທີ່ແຍກແທັບແທັບລະເບີດ:

vsearch --usearch_global queries.fas --db queries.fas --id 0.6 --self --blast6out
results.blast6 --maxaccepts 0 --maxrejects 0

ສະຫຼັບໄຟລ໌ fasta ການປ້ອນຂໍ້ມູນ (ປ່ຽນລໍາດັບຂອງລໍາດັບ) ໃນຮູບແບບທີ່ເຮັດຊ້ໍາໄດ້
(ແກ່ນຄົງທີ່), ແລະຂຽນລໍາດັບ fasta ທີ່ບໍ່ຫໍ່ໃສ່ໄຟລ໌ຜົນຜະລິດ:

vsearch --ສະຫຼັບ queries.fas -- ຜົນຜະລິດ queries_shuffled.fas --ແກ່ນ 13 --fasta_width
0

ຈັດຮຽງໂດຍການຫຼຸດລົງຄວາມອຸດົມສົມບູນຂອງລໍາດັບທີ່ມີຢູ່ໃນ queries.fas (ໂດຍໃຊ້
"ຂະຫນາດ=integer" ຂໍ້ມູນ), relabel ລໍາດັບໃນຂະນະທີ່ຮັກສາຄວາມອຸດົມສົມບູນ
ຂໍ້ມູນ (ດ້ວຍ --sizeout), ຮັກສາພຽງແຕ່ລໍາດັບທີ່ມີຄວາມອຸດົມສົມບູນເທົ່າກັບຫຼືຫຼາຍກວ່ານັ້ນ
ຫຼາຍກວ່າ 2:

vsearch --sortbysize queries.fas -- ຜົນຜະລິດ queries_sorted.fas --relabel ຕົວຢ່າງA_
--sizeout --ຂະໜາດນ້ອຍ 2

AUTHORS


ການປະຕິບັດໂດຍ Torbjørn Rognes ແລະ Tomás Flouri, ເອກະສານໂດຍ Frédéric Mahé.

ການລາຍງານ ບັກ


ສົ່ງ​ຄໍາ​ແນະ​ນໍາ​ແລະ​ບົດ​ລາຍ​ງານ bug ທີ່ , ສົ່ງ ກ
ດຶງ​ຄໍາ​ຮ້ອງ​ສະ​ຫມັກ​ , ຫຼືປະກອບເປັນມິດຫຼື
curmudgeont e-mail ກັບ Torbjørn Rognestorognes@ifi.uio.no>.

ການແຜ່ກະຈາຍ


ລະຫັດແຫຼ່ງແລະຖານສອງແມ່ນມີຢູ່ .

COPYRIGHT


ສະຫງວນລິຂະສິດ (C) 2014, 2015 Torbjørn Rognes, Frédéric Mahé ແລະ Tomás Flouri.

ໂຄງ​ການ​ນີ້​ແມ່ນ​ຊອບ​ແວ​ຟຣີ​: ທ່ານ​ສາ​ມາດ​ແຈກ​ຢາຍ​ມັນ​ແລະ / ຫຼື​ປັບ​ປຸງ​ແກ້​ໄຂ​ມັນ​ພາຍ​ໃຕ້​ເງື່ອນ​ໄຂ​ຂອງ​
ໃບອະນຸຍາດສາທາລະນະທົ່ວໄປຂອງ GNU Affero ທີ່ຈັດພີມມາໂດຍມູນນິທິຊອບແວຟຣີ, ບໍ່ວ່າຈະ
ສະບັບ 3 ຂອງໃບອະນຸຍາດ, ຫຼືສະບັບຕໍ່ມາ.

ໂຄງການນີ້ໄດ້ຖືກແຈກຢາຍໂດຍຫວັງວ່າມັນຈະເປັນປະໂຫຍດ, ແຕ່ບໍ່ມີການຮັບປະກັນໃດໆ;
ໂດຍບໍ່ມີການຮັບປະກັນທາງດ້ານການຄ້າ ຫຼືຄວາມສອດຄ່ອງສໍາລັບຈຸດປະສົງສະເພາະ.
ເບິ່ງໃບອະນຸຍາດສາທາລະນະທົ່ວໄປ GNU Affero ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ.

ທ່ານຄວນໄດ້ຮັບສໍາເນົາຂອງໃບອະນຸຍາດສາທາລະນະທົ່ວໄປ GNU Affero ພ້ອມກັບສິ່ງນີ້
ໂຄງການ. ຖ້າບໍ່, ເບິ່ງhttp://www.gnu.org/licenses/>.

vsearch ລວມມີລະຫັດຈາກໂຄງການ CityHash ຂອງ Google ໂດຍ Geoff Pike ແລະ Jyrki Alakuijala,
ສະຫນອງບາງຫນ້າທີ່ hash ທີ່ດີເລີດທີ່ມີຢູ່ພາຍໃຕ້ໃບອະນຸຍາດ MIT.

vsearch ລວມມີລະຫັດທີ່ມາຈາກ Tatusov ແລະໂຄງການ DUST ຂອງ Lipman ທີ່ຢູ່ໃນສາທາລະນະ
ໂດເມນ.

vsearch binaries ອາດຈະປະກອບມີລະຫັດຈາກຫ້ອງສະຫມຸດ zlib, ລິຂະສິດ Jean-Loup Gailly ແລະ
Mark Adler.

vsearch binary ອາດຈະປະກອບມີລະຫັດຈາກຫ້ອງສະຫມຸດ bzip2, ລິຂະສິດ Julian R. Seward.

ໃຊ້ vsearch ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net



ລ່າສຸດ Linux ແລະ Windows ໂຄງການອອນໄລນ໌