ນີ້ແມ່ນຄໍາສັ່ງ featureCounts ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
featureCounts - ໂຄງການສະຫຼຸບການອ່ານທີ່ມີປະສິດທິພາບສູງແລະຖືກຕ້ອງ
ການນໍາໃຊ້
ຈຳນວນຄຸນສົມບັດ [ທາງເລືອກ] -a -o input_file1 [input_file2]
...
ການໂຕ້ຖຽງທີ່ຕ້ອງການ:
-a
ຊື່ຂອງໄຟລ໌ຄໍາບັນຍາຍ. ຮູບແບບ GTF ໂດຍຄ່າເລີ່ມຕົ້ນ. ເບິ່ງ -F ທາງເລືອກສໍາລັບຮູບແບບເພີ່ມເຕີມ.
-o
ຊື່ຂອງໄຟລ໌ຜົນຜະລິດລວມທັງຈໍານວນການອ່ານ. ໄຟລ໌ແຍກຕ່າງຫາກລວມທັງບົດສະຫຼຸບ
ສະຖິຕິການນັບຜົນໄດ້ຮັບແມ່ນລວມຢູ່ໃນຜົນຜະລິດ (` .ສະຫຼຸບ')
input_files
ລາຍຊື່ໄຟລ໌ປ້ອນຂໍ້ມູນໃນຮູບແບບ BAM ຫຼື SAM. ຜູ້ໃຊ້ບໍ່ຈໍາເປັນຕ້ອງລະບຸວ່າມັນແມ່ນ BAM ຫຼື
ສ. ວ.
ການໂຕ້ຖຽງທາງເລືອກ:
-A
ຊື່ຂອງໄຟລ໌ທີ່ຂັ້ນດ້ວຍເຄື່ອງໝາຍຈຸດລວມທັງຊື່ chromosome alias ທີ່ໃຊ້ເພື່ອຈັບຄູ່
ຊື່ໂຄໂມໂຊມທີ່ໃຊ້ໃນຄຳອະທິບາຍປະກອບກັບຕົວທີ່ໃຊ້ໃນການປ້ອນຂໍ້ມູນ BAM/SAM, ຖ້າພວກເຂົາແມ່ນ
ແຕກຕ່າງກັນ. ເບິ່ງຄູ່ມືຜູ້ໃຊ້ສໍາລັບຮູບແບບໄຟລ໌.
-F
ລະບຸຮູບແບບຂອງໄຟລ໌ຄໍາບັນຍາຍທີ່ສະໜອງໃຫ້. ຮູບແບບທີ່ຍອມຮັບໄດ້ລວມມີ `GTF' ແລະ
`SAF'. `GTF' ຕາມຄ່າເລີ່ມຕົ້ນ. ເບິ່ງຄູ່ມືຜູ້ໃຊ້ສໍາລັບລາຍລະອຽດຂອງຮູບແບບ SAF.
-t
ລະບຸປະເພດຄຸນສົມບັດໃນຄໍາບັນຍາຍ GTF. `exon” ໂດຍຄ່າເລີ່ມຕົ້ນ. ຄຸນສົມບັດທີ່ໃຊ້ສໍາລັບການອ່ານ
ການນັບຈະຖືກແຍກອອກຈາກ annotation ໂດຍໃຊ້ຄ່າທີ່ໃຫ້ມາ.
-g
ລະບຸປະເພດຄຸນສົມບັດໃນຄໍາບັນຍາຍ GTF. `gene_id' ຕາມຄ່າເລີ່ມຕົ້ນ. ຄຸນສົມບັດເມຕາທີ່ໃຊ້ແລ້ວ
ສໍາລັບການນັບອ່ານຈະໄດ້ຮັບການແຍກອອກຈາກຄໍາອະທິບາຍໂດຍນໍາໃຊ້ຄ່າທີ່ສະຫນອງໃຫ້.
-f ປະຕິບັດການນັບການອ່ານໃນລະດັບຄຸນນະສົມບັດ (ເຊັ່ນ: ການນັບການອ່ານສໍາລັບ exons ແທນທີ່ຈະ
gene).
-O ກຳນົດການອ່ານໃຫ້ທຸກລັກສະນະເມຕາທີ່ທັບຊ້ອນກັນ (ຫຼືຄຸນສົມບັດຖ້າ -f is
ລະບຸ).
-s
ປະຕິບັດການນັບການອ່ານສະເພາະ. ຄ່າທີ່ເປັນໄປໄດ້: 0 (unstranded), 1
(stranded) ແລະ 2 (ປີ້ນກັບກັນ stranded). 0 ໂດຍຄ່າເລີ່ມຕົ້ນ.
-M ການອ່ານຫຼາຍແຜນທີ່ຈະຖືກນັບເຊັ່ນກັນ. ສໍາລັບການອ່ານ multimapping, ທັງຫມົດຂອງມັນລາຍງານ
ການຈັດຮຽງຈະຖືກນັບ. ແທັກ `NH' ໃນການປ້ອນຂໍ້ມູນ BAM/SAM ຖືກໃຊ້ເພື່ອກວດຫາ
ອ່ານຫຼາຍແຜນທີ່.
-Q
ຄະແນນຄຸນນະພາບການສ້າງແຜນທີ່ຂັ້ນຕ່ຳທີ່ອ່ານຕ້ອງເປັນທີ່ພໍໃຈເພື່ອຈະນັບໄດ້. ສໍາລັບ
ການອ່ານແບບຄູ່, ຢ່າງໜ້ອຍໜຶ່ງປາຍຄວນຕອບສະໜອງເງື່ອນໄຂນີ້. 0 ໂດຍຄ່າເລີ່ມຕົ້ນ.
-T
ຈໍານວນກະທູ້. 1 ໂດຍຄ່າເລີ່ມຕົ້ນ.
-v ສະບັບອອກຂອງໂຄງການ.
-J ນັບຈໍານວນການອ່ານທີ່ສະຫນັບສະຫນູນແຕ່ລະ exon-exon junction. Junctions ໄດ້
ກໍານົດຈາກການອ່ານ exon-spanning ເຫຼົ່ານັ້ນຢູ່ໃນວັດສະດຸປ້ອນ (ປະກອບດ້ວຍ 'N' ໃນ CIGAR
string). ຜົນການນັບຖືກບັນທຶກໄວ້ໃນໄຟລ໌ທີ່ມີຊື່ວ່າ ' .jcounts'
-G
ໄຟລ໌ Fasta ປະກອບມີ genome ອ້າງອີງທີ່ໃຊ້ໃນການສ້າງ SAM ຫຼື
ໄຟລ໌ BAM. ການໂຕ້ຖຽງນີ້ແມ່ນຕ້ອງການພຽງແຕ່ໃນເວລາທີ່ເຮັດການນັບຈຸດ.
-R ຜົນໄດ້ຮັບການມອບຫມາຍລາຍລະອຽດສໍາລັບການອ່ານແຕ່ລະຄົນ. ໄຟລ໌ຂໍ້ຄວາມຈະຖືກສ້າງຂື້ນສໍາລັບ
ແຕ່ລະໄຟລ໌ປ້ອນຂໍ້ມູນ, ລວມທັງຊື່ການອ່ານ ແລະ meta-features/features reads
ການມອບຫມາຍໃຫ້. ເບິ່ງຄູ່ມືຜູ້ໃຊ້ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ.
--largest Overlap
ກຳນົດການອ່ານໃຫ້ກັບ meta-feature/feature ທີ່ມີຈຳນວນການທັບຊ້ອນກັນຫຼາຍທີ່ສຸດ
ຖານຂໍ້.
--minOverlap
ລະບຸຈຳນວນຂັ້ນຕ່ຳຂອງຖານທັບຊ້ອນກັນທີ່ຕ້ອງການລະຫວ່າງການອ່ານ ແລະ a
meta-feature/feature ທີ່ອ່ານຖືກມອບໝາຍໃຫ້. 1 ໂດຍຄ່າເລີ່ມຕົ້ນ.
--read2pos <5: 3>
ຫຼຸດການອ່ານລົງເປັນ 5' ພື້ນຖານທີ່ສຸດ ຫຼື 3' ພື້ນຖານທີ່ສຸດ. ຫຼັງຈາກນັ້ນການນັບອ່ານແມ່ນປະຕິບັດ
ໂດຍອີງໃສ່ພື້ນຖານດຽວ, ການອ່ານໄດ້ຖືກຫຼຸດລົງ.
--readExtension5 ການອ່ານແມ່ນຂະຫຍາຍຂຶ້ນໂດຍ ຖານຈາກຂອງເຂົາເຈົ້າ
5' ຈົບ.
--readExtension3 ການອ່ານແມ່ນຂະຫຍາຍຂຶ້ນໂດຍ ຖານຈາກຂອງເຂົາເຈົ້າ
3' ຈົບ.
--ແຕ່ສ່ວນ
ໃຊ້ການນັບເສດສ່ວນ 1/n, ແທນການນັບ 1 (ໜຶ່ງ), ສໍາລັບແຕ່ລະການຈັດຮຽງທີ່ລາຍງານ.
ຂອງການອ່ານຫຼາຍແຜນທີ່ໃນການນັບການອ່ານ. n ແມ່ນຈໍານວນການຈັດຮຽງທັງໝົດທີ່ລາຍງານ
ສໍາລັບການອ່ານຫຼາຍແຜນທີ່. ຕົວເລືອກນີ້ຈະຕ້ອງໃຊ້ຮ່ວມກັນກັບຕົວເລືອກ '-M'.
--ປະຖົມ
ນັບການຈັດຮຽງຂັ້ນຕົ້ນເທົ່ານັ້ນ. ການຈັດຮຽງຂັ້ນຕົ້ນແມ່ນຖືກກໍານົດໂດຍໃຊ້ bit 0x100 in
ພາກສະຫນາມ SAM/BAM FLAG.
--ignoreDup
ບໍ່ສົນໃຈການອ່ານຊໍ້າກັນໃນການນັບການອ່ານ. ການອ່ານຊໍ້າກັນແມ່ນຖືກກໍານົດໂດຍໃຊ້ບິດ
Ox400 ໃນຊ່ອງ BAM/SAM FLAG. ຄູ່ທີ່ອ່ານທັງໝົດຈະຖືກລະເລີຍຖ້າອັນໃດອັນໜຶ່ງທີ່ອ່ານແລ້ວ
ການອ່ານຊໍ້າກັນສໍາລັບຂໍ້ມູນສິ້ນສຸດທີ່ຈັບຄູ່.
--countSplitAlignmentsOnly ນັບການຈັດຮຽງການແບ່ງປັນເທົ່ານັ້ນ (ເຊັ່ນ: ການຈັດຮຽງກັບ
ສະຕຣິງ CIGAR ປະກອບດ້ວຍ `N'). ຕົວຢ່າງຂອງການຈັດຮຽງທີ່ແບ່ງອອກແມ່ນການອ່ານ exon-spanning
ໃນຂໍ້ມູນ RNA-seq.
-p ນັບຊິ້ນ (ອ່ານຄູ່) ແທນການອ່ານສ່ວນບຸກຄົນ. ສໍາລັບແຕ່ລະຄູ່ອ່ານ, ຂອງມັນ
ການອ່ານສອງອັນຈະຕ້ອງຢູ່ຕິດກັນໃນການປ້ອນຂໍ້ມູນ BAM/SAM.
-P ກວດເບິ່ງຄວາມຖືກຕ້ອງຂອງໄລຍະຫ່າງຄູ່ເມື່ອນັບຄູ່ອ່ານ. ໃຊ້ -d ແລະ -D to
ຕັ້ງເກນ.
-d
fragment/ຄວາມຍາວຂອງແມ່ແບບຕໍາ່ສຸດ, 50 ຕາມຄ່າເລີ່ມຕົ້ນ.
-D
fragment/ຄວາມຍາວຂອງແມ່ແບບສູງສຸດ, 600 ຕາມຄ່າເລີ່ມຕົ້ນ.
-B ນັບການອ່ານຄູ່ທີ່ມີປາຍທັງສອງຈັດຮຽງຢ່າງສໍາເລັດຜົນເທົ່ານັ້ນ.
-S
ລະບຸທິດທາງຂອງສອງອ່ານຈາກຄູ່ດຽວກັນ, 'fr' ໂດຍຄ່າເລີ່ມຕົ້ນ
(ຕໍ່/ປີ້ນ).
-C ຢ່ານັບຄູ່ອ່ານທີ່ມີສອງສົ້ນຂອງພວກມັນເຮັດແຜນທີ່ໄປຫາໂຄໂມໂຊມທີ່ແຕກຕ່າງກັນ
ຫຼືການສ້າງແຜນທີ່ກັບໂຄໂມໂຊມດຽວກັນແຕ່ຢູ່ໃນສາຍທີ່ແຕກຕ່າງກັນ.
--donotsort
ຢ່າຈັດຮຽງການອ່ານຢູ່ໃນວັດສະດຸປ້ອນ BAM/SAM. ໃຫ້ສັງເກດວ່າການອ່ານຈາກຄູ່ດຽວກັນແມ່ນຕ້ອງການ
ຕັ້ງຢູ່ຂ້າງກັນໃນວັດສະດຸປ້ອນ.
--maxMOp
ຈໍານວນສູງສຸດຂອງການດໍາເນີນງານ 'M' ທີ່ອະນຸຍາດໃຫ້ຢູ່ໃນສະຕຣິງ CIGAR . 10 ໂດຍຄ່າເລີ່ມຕົ້ນ. ທັງສອງ
'X' ແລະ '=' ຖືກປະຕິບັດເປັນ 'M' ແລະການດໍາເນີນງານ 'M' ທີ່ຕິດກັນຈະຖືກລວມເຂົ້າຢູ່ໃນ CIGAR
string
ໃຊ້ featureCounts ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net