ນີ້ແມ່ນຄໍາສັ່ງ 2ndscore ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
2ndscore - ຊອກຫາ hairpin ທີ່ດີທີ່ສຸດສະມໍໃນແຕ່ລະຕໍາແຫນ່ງ.
ສະຫຼຸບສັງລວມ
ຄະແນນ 2nds in.fasta > out.hairpins
ລາຍລະອຽດ
ສໍາລັບທຸກໆຕໍາແຫນ່ງໃນລໍາດັບ, ມັນຈະອອກເສັ້ນ:
-0.6 52.. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(ຄະແນນ) (ເລີ່ມຕົ້ນ..ສິ້ນສຸດ) (ບໍລິບົດຊ້າຍ) (hairpin) (ເນື້ອໃນຂວາ)
ສຳລັບຕຳແໜ່ງທີ່ຢູ່ໃກ້ກັບທ້າຍຂອງລຳດັບ, ບໍລິບົດອາດຈະຖືກໃສ່ດ້ວຍ 'x'
ຕົວລະຄອນ. ຖ້າບໍ່ພົບ hairpin, ຄະແນນຈະເປັນ 'ບໍ່ມີ'.
ສາມາດໃຫ້ຫຼາຍໄຟລ໌ fasta ແລະຫຼາຍລໍາດັບສາມາດຢູ່ໃນແຕ່ລະໄຟລ໌ fasta. ໄດ້
ຜົນຜະລິດສໍາລັບແຕ່ລະລໍາດັບຈະຖືກແຍກອອກໂດຍເສັ້ນເລີ່ມຕົ້ນດ້ວຍ '>' ແລະປະກອບດ້ວຍ
ລາຍລະອຽດ FASTA ຂອງລໍາດັບ.
ເນື່ອງຈາກວ່າຄະແນນ hairpin ຂອງ plus-strand ແລະ minus-strand ອາດຈະແຕກຕ່າງກັນ (ເນື່ອງຈາກ GU.
ການຜູກມັດໃນ RNA), ໂດຍຄ່າເລີ່ມຕົ້ນ 2ndscore ຜົນໄດ້ຮັບສອງຊຸດຂອງ hairpins ສໍາລັບທຸກໆລໍາດັບ: the
ສືບຕໍ່ hairpins ແລະ hairpins ກັບຄືນ. hairpins ທັງຫມົດຕໍ່ຫນ້າແມ່ນຜົນຜະລິດທໍາອິດ, ແລະ
ຖືກລະບຸໂດຍການມີຄໍາວ່າ 'FORWARD' ໃນຕອນທ້າຍຂອງແຖວ '>' ທີ່ຢູ່ຂ້າງຫນ້າ.
ເຊັ່ນດຽວກັນ, ເສັ້ນຜົມແບບ REVERSE ແມ່ນລະບຸໄວ້ຫຼັງຈາກເສັ້ນ '>' ທີ່ລົງທ້າຍດ້ວຍ 'ຍ້ອນກັບ'. ຖ້າເຈົ້າ
ຕ້ອງການຄົ້ນຫາພຽງແຕ່ຫນຶ່ງຫຼືສາຍອື່ນໆ, ທ່ານສາມາດນໍາໃຊ້:
--no-fwd ຢ່າພິມ hairpins ຕໍ່ໄປ
--no-rvs ຢ່າພິມ hairpins ກັບຄືນ
ທ່ານສາມາດກໍານົດການທໍາງານຂອງພະລັງງານທີ່ໃຊ້, ຄືກັນກັບ transterm ກັບ --gc, --au, --gu,
--mm, --ຕົວເລືອກຊ່ອງຫວ່າງ. ຕົວເລືອກ --min-loop, --max-loop, ແລະ --max-len ຍັງຮອງຮັບ.
ຮູບແບບ OF ການ .ຖົງ ເອກະສານ
ຖັນສໍາລັບໄຟລ໌ .bag ແມ່ນ, ຕາມລໍາດັບ:
1. gene_name
2. terminator_start
3. terminator_end
4. hairpin_score
5. tail_score
6. terminator_sequence
7. terminator_confidence: ການປະສົມປະສານຂອງ hairpin ແລະຫາງຄະແນນທີ່
ຄຳນຶງເຖິງຄວາມເປັນໄປໄດ້ວ່າຄະແນນດັ່ງກ່າວຢູ່ໃນລຳດັບແບບສຸ່ມ. ນີ້
ແມ່ນ "ຄະແນນ" ຕົ້ນຕໍສໍາລັບ terminator ແລະຖືກຄິດໄລ່ຕາມທີ່ອະທິບາຍໄວ້ໃນ
ເຈ້ຍ.
8. APPROXIMATE_distance_from_end_of_gene: ຈຳນວນ *ປະມານ* ຂອງຖານ
ຄູ່ລະຫວ່າງຈຸດສິ້ນສຸດຂອງ gene ແລະຈຸດເລີ່ມຕົ້ນຂອງ terminator. ນີ້
ແມ່ນປະມານໃນຫຼາຍວິທີ: ທໍາອິດ, (ແລະສໍາຄັນທີ່ສຸດ) TransTermHP
ບໍ່ໄດ້ໃຊ້ gene ທີ່ແທ້ຈິງສະເຫມີ. ຂຶ້ນຢູ່ກັບທາງເລືອກທີ່ທ່ານໃຫ້
ມັນອາດຈະຕັດບາງສ່ວນຂອງພັນທຸກໍາໃນການຈັດການ terminators ທີ່
ທັບຊ້ອນກັນບາງສ່ວນກັບພັນທຸກໍາ. ອັນທີສອງ, ບ່ອນທີ່ terminator "ເລີ່ມຕົ້ນ"
ບໍ່ໄດ້ກໍານົດໄດ້ດີ. ຊ່ອງຂໍ້ມູນນີ້ແມ່ນມີຈຸດປະສົງເພື່ອກວດກາສຸຂະພາບເທົ່ານັ້ນ
(terminators ລາຍງານວ່າເປັນທີ່ດີທີ່ສຸດຢູ່ໃກ້ທີ່ສຸດຂອງພັນທຸກໍາບໍ່ຄວນຈະເປັນ
_ໄກເກີນໄປ_ຈາກຈຸດສິ້ນສຸດຂອງ gene).
ການ ນຳ ໃຊ້ ແປ ບໍ່ມີ genome ຄຳບັນຍາຍ
TransTermHP ໃຊ້ຂໍ້ມູນ gene ທີ່ຮູ້ຈັກພຽງແຕ່ 3 ຢ່າງ: (1) tagging putative
terminators ເປັນທັງ "genes ພາຍໃນ" ຫຼື "intergenic," (2) ການເລືອກພື້ນຖານ GC-
ເປີເຊັນເນື້ອຫາເພື່ອຄິດໄລ່ຄະແນນ, ເພາະວ່າພັນທຸກໍາມັກຈະມີເນື້ອຫາ GC ທີ່ແຕກຕ່າງກັນ
ກ່ວາພາກພື້ນ intergenic, ແລະ (3) ການຜະລິດຜົນຜະລິດທີ່ອ່ານໄດ້ຫຼາຍເລັກນ້ອຍ. ລາຍການ (1)
ແລະ (3) ບໍ່ຈໍາເປັນແທ້ໆ, ແລະ (2) ບໍ່ມີຜົນກະທົບໃດໆຖ້າພັນທຸກໍາຂອງເຈົ້າມີຄືກັນ
GC-ເນື້ອໃນເປັນພາກພື້ນ intergenic ຂອງທ່ານ.
ແຕ່ຫນ້າເສຍດາຍ, TransTermHP ຍັງບໍ່ທັນມີທາງເລືອກທີ່ງ່າຍດາຍທີ່ຈະດໍາເນີນການໂດຍບໍ່ມີຄໍາບັນຍາຍ
ໄຟລ໌ (ທັງ .ptt ຫຼື .coords), ແລະຕ້ອງການຢ່າງໜ້ອຍ 2 genes. ການແກ້ໄຂ
ແມ່ນການສ້າງ genes ຂະຫນາດນ້ອຍປອມທີ່ flank ແຕ່ລະ chromosome. ເພື່ອເຮັດສິ່ງນີ້, ສ້າງ fake.coords
ໄຟລ໌ທີ່ມີພຽງແຕ່ສອງແຖວນີ້:
fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id
ບ່ອນທີ່ L ແມ່ນຄວາມຍາວຂອງລໍາດັບການປ້ອນຂໍ້ມູນແລະ L-1 ແມ່ນ 1 ຫນ້ອຍກວ່າຄວາມຍາວຂອງວັດສະດຸປ້ອນ
ລຳດັບ. "chrom_id" ຄວນເປັນຄຳທີ່ຕິດຕາມໂດຍກົງຈາກ ">" ໃນໄຟລ໌ .fasta
ປະກອບດ້ວຍລໍາດັບຂອງທ່ານ. (ເຊັ່ນ: ຖ້າໄຟລ໌ .fasta ຂອງທ່ານເລີ່ມດ້ວຍ ">seq1", ຈາກນັ້ນ
chrom_id = seq1).
ອັນນີ້ສ້າງຄໍາບັນຍາຍ "ປອມ" ທີ່ມີສອງພັນທຸກໍາຍາວ 1 ໂຄນຢູ່ຂ້າງລໍາດັບໃນ
ການຈັດລຽງຫາງ---> <--. ຈາກນັ້ນ TransTermHP ສາມາດແລ່ນດ້ວຍ:
transterm -p expterm.dat sequence.fasta fake.coords
ຖ້າເນື້ອໃນຂອງ G/C ຂອງພາກພື້ນ intergenic ຂອງທ່ານແມ່ນກ່ຽວກັບພັນທຸກໍາຂອງທ່ານ, ຫຼັງຈາກນັ້ນ
ຈະບໍ່ມີຜົນກະທົບຫຼາຍເກີນໄປຕໍ່ກັບຄະແນນທີ່ຜູ້ສິ້ນສຸດໄດ້ຮັບ. ໃນທາງກົງກັນຂ້າມ,
ການນໍາໃຊ້ TransTermHP ນີ້ບໍ່ໄດ້ຖືກທົດສອບຫຼາຍ, ສະນັ້ນມັນເປັນການຍາກທີ່ຈະຢັ້ງຢືນສໍາລັບມັນ.
ຄວາມຖືກຕ້ອງ.
ໃຊ້ 2ndscore ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net