ນີ້ແມ່ນຄໍາສັ່ງ gtf2gff3p ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
gtf2gff3 - ປ່ຽນໄຟລ໌ຮູບແບບ GTF ເປັນໄຟລ໌ GFF3 ທີ່ຖືກຕ້ອງ
ເວີຊັ່ນ
ເອກະສານນີ້ອະທິບາຍສະບັບ 0.1
ສະຫຼຸບສັງລວມ
gtf2gff3 --cfg gtf2gff3_MY_CONFIG.cfg gtf_file > gff3_file
ລາຍລະອຽດ
ສະຄຣິບນີ້ຈະປ່ຽນໄຟລ໌ທີ່ມີຮູບແບບ GTF ເປັນໄຟລ໌ທີ່ມີຮູບແບບ GFF3 ທີ່ຖືກຕ້ອງ. ມັນຈະແຜນທີ່
ຄ່າໃນຖັນທີ 3 (\"type\" column) ເປັນ SO ທີ່ຖືກຕ້ອງ, ແຕ່ເນື່ອງຈາກວ່າຫຼາຍຄໍາທີ່ບໍ່ແມ່ນມາດຕະຖານ
ອາດຈະປາກົດຢູ່ໃນຖັນນັ້ນໃນໄຟລ໌ GTF, ທ່ານສາມາດແກ້ໄຂໄຟລ໌ config ເພື່ອສະຫນອງຂອງທ່ານເອງ
ຄຸນນະສົມບັດ GTF ກັບ SO mapping. script ຍັງຈະສ້າງແບບຈໍາລອງ gene ຈາກ exons, CDSs ແລະ
ລັກສະນະອື່ນໆທີ່ໄດ້ຮັບໃນໄຟລ໌ GTF. ມັນໄດ້ຖືກທົດສອບໃນປັດຈຸບັນຢູ່ໃນ Ensemble ແລະ Twinscan
GTF, ແລະມັນຄວນຈະເຮັດວຽກກັບໄຟລ໌ອື່ນໆທີ່ປະຕິບັດຕາມຂໍ້ກໍານົດດຽວກັນ. ມັນເຮັດ
ບໍ່ເຮັດວຽກຢູ່ໃນ GTF ຈາກຕົວທ່ອງເວັບຕາຕະລາງ UCSC ເພາະວ່າໄຟລ໌ເຫຼົ່ານັ້ນໃຊ້ ID ດຽວກັນສໍາລັບ gene
ແລະ transcript, ສະນັ້ນມັນເປັນໄປບໍ່ໄດ້ທີ່ຈະຈັດກຸ່ມ transcripts ຫຼາຍໄປຫາ gene. ເບິ່ງ
README ທີ່ມາພ້ອມກັບສະຄຣິບສຳລັບຂໍ້ມູນເພີ່ມເຕີມ.
ທາງເລືອກ:
--cfg
ໃຫ້ຊື່ໄຟລ໌ສໍາລັບໄຟລ໌ config. ເບິ່ງໄຟລ໌ການຕັ້ງຄ່າທີ່ສະຫນອງໃຫ້ກັບນີ້
script ສໍາລັບລາຍລະອຽດຮູບແບບ. ໃຊ້ໄຟລ໌ການຕັ້ງຄ່ານີ້ເພື່ອແກ້ໄຂພຶດຕິກໍາຂອງ
ສະຄຣິບ. ຖ້າບໍ່ມີໄຟລ໌ config ໃຫ້ມັນຊອກຫາ ./gtf2gff3.cfg, ~/gtf2gff3.cfg or
/etc/gtf2gff3.cfg ໃນຄໍາສັ່ງນັ້ນ.
- ຊ່ວຍ
ສະໜອງຂໍ້ຄວາມຊ່ວຍເຫຼືອຮູບແບບໜ້າຜູ້ຊາຍແບບລະອຽດ ແລະຫຼັງຈາກນັ້ນອອກ.
ທິດສະດີວິທະຍາ
"ຜິດພາດ: ຄຸນສົມບັດທີ່ຂາດຫາຍໄປ ຫຼືບໍ່ໄດ້ມາດຕະຖານ: parse_attributes"
ແຖວໃນໄຟລ໌ GTF ບໍ່ມີຄຸນລັກສະນະໃດໆ, ຫຼືຖັນຄຸນລັກສະນະຂອງມັນແມ່ນ
ປຽບທຽບບໍ່ໄດ້.
"ຜິດພາດ: ບໍ່ຮອງຮັບຄຸນສົມບັດ gene ທີ່ບໍ່ແມ່ນການຖອດຂໍ້ຄວາມ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນເພື່ອຂໍຄວາມຊ່ວຍເຫຼືອ:
build_gene"
ຄຳເຕືອນນີ້ຊີ້ບອກວ່າແຖວໃດນຶ່ງຖືກຂ້າມໄປເພາະມັນມີຂໍ້ຄວາມທີ່ບໍ່ແມ່ນການຖອດຂໍ້ຄວາມ
ຄຸນນະສົມບັດຂອງ gene, ແລະລະຫັດບໍ່ໄດ້ຕິດຕັ້ງໃນປັດຈຸບັນເພື່ອຈັດການກັບລັກສະນະນີ້.
ນີ້ອາດຈະບໍ່ຍາກເກີນໄປທີ່ຈະເພີ່ມ, ສະນັ້ນຕິດຕໍ່ຂ້ອຍຖ້າທ່ານໄດ້ຮັບຄວາມຜິດພາດນີ້ແລະຈະ
ຢາກມີຄຸນສົມບັດເຫຼົ່ານີ້ຮອງຮັບ.
"ຜິດພາດ: ຕ້ອງມີ exons ຫຼື CDS ຢ່າງໜ້ອຍ ເພື່ອສ້າງ transcript: build_trnsc"
ບາງຄຸນສົມບັດມີ transcript_id ແລະຍັງບໍ່ທັນມີ exons ຫຼື CDS ທີ່ກ່ຽວຂ້ອງກັບ
transcript_id ນັ້ນສະຄຣິບບໍ່ສຳເລັດໃນການສ້າງ transcript.
"ຜິດພາດ: seq_id ຂໍ້ຂັດແຍ່ງ: validate_and_finish_trnsc"
ພົບສອງລັກສະນະພາຍໃນການຖອດຂໍ້ຄວາມດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນ seq_id ດຽວກັນ.
"ERROR: ແຫຼ່ງຂໍ້ຂັດແຍ່ງ: validate_and_finish_trnsc"
ພົບສອງລັກສະນະພາຍໃນການຖອດຂໍ້ຄວາມດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນແຫຼ່ງດຽວກັນ.
"ຜິດພາດ: ພິມຂໍ້ຂັດແຍ່ງ: validate_and_finish_trnsc"
ພົບສອງລັກສະນະພາຍໃນການຖອດຂໍ້ຄວາມດຽວກັນທີ່ຄາດວ່າຈະແບ່ງປັນອັນດຽວກັນ
ປະເພດແລະພວກເຂົາບໍ່ໄດ້.
"ຜິດພາດ: strand ຂໍ້ຂັດແຍ່ງ: validate_and_finish_trnsc"
ພົບເຫັນສອງລັກສະນະພາຍໃນການຖອດຂໍ້ຄວາມດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນສາຍດຽວກັນ.
"Error: seq_id ຂໍ້ຂັດແຍ່ງ: validate_and_build_gene"
ພົບສອງລັກສະນະພາຍໃນ gene ດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນ seq_id ດຽວກັນ.
"ERROR: ແຫຼ່ງຂໍ້ຂັດແຍ່ງ: validate_and_build_gene"
ພົບສອງລັກສະນະພາຍໃນ gene ດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນແຫຼ່ງດຽວກັນ.
"ຜິດພາດ: strand ຂໍ້ຂັດແຍ່ງ: validate_and_build_gene"
ພົບສອງລັກສະນະພາຍໃນ gene ດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນສາຍດຽວກັນ.
"Error: gene_id ຂໍ້ຂັດແຍ່ງ: validate_and_build_gene"
ພົບສອງລັກສະນະພາຍໃນ gene ດຽວກັນທີ່ບໍ່ໄດ້ແບ່ງປັນ gene_id ດຽວກັນ.
"FATAL: ບໍ່ສາມາດເປີດໄຟລ໌ GTF: file_name ສໍາລັບການອ່ານ."
ບໍ່ສາມາດເປີດໄຟລ໌ GTF ສໍາລັບການອ່ານໄດ້.
"FATAL: ຕ້ອງການ exons ຫຼື CDSs ເພື່ອສ້າງ transcripts: process_start"
ຄຸນສົມບັດ start_codon ໄດ້ຖືກອະທິບາຍໄວ້ ແລະຍັງບໍ່ທັນມີ exons ຫຼື CDS ທີ່ກ່ຽວຂ້ອງ
ດ້ວຍ transcript_id ນັ້ນສະຄຣິບລົ້ມເຫລວ.
"FATAL: ລະຫັດທີ່ບໍ່ໄດ້ທົດສອບໃນ process_start. ຕິດຕໍ່ຜູ້ຂຽນເພື່ອຂໍຄວາມຊ່ວຍເຫຼືອ."
script ແມ່ນຂຽນເພື່ອ infer codon ເລີ່ມຕົ້ນໂດຍອີງໃສ່ການປະກົດຕົວຂອງ 5' UTR, ແຕ່ພວກເຮົາ
ບໍ່ມີຕົວຢ່າງ GTF ຂອງປະເພດນີ້ເມື່ອພວກເຮົາຂຽນລະຫັດ, ດັ່ງນັ້ນພວກເຮົາຂ້າຂະບວນການແທນທີ່ຈະ
ກ່ວາແລ່ນລະຫັດທີ່ບໍ່ໄດ້ທົດສອບ. ຕິດຕໍ່ຜູ້ຂຽນສໍາລັບການສະຫນັບສະຫນູນ.
"FATAL: ຊຸດຄຸນສົມບັດບໍ່ຖືກຕ້ອງ: process_start"
ພວກເຮົາໄດ້ພະຍາຍາມພິຈາລະນາທຸກວິທີທີ່ເປັນໄປໄດ້ຂອງການ infering a start codon ຫຼື infering aa non-
gene coding, ແລະພວກເຮົາຍັງລົ້ມເຫລວ. ການລວມກັນຂອງລັກສະນະ gene ຂອງທ່ານບໍ່ໄດ້ເຮັດໃຫ້
ຄວາມຮູ້ສຶກຂອງພວກເຮົາ. ທ່ານບໍ່ຄວນໄດ້ຮັບຄວາມຜິດພາດນີ້, ແລະຖ້າທ່ານເຮັດ, ພວກເຮົາກໍ່ຢາກເຫັນ
ໄຟລ໌ GTF ທີ່ສ້າງມັນ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນເພື່ອຂໍຄວາມຊ່ວຍເຫຼືອ.
"FATAL: ຕ້ອງການ exons ຫຼື CDSs ເພື່ອສ້າງ transcripts: process_stop"
ຄຸນສົມບັດ stop_codon ໄດ້ຖືກອະທິບາຍໄວ້ ແລະຍັງບໍ່ທັນມີ exons ຫຼື CDS ທີ່ກ່ຽວຂ້ອງກັບ
transcript_id ນັ້ນສະຄຣິບລົ້ມເຫລວ.
"FATAL: ລະຫັດທີ່ບໍ່ໄດ້ທົດສອບໃນ process_stop. ຕິດຕໍ່ຜູ້ຂຽນເພື່ອຂໍຄວາມຊ່ວຍເຫຼືອ."
script ແມ່ນຂຽນເພື່ອ infer a stop codon ໂດຍອີງໃສ່ການປະກົດຕົວຂອງ 3' UTR, ແຕ່ພວກເຮົາ
ບໍ່ມີຕົວຢ່າງ GTF ຂອງປະເພດນີ້ເມື່ອພວກເຮົາຂຽນລະຫັດ, ດັ່ງນັ້ນພວກເຮົາຂ້າຂະບວນການແທນທີ່ຈະ
ກ່ວາແລ່ນລະຫັດທີ່ບໍ່ໄດ້ທົດສອບ. ຕິດຕໍ່ຜູ້ຂຽນສໍາລັບການສະຫນັບສະຫນູນ.
"FATAL: ຊຸດຄຸນສົມບັດບໍ່ຖືກຕ້ອງ: process_stop"
ພວກເຮົາໄດ້ພະຍາຍາມພິຈາລະນາທຸກວິທີທີ່ເປັນໄປໄດ້ຂອງການ infering a stop codon ຫຼື infering aa non-
gene coding, ແລະພວກເຮົາຍັງລົ້ມເຫລວ. ການລວມກັນຂອງລັກສະນະ gene ຂອງທ່ານບໍ່ໄດ້ເຮັດໃຫ້
ຄວາມຮູ້ສຶກຂອງພວກເຮົາ. ທ່ານບໍ່ຄວນໄດ້ຮັບຄວາມຜິດພາດນີ້, ແລະຖ້າທ່ານເຮັດ, ພວກເຮົາກໍ່ຢາກເຫັນ
ໄຟລ໌ GTF ທີ່ສ້າງມັນ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນເພື່ອຂໍຄວາມຊ່ວຍເຫຼືອ.
"FATAL: ຊຸດຄຸນສົມບັດບໍ່ຖືກຕ້ອງ: process_exon_CDS_UTR"
ພວກເຮົາໄດ້ພະຍາຍາມພິຈາລະນາວິທີການທີ່ເປັນໄປໄດ້ທັງຫມົດຂອງ infering exons, CDSs ແລະ UTRs ແລະພວກເຮົາ
ລົ້ມເຫລວ. ການລວມກັນຂອງລັກສະນະທາງພັນທຸກໍາຂອງທ່ານບໍ່ມີຄວາມຫມາຍສໍາລັບພວກເຮົາ. ເຈົ້າແທ້
ຄວນຈະໄດ້ຮັບຄວາມຜິດພາດນີ້, ແລະຖ້າທ່ານເຮັດ, ພວກເຮົາກໍ່ຕ້ອງການເບິ່ງໄຟລ໌ GTF ນັ້ນ
ສ້າງມັນ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນເພື່ອຂໍຄວາມຊ່ວຍເຫຼືອ.
"FATAL: array ຕ້ອງການ: sort_features."
ຜູ້ໃຊ້ບໍ່ຄວນສາມາດເກີດຄວາມຜິດພາດນີ້. ມັນເກືອບແນ່ນອນຊີ້ໃຫ້ເຫັນ a
ບັກຊອບແວ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນ.
"FATAL: ບໍ່ສາມາດກໍານົດ strand ໃນ: sort_feature_types."
ນີ້ອາດຈະຊີ້ບອກວ່າໄຟລ໌ GTF ຂອງທ່ານບໍ່ໄດ້ຊີ້ໃຫ້ເຫັນເຖິງ strand ສໍາລັບລັກສະນະທີ່
ຕ້ອງການມັນ. ມັນຍັງອາດຈະຊີ້ໃຫ້ເຫັນເຖິງຂໍ້ຜິດພາດຂອງຊອບແວ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນ.
"FATAL: ຕ້ອງມີການອ້າງອິງ Hash: sort_feature_types."
ຜູ້ໃຊ້ບໍ່ຄວນສາມາດເກີດຄວາມຜິດພາດນີ້. ມັນເກືອບແນ່ນອນຊີ້ໃຫ້ເຫັນ a
ບັກຊອບແວ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນ.
"FATAL: ຄ່າບໍ່ຖືກຕ້ອງຖືກສົ່ງກັບ strand: strand."
ນີ້ອາດຈະຊີ້ບອກວ່າໄຟລ໌ GTF ຂອງທ່ານບໍ່ໄດ້ຊີ້ໃຫ້ເຫັນເຖິງ strand ສໍາລັບລັກສະນະທີ່
ຕ້ອງການມັນ. ພິຈາລະນາໃຊ້ພາລາມິເຕີ DEFAULT_STRAND ໃນໄຟລ໌ config. ມັນອາດຈະ
ຍັງຊີ້ໃຫ້ເຫັນຂໍ້ຜິດພາດຂອງຊອບແວ. ກະລຸນາຕິດຕໍ່ຜູ້ຂຽນ.
CONFIGURATION ແລະ ENVIRONMENT
ໄຟລ໌ການຕັ້ງຄ່າແມ່ນໃຫ້ກັບສະຄຣິບນີ້. script ຈະຊອກຫາວ່າ
ໄຟລ໌ການຕັ້ງຄ່າໃນ ./gtf2gff3.cfg, ~/gtf2gff3.cfg ຫຼື /etc/gtf2gff3.cfg ໃນຄໍາສັ່ງນັ້ນ.
ຖ້າໄຟລ໌ການຕັ້ງຄ່າບໍ່ພົບຢູ່ໃນຫນຶ່ງຂອງສະຖານທີ່ເຫຼົ່ານັ້ນແລະຫນຶ່ງບໍ່ໄດ້ຖືກສະຫນອງໃຫ້
ຜ່ານທຸງ --cfg ມັນຈະພະຍາຍາມເລືອກຄ່າເລີ່ມຕົ້ນທີ່ສຸພາບ, ແຕ່ເຈົ້າຄວນໃຫ້
ໄຟລ໌ການຕັ້ງຄ່າ. ເບິ່ງໄຟລ໌ການຕັ້ງຄ່າທີ່ສະໜອງໃຫ້ເອງເຊັ່ນດຽວກັນກັບ README
ທີ່ມາພ້ອມກັບຊຸດນີ້ສໍາລັບຮູບແບບແລະລາຍລະອຽດກ່ຽວກັບໄຟລ໌ການຕັ້ງຄ່າ.
ຂຶ້ນກັບ
ສະຄຣິບນີ້ຕ້ອງການແພັກເກັດ perl ຕໍ່ໄປນີ້ທີ່ມີຢູ່ຈາກ CPAN
(www.cpan.org).
Getopt::Long; ໃຊ້ Config::Std;
ຄວາມບໍ່ເຂົ້າກັນໄດ້
ບໍ່ມີລາຍງານ.
ໃຊ້ gtf2gff3p ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net