ນີ້ແມ່ນຄໍາສັ່ງ bp_bulk_load_gffp ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
bp_bulk_load_gff.pl - Bulk-load a Bio::DB::ຖານຂໍ້ມູນ GFF ຈາກໄຟລ໌ GFF.
ສະຫຼຸບສັງລວມ
%bp_bulk_load_gff.pl -d testdb dna1.fa dna2.fa features1.gff features2.gff ...
ລາຍລະອຽດ
script ນີ້ໂຫລດຖານຂໍ້ມູນ Bio::DB::GFF ທີ່ມີຄຸນສົມບັດທີ່ມີຢູ່ໃນບັນຊີລາຍຊື່ຂອງ GFF
ໄຟລ໌ ແລະ/ຫຼື ໄຟລ໌ລໍາດັບ FASTA. ທ່ານຕ້ອງໃຊ້ຕົວແປທີ່ແນ່ນອນຂອງ GFF ທີ່ອະທິບາຍໄວ້ໃນ
ຊີວະປະຫວັດ::DB::GFF. ຕົວເລືອກແຖວຄໍາສັ່ງຕ່າງໆຊ່ວຍໃຫ້ທ່ານສາມາດຄວບຄຸມວ່າຈະໂຫລດຖານຂໍ້ມູນໃດ
ແລະວ່າຈະອະນຸຍາດໃຫ້ຖານຂໍ້ມູນທີ່ມີຢູ່ແລ້ວຖືກຂຽນທັບຫຼືບໍ່.
ສະຄຣິບນີ້ແຕກຕ່າງຈາກ bp_load_gff.pl ໃນທີ່ມັນເປັນລະຫັດຍາກເພື່ອໃຊ້ MySQL ແລະບໍ່ສາມາດ
ປະຕິບັດການໂຫຼດເພີ່ມຂຶ້ນ. ເບິ່ງ bp_load_gff.pl ສໍາລັບຕົວໂຫຼດເພີ່ມຂຶ້ນທີ່ເຮັດວຽກກັບ
ຖານຂໍ້ມູນທັງໝົດທີ່ສະຫນັບສະຫນູນໂດຍ Bio::DB::GFF, ແລະ bp_fast_load_gff.pl ສໍາລັບຕົວໂຫລດ MySQL ທີ່
ຮອງຮັບການໂຫຼດເພີ່ມຂຶ້ນໄວ.
ຫມາຍເຫດ
ຖ້າຊື່ໄຟລ໌ຖືກມອບເປັນ "-" ຫຼັງຈາກນັ້ນການປ້ອນຂໍ້ມູນຖືກເອົາມາຈາກວັດສະດຸປ້ອນມາດຕະຖານ. ບີບອັດ
ໄຟລ໌ (.gz, .Z, .bz2) ຈະຖືກບີບອັດໂດຍອັດຕະໂນມັດ.
ໄຟລ໌ຮູບແບບ FASTA ຖືກແຍກອອກຈາກໄຟລ໌ GFF ໂດຍນາມສະກຸນຂອງໄຟລ໌. ໄຟລ໌
ລົງທ້າຍດ້ວຍ .fa, .fasta, .fast, .seq, .dna ແລະຕົວປ່ຽນຕົວພິມໃຫຍ່ຂອງພວກມັນຖືກປະຕິບັດເປັນ FASTA
ໄຟລ໌. ທຸກຢ່າງອື່ນຖືກປະຕິບັດເປັນໄຟລ໌ GFF. ຖ້າທ່ານຕ້ອງການໂຫລດໄຟລ໌ -fasta ຈາກ
STDIN, ຈາກນັ້ນໃຊ້ເສັ້ນຄໍາສັ່ງ -f swith ດ້ວຍການໂຕ້ຖຽງຂອງ '-', ຄືກັບໃນ
gunzip my_data.fa.gz | bp_fast_load_gff.pl -d ການທົດສອບ -f -
ລັກສະນະຂອງການໂຫຼດຈໍານວນຫລາຍຮຽກຮ້ອງໃຫ້ຖານຂໍ້ມູນຢູ່ໃນເຄື່ອງທ້ອງຖິ່ນແລະນັ້ນ
ຜູ້ໃຊ້ທີ່ລະບຸໄວ້ມີສິດ "ໄຟລ໌" ໃນການໂຫຼດຕາຕະລາງແລະມີຫ້ອງພຽງພໍ
/usr/tmp (ຫຼືອັນໃດກໍ່ຕາມທີ່ຖືກກໍານົດໂດຍຕົວແປສະພາບແວດລ້ອມ \$TMPDIR), ໃຫ້ຖື
ຕາຕະລາງຊົ່ວຄາວ.
ຂໍ້ມູນທ້ອງຖິ່ນໃນປັດຈຸບັນອາດຈະຖືກອັບໂຫລດໄປຍັງເຄື່ອງແມ່ຂ່າຍຫ່າງໄກສອກຫຼີກໂດຍຜ່ານທາງເລືອກ --local ກັບຖານຂໍ້ມູນ
ເຈົ້າພາບທີ່ລະບຸໄວ້ໃນ dsn, ເຊັ່ນ: dbi:mysql:test:db_host
ອະແດັບເຕີທີ່ໃຊ້ແມ່ນ dbi::mysqlopt. ໃນປັດຈຸບັນບໍ່ມີວິທີທີ່ຈະປ່ຽນສິ່ງນີ້.
ກ່ຽວກັບ maxfeature: ຄ່າເລີ່ມຕົ້ນແມ່ນ 100,000,000 ຖານ. ຖ້າຫາກວ່າທ່ານມີຄຸນສົມບັດທີ່ມີ
ໃກ້ກັບຫຼືຫຼາຍກວ່ານັ້ນ 100Mb ໃນຄວາມຍາວ, ຫຼັງຈາກນັ້ນ, ມູນຄ່າຂອງ maxfeature ຄວນຈະເພີ່ມຂຶ້ນ
ເຖິງ 1,000,000,000. ຄ່ານີ້ຕ້ອງເປັນຄ່າຂອງ 10.
ໃຫ້ສັງເກດວ່າຜູ້ໃຊ້ Windows ຕ້ອງໃຊ້ທາງເລືອກ --create.
ຖ້າບັນຊີລາຍຊື່ຂອງໄຟລ໌ GFF ຫຼື fasta ເກີນຂອບເຂດຈໍາກັດຂອງ kernel ສໍາລັບຈໍານວນສູງສຸດຂອງ
ການໂຕ້ຖຽງແຖວຄໍາສັ່ງ, ໃຊ້ຕົວເລືອກ --long_list /path/to/files.
ຄໍາສັ່ງ-ເສັ້ນ OPTIONS
ຕົວເລືອກແຖວຄໍາສັ່ງສາມາດຫຍໍ້ເປັນຕົວເລືອກຕົວອັກສອນດຽວ. ຕົວຢ່າງ -d ແທນ
--ຖານຂໍ້ມູນ.
--ຖານຂໍ້ມູນ ຊື່ຖານຂໍ້ມູນ (ຄ່າເລີ່ມຕົ້ນ dbi:mysql:test)
--adaptor ຊື່ອະແດບເຕີ (ຄ່າເລີ່ມຕົ້ນ mysql)
--create Reinitialize/ສ້າງຕາຕະລາງຂໍ້ມູນໂດຍບໍ່ຕ້ອງຖາມ
--user ຊື່ຜູ້ໃຊ້ເພື່ອເຂົ້າສູ່ລະບົບເປັນ
--fasta ໄຟລ໌ຫຼືໄດເລກະທໍລີທີ່ມີໄຟລ໌ fasta ທີ່ຈະໂຫລດ
--long_list ໄດເລກະທໍລີທີ່ມີຈໍານວນຈໍານວນຫລາຍຂອງ
ໄຟລ໌ GFF ແລະ/ຫຼື FASTA
--password ລະຫັດຜ່ານເພື່ອໃຊ້ສໍາລັບການພິສູດຢືນຢັນ
(ບໍ່ເຮັດວຽກກັບ Postgres, ລະຫັດຜ່ານຕ້ອງເປັນ
ສະຫນອງການໂຕ້ຕອບຫຼືຖືກປະໄວ້ຫວ່າງເປົ່າສໍາລັບ
ການກວດສອບຕົວຕົນ)
--maxbin ກໍານົດຄ່າຂອງຂະຫນາດຖັງສູງສຸດ
--local Flag ເພື່ອຊີ້ບອກວ່າແຫຼ່ງຂໍ້ມູນແມ່ນທ້ອງຖິ່ນ
--maxfeature ກໍານົດຄ່າຂອງຂະຫນາດຄຸນນະສົມບັດສູງສຸດ (ພະລັງງານຂອງ 10)
--group ບັນຊີລາຍຊື່ຂອງຫນຶ່ງຫຼືຫຼາຍຊື່ໂຄດຄໍາສັ່ງ (ເຄື່ອງຫມາຍຈຸດຫຼືທີ່ແຍກອອກ)
ເພື່ອໃຊ້ໃນການຈັດກຸ່ມຢູ່ໃນຖັນທີ 9.
--gff3_munge ເປີດໃຊ້ GFF3 ຊື່ munging (ເບິ່ງ Bio::DB::GFF)
--summary ສ້າງສະຖິຕິສະຫຼຸບສໍາລັບການແຕ້ມ histograms ການຄຸ້ມຄອງ.
ນີ້ສາມາດດໍາເນີນການຢູ່ໃນຖານຂໍ້ມູນທີ່ໂຫລດກ່ອນຫນ້ານີ້ຫຼືໃນລະຫວ່າງ
ໂຫຼດໄດ້.
-- ສະຖານທີ່ຊົ່ວຄາວຂອງໄດເລກະທໍລີ scratch ທີ່ຂຽນໄດ້
ໃຊ້ bp_bulk_load_gffp ອອນລາຍໂດຍໃຊ້ບໍລິການ onworks.net