ນີ້ແມ່ນຄໍາສັ່ງ abyss-pe ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
abyss-pe - assemble reads into contigs
ສະຫຼຸບສັງລວມ
abyss-pe [ທາງເລືອກ]... [ປາຣາມາເທີ=ມູນຄ່າ]... [MAKE_TARGET] ...
ລາຍລະອຽດ
ປະກອບການອ່ານຂອງໄຟລ໌ປ້ອນເຂົ້າໄປໃນ contigs. ການອ່ານອາດຈະຢູ່ໃນ FASTA, FASTQ,
qseq, ສົ່ງອອກ, SRA, SAM ຫຼືຮູບແບບ BAM ແລະອາດຈະຖືກບີບອັດດ້ວຍ gz, bz2 ຫຼື xz ແລະອາດຈະເປັນ
tarred.
abyss-pe ແມ່ນ script Makefile. ທາງເລືອກໃດໆຂອງການຜະລິດອາດຈະຖືກນໍາໃຊ້ກັບ abyss-pe.
ຕົວກໍານົດການ of abyss-pe
ຊື່, JOB_NAME
ຊື່ຂອງສະພາແຫ່ງນີ້. scaffolds ຜົນໄດ້ຮັບຈະຖືກເກັບໄວ້ໃນ
${name}-scaffolds.fa.
in ໄຟລ໌ປ້ອນຂໍ້ມູນ. ໃຊ້ຕົວແປນີ້ໃນເວລາທີ່ປະກອບຂໍ້ມູນຈາກຫ້ອງສະຫມຸດດຽວ.
lib ບັນຊີລາຍຊື່ທີ່ອ້າງອີງຂອງຊື່ຫ້ອງສະໝຸດທີ່ຂັ້ນດ້ວຍຊ່ອງຫວ່າງທີ່ແຍກກັນເປັນຄູ່ທ້າຍ. ໃຊ້ຕົວແປນີ້
ໃນເວລາທີ່ການປະກອບຂໍ້ມູນຈາກຫ້ອງສະຫມຸດທີ່ສິ້ນຄູ່ຫຼາຍ. ສໍາລັບແຕ່ລະຊື່ຫ້ອງສະຫມຸດໃນ
lib, ຜູ້ໃຊ້ຕ້ອງກໍານົດຕົວແປໃນເສັ້ນຄໍາສັ່ງທີ່ມີຊື່ດຽວກັນ, ເຊິ່ງ
ຊີ້ໃຫ້ເຫັນໄຟລ໌ທີ່ອ່ານສໍາລັບຫ້ອງສະຫມຸດນັ້ນ. ເບິ່ງ ຕົວຢ່າງ ຂ້າງລຸ່ມນີ້ສໍາລັບສີມັງ
ຕົວຢ່າງຂອງການນໍາໃຊ້.
pe ບັນຊີລາຍຊື່ຂອງຫ້ອງສະຫມຸດຄູ່ທ້າຍທີ່ຈະຖືກນໍາໃຊ້ພຽງແຕ່ສໍາລັບການລວມ unitigs ເຂົ້າໄປໃນ
contigs ແລະຈະບໍ່ປະກອບສ່ວນເຂົ້າໃນລໍາດັບຄວາມເຫັນດີນໍາ.
mp ບັນຊີລາຍຊື່ຂອງຫ້ອງສະຫມຸດຄູ່ຄູ່ທີ່ຈະຖືກນໍາໃຊ້ສໍາລັບການ scaffolding. ຫ້ອງສະໝຸດຄູ່
ບໍ່ໄດ້ປະກອບສ່ວນເຂົ້າໃນລໍາດັບຄວາມເຫັນດີນໍາ.
ຍາວ ບັນຊີລາຍຊື່ຂອງຫ້ອງສະຫມຸດລໍາດັບຍາວທີ່ຈະຖືກນໍາໃຊ້ສໍາລັບການ rescaffolding. ລໍາດັບຍາວ
ຫ້ອງສະຫມຸດບໍ່ໄດ້ປະກອບສ່ວນເຂົ້າໃນລໍາດັບຄວາມເຫັນດີນໍາ.
se ໄຟລ໌ທີ່ປະກອບດ້ວຍການອ່ານຈົບດຽວ
a ຈຳນວນສູງສຸດຂອງສາຂາຂອງຟອງ [2]
b ຄວາມຍາວສູງສຸດຂອງຟອງ (bp) [10000]
c ຄ່າສະເລ່ຍຕໍ່າສຸດຂອງການຄຸ້ມຄອງ k-mer ຂອງ unitig [sqrt(ປານກາງ)]
d ຄວາມຜິດພາດທີ່ອະນຸຍາດຂອງການຄາດຄະເນໄລຍະຫ່າງ (bp) [6]
e ການເຊາະເຈື່ອນຕໍາ່ສຸດທີ່ k-mer coverage [sqrt(ປານກາງ)]
E ການເຊາະເຈື່ອນຕໍາ່ສຸດທີ່ k-mer ກວມເອົາຕໍ່ສາຍ [1]
j ຈໍານວນຂອງກະທູ້ [2]
k ຂະໜາດຂອງຄູ່ k-mer (ເມື່ອ K ບໍ່ໄດ້ຕັ້ງ) ຫຼືຂະໜາດຂອງຄູ່ k-mer (ເມື່ອ K ຖືກຕັ້ງ)
K ຂະໜາດຂອງ k-mer ດຽວໃນຄູ່ k-mer (bp)
l ຄວາມຍາວການຈັດຕໍາ່ສຸດທີ່ຂອງການອ່ານ (bp) [k]
m ການທັບຊ້ອນກັນຕໍາ່ສຸດຂອງສອງ unitig (bp) [30]
n ຈໍານວນຕໍາ່ສຸດທີ່ຂອງຄູ່ທີ່ຕ້ອງການສໍາລັບການກໍ່ສ້າງ contigs [10]
N ຈໍານວນຄູ່ຕໍາ່ສຸດທີ່ຕ້ອງການສໍາລັບການກໍ່ສ້າງ scaffolds [n]
p ຕົວຕົນຂອງລຳດັບຂັ້ນຕ່ຳຂອງຟອງ [0.9]
q ຄຸນນະພາບຂັ້ນຕ່ໍາສຸດໃນເວລາທີ່ການຕັດ [3]
ຕັດພື້ນຖານຈາກທ້າຍອ່ານທີ່ມີຄຸນນະພາບໜ້ອຍກວ່າ q.
Q ຄຸນນະພາບຕໍາ່ສຸດທີ່ [0]
ໃສ່ໜ້າກາກຖານທັງໝົດຂອງການອ່ານທີ່ມີຄຸນນະພາບຕ່ຳກວ່າ Q ເປັນ `N'.
s ຂະຫນາດ unitig ຕໍາ່ສຸດທີ່ຕ້ອງການສໍາລັບການກໍ່ສ້າງ contigs (bp) [200]
ຄວາມຍາວຂອງແກ່ນຄວນຈະມີຢ່າງຫນ້ອຍສອງເທົ່າຂອງຄ່າ k. ຖ້າມີລໍາດັບຫຼາຍ
ປະກອບຫຼາຍກ່ວາຂະຫນາດ genome ຄາດວ່າຈະ, ພະຍາຍາມເພີ່ມຂຶ້ນ s.
S ຂະຫນາດ contig ຕໍາ່ສຸດທີ່ຕ້ອງການສໍາລັບການກໍ່ສ້າງ scaffolds (bp) [s]
SS SS=--SS ເພື່ອປະກອບໃນຮູບແບບສະເພາະສາຍ
ຮຽກຮ້ອງໃຫ້ຫ້ອງສະໝຸດທັງໝົດເປັນຫ້ອງສະໝຸດ RNA-Seq ສະເພາະ. ສົມມຸດວ່າ
ການອ່ານຄັ້ງທໍາອິດໃນຄູ່ທີ່ອ່ານແມ່ນ reveresed WRT transcripts sequenced.
t ຂະໜາດປາຍຂັ້ນຕ່ຳ (bp) [2k]
v v=-v ເພື່ອເປີດໃຊ້ການບັນທຶກ verbose
np, NSLOTS
ຈໍານວນຂອງຂະບວນການປະກອບ MPI
ໄພຣຸນ ເສັ້ນທາງໄປສູ່ mpirun
ແນວທາງ
ໂປລແກລມທີ່ຈະໃຊ້ເພື່ອຈັດລໍາດັບການອ່ານກັບ contigs [ແຜນທີ່].
ຄ່າທີ່ອະນຸຍາດແມ່ນ: ແຜນທີ່, kaligner, bwa, bwasw, bowtie, bowtie2, dida. ເບິ່ງ
DIDA ພາກສ່ວນຂ້າງລຸ່ມນີ້ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບທາງເລືອກ dida.
cs ປ່ຽນ contigs ຊ່ອງສີເປັນ nucleotide contigs ຫຼັງຈາກການປະກອບ
ທາງເລືອກໃນການ of ເຮັດໃຫ້
-n, -- ແລ່ນແຫ້ງ
ພິມຄໍາສັ່ງທີ່ຈະປະຕິບັດ, ແຕ່ບໍ່ປະຕິບັດໃຫ້ເຂົາເຈົ້າ.
ເຮັດໃຫ້ ເປົ້າຫມາຍ ສໍາລັບການ abyss-pe
Default
ເທົ່າກັບ 'ສະຖິຕິ scaffolds-dot'.
unitigs
ປະກອບ unitigs.
unitigs-dot
ເອົາເສັ້ນສະແດງການທັບຊ້ອນຂອງ unitig.
pe-sam ແຜນທີ່ທີ່ຈັບຄູ່-end ອ່ານໄປຫາ unitigs ແລະສົ່ງອອກໄຟລ໌ SAM. ໄຟລ໌ SAM ເທົ່ານັ້ນ
ປະກອບມີການອ່ານແຜນທີ່ກັບ contigs ທີ່ແຕກຕ່າງກັນ, ແລະ ID ອ່ານ, ລໍາດັບແລະຄຸນນະພາບ
ສະຕຣິງຈະຖືກແທນທີ່ດ້ວຍຕົວອັກສອນ '*'.
pe-bam ແຜນທີ່ທີ່ຈັບຄູ່-end ອ່ານໄປຫາ unitigs ແລະສົ່ງໄຟລ໌ BAM. ໄຟລ໌ BAM ເທົ່ານັ້ນ
ປະກອບມີການອ່ານແຜນທີ່ກັບ contigs ທີ່ແຕກຕ່າງກັນ, ແລະ ID ອ່ານ, ລໍາດັບແລະຄຸນນະພາບ
ສະຕຣິງຈະຖືກແທນທີ່ດ້ວຍຕົວອັກສອນ '*'.
pe-index
ສ້າງດັດຊະນີຂອງ unitigs ທີ່ໃຊ້ໂດຍ abyss-map.
ຕິດຕໍ່ກັນ
ປະກອບ contigs.
contigs-dot
ເອົາເສັ້ນສະແດງການທັບຊ້ອນກັນຂອງ contig.
mp-sam Map mate-pair ອ່ານໄປຫາ contigs ແລະສົ່ງໄຟລ໌ SAM. ໄຟລ໌ SAM ເທົ່ານັ້ນ
ປະກອບມີການອ່ານແຜນທີ່ກັບ contigs ທີ່ແຕກຕ່າງກັນ, ແລະ ID ອ່ານ, ລໍາດັບແລະຄຸນນະພາບ
ສະຕຣິງຈະຖືກແທນທີ່ດ້ວຍຕົວອັກສອນ '*'.
mp-bam Map mate-pair ອ່ານໄປຫາ contigs ແລະສົ່ງໄຟລ໌ BAM. ໄຟລ໌ BAM ເທົ່ານັ້ນ
ປະກອບມີການອ່ານແຜນທີ່ກັບ contigs ທີ່ແຕກຕ່າງກັນ, ແລະ ID ອ່ານ, ລໍາດັບແລະຄຸນນະພາບ
ສະຕຣິງຈະຖືກແທນທີ່ດ້ວຍຕົວອັກສອນ '*'.
mp-index
ສ້າງດັດຊະນີຂອງ contigs ທີ່ໃຊ້ໂດຍ abyss-map.
scaffolds
ປະກອບ scaffolds.
scaffolds-dot
ເອົາເສັ້ນສະແດງການທັບຊ້ອນກັນຂອງ scaffold.
scraftigs
ແຍກ scaffolds ແລະສ້າງໄຟລ໌ AGP.
scaffs ຍາວ
Rescaffold ໂດຍໃຊ້ RNA-Seq contigs ປະກອບ.
ຍາວ scaffs-dot
ສົ່ງອອກເສັ້ນສະແດງ RNA ທັບຊ້ອນກັນ.
ສະຖິຕິ ສະແດງສະຖິຕິການຕິດຂັດຂອງອຸປະກອນ.
ເຮັດຄວາມສະອາດ ເອົາໄຟລ໌ກາງ.
ສະບັບພາສາ
ສະແດງສະບັບຂອງ abyss-pe.
ສະບັບ
ສະແດງເວີຊັນຂອງໂປຣແກຣມທັງໝົດທີ່ໃຊ້ໂດຍ abyss-pe.
ຊ່ວຍເຫຼືອ ສະແດງຂໍ້ຄວາມທີ່ເປັນປະໂຫຍດ.
DIDA
ABySS ສະຫນັບສະຫນູນການນໍາໃຊ້ DIDA (Distributed Indexing Dispatched Alignment), ເປັນ MPI-based
ຂອບການຈັດລຽງຂອງການຈັດລຽງລຳດັບຂອງຄອມພີວເຕີໃນທົ່ວຫຼາຍເຄື່ອງ. ການນໍາໃຊ້
DIDA ກັບ ABySS, ທໍາອິດດາວນ໌ໂຫລດແລະຕິດຕັ້ງ DIDA ຈາກ
http://www.bcgsc.ca/platform/bioinfo/software/dida, ຈາກນັ້ນລະບຸ `dida` ເປັນຄ່າຂອງ
ໄດ້ ແນວທາງ ພາລາມິເຕີເຖິງ abyss-pe.
DIDA ທີ່ກ່ຽວຂ້ອງກັບ abyss-pe ພາລາມິເຕີ
DIDA_MPIRUN
ຄໍາສັ່ງ `mpirun` ໃຊ້ເພື່ອແລ່ນວຽກ DIDA.
DIDA_RUN_OPTIONS
ຕົວເລືອກເວລາແລ່ນ ເຊັ່ນ: ຈໍານວນກະທູ້ຕໍ່ອັນດັບ MPI ແລະຄ່າຂອງສະພາບແວດລ້ອມ
ຕົວແປ (ເຊັ່ນ: PATH, LD_LIBRARY_PATH). ແລ່ນ 'abyss-dida --help' ສໍາລັບບັນຊີລາຍຊື່ຂອງ
ທາງເລືອກທີ່ມີຢູ່.
DIDA_OPTIONS
ທາງເລືອກທີ່ຜ່ານໂດຍກົງກັບ DIDA binary. ສໍາລັບຕົວຢ່າງ, ນີ້ສາມາດຖືກນໍາໃຊ້
ເພື່ອຄວບຄຸມຂອບເຂດຄວາມຍາວການຈັດຕໍາ່ສຸດທີ່. ແລ່ນ `dida-wrapper --help` ສໍາລັບ a
ບັນຊີລາຍຊື່ຂອງທາງເລືອກທີ່ມີຢູ່.
ໂຄມໄຟ ຄວາມເຂົ້າກັນໄດ້
ເນື່ອງຈາກການນໍາໃຊ້ multi-threading, DIDA ໄດ້ຮູ້ຈັກບັນຫາ deadlocking ກັບ OpenMPI. ການນໍາໃຊ້
ຫໍສະໝຸດ MPICH MPI ຖືກແນະນຳຢ່າງແຂງແຮງເມື່ອແລ່ນການປະກອບກັບ DIDA. ການທົດສອບ
ຖືກເຮັດດ້ວຍ MPICH 3.1.3, ລວບລວມດ້ວຍ --enable-threads=funneled.
EXAMPLE
ການຕັ້ງຄ່າ runtime ທີ່ແນະນໍາສໍາລັບ DIDA ແມ່ນ 1 MPI ອັນດັບຕໍ່ເຄື່ອງແລະ 1 thread ຕໍ່
ຫຼັກ CPU. ຕົວຢ່າງ, ເພື່ອດໍາເນີນການປະກອບໃນທົ່ວ 3 ກຸ່ມກຸ່ມທີ່ມີ 12 cores ແຕ່ລະຄົນ, ເຮັດ:
abyss-pe k=64 name=ecoli in='reads1.fa reads2.fa' aligner=dida
DIDA_RUN_OPTIONS='-j12' DIDA_MPIRUN='mpirun -np 3 -ppn 1 -bind-to board'
ຕົວຢ່າງນີ້ໃຊ້ຕົວເລືອກແຖວຄໍາສັ່ງ MPICH ສໍາລັບ `mpirun`. ນີ້, `-np 3` ຊີ້ໃຫ້ເຫັນ
ຈໍານວນອັນດັບ MPI, `-ppn 1` ຊີ້ໃຫ້ເຫັນຈໍານວນອັນດັບ MPI ຕໍ່ "node", ແລະ.
`-bind-to board` ກໍານົດ "node" ເປັນເມນບອດ (ເຊັ່ນເຄື່ອງເຕັມ).
ENVIRONMENT ຄວາມຮັບຜິດຊອບ
ພາລາມິເຕີໃດໆທີ່ອາດຈະຖືກກໍານົດໄວ້ໃນເສັ້ນຄໍາສັ່ງອາດຈະຖືກລະບຸໄວ້ໃນ an
environment variable
PATH ຕ້ອງມີໄດເລກະທໍລີທີ່ ABySS executables ຖືກຕິດຕັ້ງ. ໃຊ້ `abyss-
pe versions` ເພື່ອກວດເບິ່ງວ່າ PATH ຖືກຕັ້ງຄ່າຢ່າງຖືກຕ້ອງ.
TMPDIR ລະບຸໄດເລກະທໍລີທີ່ຈະໃຊ້ສໍາລັບໄຟລ໌ຊົ່ວຄາວ
Scheduler ການເຊື່ອມໂຍງ
ABySS ປະສົມປະສານໄດ້ດີກັບຕົວກໍານົດເວລາວຽກຂອງກຸ່ມ, ເຊັ່ນ:
* SGE (Sun Grid Engine)
* ລະບົບ Batch Portable (PBS)
* Load Sharing Facility (LSF)
* IBM LoadLeveler
ຕົວແປສະພາບແວດລ້ອມ SGE JOB_NAME, SGE_TASK_ID ແລະ NSLOTS ອາດຈະຖືກໃຊ້ເພື່ອລະບຸ
ຊື່ພາລາມິເຕີ, k ແລະ np, ຕາມລໍາດັບ, ແລະຄ້າຍຄືກັນກັບຕົວກໍານົດເວລາອື່ນໆ.
ຕົວຢ່າງ
ຫນຶ່ງ ຄູ່ທ້າຍ ຫ້ອງສະຫມຸດ
abyss-pe k=64 name=ecoli in='reads1.fa ອ່ານ2.fa'
ຫຼາຍ ຄູ່ທ້າຍ ຫ້ອງສະຫມຸດ
abyss-pe k=64 ຊື່=ecoli lib='lib1 lib2' \
lib1='lib1_1.fa lib1_2.fa' lib2='lib2_1.fa lib2_2.fa' \
se='se1.fa se2.fa'
ຄູ່ ແລະ ຄູ່ຮັກ ຫ້ອງສະຫມຸດ
abyss-pe k=64 name=ecoli lib='pe1 pe2' mp='mp1 mp2' \
pe1='pe1_1.fa pe1_2.fa' pe2='pe2_1.fa pe2_2.fa' \
mp1='mp1_1.fa mp1_2.fa' mp2='mp2_1.fa mp2_2.fa' \
se='se1.fa se2.fa'
ລວມທັງ RNA-Seq assemblies
abyss-pe k=64 ຊື່=ecoli lib=pe1 mp=mp1 long=long1 \
pe1='pe1_1.fa pe1_2.fa' mp1='mp1_1.fa mp1_2.fa' \
long1=long1.fa
ໂຄມໄຟ
abyss-pe np=8 k=64 name=ecoli in='reads1.fa reads2.fa'
SGE
qsub -N ecoli -t 64 -pe openmpi 8 \
abyss-pe n=10 in='reads1.fa reads2.fa'
ໃຊ້ abyss-pe ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net