Ini ialah arahan Ray yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
Ray - pasang genom secara selari menggunakan antara muka penghantaran mesej
SINOPSIS
mpiexec -n NUMBER_OF_RANKS Ray -k KMERLENGTH -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o ujian
mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # dengan arahan dalam fail
HURAIAN:
Penghimpun genom Ray dibina di atas RayPlatform, berasaskan pemalam generik
enjin pengiraan teragih dan selari yang menggunakan antara muka penghantaran mesej untuk
menghantar mesej.
Ray mensasarkan beberapa aplikasi:
- himpunan genom de novo (dengan vanila Ray) - himpunan meta-genom de novo (dengan
Ray Meta) - perhimpunan transkrip de novo (berfungsi, tetapi tidak banyak diuji) -
kuantifikasi kelimpahan contig - kuantifikasi konsortia mikrobiom
ahli (dengan Komuniti Ray) - kuantifikasi ungkapan transkrip - taksonomi
pemprofilan sampel (dengan Komuniti Ray) - pemprofilan ontologi gen sampel
(dengan Ray Ontologies)
-membantu
Memaparkan halaman bantuan ini.
-turun
Memaparkan versi Ray dan pilihan kompilasi.
Menggunakan fail konfigurasi
Ray boleh dilancarkan dengan mpiexec -n 16 Ray Ray.conf Fail konfigurasi boleh
sertakan ulasan (bermula dengan #).
Panjang K-mer
-k kmerLength
Memilih panjang k-mers. Nilai lalai ialah 21. Ia mesti ganjil kerana
bucu pelengkap songsang disimpan bersama. Panjang maksimum ditakrifkan pada
kompilasi oleh MAXKMERLENGTH K-mers yang lebih besar menggunakan lebih banyak memori.
Input
-p leftSequenceFile rightSequenceFile [averageOuterDistance standardDeviation]
Menyediakan dua fail yang mengandungi bacaan akhir berpasangan. purataOuterDistance dan
standardDeviation dikira secara automatik jika tidak disediakan.
-i interleavedSequenceFile [averageOuterDistance standardDeviation]
Menyediakan satu fail yang mengandungi bacaan berganding-hujung berjalin. purataOuterDistance
dan sisihan piawai dikira secara automatik jika tidak disediakan.
-s sequenceFile
Menyediakan fail yang mengandungi bacaan satu hujung.
Output
-o outputDirektori
Menentukan direktori untuk fail yang dikeluarkan. Lalai ialah RayOutput
Pilihan pemasangan (lalai berfungsi dengan baik)
-lumpuhkan-kitar semula
Melumpuhkan kitar semula bacaan semasa bacaan pemasangan akan dibebaskan dalam 3 kes: 1.
jarak tidak sepadan untuk sepasang 2. yang dibaca belum bertemu pasangannya 3. yang
populasi perpustakaan menunjukkan peletakan yang salah lihat Kekangan lintasan ulangan
dengan urutan berpasangan. Sebastien Boisvert, Elenie Godzaridis, Francois Laviolette
& Jacques Corbeil. Bengkel Satelit RECOMB Tahunan Pertama mengenai Selari Secara Besar-besaran
Sequencing, 26-27 Mac 2011, Vancouver, BC, Kanada.
-lumpuhkan-perancah
Melumpuhkan perancah.
-panjang-contig-minimum minimumContigLength
Mengubah panjang contig minimum, lalai ialah 100 nukleotida
-ruang-warna
Berjalan dalam ruang warna Memerlukan fail csfasta. Diaktifkan secara automatik jika fail csfasta
disediakan.
-gunakan-penutup-benih-maksimum maksimumSeedCoverageDepth
Abaikan mana-mana benih dengan kedalaman liputan di atas ambang ini. Lalainya ialah
4294967295.
-gunakan-minimum-seed-liputan minimumSeedCoverageDepth
Menetapkan kedalaman litupan benih minimum. Mana-mana laluan dengan kedalaman liputan lebih rendah daripada
ini akan dibuang. Lalai ialah 0.
Enjin storan teragih (semua nilai ini adalah untuk setiap pangkat MPI)
-bit-penapis mekar bit
Menetapkan bilangan bit untuk penapis Bloom Lalai ialah 268435456 bit, 0 bit
melumpuhkan penapis Bloom.
-hash-table-baldi Baldi
Menetapkan bilangan awal baldi. Mesti kuasa 2! Nilai asal:
268435456
-hash-table-baldi-setiap-kumpulan Baldi
Menetapkan bilangan baldi setiap kumpulan untuk storan jarang Nilai lalai: 64, Mestilah
antara >=1 dan <= 64
-hash-table-load-factor-threshold ambang
Menetapkan ambang faktor beban untuk saiz semula masa nyata Nilai lalai: 0.75, mestilah
>= 0.5 dan < 1
-hash-table-verbosity
Mengaktifkan verbositi untuk enjin storan teragih
Kelimpahan biologi
-search carianDirektori
Menyediakan direktori yang mengandungi fail fasta untuk dicari dalam graf de Bruijn.
Kelimpahan biologi akan ditulis kepada RayOutput/BiologicalAbundances See
Dokumentasi/BiologicalAbundances.txt
-satu-warna-setiap-fail
Menetapkan satu warna bagi setiap fail dan bukannya satu warna bagi setiap jujukan. Secara lalai, setiap urutan masuk
setiap fail mempunyai warna yang berbeza. Untuk fail dengan bilangan jujukan yang banyak, gunakan
satu warna bagi setiap fail mungkin lebih cekap.
Pemprofilan taksonomi dengan graf de Bruijn berwarna
-dengan-taksonomi Genome-to-Taxon.tsv TreeOfLife-Edges.tsv Taxon-Names.tsv
Menyediakan taksonomi. Mengira dan menulis profil taksonomi terperinci. Lihat
Dokumentasi/Taksonomi.txt untuk butiran.
-gen-ontologi OntologyTerms.txt
Anotasi.txt
Menyediakan ontologi dan anotasi. OntologyTerms.txt diambil daripada
http://geneontology.org Annotations.txt ialah fail 2 lajur (EMBL_CDS pemegang &
pengecam ontologi gen) Lihat Dokumentasi/GeneOntology.txt
Keluaran lain
-membolehkan-kejiranan
Mengira kejiranan contig dalam fail Output graf de Bruijn:
RayOutput/NeighbourhoodRelations.txt
-amos
Menulis fail AMOS yang dipanggil RayOutput/AMOS.afg Fail AMOS mengandungi kedudukan baca
pada contigs. Boleh dibuka dengan perisian dengan antara muka pengguna grafik.
-tulis-kmers
Menulis graf k-mer kepada RayOutput/kmers.txt Fail yang terhasil tidak digunakan oleh
Ray. Fail yang terhasil sangat besar.
-tulis-baca-penanda
Menulis penanda baca ke cakera.
-tulis-benih
Menulis urutan DNA benih kepada RayOutput/Rank .RaySeeds.fasta
-tulis-sambungan
Menulis urutan DNA sambungan kepada RayOutput/Rank .RayExtensions.fasta
-tulis-contig-paths
Menulis laluan contig dengan nilai liputan ke RayOutput/Rank .RayContigPaths.txt
-tulis-penanda-ringkasan
Menulis statistik penanda.
Penggunaan memori
-tunjuk-memori-penggunaan
Menunjukkan penggunaan memori. Data diambil daripada / proc pada GNU/Linux Memerlukan __linux__
-tunjuk-memori-peruntukan
Menunjukkan peristiwa peruntukan memori
Algoritma verbositi
-tunjuk-lanjutan-pilihan
Menunjukkan pilihan yang dibuat (dengan pilihan lain) semasa sambungan.
-konteks-penamat-tunjuk
Menunjukkan konteks penamat bagi setiap sambungan. Menunjukkan kanak-kanak bucu di mana
sambungan terlalu sukar.
-tunjukkan-jarak-ringkasan
Menunjukkan ringkasan jarak luar yang digunakan untuk laluan sambungan.
-tunjuk-konsensus
Menunjukkan konsensus apabila pilihan dilakukan.
Checkpointing
-tulis-titik semak checkpointDirektori
Tulis fail pusat pemeriksaan
-baca-tempat pemeriksaan checkpointDirektori
Baca fail pusat pemeriksaan
-baca-tulis-titik semak checkpointDirektori
Baca dan tulis fail pusat pemeriksaan
Penghalaan mesej untuk sejumlah besar teras
-laluan-mesej
Mendayakan penghala mesej Ray. Dilumpuhkan secara lalai. Mesej akan dihalakan
sewajarnya supaya mana-mana pangkat boleh berhubung terus dengan beberapa orang lain sahaja.
Tanpa -laluan-mesej, mana-mana pangkat boleh berhubung terus dengan mana-mana pangkat lain.
Fail yang dijana: Routing/Connections.txt, Routing/Routes.txt dan
Routing/RelayEvents.txt dan Routing/Summary.txt
-jenis sambungan jenis
Menetapkan jenis sambungan untuk laluan. Nilai yang diterima ialah debruijn, hypercube,
polytope, kumpulan, rawak, kautz dan lengkap. Lalai ialah debruijn.
debruijn: graf de Bruijn penuh abjad dan diameter hiperkubus yang diberikan: a
hypercube, abjad ialah {0,1} dan bucu ialah kuasa 2 politop: cembung
politop biasa, abjad ialah {0,1,...,B-1} dan bucu ialah kuasa kumpulan B:
model bodoh di mana seorang wakil setiap kumpulan boleh berkomunikasi dengan orang luar
rawak: Erdos-Renyi model kautz: graf de Kautz penuh, yang merupakan subgraf de
Graf Bruijn lengkap: graf penuh dengan semua kemungkinan sambungan
Dengan jenis debruijn, bilangan pangkat mestilah kuasa sesuatu.
Contoh: 256 = 16*16, 512=8*8*8, 49=7*7, dan seterusnya. Jika tidak, jangan gunakan debruijn
routing tapi guna satu lagi Dengan jenis kautz, bilangan pangkat n mestilah
n=(k+1)*k^(d-1) untuk beberapa k dan d
-peralihan-graf-darjah ijazah
Menentukan darjah keluar untuk graf penghalaan. Lihat Documentation/Routing.txt
Ujian perkakasan
-ujian-rangkaian-sahaja
Menguji rangkaian dan kembali.
-tulis-rangkaian-uji-data-mentah
Menulis satu fail tambahan setiap pangkat yang memperincikan ujian rangkaian.
-pertukaran NumberOfExchanges
Menetapkan bilangan pertukaran
-lumpuhkan-rangkaian-ujian
Melangkau ujian rangkaian.
Debugging
-sahkan-mesej-integriti
Menyemak kebolehpercayaan data mesej untuk sebarang mesej yang tidak kosong. tambah '-D CONFIG_SSE_4_2'
dalam Makefile untuk menggunakan arahan perkakasan (SSE 4.2)
-run-profiler
Menjalankan profiler semasa kod berjalan. Secara lalai, hanya tunjukkan amaran butiran.
Menjalankan profiler meningkatkan masa berjalan.
-dengan-perincian-profil
Menunjukkan bilangan mesej yang dihantar dan diterima dalam setiap kaedah semasa dalam setiap masa
hirisan (zaman). Keperluan -run-profiler.
-tunjuk-acara-komunikasi
Menunjukkan semua mesej yang dihantar dan diterima.
-tunjuk-baca-peletakan
Menunjukkan peletakan baca dalam graf semasa sambungan.
-debug-buih
Nyahpepijat kod gelembung. Buih boleh disebabkan oleh tapak heterozigot atau ralat penjujukan
atau peristiwa lain (tidak diketahui).
-debug-benih
Nyahpepijat kod benih. Benih ialah laluan dalam graf yang berkemungkinan unik.
-debug-fusions
Nyahpepijat kod gabungan.
-debug-scaffolder
Nyahpepijat perancah.
FILES
Fail input
Nota: format fail ditentukan dengan sambungan fail.
.fasta .fasta.gz (memerlukan HAVE_LIBZ=y semasa kompilasi) .fasta.bz2 (memerlukan HAVE_LIBBZ2=y
pada penyusunan) .fastq .fastq.gz (perlu HAVE_LIBZ=y pada penyusunan) .fastq.bz2
(memerlukan HAVE_LIBBZ2=y pada kompilasi) .sff (bacaan berpasangan mesti diekstrak secara manual)
.csfasta (bacaan ruang warna)
Fail yang dikeluarkan
Perancah
RayOutput/Scaffolds.fasta
Urutan perancah dalam format FASTA
RayOutput/ScaffoldComponents.txt
Komponen setiap perancah
RayOutput/ScaffoldLengths.txt
Panjang setiap perancah
RayOutput/ScaffoldLinks.txt
Pautan perancah
Contigs
RayOutput/Contigs.fasta
Urutan bersambung dalam format FASTA
RayOutput/ContigLengths.txt
Panjang jujukan bersebelahan
Ringkasan
RayOutput/OutputNumbers.txt
Jumlah keseluruhan untuk perhimpunan
graf de Bruijn
RayOutput/CoverageDistribution.txt
Pengagihan nilai liputan
RayOutput/CoverageDistributionAnalysis.txt
Analisis pengagihan liputan
RayOutput/degreeDistribution.txt
Pengagihan darjah masuk dan keluar
RayOutput/kmers.txt
graf k-mer, pilihan yang diperlukan: -tulis-kmers
Fail yang terhasil tidak digunakan oleh Ray. Fail yang terhasil sangat besar.
Langkah pemasangan
RayOutput/SeedLengthDistribution.txt
Taburan panjang benih
RayOutput/Pangkat .OptimalReadMarkers.txt
Baca penanda.
RayOutput/Pangkat .RaySeeds.fasta
Urutan DNA benih, pilihan yang diperlukan: -tulis-benih
RayOutput/Pangkat .RayExtensions.fasta
Urutan DNA lanjutan, pilihan yang diperlukan: -tulis-sambungan
RayOutput/Pangkat .RayContigPaths.txt
Laluan contig dengan nilai liputan, pilihan yang diperlukan: -tulis-contig-paths
Bacaan berpasangan
RayOutput/LibraryStatistics.txt
Anggaran jarak luar untuk bacaan berpasangan
RayOutput/Perpustakaan .txt
Kekerapan untuk jarak luar yang diperhatikan (saiz sisipan + panjang baca)
Partition
RayOutput/NumberOfSequences.txt
Bilangan bacaan dalam setiap fail
RayOutput/SequencePartition.txt
Pembahagian urutan
perisian Ray
RayOutput/RayVersion.txt
Versi Ray
RayOutput/RayCommand.txt
Perintah yang sama yang diberikan
AMOS
RayOutput/AMOS.afg
Perwakilan perhimpunan dalam format AMOS, pilihan yang diperlukan: -amos
Komunikasi
RayOutput/MessagePassingInterface.txt
Bilangan mesej yang dihantar
RayOutput/NetworkTest.txt
Latensi dalam mikrosaat
RayOutput/Pangkat NetworkTestData.txt
Data mentah ujian rangkaian
DOKUMENTASI
- mpiexec -n 1 Ray -membantu|less (sentiasa terkini) - Halaman bantuan ini (sentiasa
terkini) - Direktori Dokumentasi/ - Manual (Format Dokumen Mudah Alih):
InstructionManual.tex (dalam Dokumentasi) - Arkib senarai mel:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-users
AUTHOR
Ditulis oleh Sebastien Boisvert.
MELAPORKAN PEPIJAT
Laporkan pepijat kepada [e-mel dilindungi] Laman utama:
<http://denovoassembler.sourceforge.net/>
HAKCIPTA
Program ini adalah perisian percuma: anda boleh mengedarkannya semula dan/atau mengubah suainya di bawah
syarat-syarat Lesen Awam Umum GNU seperti yang diterbitkan oleh Perisian Percuma
Yayasan, versi 3 Lesen.
Program ini diedarkan dengan harapan ianya bermanfaat, tetapi TANPA SEBARANG
WARANTI; tanpa jaminan tersirat KEBOLEHPERDAGANGAN atau KESESUAIAN UNTUK A
TUJUAN TERTENTU. Lihat Lesen Awam Am GNU untuk butiran lanjut.
Anda telah menerima salinan Lesen Awam Am GNU bersama-sama dengan program ini
(lihat LESEN).
Sinar 2.1.0
Lesen untuk Ray: GNU General Public License versi 3 Versi RayPlatform: 1.1.0 License
untuk RayPlatform: GNU Lesser General Public License versi 3
MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 Kedalaman liputan maksimum disimpan mengikut CoverageDepth:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 byte FORCE_PACKING = n ASSERT = n
HAVE_LIBZ = y HAVE_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y standard MPI
versi: Pustaka MPI 2.1 MPI: Open-MPI 1.4.2 Compiler: GNU gcc/g++ 4.4.5
Gunakan Ray dalam talian menggunakan perkhidmatan onworks.net