Ini adalah perintah Ray yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
Ray - merakit genom secara paralel menggunakan antarmuka penyampaian pesan
RINGKASAN
mpexec -n NUMBER_OF_RANKS Sinar -k KMERPANJANG -p l1_1.cepatq l1_2.cepatq -p l2_1.fastq
l2_2.fastq -o uji
mpexec -n NUMBER_OF_RANKS Ray Ray.conf # dengan perintah dalam file
DESKRIPSI:
Perakit genom Ray dibangun di atas RayPlatform, berbasis plugin generik
mesin komputasi terdistribusi dan paralel yang menggunakan antarmuka pengiriman pesan untuk
lewat pesan.
Ray menargetkan beberapa aplikasi:
- perakitan genom de novo (dengan Ray vanilla) - perakitan meta-genom de novo (dengan
Ray Meta) - perakitan transkriptom de novo (berfungsi, tetapi tidak banyak diuji) -
kuantifikasi kelimpahan contig - kuantifikasi konsorsium mikrobioma
anggota (dengan Komunitas Ray) - kuantifikasi ekspresi transkrip - taksonomi
pembuatan profil sampel (dengan Komunitas Ray) - pembuatan profil ontologi gen sampel
(dengan Ray Ontologi)
-bantu
Menampilkan halaman bantuan ini.
-versi
Menampilkan versi Ray dan opsi kompilasi.
Menggunakan file konfigurasi
Ray dapat diluncurkan dengan mpiexec -n 16 Ray Ray.conf File konfigurasi dapat
sertakan komentar (dimulai dengan #).
Panjang K-mer
-k kmerPanjang
Memilih panjang k-mers. Nilai defaultnya adalah 21. Pasti ganjil karena
simpul pelengkap-balik disimpan bersama. Panjang maksimum ditentukan pada
kompilasi oleh MAXKMERLENGTH K-mer yang lebih besar menggunakan lebih banyak memori.
Masukan
-p leftSequenceFile rightSequenceFile [Penyimpangan standarOuterDistance rata-rata]
Menyediakan dua file yang berisi bacaan akhir berpasangan. rata-rataOuterDistance dan
standardDeviation secara otomatis dihitung jika tidak disediakan.
-i interleavedSequenceFile [AverageOuterDistance standardDeviation]
Menyediakan satu file yang berisi bacaan ujung berpasangan yang disisipkan. rata-rataJarak Luar
dan standardDeviation secara otomatis dihitung jika tidak disediakan.
-s urutanFile
Menyediakan file yang berisi bacaan ujung tunggal.
Output
-o Direktori keluaran
Menentukan direktori untuk file yang dikeluarkan. Standarnya adalah RayOutput
Opsi perakitan (default berfungsi dengan baik)
-nonaktifkan-daur ulang
Menonaktifkan daur ulang baca selama pembacaan perakitan akan dibebaskan dalam 3 kasus: 1.
jarak tidak cocok untuk sepasang 2. yang dibaca belum ketemu jodohnya 3.
populasi perpustakaan menunjukkan penempatan yang salah, lihat Lintasan pengulangan terbatas
dengan urutan berpasangan. Sebastien Boisvert, Elenie Godzaridis, Francois Laviolette
& Jacques Corbeil. Lokakarya Satelit RECOMB Tahunan Pertama tentang Paralel Massive
Urutan, 26-27 Maret 2011, Vancouver, BC, Kanada.
-nonaktifkan-scaffolder
Menonaktifkan perancah.
-minimum-contig-panjang minimumContigLength
Mengubah panjang contig minimum, defaultnya adalah 100 nukleotida
-ruang-warna
Berjalan di ruang warna Memerlukan file csfasta. Diaktifkan secara otomatis jika file csfasta
disediakan.
-gunakan-maksimum-cakupan benih maksimumSeedCoverageDepth
Mengabaikan benih apa pun dengan kedalaman cakupan di atas ambang batas ini. Standarnya adalah
4294967295.
-gunakan-minimum-cakupan benih minimumKedalaman Cakupan Benih
Mengatur kedalaman tutupan benih minimum. Jalur apa pun dengan kedalaman cakupan lebih rendah dari
ini akan dibuang. Standarnya adalah 0.
Mesin penyimpanan terdistribusi (semua nilai ini untuk setiap peringkat MPI)
-bloom-filter-bit bit
Mengatur jumlah bit untuk filter Bloom Default adalah 268435456 bit, 0 bit
menonaktifkan filter Bloom.
-hash-table-bucket Ember
Menetapkan jumlah awal ember. Harus menjadi kekuatan 2! Nilai bawaan:
268435456
-hash-tabel-ember-per-grup Ember
Menyetel jumlah ember per grup untuk penyimpanan jarang Nilai default: 64, Harus
antara >=1 dan <= 64
-hash-tabel-beban-faktor-ambang ambang
Menyetel ambang faktor beban untuk pengubahan ukuran waktu nyata Nilai default: 0.75, harus
>= 0.5 dan < 1
-hash-tabel-verbositas
Mengaktifkan verbositas untuk mesin penyimpanan terdistribusi
Kelimpahan biologis
-pencarian cariDirektori
Menyediakan direktori yang berisi file fasta untuk dicari dalam grafik de Bruijn.
Kelimpahan biologis akan ditulis ke RayOutput/BiologicalAbundances Lihat
Dokumentasi/BiologicalAbundances.txt
-satu-warna-per-file
Menetapkan satu warna per file, bukan satu per urutan. Secara default, setiap urutan dalam
setiap file memiliki warna yang berbeda. Untuk file dengan jumlah urutan yang besar, gunakan
satu warna per file mungkin lebih efisien.
Pembuatan profil taksonomi dengan grafik de Bruijn berwarna
-dengan-taksonomi Genom-ke-Taxon.tsv TreeOfLife-Edges.tsv Nama-Taxon.tsv
Menyediakan taksonomi. Menghitung dan menulis profil taksonomi terperinci. Melihat
Dokumentasi/Taxonomy.txt untuk detailnya.
-gen-ontologi Ketentuan Ontologi.txt
Anotasi.txt
Menyediakan ontologi dan anotasi. OntologyTerms.txt diambil dari
http://geneontology.org Annotations.txt adalah file 2 kolom (menangani EMBL_CDS &
pengenal ontologi gen) Lihat Dokumentasi/GeneOntology.txt
Output lainnya
-aktifkan-lingkungan
Menghitung lingkungan contig dalam grafik de Bruijn File keluaran:
RayOutput/NeighbourhoodRelations.txt
-amos
Menulis file AMOS yang disebut RayOutput/AMOS.afg File AMOS berisi posisi baca
pada contig. Dapat dibuka dengan perangkat lunak dengan antarmuka pengguna grafis.
-tulis-kmers
Menulis grafik k-mer ke RayOutput/kmers.txt File yang dihasilkan tidak digunakan oleh
Sinar. File yang dihasilkan sangat besar.
-tulis-baca-spidol
Menulis penanda baca ke disk.
-tulis-benih
Menulis urutan DNA benih ke RayOutput/Rank .RaySeeds.fasta
-tulis-ekstensi
Menulis urutan DNA ekstensi ke RayOutput/Rank .RayExtensions.fasta
-tulis-contig-paths
Menulis jalur contig dengan nilai cakupan ke RayOutput/Rank .RayContigPaths.txt
-tulis-penanda-ringkasan
Menulis statistik penanda.
Penggunaan memori
-tampilkan-memori-penggunaan
Menunjukkan penggunaan memori. Data diambil dari / proc di GNU/Linux Membutuhkan __linux__
-tampilkan-memori-alokasi
Menunjukkan acara alokasi memori
verbositas algoritma
-tampilkan-ekstensi-pilihan
Menunjukkan pilihan yang dibuat (dengan pilihan lain) selama ekstensi.
-acara-akhir-konteks
Menunjukkan konteks akhir dari setiap ekstensi. Menunjukkan anak-anak dari simpul di mana
ekstensi terlalu sulit.
-tunjukkan-jarak-ringkasan
Menampilkan ringkasan jarak terluar yang digunakan untuk jalur ekstensi.
-tunjukkan-konsensus
Menunjukkan konsensus ketika pilihan dilakukan.
Pos pemeriksaan
-tulis-pos pemeriksaan direktori pos pemeriksaan
Tulis file pos pemeriksaan
-baca-pos pemeriksaan direktori pos pemeriksaan
Baca file pos pemeriksaan
-baca-tulis-pos pemeriksaan direktori pos pemeriksaan
Membaca dan menulis file pos pemeriksaan
Perutean pesan untuk sejumlah besar inti
-rute-pesan
Mengaktifkan router pesan Ray. Dinonaktifkan secara default. Pesan akan dialihkan
sesuai sehingga peringkat mana pun dapat berkomunikasi secara langsung hanya dengan beberapa orang lainnya.
Tanpa -rute-pesan, peringkat mana pun dapat berkomunikasi langsung dengan peringkat lainnya.
File yang dihasilkan: Routing/Connections.txt, Routing/Routes.txt dan
Perutean/RelayEvents.txt dan Perutean/Ringkasan.txt
-tipe koneksi mengetik
Mengatur jenis koneksi untuk rute. Nilai yang diterima adalah debruijn, hypercube,
polytope, group, random, kautz dan complete. Standarnya adalah debruijn.
debruijn: grafik de Bruijn penuh alfabet dan diameter hypercube yang diberikan: a
hypercube, alfabet adalah {0,1} dan simpul adalah kekuatan dari 2 polytope: sebuah cembung
politop beraturan, alfabet adalah {0,1,...,B-1} dan simpulnya adalah pangkat dari grup B:
model konyol di mana satu perwakilan per kelompok dapat berkomunikasi dengan orang luar
acak: Erdos-Renyi model kautz: graf de Kautz penuh, yang merupakan subgraf dari de
Grafik Bruijn selesai: grafik lengkap dengan semua kemungkinan koneksi
Dengan tipe debruijn, jumlah rangking pasti merupakan kekuatan dari sesuatu.
Contoh: 256 = 16*16, 512=8*8*8, 49=7*7, dan seterusnya. Jika tidak, jangan gunakan debruijn
perutean tetapi gunakan yang lain Dengan tipe kautz, jumlah peringkat n harus
n=(k+1)*k^(d-1) untuk beberapa k dan d
-perutean-grafik-derajat gelar
Menentukan derajat keluar untuk grafik perutean. Lihat Dokumentasi/Routing.txt
Pengujian perangkat keras
-uji-jaringan-saja
Menguji jaringan dan kembali.
-tulis-jaringan-tes-data mentah
Menulis satu file tambahan per peringkat yang merinci pengujian jaringan.
-pertukaran JumlahPertukaran
Mengatur jumlah pertukaran
-nonaktifkan-network-test
Melewati tes jaringan.
Debugging
-verifikasi-pesan-integritas
Memeriksa keandalan data pesan untuk pesan yang tidak kosong. tambahkan '-D CONFIG_SSE_4_2'
di Makefile untuk menggunakan instruksi perangkat keras (SSE 4.2)
-jalankan-profiler
Menjalankan profiler saat kode berjalan. Secara default, hanya tampilkan peringatan perincian.
Menjalankan profiler meningkatkan waktu berjalan.
-dengan-profil-detail
Menunjukkan jumlah pesan yang dikirim dan diterima di setiap metode selama di setiap waktu
irisan (epoch). Kebutuhan -jalankan-profiler.
-acara-komunikasi-acara
Menampilkan semua pesan yang dikirim dan diterima.
-tunjukkan-baca-penempatan
Menunjukkan penempatan baca dalam grafik selama ekstensi.
-debug-gelembung
Men-debug kode gelembung. Gelembung dapat disebabkan oleh situs heterozigot atau kesalahan pengurutan
atau peristiwa (tidak diketahui) lainnya
-debug-biji
Debug kode benih. Benih adalah jalur dalam grafik yang cenderung unik.
-debug-fusi
Debug kode fusi.
-debug-perancah
Debug perancah.
FILE
File masukan
Catatan: format file ditentukan dengan ekstensi file.
.fasta .fasta.gz (membutuhkan HAVE_LIBZ=y saat kompilasi) .fasta.bz2 (membutuhkan HAVE_LIBBZ2=y
saat kompilasi) .fastq .fastq.gz (membutuhkan HAVE_LIBZ=y saat kompilasi) .fastq.bz2
(membutuhkan HAVE_LIBBZ2=y saat kompilasi) .sff (bacaan berpasangan harus diekstraksi secara manual)
.csfasta (pembacaan ruang warna)
File yang dikeluarkan
Perancah
RayOutput/Perancah.fasta
Urutan perancah dalam format FASTA
RayOutput/ScaffoldComponents.txt
Komponen setiap perancah
RayOutput/ScafffoldLengths.txt
Panjang setiap perancah
RayOutput/ScaffoldLinks.txt
Tautan perancah
tambahan
RayOutput/Contigs.fasta
Urutan bersebelahan dalam format FASTA
RayOutput/ContigLengths.txt
Panjang barisan yang bersebelahan
Ringkasan
RayOutput/OutputNumbers.txt
Jumlah keseluruhan untuk majelis
grafik de Bruijn
RayOutput/CakupanDistribusi.txt
Distribusi nilai cakupan
RayOutput/CoverageDistributionAnalysis.txt
Analisis distribusi cakupan
RayOutput/derajatDistribusi.txt
Distribusi derajat masuk dan keluar
RayOutput/kmers.txt
grafik k-mer, opsi yang diperlukan: -tulis-kmers
File yang dihasilkan tidak dimanfaatkan oleh Ray. File yang dihasilkan sangat besar.
Langkah perakitan
RayOutput/SeedLengthDistribution.txt
Distribusi panjang benih
RayOutput/Peringkat .OptimalReadMarkers.txt
Baca penanda.
RayOutput/Peringkat .RaySeeds.fasta
Urutan DNA benih, opsi yang diperlukan: -tulis-benih
RayOutput/Peringkat .RayExtensions.fasta
Urutan DNA ekstensi, opsi yang diperlukan: -tulis-ekstensi
RayOutput/Peringkat .RayContigPaths.txt
Jalur contig dengan nilai cakupan, opsi yang diperlukan: -tulis-contig-paths
Bacaan berpasangan
RayOutput/LibraryStatistics.txt
Estimasi jarak luar untuk bacaan berpasangan
RayOutput/Perpustakaan .txt
Frekuensi untuk jarak terluar yang diamati (ukuran sisipkan + panjang baca)
sekat
RayOutput/NumberOfSequences.txt
Jumlah bacaan di setiap file
RayOutput/SequencePartition.txt
Partisi urutan
Perangkat lunak sinar
RayOutput/RayVersion.txt
Versi Ray
RayOutput/RayCommand.txt
Perintah yang sama persis disediakan
AMOS
RayOutput/AMOS.afg
Representasi perakitan dalam format AMOS, opsi yang diperlukan: -amos
Komunikasi
RayOutput/MessagePassingInterface.txt
Jumlah pesan yang dikirim
RayOutput/NetworkTest.txt
Latensi dalam mikrodetik
RayOutput/Peringkat JaringanTestData.txt
Data mentah uji jaringan
DOKUMENTASI
- mpexec -n 1 sinar -bantu|kurang (selalu up-to-date) - Halaman bantuan ini (selalu
up-to-date) - Direktori Documentation/ - Manual (Portable Document Format):
InstructionManual.tex (dalam Dokumentasi) - Arsip milis:
http://sourceforge.net/mailarchive/forum.php?forum_name=pengguna-denovoassembler
PENULIS
Ditulis oleh Sebastien Boisvert.
PELAPORAN BUG
Laporkan bug ke [email dilindungi] Halaman rumah:
<http://denovoassembler.sourceforge.net/>
HAK CIPTA
Program ini adalah perangkat lunak gratis: Anda dapat mendistribusikannya kembali dan/atau memodifikasinya di bawah
ketentuan Lisensi Publik Umum GNU sebagaimana diterbitkan oleh Perangkat Lunak Bebas
Foundation, versi 3 dari Lisensi.
Program ini disebarluaskan dengan harapan dapat bermanfaat, tapi TANPA APAPUN
JAMINAN; bahkan tanpa jaminan tersirat tentang DAGANG atau KESESUAIAN UNTUK A
TUJUAN TERTENTU. Lihat Lisensi Publik Umum GNU untuk lebih jelasnya.
Anda telah menerima salinan GNU General Public License bersama dengan program ini
(lihat LISENSI).
Sinar 2.1.0
Lisensi untuk Ray: Lisensi Publik Umum GNU versi 3 Versi RayPlatform: Lisensi 1.1.0
untuk RayPlatform: GNU Lesser General Public License versi 3
MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 Kedalaman cakupan maksimum yang disimpan oleh CoverageDepth:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 byte FORCE_PACKING = n ASSERT = n
HAVE_LIBZ = y HAVE_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y standar MPI
versi: MPI 2.1 Pustaka MPI: Open-MPI 1.4.2 Kompilator: GNU gcc/g++ 4.4.5
Gunakan Ray online menggunakan layanan onworks.net
