InggrisPerancisSpanyol

Ad


favorit OnWorks

maq - Online di Cloud

Jalankan maq di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah maq yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


Maq - Pemetaan dan Perakitan dengan Kualitas

RINGKASAN


tapi Q Command [Pilihan] argumen

maq.pl Command [Pilihan] argumen

DESKRIPSI


Maq adalah perangkat lunak yang membangun rakitan pemetaan dari pembacaan singkat yang dihasilkan oleh
mesin pengurutan generasi. Ini dirancang khusus untuk Illumina-Solexa 1G Genetika
Analyzer, dan memiliki fungsionalitas awal untuk menangani data AB SOLID.

Dengan Maq Anda dapat:

· Penyelarasan cepat bacaan Illumina/SOLiD ke genom referensi. Dengan opsi default, satu
juta pasang bacaan dapat dipetakan ke genom manusia dalam waktu sekitar 10 jam CPU dengan lebih sedikit
dari memori 1G.

· Akurat mengukur probabilitas kesalahan keselarasan setiap membaca individu.

· Sebut genotipe konsensus, termasuk polimorfisme homozigot dan heterozigot, dengan
kualitas probabilistik Phred yang ditetapkan untuk setiap basis.

· Temukan indels pendek dengan bacaan akhir berpasangan.

· Secara akurat menemukan penghapusan dan translokasi genomik skala besar dengan pembacaan akhir berpasangan.

· Temukan CNV potensial dengan memeriksa kedalaman baca.

· Evaluasi keakuratan kualitas dasar mentah dari sequencer dan bantu untuk memeriksa
kesalahan sistematis.

Namun, Mak bisa JANGAN:

· Mengerjakan de baru perakitan. (Maq hanya dapat memanggil konsensus dengan memetakan bacaan ke yang diketahui
referensi.)

· Celana pendek peta membaca melawan diri mereka sendiri. (Maq hanya dapat menemukan tumpang tindih lengkap antara bacaan.)

· Sejajarkan pembacaan kapiler atau 454 pembacaan ke referensi. (Maq tidak dapat menyelaraskan bacaan lebih lama dari
63bp.)

MAQ PERINTAH


kunci Perintah

fasta2bfa tapi Q fasta2bfa di.ref.fasta keluar.ref.bfa

Konversi urutan dalam format FASTA ke format BFA (FASTA biner) Maq.

fastq2bfq tapi Q fastq2bfq [-n belum dibaca] di.baca.fastq keluar.baca.bfqkeluar.awalan

Konversikan bacaan dalam format FASTQ ke format BFQ (FASTQ biner) Maq.

PILIHAN:

-n INT jumlah pembacaan per file [tidak ditentukan]

peta tapi Q peta [-n salah] [-a maksin] [-c] [-1 len1] [-2 len2] [-d beradaptasi3] [-m bermutasi]
[-u belum dipetakan] [-e maksimal] [-M cg] [-N] [-H semuanya sukses] [-C maksimal] keluar.aln.map
di.ref.bfa di.read1.bfq [di.read2.bfq] 2> keluar.peta.log

Peta membaca ke urutan referensi.

PILIHAN:

-n INT Jumlah ketidaksesuaian maksimum yang selalu dapat ditemukan [2]

-a INT Jarak luar maksimum untuk pasangan baca yang benar [250]

-A INT Jarak luar maksimum dua RF berbayar baca (0 untuk nonaktif) [0]

-c Peta dibaca dalam ruang warna (hanya untuk SOLiD)

-1 INT Panjang baca untuk pembacaan pertama, 0 untuk otomatis [0]

-2 INT Panjang baca untuk pembacaan kedua, 0 untuk otomatis [0]

-m FLOAT Tingkat mutasi antara urutan referensi dan bacaan [0.001]

-d FILE Tentukan file yang berisi satu baris dari urutan adaptor 3'
[batal]

-u FILE Buang bacaan yang belum dipetakan dan bacaan yang mengandung lebih dari salah tidak cocok dengan
file terpisah [null]

-e INT Ambang batas jumlah kualitas dasar yang tidak cocok [70]

-H FILE Buang beberapa/semua hit 01-ketidakcocokan ke FILE [batal]

-C INT Jumlah maksimum klik yang dihasilkan. Tidak terbatas jika lebih besar dari 512. [250]

-M mode penyelarasan metilasi c⎪g. Semua C (atau G) pada untai depan akan menjadi
diubah menjadi T (atau A). Opsi ini hanya untuk pengujian.

-N simpan posisi ketidakcocokan dalam file output keluar.aln.map. Kapan ini
opsi sedang digunakan, panjang baca maksimum yang diizinkan adalah 55bp.

CATATAN:

* Bacaan akhir berpasangan harus disiapkan dalam dua file, satu untuk setiap akhir, dengan
bacaan diurutkan dalam urutan yang sama. Ini berarti k-th dibaca di yang pertama
file dikawinkan dengan k-th yang dibaca di file kedua. Bacaan yang sesuai
nama harus sama hingga tailing `/1' atau `/2'. Misalnya seperti
sepasang nama baca diperbolehkan: `EAS1_1_5_100_200/1' dan
`EAS1_1_5_100_200/2'. Tailing `/[12]' biasanya dihasilkan oleh
GAPipeline untuk membedakan dua ujung yang berpasangan.

* Outputnya adalah file biner terkompresi. Hal ini dipengaruhi oleh endianness.

* Cara terbaik untuk menjalankan perintah ini adalah dengan menyediakan sekitar 1 hingga 3 juta bacaan sebagai
memasukkan. Lebih banyak membaca menghabiskan lebih banyak memori.

* Pilihan -n mengontrol sensitivitas keselarasan. Secara default, hit dengan
hingga 2 ketidakcocokan selalu dapat ditemukan. Lebih tinggi -n menemukan lebih banyak hits dan juga
meningkatkan akurasi kualitas pemetaan. Namun, ini dilakukan dengan biaya
kecepatan.

* Penjajaran dengan banyak ketidakcocokan berkualitas tinggi harus dibuang sebagai salah
keselarasan atau kemungkinan kontaminasi. Perilaku ini dikendalikan oleh opsi
-e. itu -e ambang batas hanya dihitung kira-kira karena kualitas dasar
dibagi 10 pada tahap tertentu dari keselarasan. NS -Q pilihan dalam
berkumpul perintah tepat mengatur ambang batas.

* Sepasang bacaan dikatakan berpasangan dengan benar jika dan hanya jika
orientasi adalah FR dan jarak terluar pasangan tidak lebih besar dari
maksin. Tidak ada batasan ukuran sisipan minimum. Pengaturan ini adalah
ditentukan oleh algoritma penjajaran ujung berpasangan yang digunakan di Maq. Membutuhkan
ukuran sisipan minimum akan menyebabkan beberapa keberpihakan yang salah dengan sangat
kualitas pemetaan yang terlalu tinggi.

* Saat ini, pasangan baca dari perpustakaan sisipan panjang Illumina/Solexa memiliki pembacaan RF
orientasi. Ukuran insert maksimum diatur oleh opsi -A. Namun, lama-
perpustakaan sisipan juga dicampur dengan sebagian kecil dari bacaan sisipan pendek
pasang. -a juga harus diatur dengan benar.

* Terkadang 5'-end atau bahkan seluruh rangkaian 3'-adaptor dapat diurutkan.
Menyediakan -d membuat Maq untuk menghilangkan kontaminasi adaptor.

* Diberikan 2 juta bacaan sebagai input, tapi Q biasanya membutuhkan memori 800MB.

penggabungan peta tapi Q penggabungan peta keluar.aln.map di.aln1.map di.aln2.map [...]

Gabungkan sekumpulan perataan baca bersama-sama.

CATATAN:

* Secara teori, perintah ini dapat menggabungkan jumlah keberpihakan yang tidak terbatas. Namun, sebagai
mapmerge akan membaca semua input pada saat yang sama, mungkin mengenai
batas jumlah maksimum file pembuka yang ditetapkan oleh OS. Saat ini, ini
harus diselesaikan secara manual oleh pengguna akhir.

* Memerintah penggabungan peta dapat digunakan untuk menggabungkan file perataan dengan pembacaan yang berbeda
panjang. Semua analisis berikutnya tidak lagi mengasumsikan panjang tetap.

rmdup tapi Q rmdup keluar.rmdup.map di.ori.map

Hapus pasangan dengan koordinat luar yang identik. Pada prinsipnya, berpasangan dengan
koordinat luar yang identik seharusnya jarang terjadi. Namun, karena
amplifikasi dalam persiapan sampel, ini terjadi jauh lebih sering daripada
peluang. Analisis praktis menunjukkan bahwa menghapus duplikat membantu meningkatkan
akurasi keseluruhan panggilan SNP.

berkumpul tapi Q berkumpul [-sp] [-m maksimal] [-Q maksimal] [-r sangat marah] [-t koefisien] [-q minQ] [-N
nHap] keluar.cns di.ref.bfa di.aln.map 2> keluar.cns.log

Panggil urutan konsensus dari pemetaan baca.

PILIHAN:

-t FLOAT Koefisien ketergantungan kesalahan [0.93]

-r FLOAT Fraksi heterozigot di antara semua situs [0.001]

-s Ambil kualitas pemetaan ujung tunggal sebagai kualitas pemetaan akhir;
jika tidak, kualitas pemetaan akhir yang dipasangkan akan digunakan

-p Buang bacaan akhir berpasangan yang tidak dipetakan dalam pasangan yang benar

-m INT Jumlah maksimum ketidakcocokan yang diizinkan untuk pembacaan digunakan dalam
panggilan konsensus [7]

-Q INT Jumlah maksimum nilai kualitas yang diizinkan dari basis yang tidak cocok [60]

-q INT Kualitas pemetaan minimum yang diizinkan untuk pembacaan digunakan dalam konsensus
panggilan [0]

-N INT Jumlah haplotipe dalam kumpulan (>=2) [2]

CATATAN:

* Pilihan -Q menetapkan batas jumlah maksimum kualitas dasar yang tidak cocok.
Bacaan yang mengandung banyak ketidakcocokan berkualitas tinggi harus dibuang.

* Pilihan -N menetapkan jumlah haplotipe dalam kumpulan. Ini dirancang untuk
pengurutan ulang sampel dengan mengumpulkan beberapa galur/individu bersama-sama. Untuk
pengurutan ulang genom diploid, opsi ini sama dengan 2.

glfgen tapi Q glfgen [-sp] [-m maksimal] [-Q maksimal] [-r sangat marah] [-t koefisien] [-q minQ] [-N
nHap] keluar.cns di.ref.bfa di.aln.map 2> keluar.cns.log

Hitung kemungkinan log untuk semua genotipe dan simpan hasilnya dalam format GLF
(Format Kemungkinan Genotip). Silakan periksa situs web MAQ untuk detailnya
deskripsi format file dan utilitas terkait.

indelpe tapi Q indelpe di.ref.bfa di.aln.map > keluar.indelpe

Panggil indel yang konsisten dari pembacaan akhir yang dipasangkan. Outputnya adalah TAB yang dibatasi dengan
setiap baris terdiri dari kromosom, posisi awal, jenis indel, nomor
pembacaan di seluruh indel, ukuran indel dan nukleotida yang dimasukkan/dihapus
(dipisahkan dengan titik dua), jumlah indel pada untai terbalik, jumlah indel
pada untai maju, urutan 5' di depan indel, urutan 3' mengikuti
indel, jumlah bacaan yang disejajarkan tanpa indel dan tiga kolom tambahan
untuk filter.

Pada kolom ke-3, jenis indel, bintang menunjukkan indel dikonfirmasi
dengan membaca dari kedua untai, plus berarti indel terkena setidaknya dua kali membaca
tetapi dari untai yang sama, minus menunjukkan indel hanya ditemukan pada satu kali baca,
dan titik berarti indel terlalu dekat dengan indel lain dan disaring.

Pengguna disarankan untuk menjalankan `maq.pl indelpe' untuk memperbaiki jumlah
membaca dipetakan tanpa indels. Untuk lebih jelasnya, lihat `maq.pl indelpe'
bagian.

indelsoa tapi Q indelsoa di.ref.bfa di.aln.map > keluar.indelsoa

Panggil indel homozigot potensial dan break point dengan mendeteksi abnormal
pola keselarasan di sekitar indels dan break point. Outputnya juga TAB
dibatasi dengan setiap baris yang terdiri dari kromosom, koordinat perkiraan,
panjang wilayah abnormal, jumlah pembacaan yang dipetakan di seluruh posisi,
jumlah bacaan di sisi kiri posisi dan jumlah bacaan di
sisi kanan. Kolom terakhir dapat diabaikan.

Outputnya mengandung banyak positif palsu. Filter yang direkomendasikan dapat berupa:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

Perhatikan bahwa perintah ini tidak bertujuan untuk menjadi pendeteksi indel yang akurat, tetapi
terutama membantu untuk menghindari beberapa kesalahan positif dalam panggilan substitusi. Di dalam
selain itu, ini hanya berfungsi dengan baik mengingat kedalaman yang dalam (~ 40X misalnya); jika tidak
tingkat negatif palsu akan sangat tinggi.

dibentuk Konversi

sol2sanger tapi Q sol2sanger di.sol.fastq keluar.sanger.fastq

Konversikan Solexa FASTQ ke format standar/Sanger FASTQ.

bfq2fastq tapi Q bfq2fastq di.baca.bfq keluar.baca.fastq

Konversi format BFQ Maq ke format FASTQ standar.

mapas2maq tapi Q mapas2maq di.mapass2.map keluar.maq.map

Ubah format peta mapas2 usang ke format peta Maq. Format lama tidak
tidak mengandung nama baca.

Informasi Ekstraksi

tampilan peta tapi Q tampilan peta [-bN] di.aln.map > keluar.aln.txt

Menampilkan perataan baca dalam teks biasa. Untuk bacaan yang disejajarkan sebelum Smith-
Penjajaran waterman, setiap baris terdiri dari nama baca, kromosom, posisi,
untai, masukkan ukuran dari koordinat luar pasangan, bendera berpasangan, pemetaan
kualitas, kualitas pemetaan ujung tunggal, kualitas pemetaan alternatif, jumlah
ketidakcocokan hit terbaik, jumlah kualitas basis yang tidak cocok dari yang terbaik
hit, jumlah hit 0-ketidakcocokan dari 24bp pertama, jumlah hit 1-ketidakcocokan
24bp pertama pada referensi, panjang baca, urutan baca dan nya
kualitas. Kualitas pemetaan alternatif selalu sama dengan kualitas pemetaan jika:
membaca tidak berpasangan. Jika bacaan dipasangkan, itu sama dengan pemetaan yang lebih kecil
kualitas kedua ujungnya. Kualitas pemetaan alternatif ini sebenarnya adalah
kualitas pemetaan dari pasangan abnormal.

Kolom kelima, bendera berpasangan, adalah bendera bitwise. 4 bit yang lebih rendah memberikan
orientasi: 1 untuk FF, 2 untuk FR, 4 untuk RF, dan 8 untuk RR, di mana FR berarti
bahwa pembacaan dengan koordinat yang lebih kecil ada di untai depan, dan pasangannya adalah
pada untai terbalik. Hanya FR yang diperbolehkan untuk pasangan yang benar. Bit yang lebih tinggi
bendera ini memberikan informasi lebih lanjut. Jika pasangan memenuhi ujung yang berpasangan
persyaratan, 16 akan ditetapkan. Jika kedua bacaan dipetakan ke berbeda
kromosom, 32 akan ditetapkan. Jika salah satu dari dua bacaan tidak dapat dipetakan sama sekali,
64 akan ditetapkan. Bendera untuk pasangan yang benar selalu sama dengan 18.

Untuk pembacaan yang disejajarkan oleh penyelarasan Smith-Waterman setelahnya, benderanya adalah
selalu 130. Sebuah baris terdiri dari nama baca, kromosom, posisi, untai, sisipan
ukuran, bendera (selalu 130), posisi indel pada pembacaan (0 jika tidak ada indel),
panjang indel (positif untuk penyisipan dan negatif untuk penghapusan),
memetakan kualitas pasangannya, jumlah ketidakcocokan hit terbaik, jumlah
kualitas basis hit terbaik yang tidak cocok, dua nol, panjang pembacaan,
membaca urutan dan kualitasnya. Pasangan pembaca berbendera 130 selalu mendapat
bendera 18.

Bendera 192 menunjukkan bahwa pembacaan tidak dipetakan tetapi pasangannya dipetakan. Untuk seperti itu
pasangan baca, satu bacaan memiliki bendera 64 dan yang lainnya memiliki 192.

PILIHAN:

-b jangan tampilkan urutan baca dan kualitasnya

-N menampilkan posisi di mana ketidakcocokan terjadi. Bendera ini hanya berfungsi
dengan file .map yang dihasilkan oleh `maq map -N'.

pemeriksaan peta tapi Q pemeriksaan peta [-s] [-m maksimal] [-q minQ] di.ref.bfa di.aln.map > keluar.mapcheck

Baca pemeriksaan kualitas. Mapcheck pertama-tama melaporkan komposisi dan kedalaman
referensi. Setelah itu ada formulir. Kolom pertama menunjukkan
posisi pada bacaan. Berikut empat kolom yang menunjukkan nukleotida:
komposisi, tingkat substitusi antara referensi dan bacaan akan diberikan.
Tarif dan angka di kolom berikut ini diskalakan ke 999 dan
dibulatkan ke bilangan bulat terdekat. Kelompok kolom berikutnya menunjukkan distribusi
kualitas dasar sepanjang pembacaan pada interval kualitas 10. Penurunan kualitas
biasanya dapat diamati, yang berarti basa di akhir pembacaan lebih sedikit
tepat. Kelompok kolom terakhir menyajikan fraksi substitusi untuk
membaca basis pada interval kualitas. Ini mengukur keakuratan kualitas dasar
perkiraan. Idealnya, kami berharap untuk melihat 1 dari 3? kolom, 10 di 2? kolom
dan 100 dalam 1? kolom.

PILIHAN:

-s Ambil kualitas pemetaan ujung tunggal sebagai kualitas pemetaan akhir

-m INT Jumlah maksimum mismatahce yang diperbolehkan untuk pembacaan dihitung [4]

-q INT Kualitas pemetaan minimum yang diperbolehkan untuk pembacaan dihitung [30]

menumpuk tapi Q menumpuk [-spvP] [-m maksimal] [-Q maksimal] [-q minQ] [-l file situs] di.ref.bfa
di.aln.map > keluar.pileup

Menampilkan perataan dalam format teks `pileup'. Setiap baris terdiri dari
kromosom, posisi, basis referensi, kedalaman, dan basis pada bacaan yang menutupi
posisi ini. Jika -v ditambahkan pada baris perintah, kualitas dasar, dan pemetaan
kualitas akan disajikan dalam kolom keenam dan ketujuh secara berurutan.

Kolom kelima selalu dimulai dengan `@'. Di kolom ini, baca basa identik
untuk referensi ditunjukkan dalam koma `,' atau titik `.', dan membaca basis yang berbeda
dari referensi dalam surat. Sebuah koma atau huruf besar menunjukkan bahwa basis
berasal dari bacaan yang disejajarkan pada untai depan, sementara titik atau huruf kecil di
untai terbalik.

Perintah ini untuk pengguna yang ingin mengembangkan pemanggil SNP mereka sendiri.

PILIHAN:

-s Ambil kualitas pemetaan ujung tunggal sebagai kualitas pemetaan akhir

-p Buang bacaan akhir berpasangan yang tidak dipetakan sebagai pasangan yang benar

-v Keluarkan informasi verbose termasuk kualitas dasar dan pemetaan
kualitas

-m INT Jumlah maksimum ketidakcocokan yang diperbolehkan untuk pembacaan yang akan digunakan [7]

-Q INT Jumlah maksimum nilai kualitas ketidakcocokan yang diizinkan [60]

-q INT Kualitas pemetaan minimum yang diizinkan untuk digunakan pembacaan [0]

-l FILE File yang berisi situs di mana pileup akan dicetak. Di dalam
file kolom pertama memberikan nama referensi dan yang kedua
koordinat. Kolom tambahan akan diabaikan. [batal]

-P juga menampilkan posisi dasar pada pembacaan

cns2fq tapi Q cns2fq [-Q minPetaQ] [-n minNeiQ] [-d kedalaman min] [-D kedalaman maks] di.cns >
keluar.cns.fastq

Ekstrak urutan konsensus dalam format FASTQ. Dalam barisan barisan, basa
dalam huruf kecil pada dasarnya berulang atau tidak memiliki cakupan yang memadai; pangkalan
dalam huruf besar menunjukkan wilayah di mana SNP dapat dipanggil dengan andal. Dalam
garis kualitas, ASCII karakter minus 33 memberikan kualitas PHRED.

PILIHAN:

-Q INT Kualitas pemetaan minimum [40]

-d INT Kedalaman baca minimum [3]

-n INT Kualitas tetangga minimum [20]

-D INT Kedalaman baca maksimum. >=255 untuk tidak terbatas. [255]

cns2snp tapi Q cns2snp di.cns > keluar.snp

Ekstrak situs SNP. Setiap baris terdiri dari kromosom, posisi, basis referensi,
basis konsensus, kualitas konsensus seperti Phred, kedalaman baca, jumlah rata-rata
hits bacaan yang mencakup posisi ini, kualitas pemetaan tertinggi dari bacaan
mencakup posisi, kualitas konsensus minimum di sayap 3bp
wilayah di setiap sisi situs (total 6bp), panggilan terbaik kedua, log
rasio kemungkinan panggilan terbaik kedua dan terbaik ketiga, dan terbaik ketiga
panggilan.

Kolom ke-5 adalah kriteria utama ketika Anda menilai keandalan SNP.
Namun, karena kualitas ini hanya dihitung dengan asumsi independensi situs, Anda
juga harus mempertimbangkan kolom lain untuk mendapatkan panggilan SNP yang lebih akurat. Naskah
perintah `maq.pl Filter SNP' dirancang untuk ini (lihat di bawah).

Kolom ke-7 menyiratkan apakah situs tersebut berada di wilayah yang berulang. Jika tidak
membaca meliputi situs dapat dipetakan dengan kualitas pemetaan yang tinggi, mengapit
wilayah mungkin berulang atau kurangnya bacaan yang baik. SNP di situs tersebut
biasanya tidak dapat diandalkan.

Kolom ke-8 secara kasar memberikan nomor salinan dari wilayah mengapit di
genom referensi. Dalam kebanyakan kasus, angka ini mendekati 1.00, yang berarti
daerah adalah tentang unik. Terkadang Anda mungkin melihat kedalaman baca bukan nol tetapi 0.00 pada
kolom ke-7. Ini menunjukkan bahwa semua bacaan yang mencakup posisi tersebut memiliki
setidaknya dua ketidaksesuaian. Maq hanya menghitung jumlah hit 0- dan 1-ketidakcocokan untuk
referensi. Ini karena masalah teknis yang rumit.

Kolom ke-9 memberikan kualitas tetangga. Penyaringan pada kolom ini juga
diperlukan untuk mendapatkan SNP yang andal. Ide ini terinspirasi oleh NQS, meskipun NQS adalah
awalnya dirancang untuk sekali baca, bukan konsensus.

tampilan cns2 tapi Q tampilan cns2 di.cns > keluar.lihat

Tampilkan informasi rinci di semua situs. Format output identik dengan
cns2snp melaporkan.

cns2ref tapi Q cns2ref di.cns > keluar.ref.fasta

Ekstrak urutan referensi.

cns2win tapi Q cns2win [-w ukuran besar] [-c chr] [-b mulai] [-e akhir] [-q minQ] di.cns >
keluar.menang

Ekstrak informasi yang dirata-ratakan di jendela pengolahan. Outputnya dibatasi TAB,
yang terdiri dari nama referensi, koordinat dibagi 1,000,000, tarif SNP,
laju panas, kedalaman baca mentah, kedalaman baca di sekitar wilayah yang unik,
jumlah rata-rata klik bacaan di jendela dan persen GC.

PILIHAN:

-w INT Ukuran jendela [1000]

-c STR Urutan referensi yang dituju; jika tidak, semua referensi akan digunakan
[batal]

-b INT Posisi awal, 0 tanpa batasan [0]

-e INT Posisi akhir, 0 tanpa batasan [0]

-q INT Kualitas konsensus minimum dari situs yang akan digunakan [0]

Simulasi terkait

palsumut tapi Q palsumut [-r bermutasi] [-R indelfrac] di.ref.fasta > keluar.fakeref.fasta 2>
keluar.palsu.snp

Secara acak perkenalkan substitusi dan indel ke referensi. Substitusi dan
Indel pasangan basa tunggal dapat ditambahkan.

PILIHAN:

-r FLOAT Tingkat mutasi [0.001]

-R FLOAT Fraksi mutasi menjadi indel [0.1]

simutrain tapi Q simutrain keluar.simupars.dat di.baca.fastq

Estimasi/latih parameter untuk simulasi baca.

mensimulasikan tapi Q mensimulasikan [-d dalam ukuran] [-s stdev] [-N nBaca] [-1 bacaLen1] [-2 bacaLen2] [-r
mutRate] [-R indelFrac] [-h] keluar.read1.fastq keluar.read2.fastq di.ref.fasta
di.simupars.dat

Simulasikan pembacaan akhir berpasangan. Mengajukan di.simupars.dat menentukan panjang baca dan
distribusi kualitas. Ini dihasilkan dari simutrain, atau dapat diunduh dari
situs web mak. Dalam file baca keluaran, nama baca terdiri dari referensi
nama urutan dan koordinat luar dari pasangan bacaan yang disimulasikan. Oleh
bawaan, mensimulasikan mengasumsikan bacaan berasal dari urutan diploid yang dihasilkan
dengan menambahkan dua set mutasi yang berbeda, termasuk satu indel pasangan basa, ke
di.ref.fasta.

PILIHAN:

-d INT rata-rata jarak terluar ukuran sisipan [170]

-s INT standar deviasi ukuran insert [20]

-N INT jumlah pasangan bacaan yang akan dihasilkan [1000000]

-1 INT panjang bacaan pertama [ditetapkan oleh di.simupars.dat]

-2 INT panjang pembacaan kedua [ditetapkan oleh di.simupars.dat]

-r FLOAT tingkat mutasi [0.001]

-R FLOAT pecahan indel 1bp [0.1]

-h tambahkan semua mutasi ke di.ref.fasta dan hasilkan bacaan dari single
urutan bermutasi (modus haploid)

CATATAN:

* Bacaan yang dihasilkan dari perintah ini bersifat independen, yang menyimpang dari
kebenaran. Sedangkan evaluasi keselarasan kurang terpengaruh oleh ini, evaluasi pada
Panggilan SNP harus dilakukan dengan hati-hati. Ketergantungan kesalahan mungkin salah satunya
penyebab utama panggilan SNP yang salah.

simustat tapi Q simustat di.simu-aln.map > keluar.simustat

Evaluasi kualitas pemetaan dari pembacaan simulasi.

Padat terkait

fasta2csfa tapi Q fasta2csfa di.nucl-ref.fasta > out.color-ref.fasta

Konversi nukleotida FASTA menjadi FASTA berkode warna. Bendera -c harus kemudian diterapkan
untuk peta memerintah. Pada output, huruf `A' berarti warna 0, `C' untuk 1, `G'
untuk 2 dan `T' untuk 3. Setiap urutan dalam output lebih pendek 1bp dari input.

csmap2nt tapi Q csmap2nt out.nt.peta di.ref.nt.bfa in.cs.peta

Ubah perataan warna menjadi perataan nukleotida. masukan di.ref.nt.bfa adalah
file referensi FASTA biner nukleotida. Itu harus sesuai dengan file aslinya
dari mana referensi warna dikonversi. Konsensus nukleotida dapat disebut
dari keselarasan yang dihasilkan.

Lain-lain/Lanjutan Perintah

subpeta tapi Q subpeta [-q minPetaQ] [-Q maxSumErr] [-m maksMM] [-p] keluar.peta di.peta

Filter keberpihakan yang buruk di di.peta. Opsi baris perintah dijelaskan dalam
`berkumpul' memerintah.

eland2maq tapi Q eland2maq [-q defqual] keluar.peta di.daftar di.eland

Ubah perataan eland ke format .map maq. Mengajukan di.daftar terdiri dari
nama urutan yang muncul di kolom ketujuh dari file penyelarasan eland
di.eland dan nama yang Anda harapkan akan terlihat dalam keselarasan maq. Berikut ini adalah
contoh:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Jika Anda menyelaraskan bacaan dalam beberapa kelompok menggunakan eland, penting untuk
gunakan yang sama di.daftar untuk konversi. Selain itu, maq akan memuat semua
keberpihakan dan mengurutkannya dalam memori. Jika Anda telah menggabungkan beberapa eland
output menjadi satu file besar, Anda harus memisahkannya menjadi file yang lebih kecil untuk
mencegah maq memakan semua memori mesin Anda.

Perintah ini sebenarnya bertujuan untuk menunjukkan keselarasan Eland di Maqview. Karena tidak ada kualitas
informasi tersedia, file penyelarasan maq yang dihasilkan tidak boleh digunakan
untuk menyebut genotipe konsensus.

ekspor2maq tapi Q ekspor2maq [-1 baca1len] [-2 baca2len] [-a ahli maksiat] [-n] keluar.peta di.daftar
masuk.ekspor

Konversi format Ekspor Illumina ke Maq's .peta format. Format ekspor adalah yang baru
format penyelarasan sejak SolexaPipeline-0.3.0 yang juga menghitung pemetaan
kualitas seperti maq. File yang dihasilkan dapat digunakan untuk memanggil genotipe konsensus
karena sebagian besar informasi yang diperlukan tersedia untuk maq untuk melakukan ini secara akurat.

PILIHAN:

-1 INT Panjang bacaan pertama [0]

-2 INT Panjang pembacaan kedua [0]

-a INT Jarak luar maksimum untuk pasangan baca yang benar [250]

-n Pertahankan pembacaan yang difilter

MAQ-PERL PERINTAH


demo maq.pl demo [-h] [-s] [-N nPasangan] [-d keluarDir] di.fasta di.simudat

Mendemonstrasikan penggunaan tapi Q dan skrip pendampingnya. Perintah ini akan
simulasikan pembacaan dari file FASTA di.fasta. Panjang dan kualitas urutan
ditentukan oleh di.simudat yang dihasilkan dari tapi Q simutrain atau bisa
diunduh dari situs web Maq. Bacaan yang disimulasikan kemudian akan dipetakan dengan
maq.pl mudah. Akurasi keselarasan dievaluasi oleh tapi Q simustat, yang
akurasi konsensus oleh tapi Q simucns, dan akurasi SNP sebesar maq_eval.pl.

Secara default, pembacaan akhir berpasangan akan disimulasikan dan urutan diploid akan
dihasilkan dari input dengan menambahkan mutasi ke salah satu jenis haploid. sisipan
ukuran dan tingkat mutasi dikendalikan oleh tapi Q mensimulasikan.

PILIHAN:

-h mensimulasikan urutan haploid alih-alih urutan diploid

-s gunakan mode ujung tunggal untuk menyelaraskan bacaan alih-alih mode ujung berpasangan

-N INT jumlah pasangan bacaan yang akan disimulasikan [1000000]

-d DIR direktori keluaran [maqdemo]

CATATAN:

* File keluaran dari maq_eval.pl belum didokumentasikan, tetapi Anda dapat membuat
tebakan yang bagus di beberapa file ini.

* Perintah ini hanya menunjukkan penggunaan maq suite. Akurasi nyata
data hampir selalu lebih rendah dari apa yang Anda lihat dari simulasi murni.

mudah maq.pl mudah [-1 baca1Len] [-d keluar.dir] [-n nBaca] [-A 3 adaptor] [-e minDep]
[-q minCnsQ] [-p] [-2 baca2Len] [-a maksimal] [-S] [-N] di.ref.fasta in1.fastq
[in2.fastq]

Menganalisis saluran untuk genom kecil. Perintah Easyrun akan menjalankan sebagian besar analisis
diimplementasikan dalam tapi Q. Secara default, mudah mengasumsikan semua urutan baca input
file bersifat single-end dan independen; Kapan -p ditentukan, dua urutan baca
file yang diperlukan, satu untuk setiap akhir.

Beberapa file akan dihasilkan di keluar.dir, di antaranya file-file berikut adalah
keluaran kunci:

cns.final.snp panggilan SNP terakhir dengan yang berkualitas rendah disaring

cns.fq urutan konsensus dan kualitas dalam format FASTQ

PILIHAN:

-d DIR direktori keluaran [easyrun]

-n INT jumlah pembacaan/pasangan dalam satu batch keselarasan [2000000]

-S terapkan analisis baca terpisah dari indels pendek (mungkin sangat lambat)

-N INT jumlah haplotipe/strain di pool (>=2) [2]

-A FILE file untuk 3'-adaptor. File harus berisi satu baris urutan
[batal]

-1 INT panjang pembacaan pertama, 0 untuk otomatis [0]

-e INT kedalaman baca minimum yang diperlukan untuk memanggil SNP (untuk SNPfilter) [3]

-q INT kualitas konsensus minimum untuk SNP di cns.final.snp [30]

-p beralih ke mode perataan ujung berpasangan

-2 INT panjang bacaan kedua ketika -p diterapkan [0]

-a INT ukuran insert maksimum ketika -p diterapkan [250]

CATATAN:

* Untuk panggilan SNP pada sampel yang dikumpulkan, pengguna harus menyetel ` . yang benar-N' sebaik
`-E 0 '.

* File input dapat berupa format biner maq. maq.pl akan secara otomatis mendeteksi
format filenya.

Filter SNP maq.pl Filter SNP [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinUkuran] [-n minNeiQ] [-F di.indelpe] [-f di.indelsoa] [-s minSkor] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinUkuran] di.cns2snp.snp >
keluar.filtered.snp

Singkirkan SNP yang dicakup oleh sedikit bacaan (ditentukan oleh -d), terlalu banyak
membaca (ditentukan oleh -D), dekat (ditentukan oleh -w) ke indel potensial, jatuh
di wilayah yang mungkin berulang (ditandai dengan -Q), atau memiliki kualitas rendah
basis tetangga (ditentukan oleh -n). Jika maxWinSNP atau lebih SNP muncul di mana saja
densWinUkuran jendela, mereka juga akan disaring bersama-sama.

PILIHAN:

-d INT Kedalaman baca minimum yang diperlukan untuk memanggil SNP [3]

-D INT Kedalaman baca maksimum yang diperlukan untuk memanggil SNP (<255, jika tidak diabaikan)
[256]

-Q INT Diperlukan kualitas pemetaan maksimum dari pembacaan yang mencakup SNP [40]

-q INT Kualitas konsensus minimum [20]

-n INT Kualitas konsensus minimum yang berdekatan [20]

-w INT Ukuran jendela di sekitar indel potensial. SNP yang dekat
ke indel akan ditekan [3]

-F FILE Grafik indelpe keluaran [null]

-f FILE Grafik indelsoa keluaran [null]

-s INT Skor minimum untuk soa-indel dipertimbangkan [3]

-m INT Jumlah maksimum pembacaan yang dapat dipetakan di seluruh soa-indel [1]

-a Filter alternatif untuk perataan ujung tunggal

indelpe maq.pl indelpe di.indelpe > keluar.indelpe

Perbaiki jumlah pembacaan yang dipetakan tanpa indel untuk traktat homopolimer. Ini
perintah memodifikasi 4, 10 dan tiga kolom terakhir di.indelpe dan
keluarkan hasilnya dalam keluar.indelpe. Setelah dikoreksi, berikut ini Wow
perintah memberikan indel homozigot diduga:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

dan berikut ini memberikan heterozigot:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Harap dicatat bahwa ini indelpe perintah hanya mengimplementasikan beberapa aturan heuristik.
Itu tidak benar untuk homopolimer yang tidak murni atau di-nukleotida/triplet
mengulang. Akibatnya, dua perintah awk hanya memberikan perkiraan hom/het
indel.

CONTOH


· Skrip Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Perintah kunci di belakang easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq bagian1.fastq bagian1.bfq;
maq fastq2bfq bagian2.fastq bagian2.bfq;
maq peta part1.map ref.bfa part1.bfq;
maq peta part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq merakit cns.cns ref.bfa aln.map;

Gunakan maq online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

  • 1
    Phaser
    Phaser
    Phaser adalah pembukaan yang cepat, gratis, dan menyenangkan
    kerangka kerja game HTML5 sumber yang menawarkan
    Rendering WebGL dan Canvas di seluruh
    browser web desktop dan seluler. permainan
    bisa bersama...
    Unduh Phaser.dll
  • 2
    Mesin VASSAL
    Mesin VASSAL
    VASSAL adalah mesin permainan untuk membuat
    versi elektronik dari papan tradisional
    dan permainan kartu. Ini memberikan dukungan untuk
    rendering dan interaksi potongan game,
    dan ...
    Unduh Mesin VASSAL
  • 3
    OpenPDF - Garpu iText
    OpenPDF - Garpu iText
    OpenPDF adalah perpustakaan Java untuk membuat
    dan mengedit file PDF dengan LGPL dan
    Lisensi sumber terbuka MPL. OpenPDF adalah
    LGPL/MPL penerus sumber terbuka iText,
    Sebuah...
    Unduh OpenPDF - Garpu iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - Sistem untuk Otomatis
    Analisis Geoscientific - adalah Geografis
    Perangkat lunak Sistem Informasi (GIS) dengan
    kemampuan luar biasa untuk geodata
    pengolahan dan ...
    Unduh SAGA GIS
  • 5
    Toolbox untuk Java/JTOpen
    Toolbox untuk Java/JTOpen
    Toolbox IBM untuk Java / JTOpen adalah a
    perpustakaan kelas Java mendukung
    client/server dan pemrograman internet
    model ke sistem yang menjalankan OS/400,
    i5/OS, atau...
    Unduh Toolbox untuk Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (atau D3 untuk Dokumen Berbasis Data)
    adalah perpustakaan JavaScript yang memungkinkan Anda
    untuk menghasilkan data yang dinamis dan interaktif
    visualisasi di browser web. Dengan D3
    kamu...
    Unduh D3.js
  • Lebih banyak lagi »

Perintah Linux

Ad