EnglishFrenchSpanyol

Ad


Favicon OnWorks

cmalign - Dalam talian dalam Awan

Jalankan cmalign dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah arahan cmalign yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


cmalign - menjajarkan jujukan kepada model kovarians

SINOPSIS


cmalign
[pilihan]

DESCRIPTION


cmalign menyelaraskan urutan RNA dalam kepada model kovarians (CM) dalam .
Penjajaran baharu dikeluarkan kepada stdout dalam format Stockholm, tetapi boleh diubah hala ke fail
dengan -o pilihan.

Sama ada or (tetapi bukan kedua-duanya) mungkin '-' (sempang), yang bermaksud membaca ini
input daripada stdin bukannya fail.

Fail urutan mestilah dalam format FASTA atau Genbank.

cmalign menggunakan teknik jalur HMM untuk mempercepatkan penjajaran secara lalai seperti yang diterangkan
di bawah untuk --hbanded pilihan. Banding HMM boleh dimatikan dengan --tidak berjalur pilihan.

Secara lalai, cmalign mengira penjajaran dengan ketepatan jangkaan maksimum iaitu
selaras dengan kekangan (jalur) yang diperoleh daripada HMM, menggunakan versi berjalur
Algoritma ketepatan optimum Durbin/Holmes. Tingkah laku ini boleh diubah dengan --cyk or
--sampel pilihan.

cmalign mengambil perhatian khusus untuk menjajarkan jujukan terpotong dengan betul, di mana beberapa nukleotida
dari awal (5') dan/atau akhir (3') jujukan biologi panjang penuh sebenar ialah
tidak terdapat dalam jujukan input (lihat DL Kolbe dan SR Eddy, Bioinformatics, 25:1236-1243,
2009). Tingkah laku ini dihidupkan secara lalai, tetapi boleh dimatikan dengan --notrunc. Dalam sebelumnya
versi cmalign yang --sub pilihan diperlukan untuk mengendalikan terpotong dengan sewajarnya
urutan. The --sub pilihan masih tersedia dalam versi ini, tetapi kaedah lalai baharu
untuk mengendalikan urutan terpenggal haruslah sebaik atau lebih baik daripada kaedah sub dalam hampir
semua kes.

. --mamali pilihan membenarkan kemasukan penjajaran latihan tetap yang digunakan untuk membina
CM daripada fail dalam penjajaran output daripada cmalign.

Adalah mungkin untuk menggabungkan dua atau lebih penjajaran yang dibuat oleh CM yang sama menggunakan Easel
MiniApp esl-alimerge (disertakan dalam easel/miniapps/ subdirektori Infernal). Sebelumnya
versi cmalign termasuk pilihan untuk menggabungkan penjajaran tetapi ia telah ditamatkan
pembangunan esl-alimerge, yang jauh lebih cekap memori.

Secara lalai, cmalign akan mengeluarkan penjajaran kepada stdout. Penjajaran boleh diubah hala
kepada fail output dengan -o pilihan. Dengan -o, maklumat pada setiap sejajar
jujukan, termasuk sempadan penjajaran skor dan model akan dicetak ke stdout (lebih
di bawah ini).

Penjajaran output akan berada dalam format Stockholm secara lalai. Ini boleh ditukar kepada Pfam,
menjajarkan FASTA (AFA), A2M, Clustal atau format Phylip menggunakan --format luar pilihan,
di mana ialah nama format yang dikehendaki. Sebagai kes khas, jika penjajaran output
adalah besar (lebih daripada 10,000 jujukan atau lebih daripada 10,000,000 jumlah nukleotida) daripada
format output akan menjadi format Pfam, dengan setiap urutan muncul pada satu baris, untuk
sebab kecekapan ingatan. Untuk penjajaran yang lebih besar daripada ini, gunakan --ileaved akan paksa
format Stockholm berjalin, tetapi pengguna harus sedar bahawa ini mungkin memerlukan banyak
memori. --ileaved hanya akan berfungsi untuk penjajaran sehingga 100,000 jujukan atau 100,000,000
jumlah nukleotida.

Jika format penjajaran output ialah Stockholm atau Pfam, penjajaran output akan menjadi
dianotasi dengan kebarangkalian posterior yang menganggarkan tahap keyakinan setiap jajaran
nukleotida. Anotasi ini muncul sebagai baris yang bermula dengan "#=GR PP", satu per
jujukan, setiap satu di bawah jujukan sejajar yang sepadan " ".
Aksara dalam baris PP mempunyai 12 nilai yang mungkin: "0-9", "*", atau ".". Jika ".", kedudukan
sepadan dengan jurang dalam urutan. Nilai "0" menunjukkan kebarangkalian posterior bagi
antara 0.0 dan 0.05, "1" menunjukkan antara 0.05 dan 0.15, "2" menunjukkan antara 0.15 dan
0.25 dan seterusnya sehingga "9" yang menunjukkan antara 0.85 dan 0.95. Nilai "*" menunjukkan a
kebarangkalian posterior antara 0.95 dan 1.0. Kebarangkalian posterior yang lebih tinggi sepadan
untuk keyakinan yang lebih bahawa nukleotida sejajar adalah milik di mana ia muncul dalam
penjajaran. Dengan --tidak berjalur, pengiraan kebarangkalian posterior mempertimbangkan semua
kemungkinan penjajaran jujukan sasaran kepada CM. Tanpa --tidak berjalur (iaitu secara lalai
mod), pengiraan hanya mempertimbangkan kemungkinan penjajaran dalam jalur HMM. Selanjutnya,
kebarangkalian posterior adalah bersyarat pada mod pemangkasan penjajaran. Untuk
contoh, jika penjajaran jujukan dipenggal 5', nilai PP "9" menunjukkan antara
0.85 dan 0.95 daripada semua penjajaran terpotong 5' termasuk nukleotida yang diberikan pada
kedudukan. Anotasi posterior boleh dimatikan dengan --tiada masalah pilihan. Jika --kecil
didayakan, anotasi posterior juga mesti dimatikan menggunakan --tiada masalah.

Output jadual yang dicetak ke stdout jika -o pilihan yang digunakan termasuk satu baris
setiap urutan dan dua belas medan setiap baris: "idx": indeks jujukan dalam input
fail, "seq name": nama urutan; "panjang": panjang jujukan; "cm dari" dan
"cm to": kedudukan mula dan tamat model penjajaran; "trunc": "tidak" jika urutan
tidak dipenggal, "5'" jika permulaan urutan dipenggal 5', "3'" jika penghujung
jujukan dipotong, dan "5'&3'" jika kedua-dua permulaan dan penghujung dipotong;
"bit sc": skor bit penjajaran, "avg pp" purata kebarangkalian posterior bagi
semua nukleotida sejajar dalam penjajaran; "band calc", "penjajaran" dan "jumlah": masa
dalam saat yang diperlukan untuk mengira jalur HMM, mengira penjajaran dan melengkapkan
pemprosesan urutan, masing-masing; "mem (Mb)": saiz dalam Mb semua dinamik
matriks pengaturcaraan yang diperlukan untuk menjajarkan jujukan. Data jadual ini boleh disimpan
untuk memfailkan dengan --sfile pilihan.

PILIHAN


-h Bantuan; mencetak peringatan ringkas tentang penggunaan baris arahan dan pilihan yang tersedia.

-o Simpan penjajaran dalam format Stockholm ke fail . Lalai adalah untuk menulisnya
kepada keluaran standard.

-g Konfigurasikan model untuk penjajaran global model pertanyaan kepada sasaran
urutan. Secara lalai, model dikonfigurasikan untuk penjajaran setempat. Tempatan
penjajaran boleh mengandungi sisipan dan pemadaman besar yang dipanggil "hujung tempatan" dalam
struktur yang akan dihukum secara berbeza daripada indel biasa. Ini dianotasi sebagai
Lajur "~" dalam baris RF penjajaran output. The -g pilihan boleh digunakan untuk
tidak membenarkan tujuan tempatan ini. The -g pilihan diperlukan jika --sub pilihan juga
terpakai.

PILIHAN UNTUK MENGAWAL THE PENJELASAN ALGORITMA


--optacc
Jajarkan jujukan menggunakan algoritma ketepatan optimum Durbin/Holmes. Ini adalah
lalai. Penjajaran ketepatan optimum akan dikekang oleh jalur HMM untuk
pecutan melainkan jika --tidak berjalur pilihan didayakan. Ketepatan yang optimum
algoritma menentukan penjajaran yang memaksimumkan kebarangkalian posterior bagi
nukleotida sejajar di dalamnya. Kebarangkalian posterior ditentukan menggunakan
(mungkin berjalur HMM) varian algoritma Dalam dan Luar.

--cyk Jangan gunakan penjajaran ketepatan optimum Durbin/Holmes untuk menjajarkan jujukan,
sebaliknya gunakan algoritma CYK yang menentukan pemarkahan optimum (maksimum
kemungkinan) penjajaran jujukan kepada model, memandangkan jalur HMM (kecuali
--tidak berjalur juga didayakan).

--sampel
Contoh penjajaran daripada pengedaran penjajaran posterior. Bahagian belakang
pengedaran ditentukan menggunakan jalur HMM (kecuali --tidak berjalur) varian dari
Algoritma dalam.

--benih
Benih penjana nombor rawak dengan , integer >= 0. Pilihan ini hanya boleh
digunakan dalam kombinasi dengan --sampel. If adalah bukan sifar, pensampelan stokastik bagi
penjajaran akan boleh dihasilkan semula; arahan yang sama akan memberikan hasil yang sama. Jika
ialah 0, penjana nombor rawak disemai secara sewenang-wenangnya, dan stokastik
pensampelan mungkin berbeza dari run ke run perintah yang sama. Benih lalai ialah 181.

--notrunc
Matikan algoritma penjajaran terpotong. Semua urutan dalam fail input akan menjadi
diandaikan panjang penuh, melainkan --sub juga digunakan, dalam hal ini program boleh
masih mengendalikan urutan terpenggal tetapi akan menggunakan strategi alternatif untuk mereka
penjajaran.

--sub Hidupkan prosedur pembinaan dan penjajaran sub model. Bagi setiap urutan, an
HMM mula-mula digunakan untuk meramalkan lajur konsensus mula dan tamat model, dan lajur baharu
sub CM dibina yang hanya memodelkan lajur konsensus dari awal hingga akhir. The
jujukan kemudiannya diselaraskan dengan sub CM ini. Penjajaran sub ialah kaedah yang lebih lama daripada
lalai untuk menjajarkan jujukan yang mungkin dipotong. Secara lalai, cmalign
menggunakan algoritma DP khas untuk mengendalikan urutan terpotong yang sepatutnya lebih banyak
tepat daripada sub kaedah dalam kebanyakan kes. --sub masih disertakan sebagai pilihan
terutamanya untuk ujian terhadap pengendalian jujukan terpenggal lalai ini. "sub CM" ini
prosedur tidak sama dengan "sub CM" yang diterangkan oleh Weinberg dan Ruzzo.

PILIHAN UNTUK MENGAWAL Kelajuan DAN MEMORY KEPERLUAN


--hbanded
Pilihan ini dihidupkan secara lalai. Percepatkan penjajaran dengan memangkas kawasan
daripada matriks DP CM yang dianggap boleh diabaikan oleh HMM. Pertama, setiap urutan adalah
dijaringkan dengan pelan CM 9 HMM yang diperoleh daripada CM menggunakan HMM Ke Hadapan dan Ke Belakang
algoritma untuk mengira kebarangkalian posterior bahawa setiap nukleotida sejajar dengan setiap nukleotida
keadaan HMM. Kebarangkalian posterior ini digunakan untuk mendapatkan kekangan
(jalur) pada matriks DP CM. Akhirnya, jujukan sasaran diselaraskan dengan CM
menggunakan matriks DP berjalur, di mana sel di luar jalur diabaikan.
Biasanya kebanyakan matriks DP penuh terletak di luar jalur (selalunya lebih daripada 95%),
menjadikan teknik ini lebih pantas kerana lebih sedikit pengiraan DP diperlukan, dan banyak lagi
cekap ingatan kerana hanya sel dalam jalur perlu diperuntukkan.

Yang penting, banding HMM mengorbankan jaminan untuk menentukan secara optimum
penjajaran tepat atau optimum, yang akan terlepas jika ia terletak di luar jalur.
Paramater tau ialah jumlah jisim kebarangkalian yang dianggap boleh diabaikan semasa
pengiraan jalur HMM; nilai tau yang lebih rendah menghasilkan kelajuan yang lebih besar tetapi juga lebih besar
peluang kehilangan penjajaran optimum. Tau lalai ialah 1E-7, ditentukan
secara empirik sebagai pertukaran yang baik antara sensitiviti dan kelajuan, walaupun nilai ini boleh
diubah dengan --tau pilihan. Tahap pecutan meningkat dengan
kedua-dua tahap pemuliharaan panjang dan jujukan utama keluarga. Sebagai contoh,
dengan tau lalai 1E-7, model tRNA (pemuliharaan jujukan primer rendah dengan
panjang kira-kira 75 nukleotida) menunjukkan kira-kira 10X pecutan, dan rRNA bakteria SSU
model (pemuliharaan jujukan primer yang tinggi dengan panjang kira-kira 1500 nukleotida)
tunjukkan kira-kira 700X. Banding HMM boleh dimatikan dengan --tidak berjalur pilihan.

--tau
Tetapkan kebarangkalian kehilangan ekor yang digunakan semasa pengiraan jalur HMM kepada . Ini adalah
jumlah jisim kebarangkalian dalam kebarangkalian posterior HMM iaitu
dianggap remeh. Nilai lalai ialah 1E-7. Secara umum, nilai yang lebih tinggi akan
menghasilkan pecutan yang lebih besar, tetapi meningkatkan peluang kehilangan yang optimum
penjajaran disebabkan oleh jalur HMM.

--saiz mx
Tetapkan jumlah saiz matriks DP maksimum yang dibenarkan kepada megabait. Secara lalai ini
saiz ialah 1028 Mb. Ini sepatutnya cukup besar untuk kebanyakan penjajaran,
namun jika tidak cmalign akan cuba mengetatkan jalur HMM secara berulang
digunakan untuk mengekang penjajaran dengan menaikkan parameter tau dan mengira semula
jalur sehingga jumlah saiz matriks yang diperlukan jatuh di bawah megabait atau maksimum
nilai tau yang dibenarkan (0.05 secara lalai, tetapi boleh ditukar dengan --maxtau) dicapai. Pada
setiap lelaran pengetatan jalur, tau didarab dengan 2.0. Band mengetatkan
strategi boleh dimatikan dengan --fixedtau pilihan. Kalau maksimum tau
dicapai dan saiz matriks yang diperlukan masih melebihi atau jika banding HMM tidak
sedang digunakan dan saiz matriks yang diperlukan melebihi kemudian cmalign akan keluar
lebih awal dan laporkan mesej ralat bahawa matriks melebihi maksimumnya
saiz yang dibenarkan. Dalam kes ini, --saiz mx boleh digunakan untuk menaikkan had saiz atau
maksimum tau boleh dinaikkan dengan --maxtau. Had biasanya akan dilampaui
apabila --tidak berjalur pilihan digunakan tanpa --kecil pilihan, tetapi masih boleh berlaku
apabila --tidak berjalur tidak digunakan. Perhatikan bahawa jika cmalign sedang dijalankan pelbagai
benang pada mesin berbilang teras maka setiap benang mungkin mempunyai matriks yang diperuntukkan sehingga
mengikut ukuran Mb pada bila-bila masa.

--fixedtau
Matikan strategi pengetatan jalur HMM yang diterangkan dalam penjelasan mengenai
--saiz mx pilihan di atas.

--maxtau
Tetapkan nilai maksimum yang dibenarkan untuk tau semasa mengetatkan jalur, diterangkan dalam
penerangan tentang --saiz mx di atas, kepada . Secara lalai nilai ini ialah 0.05.

--tidak berjalur
Mematikan jalur HMM. Penjajaran yang dikembalikan adalah dijamin secara global
tepat secara optimum (secara lalai) atau skor global secara optimum (jika --cyk
didayakan). The --kecil pilihan disyorkan dalam kombinasi dengan pilihan ini,
kerana penjajaran standard tanpa jalur HMM memerlukan banyak memori (lihat
--kecil ).

--kecil
Gunakan algoritma penjajaran bahagi dan takluk CYK yang diterangkan dalam SR Eddy, BMC
Bioinformatik 3:18, 2002. The --tidak berjalur pilihan mesti digunakan dalam kombinasi dengan
pilihan ini. Juga, ia disyorkan pada bila-bila masa --tidak berjalur digunakan itu --kecil is
juga digunakan kerana penjajaran CM standard tanpa banding HMM memerlukan banyak
ingatan, terutamanya untuk RNA besar. --kecil membolehkan penjajaran CM dalam praktikal
had ingatan, mengurangkan memori yang diperlukan untuk penjajaran LSU rRNA, yang terbesar
RNA yang diketahui, daripada 150 Gb kepada kurang daripada 300 Mb. Pilihan ini hanya boleh digunakan dalam
gabungan dengan --tidak berjalur, --notrunc, and --cyk.

PILIHAN OUTPUT FILES


--sfile
Buang skor penjajaran setiap jujukan dan maklumat timig ke fail . Format
fail ini diterangkan di atas (ia adalah data yang sama dalam format yang sama seperti jadual
output stdout apabila -o pilihan digunakan).

--tfile
Buang jejak balik jujukan jadual untuk setiap jujukan individu ke fail .
Terutamanya berguna untuk penyahpepijatan.

--ifile
Buang maklumat sisipan setiap urutan ke fail . Format fail ialah
diterangkan oleh "#"-baris ulasan awalan disertakan di bahagian atas fail . .
memasukkan maklumat adalah sah walaupun apabila --matchonly pilihan digunakan.

--elfile
Buang maklumat masukkan keadaan EL setiap jujukan (hujung setempat) ke fail . Formatnya
daripada fail diterangkan oleh "#"-baris komen awalan disertakan di bahagian atas
fail . Maklumat sisipan EL adalah sah walaupun apabila --matchonly pilihan adalah
terpakai.

LAIN PILIHAN


--mamali
Membaca penjajaran daripada fail digunakan untuk membina model menyelaraskannya sebagai satu
membantah CM; cth penjajaran dalam diadakan tetap. Ini membolehkan anda
menjajarkan jujukan kepada model dengan cmalign dan melihatnya dalam konteks yang sedia ada
penjajaran berbilang dipercayai. mestilah fail penjajaran yang telah dibina oleh CM
daripada. Program ini mengesahkan bahawa jumlah semak fail sepadan dengan fail
digunakan untuk membina CM. Pilihan yang serupa dengan yang ini dipanggil --withali in
versi terdahulu daripada cmalign.

--mapstr
Mesti digunakan dalam kombinasi dengan --mamali . Cadangkan maklumat struktur
untuk mana-mana pseudoknot yang wujud dalam kepada penjajaran output. Pilihan yang serupa dengan
yang ini dipanggil --withstr dalam versi sebelumnya cmalign.

--maklumat
Tegaskan bahawa input adalah dalam format . Jangan jalankan format Babelfish
autodection. Ini sedikit sebanyak meningkatkan kebolehpercayaan program, kerana
Babelfish boleh membuat kesilapan; terutamanya disyorkan untuk tanpa pengawasan, tinggi-
larian throughput Infernal. Format yang boleh diterima ialah: FASTA, GENBANK dan DDBJ.
adalah tidak peka huruf besar-besaran.

--format luar
Tentukan format penjajaran output sebagai . Format yang boleh diterima ialah: Pfam, AFA,
A2M, Clustal dan Phylip. AFA diselaraskan dengan cepat. Hanya penjajaran Pfam dan Stockholm
format akan merangkumi anotasi struktur konsensus dan kebarangkalian posterior
anotasi sisa sejajar.

--dnaout
Keluarkan penjajaran sebagai penjajaran jujukan DNA, bukannya penjajaran RNA.

--tiada masalah
Jangan anotasi penjajaran output dengan kebarangkalian posterior.

--matchonly
Hanya sertakan lajur padanan dalam penjajaran output, jangan sertakan sebarang sisipan
berbanding dengan model konsensus. Pilihan ini mungkin berguna apabila membuat sangat besar
penjajaran yang memerlukan banyak memori dan ruang cakera, kebanyakannya diperlukan
hanya untuk menangani lajur sisipan yang merupakan jurang dalam kebanyakan jujukan.

--ileaved
Keluarkan penjajaran dalam format Stockholm berjalin dengan lebar tetap yang mungkin
lebih selesa untuk peperiksaan. Ini ialah format penjajaran output lalai bagi
versi terdahulu daripada cmalign. Perhatikan bahawa cmalign memerlukan lebih banyak ingatan apabila ini
pilihan digunakan. Atas sebab ini, --ileaved hanya akan berfungsi untuk penjajaran sehingga
100,000 jujukan atau sejumlah 100,000,000 nukleotida sejajar.

--kemunduran
Simpan salinan tambahan penjajaran output tanpa maklumat pengarang untuk difailkan
.

--verbose
Keluarkan maklumat tambahan dalam output skor jadual (output kepada stdout if -o
digunakan, atau untuk if --sfile digunakan). Ini terutamanya berguna untuk ujian dan
penyahpepijatan.

--CPU
Nyatakan bahawa pekerja CPU selari digunakan. Jika ditetapkan sebagai "0", kemudian
program akan dijalankan dalam mod bersiri, tanpa menggunakan benang. Anda juga boleh mengawal
nombor ini dengan menetapkan pembolehubah persekitaran, INFERNAL_NCPU. Pilihan ini akan
hanya tersedia jika mesin di mana Infernal dibina mampu digunakan
Benang POSIX (lihat bahagian Pemasangan panduan pengguna untuk maklumat lanjut
maklumat).

--mpi Jalankan sebagai program selari MPI. Pilihan ini hanya akan tersedia jika Infernal ada
telah dikonfigurasikan dan dibina dengan bendera "--enable-mpi" (lihat bahagian Installation
bahagian panduan pengguna untuk maklumat lanjut).

Gunakan cmalign dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

  • 1
    Alt-F
    Alt-F
    Alt-F menyediakan sumber percuma dan terbuka
    perisian tegar alternatif untuk DLINK
    DNS-320/320L/321/323/325/327L and
    DNR-322L. Alt-F mempunyai Samba dan NFS;
    menyokong ext2/3/4...
    Muat turun Alt-F
  • 2
    usm
    usm
    Usm adalah pakej slackware bersatu
    pengurus yang mengendalikan automatik
    resolusi pergantungan. Ia menyatukan
    pelbagai repositori pakej termasuk
    slackware, slacky, p...
    Muat turun usm
  • 3
    Chart.js
    Chart.js
    Chart.js ialah perpustakaan Javascript yang
    membolehkan pereka bentuk dan pembangun melukis
    semua jenis carta menggunakan HTML5
    elemen kanvas. Carta js menawarkan yang hebat
    tatasusunan...
    Muat turun Chart.js
  • 4
    iReport-Designer untuk JasperReports
    iReport-Designer untuk JasperReports
    NOTA: Sokongan iReport/Jaspersoft Studio
    Pengumuman: Mulai versi 5.5.0,
    Jaspersoft Studio akan menjadi rasmi
    pelanggan reka bentuk untuk JasperReports. iReport
    akan ...
    Muat turun iReport-Designer untuk JasperReports
  • 5
    PostInstallerF
    PostInstallerF
    PostInstallerF akan memasang semua
    perisian yang Fedora Linux dan lain-lain
    tidak termasuk secara lalai, selepas
    menjalankan Fedora buat kali pertama. Ianya
    senang untuk ...
    Muat turun PostInstallerF
  • 6
    helai
    helai
    Projek strace telah dipindahkan ke
    https://strace.io. strace is a
    diagnostik, penyahpepijatan dan pengajaran
    pengesan ruang pengguna untuk Linux. Ia telah diguna
    untuk memantau...
    Muat turun strace
  • Lebih »

Arahan Linux

Ad