InggrisPerancisSpanyol

Ad


favorit OnWorks

hmmsim - Online di Awan

Jalankan hmmsim di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows, atau emulator online MAC OS

Ini adalah perintah hmmsim yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, Windows online emulator atau MAC OS online emulator

PROGRAM:

NAMA


hmmsim - kumpulkan distribusi skor pada urutan acak

RINGKASAN


hmmm [pilihan]

DESKRIPSI


Grafik hmmm program menghasilkan urutan acak, menilainya dengan model di ,
dan mengeluarkan berbagai macam histogram, plot, dan distribusi yang sesuai untuk hasilnya
skor.

hmmm bukan bagian utama dari paket HMMER. Sebagian besar pengguna tidak akan punya alasan untuk
Gunakan. Ini digunakan untuk mengembangkan dan menguji metode statistik yang digunakan untuk menentukan nilai-P
dan E-nilai di HMMER3. Misalnya, itu digunakan untuk menghasilkan sebagian besar hasil di tahun 2008
makalah tentang statistik keselarasan lokal H3 (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Karena ini adalah testbed penelitian, Anda seharusnya tidak mengharapkannya sekuat yang lain
program dalam paket. Misalnya, opsi dapat berinteraksi dengan cara yang aneh; kita belum
diuji atau mencoba mengantisipasi semua kemungkinan kombinasi yang berbeda.

Tugas utamanya adalah menyesuaikan distribusi Gumbel kemungkinan maksimum dengan skor Viterbi atau
kemungkinan maksimum eksponensial ekor ke skor Maju skor tinggi, dan untuk menguji bahwa ini
distribusi pas mematuhi dugaan bahwa lambda ~ log_2 untuk kedua Viterbi Gumbel
dan ekor eksponensial Maju.

Outputnya adalah tabel angka, satu baris untuk setiap model. Empat kecocokan parametrik yang berbeda
terhadap data skor yang diuji: (1) kemungkinan maksimum cocok untuk kedua lokasi (mu/tau) dan
parameter kemiringan (lambda); (2) dengan asumsi lambda=log_2, kemungkinan maksimum cocok dengan
parameter lokasi saja; (3) sama tetapi dengan asumsi lambda yang dikoreksi tepi, menggunakan arus
prosedur pada H3 [Eddy, 2008]; dan (4) menggunakan kedua parameter yang ditentukan oleh arus H3
Prosedur. Statistik standar yang sederhana, cepat, dan kotor untuk kesesuaian adalah 'E@10',
nilai-E yang dihitung dari hit teratas peringkat ke-10, yang kami perkirakan sekitar 10.

Secara rinci, kolom output adalah:

nama Nama modelnya.

ekor Pecahan skor tertinggi digunakan agar sesuai dengan distribusinya. Untuk Viterbi, MSV, dan
Skor hibrida, defaultnya adalah 1.0 (distribusi Gumbel dipasang ke semua
data). Untuk skor Forward, defaultnya adalah 0.02 (ekor eksponensial dipasang ke
skor 2% tertinggi).

mu/tau Parameter lokasi untuk kemungkinan kecocokan maksimum dengan data.

lambda Parameter kemiringan untuk kemungkinan maksimum yang sesuai dengan data.

L@10 Nilai-E dihitung untuk skor tinggi peringkat 10 ('E@10') menggunakan ML mu/tau
dan lambda. Menurut definisi, ini diharapkan menjadi sekitar 10, jika estimasi nilai-E adalah
tepat.

mufiks Parameter lokasi, untuk kemungkinan maksimum yang sesuai dengan kemiringan yang diketahui (tetap)
parameter lambda dari log_2 (0.693).

E@10perbaikan
Nilai-E dihitung untuk skor peringkat 10 menggunakan mufix dan yang diharapkan
lambda = log_2 = 0.693.

mufix2 Parameter lokasi, untuk kemungkinan maksimum yang sesuai dengan efek tepi yang dikoreksi
lambda.

E@10perbaikan2
E-value dihitung untuk skor peringkat 10 menggunakan mufix2 dan edge-effect-
lambda yang dikoreksi.

PMU Parameter lokasi ditentukan oleh prosedur estimasi H3.

plambda
Parameter kemiringan yang ditentukan oleh prosedur estimasi H3.

pe@10 Nilai E dihitung untuk skor peringkat 10 menggunakan pmu, plambda.

Di akhir tabel ini, satu baris lagi dicetak, dimulai dengan # dan meringkasnya
keseluruhan waktu CPU yang digunakan oleh simulasi.

Beberapa file output opsional dalam format xmgrace xy. xmgrace kuat dan bebas
perangkat lunak grafik-plotting yang tersedia.

LAIN-LAIN PILIHAN


-h Membantu; cetak pengingat singkat tentang penggunaan baris perintah dan semua opsi yang tersedia.

-a Kumpulkan statistik panjang keselarasan Viterbi yang diharapkan dari setiap urutan simulasi.
Ini hanya berfungsi dengan skor Viterbi (default; lihat --vit). Dua tambahan
bidang dicetak dalam tabel keluaran untuk setiap model: panjang rata-rata Viterbi
keselarasan, dan standar deviasi.

-v (Verbose). Cetak skor juga, satu skor per baris.

-L Atur panjang urutan sampel secara acak (nonhomolog) ke . itu
defaultnya adalah 100.

-N Atur jumlah urutan sampel secara acak ke . Standarnya adalah 1000.

--mpi Jalankan dalam mode paralel MPI, di bawah pirun. Itu diparalelkan pada tingkat pengiriman
satu profil pada satu waktu ke proses pekerja MPI, jadi paralelisasi hanya membantu jika
Anda memiliki lebih dari satu profil di , dan Anda ingin memiliki setidaknya sebagai
banyak profil sebagai proses pekerja MPI. (Hanya tersedia jika dukungan MPI opsional adalah
diaktifkan pada waktu kompilasi.)

PILIHAN PENGENDALIAN KELUARAN


-o Simpan tabel output utama ke file daripada mengirimnya ke stdout.

--file
Saat mengumpulkan statistik keselarasan Viterbi (the -a opsi), untuk setiap sampel
urutan, keluaran dua bidang per baris ke file : panjang optimal
keselarasan, dan skor bit Viterbi. Mengharuskan bahwa -a pilihan juga digunakan.

--efile
Keluarkan plot peringkat vs. E-nilai dalam format XMGRACE xy ke file . sumbu x adalah
peringkat urutan ini, dari skor tertinggi ke terendah; sumbu y adalah nilai-E
dihitung untuk urutan ini. Nilai-E dihitung menggunakan prosedur default H3
(yaitu parameter pmu, plambda dalam tabel keluaran). Anda mengharapkan pertandingan yang kasar
antara peringkat dan nilai-E jika nilai-E diperkirakan secara akurat.

--file
Keluarkan file "kekuatan filter" ke : untuk setiap model, garis dengan tiga bidang:
nama model, jumlah urutan yang melewati ambang nilai-P, dan fraksi
urutan melewati ambang P-nilai. Melihat --pthresh untuk mengatur nilai-P
ambang batas, yang defaultnya adalah 0.02 (ambang filter MSV default di H3). P-
nilai ditentukan oleh prosedur default H3 (parameter pmu,plambda di
tabel keluaran). Jika semuanya baik-baik saja, Anda berharap melihat kekuatan filter sama dengan
pengaturan nilai-P yang diprediksi dari ambang batas.

--file
Keluarkan plot kelangsungan hidup kumulatif (P(S>x)) ke file dalam format XMGRACE xy. Di sana
ada tiga plot: (1) distribusi skor yang diamati; (2) kemungkinan maksimum
distribusi dipasang; (3) kemungkinan maksimum yang sesuai dengan parameter lokasi
(mu/tau) sementara
dengan asumsi lambda=log_2.

--xfile
Keluarkan skor bit sebagai larik biner float presisi ganda (8 byte per
skor) untuk mengajukan . Program seperti Easel's esl-histplot dapat membaca file biner tersebut.
Ini berguna ketika menghasilkan ukuran sampel yang sangat besar.

PILIHAN PENGENDALIAN MODEL KONFIGURASI (MODE)


H3 hanya menggunakan multihit local alignment ( --fs mode), dan di sinilah kami percaya bahwa
statistik cocok. Skor keselarasan lokal Unihit (Smith/Waterman; --sw mode) juga patuhi kami
dugaan statistik. Statistik keselarasan glocal (baik multihit atau unihit) adalah
masih belum cukup dipahami atau dipasang secara memadai.

--fs Kumpulkan skor penyelarasan lokal multihit. Ini adalah default. keselarasan sebagai
'mode pencarian fragmen'.

--sw Kumpulkan skor keselarasan lokal unit. Status H3 J dinonaktifkan. keselarasan sebagai
'Mode pencarian Smith/Waterman'.

--l Kumpulkan skor keselarasan glocal multihit. Dalam keselarasan glocal (global/lokal),
seluruh model harus sejajar, dengan urutan target. Masuk/keluar lokal H3
probabilitas transisi dinonaktifkan. 'ls' berasal dari sejarah HMMER2
terminologi untuk penyelarasan lokal multihit sebagai 'mode pencarian lokal'.

--S Kumpulkan skor keselarasan glocal unihit. Baik negara bagian H3 J dan entri/keluar lokal
probabilitas transisi dinonaktifkan. 's' berasal dari sejarah HMMER2
terminologi untuk keselarasan glocal unit.

PILIHAN PENGENDALIAN SKOR ALGORITMA


--vit Kumpulkan skor keselarasan kemungkinan maksimum Viterbi. Ini adalah default.

--fwd Kumpulkan skor kemungkinan log-peluang maju, dijumlahkan dengan ansambel penyelarasan.

--hyb Kumpulkan skor 'Hibrida', seperti yang dijelaskan dalam makalah oleh Yu dan Hwa (misalnya,
Bioinformatika 18:864, 2002). Ini melibatkan menghitung matriks Maju dan mengambil
nilai sel maksimum. Angka itu sendiri secara statistik agak tidak termotivasi,
tetapi distribusinya diharapkan menjadi distribusi nilai ekstrim yang berperilaku baik
(Gumbel).

--msv Kumpulkan skor MSV (multiple ungapped segment Viterbi), menggunakan main H3
heuristik percepatan.

--cepat Untuk salah satu opsi di atas, gunakan implementasi produksi H3 yang dioptimalkan (menggunakan
vektorisasi SIMD). Standarnya adalah menggunakan implementasi yang mengorbankan sedikit
jumlah presisi numerik. Hal ini dapat menimbulkan kebisingan yang mengganggu ke dalam
simulasi statistik dan kecocokan, jadi ketika seseorang menjadi sangat khawatir tentang yang tepat
detail, lebih baik untuk dapat memfaktorkan sumber kebisingan itu.

PILIHAN PENGENDALIAN PAS EKOR MASSA UNTUK MENERUSKAN


Dalam beberapa percobaan, itu berguna untuk menyesuaikan skor Maju ke berbagai ekor yang berbeda
massa, bukan hanya satu. Opsi-opsi ini menyediakan mekanisme untuk memasang secara merata-
rentang jarak dari massa ekor yang berbeda. Untuk setiap massa ekor yang berbeda, sebuah garis dihasilkan
dalam keluaran.

--tmin
Tetapkan batas bawah pada distribusi massa ekor. (Defaultnya adalah 0.02 untuk
massa ekor tunggal default.)

--tmaks
Atur batas atas pada distribusi massa ekor. (Defaultnya adalah 0.02 untuk
massa ekor tunggal default.)

--titik
Atur jumlah massa ekor untuk sampel, mulai dari --tmin dan berakhir pada --tmaks.
(Defaultnya adalah 1, untuk massa ekor tunggal 0.02 default.)

--tlinier
Contoh rentang massa ekor dengan jarak linier seragam. Standarnya adalah menggunakan
jarak logaritma seragam.

PILIHAN PENGENDALIAN H3 PARAMETER MEMPERKIRAKAN METODE


H3 menggunakan tiga simulasi urutan acak pendek untuk memperkirakan parameter lokasi untuk
distribusi skor yang diharapkan untuk skor MSV, skor Viterbi, dan skor Forward. Ini
pilihan memungkinkan simulasi ini untuk dimodifikasi.

--EmL
Menetapkan panjang urutan dalam simulasi yang memperkirakan parameter lokasi mu untuk
MSV E-nilai. Standarnya adalah 200.

--EmN
Menetapkan jumlah urutan dalam simulasi yang memperkirakan parameter lokasi mu
untuk nilai-E MSV. Standarnya adalah 200.

--EvL
Menetapkan panjang urutan dalam simulasi yang memperkirakan parameter lokasi mu untuk
Viterbi E-nilai. Standarnya adalah 200.

--EvN
Menetapkan jumlah urutan dalam simulasi yang memperkirakan parameter lokasi mu
untuk Viterbi E-nilai. Standarnya adalah 200.

--EfL
Menetapkan panjang urutan dalam simulasi yang memperkirakan parameter lokasi tau
untuk Maju E-nilai. Standarnya adalah 100.

--EfN
Menetapkan jumlah urutan dalam simulasi yang memperkirakan parameter lokasi
tau untuk Forward E-nilai. Standarnya adalah 200.

--Eft
Mengatur fraksi massa ekor agar sesuai dengan simulasi yang memperkirakan lokasi
parameter tau untuk nilai Maju. Standarnya adalah 0.04.

DEBUGING PILIHAN


--kios
Untuk men-debug versi master/pekerja MPI: jeda setelah mulai, untuk mengaktifkan
pengembang untuk melampirkan debugger ke proses master dan pekerja yang sedang berjalan. Mengirim
Sinyal SIGCONT untuk melepaskan jeda. (Di bawah gdb: (Gdb) sinyal KONTAK BERIKUTNYA) (Hanya
tersedia jika dukungan MPI opsional diaktifkan pada waktu kompilasi.)

--benih
Setel benih nomor acak ke . Standarnya adalah 0, yang membuat angka acak
generator menggunakan benih sewenang-wenang, sehingga menjalankan yang berbeda hmmm akan hampir
tentu menghasilkan sampel statistik yang berbeda. Untuk debugging, berguna untuk
memaksakan hasil yang dapat direproduksi, dengan memperbaiki seed nomor acak.

EKSPERIMENTAL PILIHAN


Opsi-opsi ini digunakan dalam sejumlah kecil eksperimen eksplorasi yang berbeda.

--bgflat
Atur distribusi residu latar belakang ke distribusi seragam, baik untuk
tujuan model nol yang digunakan dalam menghitung skor, dan untuk menghasilkan
urutan acak. Standarnya adalah menggunakan frekuensi latar belakang asam amino standar
distribusi.

--bgkomp
Atur distribusi residu latar belakang ke komposisi rata-rata profil.
Ini digunakan dalam mengeksplorasi beberapa efek dari komposisi yang bias.

--x-tanpa-panjangmodel
Matikan model panjang urutan target H3. Tetapkan transisi mandiri untuk N,C,J
dan model nol menjadi 350/351 sebagai gantinya; ini mengemulasi HMMER2. Bukan ide yang bagus di
umum. Ini digunakan untuk menunjukkan salah satu perbedaan utama H2 vs H3.

--tidak
Tetapkan parameter nu untuk algoritme MSV -- jumlah yang diharapkan dari lokal yang tidak di-gap
keselarasan per urutan target. Standarnya adalah 2.0, sesuai dengan E->J
probabilitas transisi 0.5. Ini digunakan untuk menguji apakah variasi nu memiliki
efek signifikan pada hasil (tampaknya tidak, dalam alasan). Opsi ini saja
bekerja jika --msv dipilih (hanya mempengaruhi MSV), dan tidak akan bekerja dengan --cepat
(karena implementasi yang dioptimalkan dirancang untuk mengasumsikan nu=2.0).

--pthresh
Atur ambang batas nilai P filter untuk digunakan dalam menghasilkan file daya filter dengan
--file. Standarnya adalah 0.02 (yang sesuai untuk menguji skor MSV,
karena ini adalah ambang filter MSV default dalam pipa akselerasi H3.)
Pilihan lain yang sesuai (default yang cocok dalam pipa akselerasi) adalah
0.001 untuk Viterbi, dan 1e-5 untuk Forward.

Gunakan hmmsim online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

Perintah Linux

Ad