İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

hmmsim - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında hmmsim çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen hmmsim komutudur.

Program:

ADI


hmmsim - rastgele dizilerdeki puan dağılımlarını topla

SİNOPSİS


hmmsim [seçenekler]

TANIM


The hmmsim program rastgele diziler üretir, bunları aşağıdaki model(ler)le puanlar. ,
ve elde edilen sonuçlar için çeşitli türlerde histogramlar, çizimler ve uygun dağılımlar verir.
puanları.

hmmsim HMMER paketinin ana bir parçası değildir. Çoğu kullanıcının bir nedeni olmaz
onu kullan. P-değerlerini belirlemek için kullanılan istatistiksel yöntemleri geliştirmek ve test etmek için kullanılır.
ve HMMER3'teki E değerleri. Örneğin, 2008'deki sonuçların çoğunu oluşturmak için kullanıldı.
H3'ün yerel hizalama istatistiklerine ilişkin makale (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Bir araştırma test ortamı olduğu için, diğerleri kadar sağlam olmasını beklememelisiniz.
paketteki programlar. Örneğin, seçenekler tuhaf şekillerde etkileşime girebilir; biz yapmadık
test edilmiş veya tüm farklı olası kombinasyonları tahmin etmeye çalışmamıştır.

Ana görev, bir maksimum olasılık Gumbel dağılımını Viterbi puanlarına veya bir
maksimum olabilirlik üstel yüksek puanlı İleri puanlara kuyruk ve bunların test edilmesi için
uygun dağılımlar, hem Viterbi Gumbel için lambda ~ log_2 varsayımına uyar
ve İleri üstel kuyruk.

Çıktı, her model için bir satır olan bir sayılar tablosudur. Dört farklı parametrik uyum
puan verileri test edilir: (1) maksimum olabilirlik hem konuma (mu/tau) hem de
eğim (lambda) parametreleri; (2) lambda=log_2 varsayıldığında, maksimum olabilirlik
yalnızca konum parametresi; (3) aynı, ancak akımı kullanarak kenar düzeltmeli bir lambda varsayarak
H3'teki prosedürler [Eddy, 2008]; ve (4) H3'ün akımı tarafından belirlenen her iki parametreyi kullanarak
prosedürler. Uyum iyiliği için standart basit, hızlı ve kirli istatistik 'E@10'dur,
10. sıradaki en yüksek isabetin hesaplanan E-değeri, yaklaşık 10 olmasını bekliyoruz.

Ayrıntılı olarak, çıktının sütunları şunlardır:

isim Modelin adı.

kuyruk Dağılıma uyması için kullanılan en yüksek puanların kesri. Viterbi, MSV ve için
Hibrit puanlar, bu varsayılan olarak 1.0'dır (bir Gumbel dağılımı, tüm
veri). İleri puanlar için, bu varsayılan olarak 0.02'dir (üstel bir kuyruk,
en yüksek %2 puan).

mu/tau Verilere uyma olasılığı en yüksek olan konum parametresi.

lambda Verilere uyan maksimum olasılık için eğim parametresi.

E@10 ML mu/tau kullanılarak 10. sıradaki yüksek puan ('E@10') için hesaplanan E-değeri
ve lambda. Tanım olarak, E-değeri tahmini olsaydı, bunun yaklaşık 10 olması beklenirdi.
doğru.

mufiks Bilinen (sabit) bir eğimle maksimum olasılık uyumu için konum parametresi
log_2'nin lambda parametresi (0.693).

E@10 düzeltme
10. sıradaki puan için mufix kullanılarak hesaplanan E değeri ve beklenen
lambda = log_2 = 0.693.

mufix2 Kenar etkisi düzeltmeli bir maksimum olasılık uyumu için konum parametresi
lambda.

E@10fix2
10. sıradaki puan için mufix2 ve kenar etkisi kullanılarak hesaplanan E değeri
düzeltilmiş lambda

pmu H3'ün tahmin prosedürleri tarafından belirlenen konum parametresi.

plambda
H3'ün tahmin prosedürleri tarafından belirlenen eğim parametresi.

pE@10 10. sıradaki puan için pmu, plambda kullanılarak hesaplanan E değeri.

Bu tablonun sonunda, # ile başlayan ve tabloyu özetleyen bir satır daha yazdırılır.
simülasyonlar tarafından kullanılan toplam CPU zamanı.

İsteğe bağlı çıktı dosyalarından bazıları xmgrace xy biçimindedir. xmgrace güçlü ve özgürdür
mevcut grafik çizme yazılımı.

ÇEŞİTLİ SEÇENEKLER


-h Yardım; komut satırı kullanımı ve mevcut tüm seçenekler hakkında kısa bir hatırlatma yazdırın.

-a Her simüle edilmiş diziden beklenen Viterbi hizalama uzunluğu istatistiklerini toplayın.
Bu yalnızca Viterbi puanlarıyla çalışır (varsayılan; bkz. --vit). iki ek
alanlar her model için çıktı tablosunda yazdırılır: ortalama Viterbi uzunluğu
hizalamalar ve standart sapma.

-v (Ayrıntılı). Puanları da yazdırın, satır başına bir puan.

-L Rastgele örneklenmiş (homolog olmayan) dizilerin uzunluğunu şu şekilde ayarlayın: .
varsayılan 100'tür.

-N Rastgele örneklenen dizilerin sayısını şu şekilde ayarlayın: . Varsayılan 1000'dir.

--mpi altında, MPI paralel modunda çalıştırın mpirun. Gönderme düzeyinde paralelleştirilir.
MPI çalışan işlemine her seferinde bir profil, bu nedenle paralelleştirme yalnızca şu durumlarda yardımcı olur:
içinde birden fazla profiliniz var ve en azından sahip olmak istediğiniz
MPI çalışan süreçleri olarak birçok profil. (Yalnızca isteğe bağlı MPI desteği
derleme zamanında etkinleştirilir.)

SEÇENEKLER KONTROL ÇIKTI


-o Ana çıktı tablosunu bir dosyaya kaydedin stdout'a göndermek yerine.

--bir dosya
Viterbi hizalama istatistiklerini toplarken ( -a seçenek), her örneklenen için
sıra, bir dosyaya satır başına iki alan çıktısı al : optimalin uzunluğu
hizalama ve Viterbi bit puanı. Şunları gerektirir: -a seçeneği de kullanılır.

--E-Dosya
Dosyaya XMGRACE xy formatında bir sıralama ve E-değer grafiği çıktısı alın . x ekseni
bu dizinin sıralaması, en yüksek puandan en düşüğe; y ekseni E değeridir
bu dizi için hesaplanmıştır. E-değerleri, H3'ün varsayılan prosedürleri kullanılarak hesaplanır
(yani çıktı tablosundaki pmu, plambda parametreleri). Zor bir maç bekliyorsun
E-değerleri doğru bir şekilde tahmin edilirse, sıra ile E-değeri arasında.

--fffile
Bir "filtre gücü" dosyası çıktısı alın : her model için üç alanlı bir satır:
model adı, P değeri eşiğini geçen dizi sayısı ve
P değeri eşiğini geçen diziler. Görmek --ptresh P değerini ayarlamak için
varsayılan olarak 0.02 olan eşik (H3'teki varsayılan MSV filtre eşiği). P-
değerler H3'ün varsayılan prosedürleri tarafından belirlenir (pmu,plambda parametreleri
çıktı tablosu). Her şey yolundaysa, filtre gücünün şuna eşit olmasını beklersiniz:
eşiğin tahmini P değeri ayarı.

--p dosyası
Dosyaya kümülatif hayatta kalma grafikleri (P(S>x)) çıktısı XMGRACE xy formatında. Orası
üç grafiktir: (1) gözlemlenen puan dağılımı; (2) maksimum olasılık
uygun dağıtım; (3) konum parametresine uygun bir maksimum olasılık
(mu/tau) iken
lambda=log_2 varsayarsak.

--xdosyası
Bit puanlarını, çift duyarlıklı kayan noktaların ikili dizisi olarak (her biri için 8 bayt) çıktılayın.
puan) dosyaya . Şövale gibi programlar esl-histoplot bu tür ikili dosyaları okuyabilir.
Bu, son derece büyük örnek boyutları oluştururken kullanışlıdır.

SEÇENEKLER KONTROL MODEL YAPILANDIRMA (MODA)


H3 yalnızca çok vuruşlu yerel hizalamayı kullanır ( --fs modu) ve burası bizim inandığımız yer
istatistiksel uyum. Unihit yerel hizalama puanları (Smith/Waterman; --sw modu) ayrıca bize uyun
istatistiksel varsayımlar. Küresel hizalama istatistikleri (çoklu isabetli veya tekli vuruşlu)
hala yeterince anlaşılmamış ve yeterince takılmamıştır.

--fs Çok vuruşlu yerel hizalama puanları toplayın. Bu varsayılandır. olarak hizalama
'parça arama modu'.

--sw Unihit yerel hizalama puanları toplayın. H3 J durumu devre dışı. olarak hizalama
'Smith/Waterman arama modu'.

--ls Çok vuruşlu küresel hizalama puanlarını toplayın. Küresel (küresel/yerel) hizalamada,
tüm model, hedefin bir alt sırasına göre hizalanmalıdır. H3 yerel giriş/çıkış
geçiş olasılıkları devre dışı bırakılır. 'ls' HMMER2'nin geçmişinden geliyor
'yerel arama modu' olarak çok vuruşlu yerel hizalama için terminoloji.

--S Unihit glocal hizalama puanları toplayın. Hem H3 J durumu hem de yerel giriş/çıkış
geçiş olasılıkları devre dışı bırakılır. 's' HMMER2'nin geçmişinden geliyor
unihit küresel uyum için terminoloji.

SEÇENEKLER KONTROL PUANLAMA ALGORITMASı


--vit Viterbi maksimum olabilirlik hizalama puanlarını toplayın. Bu varsayılandır.

--ileri Hizalama topluluğu üzerinden toplanan Forward log-odds olasılık puanlarını toplayın.

--hyb Yu ve Hwa'nın makalelerinde açıklandığı gibi 'Hibrit' puanları toplayın (örneğin,
Biyoinformatik 18:864, 2002). Bunlar, bir Forward matrisinin hesaplanmasını ve alınmasını içerir.
maksimum hücre değeri. Sayının kendisi istatistiksel olarak bir şekilde motive edilmemiş,
ancak dağılımın iyi niyetli bir aşırı değer dağılımı olması bekleniyor
(Gümbel).

--msv H3'ün ana değerini kullanarak MSV (çoklu bağlanmamış segment Viterbi) puanlarını toplayın
hızlanma buluşsal.

--hızlı Yukarıdaki seçeneklerden herhangi biri için H3'ün optimize edilmiş üretim uygulamasını kullanın (kullanarak
SIMD vektörleştirme). Varsayılan, uygulamaları kullanmaktır, küçük bir fedakarlık yapın
sayısal hassasiyet miktarı. Bu, kafa karıştırıcı gürültüye neden olabilir
istatistiksel simülasyonlar ve uyumlar, bu nedenle kesinlik hakkında süper endişe duyulduğunda
Ayrıntılar için, bu gürültü kaynağını hesaba katabilmek daha iyidir.

SEÇENEKLER KONTROL HAZIR KUYRUK KİTLELER İÇİN İLERİ


Bazı deneylerde, Forward puanlarını bir dizi farklı kuyruğa sığdırmak faydalı oldu.
bir değil, kitleler. Bu seçenekler, eşit bir şekilde takmak için bir mekanizma sağlar.
farklı kuyruk kütlelerinin aralıklı aralığı. Her farklı kuyruk kütlesi için bir çizgi oluşturulur
çıktıda.

--tmin
Kuyruk kütlesi dağılımında alt sınırı ayarlayın. (Varsayılan değer 0.02'dir.
varsayılan tek kuyruk kütlesi.)

--tmaks
Kuyruk kütlesi dağılımında üst sınırı ayarlayın. (Varsayılan değer 0.02'dir.
varsayılan tek kuyruk kütlesi.)

--tpuanlar
Numune alınacak kuyruk kütlelerinin sayısını aşağıdakilerden başlayarak ayarlayın: --tmin ve biten --tmaks.
(Varsayılan 1 tek kuyruk kütlesi için varsayılan 0.02'dir.)

--doğrusal
Düzgün doğrusal aralıklı bir dizi kuyruk kütlesini örnekleyin. Varsayılan, kullanmaktır
tek tip logaritmik aralık.

SEÇENEKLER KONTROL H3 PARAMETRE TAHMİN YÖNTEMLER


H3, konum parametrelerini tahmin etmek için üç kısa rastgele dizi simülasyonu kullanır.
MSV puanları, Viterbi puanları ve İleri puanlar için beklenen puan dağılımları. Bunlar
seçenekler bu simülasyonların değiştirilmesine izin verir.

--EmL
için konum parametresini tahmin eden simülasyondaki dizi uzunluğunu ayarlar.
MSV E değerleri. Varsayılan 200'dür.

--EmN
Konum parametresini tahmin eden simülasyondaki dizilerin sayısını ayarlar mu
MSV E değerleri için. Varsayılan 200'dür.

--EvL
için konum parametresini tahmin eden simülasyondaki dizi uzunluğunu ayarlar.
Viterbi E değerleri. Varsayılan 200'dür.

--EvN
Konum parametresini tahmin eden simülasyondaki dizilerin sayısını ayarlar mu
Viterbi E değerleri için. Varsayılan 200'dür.

--EfL
Konum parametresi tau'yu tahmin eden simülasyondaki dizi uzunluğunu ayarlar
İleri E-değerleri için. Varsayılan 100'dür.

--EfN
Konum parametresini tahmin eden simülasyondaki dizilerin sayısını ayarlar
İleri E-değerleri için tau. Varsayılan 200'dür.

--Eft
Kuyruk kütle fraksiyonunu konumu tahmin eden simülasyona sığacak şekilde ayarlar
İleri değerler için tau parametresi. Varsayılan 0.04'tür.

HATA AYIKLAMA SEÇENEKLER


--ahır
MPI ana/işçi sürümünde hata ayıklamak için: başlatıldıktan sonra duraklatın,
çalışan ana ve çalışan(lar) süreçlerine hata ayıklayıcılar eklemek için geliştirici. Göndermek
Duraklatmayı bırakmak için SIGCONT sinyali. (gdb altında: (gdb) işaret SONRAKİCONT) (Bir tek
derleme zamanında isteğe bağlı MPI desteği etkinleştirildiyse kullanılabilir.)

--tohum
Rastgele sayı tohumunu şuna ayarlayın: . Varsayılan, rastgele sayı yapan 0'dır.
jeneratör keyfi bir tohum kullanır, böylece farklı çalıştırmalar hmmsim neredeyse olacak
kesinlikle farklı bir istatistiksel örnek oluşturur. Hata ayıklama için yararlıdır
rastgele bir sayı tohumunu sabitleyerek tekrarlanabilir sonuçları zorlayın.

DENEYSEL SEÇENEKLER


Bu seçenekler, küçük bir çeşitlilikte farklı keşif deneylerinde kullanıldı.

--bgflat
Arka plan kalıntı dağılımını, her ikisi için de tek tip bir dağılıma ayarlayın.
puanların hesaplanmasında kullanılan boş modelin amaçları ve
rastgele diziler. Varsayılan, standart bir amino asit arka plan frekansı kullanmaktır.
dağılımı.

--bgcomp
Arka plan kalıntı dağılımını profilin ortalama bileşimine ayarlayın.
Bu, taraflı kompozisyonun bazı etkilerinin araştırılmasında kullanıldı.

--x-uzunluksuz model
H3 hedef dizi uzunluğu modelini kapatın. N,C,J için kendi kendine geçişleri ayarlayın
ve bunun yerine boş model 350/351'e; bu, HMMER2'yi öykünür. içinde iyi bir fikir değil
Genel. Bu, ana H2 ve H3 farklılıklarından birini göstermek için kullanıldı.

--nu
MSV algoritması için nu parametresini ayarlayın -- beklenen sayıda kapatılmamış yerel
hedef dizi başına hizalamalar. Varsayılan, bir E->J'ye karşılık gelen 2.0'dır.
0.5 geçiş olasılığı. Bu, değişen nu'nun olup olmadığını test etmek için kullanıldı.
sonuç üzerinde önemli bir etki (mantık dahilinde görünmüyor). Bu seçenek yalnızca
çalışırsa --msv seçildiğinde (yalnızca MSV'yi etkiler) ve birlikte çalışmayacaktır. --hızlı
(çünkü optimize edilmiş uygulamalar nu=2.0 varsaymak üzere kabloludur).

--ptresh
Filtre güç dosyalarının oluşturulmasında kullanılacak filtre P değeri eşiğini ayarlayın.
--fffile. Varsayılan, 0.02'dir (MSV puanlarını test etmek için uygun olacaktır,
bu, H3'ün hızlandırma boru hattındaki varsayılan MSV filtre eşiği olduğundan.)
Diğer uygun seçenekler (hızlandırma boru hattındaki eşleşen varsayılanlar) şu şekilde olacaktır:
Viterbi için 0.001 ve Forvet için 1e-5.

onworks.net hizmetlerini kullanarak hmmsim'i çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad