İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

cmcalibrate - Bulutta Çevrimiçi

OnWorks ücretsiz barındırma sağlayıcısında cmcalibrate'i Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü üzerinden çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden çok ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen cmcalibrate komutudur.

Program:

ADI


cmcalibrate - kovaryans modeli E-değeri belirleme için üstel kuyrukları sığdır

SİNOPSİS


cmkalibre [seçenekler] cm dosyası

TANIM


cmkalibre üreterek E-değeri belirleme için üstel kuyruk parametrelerini belirler
rastgele diziler, bunları CM ile arar ve elde edilen sonuçların puanlarını toplar.
isabetler. İsabetlerin bit puanlarının histogramı, üstel bir kuyruğa sığdır ve
takılan kuyruğun parametreleri CM dosyasına kaydedilir. üstel kuyruk parametreleri
daha sonra bulunan isabetlerin istatistiksel önemini tahmin etmek için kullanılır. cmarama ve
cmscan.

Bir CM dosyası ile kalibre edilmelidir cmkalibre önce kullanılabilir cmarama or cmtarama,
tek bir istisna dışında: yalnızca aşağıdakileri içeren CM dosyalarını kalibre etmek gerekli değildir.
çalıştırmadan önce sıfır temel çifti olan modeller cmarama.

cmkalibre çok yavaş. Tek bir ortalama boyutu kalibre etmek birkaç saat sürer
Tek bir CPU üzerinde CM. cmkalibre Infernal ise mevcut tüm çekirdeklerde paralel olarak çalışır
POSIX iş parçacığını destekleyen bir sistem üzerine kurulmuştur (bkz.
daha fazla bilgi için kullanım kılavuzu). kullanma çekirdekler kabaca sonuçlanacak kat
tek bir CPU'ya karşı hızlanma. MPI (Mesaj Geçiş Arayüzü) için de kullanılabilir
ile paralelleştirme --mpi Infernal, MPI etkinken oluşturulmuşsa, ancak
161'den fazla işlemci önerilmez çünkü 161'i aşmak hızlanmaz
kalibrasyon. Daha fazla bilgi için kullanıcı kılavuzunun Kurulum bölümüne bakın.

The --tahmin etmek seçeneği, programın belirli bir süre boyunca çalışmasının ne kadar süreceğini tahmin etmek için kullanılabilir.
verilmiş cm dosyası mevcut makinede. Çalışma süresini tahmin etmek için işlemciler
MPI, ayrıca --öngörü seçeneği.

Aranan rastgele diziler cmkalibre konusunda eğitilmiş bir HMM tarafından üretilir.
çeşitli GC içeriklerine sahip gerçek genomik diziler. Amaç, GC dağılımlarına sahip olmaktır.
rastgele dizilerdeki gerçek genomik dizilerdekilere benzer olmalıdır.

Her biri için bir tane olmak üzere dört arama turu ve ardından üstel kuyruk uydurma gerçekleştirilir
kullanılabilecek dört farklı CM algoritması cmarama ve cmtarama: küresel CYK,
glokal Inside, yerel CYK ve yerel Inside.

tarafından belirlenen E-değerleri parametreleri cmkalibre sadece tarafından kullanılır cmarama ve cm tarama
programlar. Bu programları kullanmayacaksanız, kalibrasyon yapmak için zaman kaybetmeyin.
senin modellerin.

SEÇENEKLER


-h Yardım; komut satırı kullanımı ve mevcut seçenekler hakkında kısa bir hatırlatma yazdırın.

-L Aramak için rastgele dizilerin toplam uzunluğunu ayarlayın. megabazlar (Mb). Tarafından
, varsayılan is 1.6 Mb. Artan üstel kuyruğun daha fazla oturmasını sağlayacak
kesin ve E-değerleri daha doğrudur, ancak daha uzun sürer (iki katına kabaca olacak
çalışma süresini ikiye katlayın). azalan yapacağından tavsiye edilmez.
daha az hassas ve E-değerleri daha az doğrudur.

SEÇENEKLER İÇİN TAHMİN GEREKLİ ZAMAN VE BELLEK


--tahmin etmek
Kalibrasyonun çalışma süresini tahmin edin cm dosyası (verilen seçeneklerle birlikte)
geçerli makine ve çıkış. Kalibrasyon gerçekleştirilmez. tahminler
kaba tahminler olarak kabul edilmelidir. Çoklu kullanım etkinse (bkz.
Kullanım kılavuzunun kurulum bölümü), zamanlama sayıyı dikkate alacaktır.
mevcut çekirdek sayısı.

--öngörü
İle --tahmin etmek, bunu belirt Kalibrasyon için işlemciler kullanılacaktır.
Bu, bir MPI çalıştırmasının çalışma süresini tahmin etmek için yararlı olabilir.
işlemciler.

--memreq
Kalibrasyon için gerekli bellek miktarını tahmin edin cm dosyası (sağlanan
seçenekler) geçerli makinede ve çıkın. Kalibrasyon gerçekleştirilmez.

SEÇENEKLER KONTROL üstel KUYRUK uyar


--gtailn
glocal Inside ve glocal CYK için üstel kuyruğu en yüksek puanlar
histogram kuyruğunda, nerede is aranan Mb sayısının katıdır. NS
varsayılan değeri 250'dir. 250 değeri iyi çalıştığı için seçilmiştir.
ampirik olarak diğer değerlere göre.

--ltailn
yerel Inside ve yerel CYK için üstel kuyruğu en yüksek puanlar
histogram kuyruğunda, nerede is aranan Mb sayısının katıdır. NS
varsayılan değeri 750'dir. 750 değeri iyi çalıştığı için seçilmiştir.
ampirik olarak diğer değerlere göre.

--kuyruk
Görmezden gel --gtailn ve --ltailn ön ekli seçenekler ve uygun kesir kuyruğu
Tüm arama modları için histogramı üstel bir kuyruğa.

İSTEĞE BAĞLI ÇIKTI DOSYALAR


--hdosyası
Dosyaya uygun histogramları kaydedin . Bu dosyanın formatı iki boşluktur
satır başına sınırlandırılmış sütunlar. İlk sütun, bit puanlarının x ekseni değerleridir.
her bir kutu. İkinci sütun, kutu başına isabet sayısının y ekseni değerleridir. Her biri
dizi, tek bir "&" karakterli bir satırla sınırlandırılır. Dosya şunları içerecektir:
dört üstel kuyruğun her biri için bir dizi aşağıdaki sıraya göre uyar:
glokal CYK, glokal Inside, yerel CYK ve yerel Inside.

--dosya
Hayatta kalma planı bilgilerini dosyaya kaydet . Bu dosyanın formatı iki boşluktur
satır başına sınırlandırılmış sütunlar. İlk sütun, bit puanlarının x ekseni değerleridir.
her bir kutu. İkinci sütun, aşağıdakileri karşılayan veya karşılayan isabetlerin kesrinin y ekseni değerleridir.
her kutu için puanı aş. Her seri, tek bir çizgi ile sınırlandırılmıştır.
"&" karakteri. Dosya, dört CM'nin her biri için üç dizi veri içerecektir.
arama modları şu sırayla: glocal CYK, glocal Inside, yerel CYK ve
yerel İç. İlk seri, histogramdan elde edilen ampirik hayatta kalma grafiğidir.
rastgele sıraya isabet sayısı. İkinci seri, üstel kuyruk uygun
ampirik dağılım. Üçüncü seri, lambda ise üstel kuyruk uyumudur.
sabitlendi ve 2 (0.691314718) doğal günlüğü olarak ayarlandı.

--qq dosyası
Kuantil-kuantil arsa bilgilerini dosyaya kaydedin . Bu dosyanın formatı
satır başına iki boşlukla ayrılmış sütun. İlk sütun x ekseni değerleridir ve
ikinci sütun y ekseni değerleridir. Noktaların noktadan uzaklığı
özdeşlik çizgisi (y=x), üstel kuyruk uyumunun ne kadar iyi olduğunun bir ölçüsüdür,
noktalar özdeşlik çizgisine ne kadar yakınsa uyum o kadar iyidir. Her seri
tek bir "&" karakterli bir satırla sınırlandırılmıştır. Dosya bir dizi içerecektir
dört üstel kuyruğun her biri için ampirik verilerin aşağıdakilere uyması
düzen: glokal CYK, glokal Inside, yerel CYK ve yerel Inside.

--fffile
Dosyaya uyan farklı üstel kuyrukların yerle sınırlandırılmış istatistiklerini kaydedin .
Dosya, uygun üstel kuyruklar için lambda ve mu değerlerini içerecektir.
farklı boyutlarda histogram kuyrukları. Dosyadaki alanlar etiketlenir
bilgilendirici.

--xdosyası
Her uygun histogram kuyruğundaki puanların bir listesini dosyaya kaydedin . her satırı
bu dosya, kuyrukta bir vuruş olduğunu gösteren farklı bir puana sahip olacaktır.
o puan. Her dizi, tek bir "&" karakteri olan bir satırla sınırlandırılmıştır. NS
dosyası, dört üstel kuyruk uyumunun her biri için bir dizi içerecektir.
aşağıdaki sıra: glokal CYK, glokal Inside, yerel CYK ve yerel Inside.

DİĞER SEÇENEKLER


--tohum
Rastgele sayı üretecini şu şekilde tohumlayın , bir tamsayı >= 0. sıfır olmayan
stokastik simülasyonlar tekrarlanabilir olacaktır; aynı komut aynı şeyi verecek
Sonuçlar. Eğer 0 ise, rastgele sayı üreteci keyfi olarak ekilir ve
stokastik simülasyonlar, aynı komutun çalıştırılmasından çalıştırılmasına değişiklik gösterecektir. Varsayılan
tohum 181'dir.

--beta
Varsayılan olarak, CM aramasını hızlandırmak için sorguya bağlı bantlama (QDB) kullanılır
1E-15 beta kuyruk kaybı olasılığı olan algoritmalar. Bu beta değeri,
olarak değiştirildi ile --beta . Beta parametresi olasılık miktarıdır.
bant hesaplaması sırasında kütle hariç tutulur, daha yüksek beta değerleri daha fazla hızlanma sağlar
ancak daha düşük değerlerden daha fazla doğruluktan ödün verin. Kullanılan varsayılan değer 1E-15'tir.
(QDB hakkında daha fazla bilgi için bkz. Nawrocki ve Eddy, PLoS Computational Biology
3(3): e56.)

--bantsız
E-değeri kalibrasyonu sırasında QDB'yi kapatın. Bu, kalibrasyonu yavaşlatacaktır.

--null3
null3 post hoc ek boş modelini kapatın. olmadıkça bu tavsiye edilmez.
aynı seçeneği kullanmayı planlıyorsanız cmarama ve / veya cmscan.

--rastgele
Bunun yerine rastgele dizileri oluşturmak için CM'nin arka plan boş modelini kullanın.
daha gerçekçi HMM. CM kullanılarak oluşturulmadıkça --boş için seçenek
cm yapı, arka plan boş modeli her A, C, G ve U'nun %25'i olacaktır.

--gc
Diziden nükleotid dağılımını kullanarak rastgele diziler oluşturun
dosya .

--İşlemci
Bunu belirtin paralel CPU çalışanları kullanılabilir. Eğer "0" olarak ayarlanır, ardından
program, thread kullanılmadan seri modda çalıştırılacaktır. Ayrıca kontrol edebilirsiniz
bir ortam değişkeni ayarlayarak bu sayı, INFERNAL_NCPU. Bu seçenek
yalnızca Infernal'in kurulduğu makine aşağıdakileri kullanabiliyorsa kullanılabilir.
POSIX diş açma (daha fazla bilgi için kullanım kılavuzunun Kurulum bölümüne bakın)
bilgi).

--mpi MPI paralel programı olarak çalıştırın. Bu seçenek yalnızca Infernal'ın
"--enable-mpi" bayrağıyla yapılandırıldı ve oluşturuldu (bkz.
Daha fazla bilgi için kullanım kılavuzunun bölümü).

onworks.net hizmetlerini kullanarak cmcalibrate'i çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad