Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

hmmsim - Online w chmurze

Uruchom hmmsim w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

Jest to polecenie hmmsim, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


hmmsim - zbiera rozkłady wyników w losowych sekwencjach

STRESZCZENIE


hmmm [opcje]

OPIS


Połączenia hmmm program generuje losowe sekwencje, porównuje je z modelem(ami) w ,
i generuje różnego rodzaju histogramy, wykresy i dopasowane rozkłady wyników
wyniki.

hmmm nie jest główną częścią pakietu HMMER. Większość użytkowników nie miałaby powodu
Użyj tego. Służy do opracowywania i testowania metod statystycznych stosowanych do określania wartości P
i wartości E w HMMER3. Na przykład wykorzystano go do wygenerowania większości wyników w roku 2008
artykuł na temat statystyk lokalnego dostosowania H3 (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Ponieważ jest to stanowisko badawcze, nie należy oczekiwać, że będzie tak solidny jak inne
programy w pakiecie. Na przykład opcje mogą wchodzić w interakcje w dziwny sposób; nie mamy
testowane ani nie próbowały przewidzieć wszystkich możliwych kombinacji.

Głównym zadaniem jest dopasowanie rozkładu Gumbela o największej wiarygodności do wyników Viterbiego lub an
Maksymalne prawdopodobieństwo wykładniczego ogona do wysoko punktowanych wyników napastników i przetestowanie ich
dopasowane rozkłady są zgodne z przypuszczeniem, że lambda ~ log_2 zarówno dla Viterbiego Gumbela
i przedni ogon wykładniczy.

Dane wyjściowe to tabela liczb, po jednym wierszu dla każdego modelu. Cztery różne dopasowania parametryczne
do danych punktowych są testowane: (1) maksymalne prawdopodobieństwo pasuje zarówno do lokalizacji (mu/tau), jak i
parametry nachylenia (lambda); (2) zakładając lambda=log_2, maksymalne prawdopodobieństwo dopasowania do
tylko parametr lokalizacji; (3) to samo, ale przy założeniu lambdy skorygowanej zboczem, przy użyciu prądu
procedury w H3 [Eddy, 2008]; oraz (4) przy użyciu obu parametrów określonych przez prąd H3
procedury. Standardowa prosta, szybka i brudna statystyka dobroci dopasowania to „E@10”,
obliczona wartość E 10. najwyższego trafienia w rankingu, która według nas będzie wynosić około 10.

Szczegółowo kolumny danych wyjściowych to:

Nazwa Nazwa modelu.

ogon Ułamek najwyższych wyników zastosowany do dopasowania rozkładu. Dla Viterbi, MSV i
Wyniki hybrydowe, domyślnie wynosi 1.0 (rozkład Gumbela jest dopasowywany do wszystkich
dane). W przypadku wyników Forward wartość domyślna wynosi 0.02 (dopasowany jest ogon wykładniczy
najwyższe wyniki 2%).

mu/tau Parametr lokalizacji dla maksymalnego prawdopodobieństwa dopasowania do danych.

lambda Parametr nachylenia dla maksymalnego prawdopodobieństwa dopasowania do danych.

E@10 Wartość E obliczona dla 10. najwyższego wyniku („E@10”) przy użyciu ML mu/tau
i lambda. Z definicji oczekuje się, że będzie to około 10, jeśli oszacowano wartość E
dokładny.

mufiks Parametr lokalizacji dla dopasowania z największą wiarygodnością przy znanym (stałym) nachyleniu
parametr lambda log_2 (0.693).

E@10fix
Wartość E obliczona dla 10. miejsca w rankingu przy użyciu mufiksu i wartości oczekiwanej
lambda = log_2 = 0.693.

mufix2 Parametr lokalizacji zapewniający dopasowanie o maksymalnej wiarygodności z skorygowanym efektem krawędzi
lambda.

E@10fix2
Wartość E obliczona dla 10. miejsca w rankingu za pomocą mufix2 i efektu krawędzi-
poprawiona lambda.

pmu Parametr lokalizacji określony w procedurach szacunkowych H3.

plambda
Parametr nachylenia określony w procedurach estymacji H3.

pE@10 Wartość E obliczona dla 10. miejsca w rankingu przy użyciu pmu, plambda.

Na końcu tej tabeli wypisany jest jeszcze jeden wiersz, zaczynający się od # i podsumowujący
całkowity czas procesora wykorzystany w symulacjach.

Niektóre opcjonalne pliki wyjściowe są w formacie xmgrace xy. xmgrace jest potężny i darmowy
dostępne oprogramowanie do tworzenia wykresów.

RÓŻNE OPCJE


-h Pomoc; wydrukuj krótkie przypomnienie o użyciu wiersza poleceń i wszystkich dostępnych opcjach.

-a Zbierz oczekiwane statystyki długości dopasowania Viterbiego z każdej symulowanej sekwencji.
Działa to tylko z wynikami Viterbiego (domyślnie; patrz --wit). Dwa dodatkowe
pola są drukowane w tabeli wyjściowej dla każdego modelu: średnia długość Viterbiego
wyrównania i odchylenia standardowego.

-v (Gadatliwy). Wydrukuj także wyniki, po jednym w wierszu.

-L Ustaw długość losowo wybranych (niehomologicznych) sekwencji na ,
wartość domyślna to 100.

-N Ustaw liczbę losowo próbkowanych sekwencji na . Wartość domyślna to 1000.

--mpi Uruchom w trybie równoległym MPI, pod mpiruna. Jest to zrównoleglone na poziomie wysyłania
jeden profil na raz do procesu roboczego MPI, więc równoległość pomaga tylko wtedy, gdy
masz więcej niż jeden profil w , a chcesz mieć przynajmniej tyle
wiele profili jako procesów roboczych MPI. (Dostępne tylko wtedy, gdy była opcjonalna obsługa MPI
włączone w czasie kompilacji.)

OPCJE KONTROLOWANIE WYDAJNOŚĆ


-o Zapisz główną tabelę wyjściową do pliku zamiast wysyłać go na standardowe wyjście.

--plik
Podczas zbierania statystyk wyrównania Viterbiego (plik -a opcja) dla każdej próbki
sekwencji, wyprowadź dwa pola w wierszu do pliku : długość optymalna
wyrównanie i wynik bitowy Viterbiego. Wymaga, aby -a opcja jest również używana.

--eplik
Wyprowadź wykres rangi w funkcji wartości E w formacie XMGRACE xy do pliku . Oś x to
ranga tej sekwencji, od najwyższego wyniku do najniższego; oś y to wartość E
obliczone dla tej sekwencji. Wartości E są obliczane przy użyciu domyślnych procedur H3
(tzn. parametry pmu, plambda w tabeli wyjściowej). Spodziewacie się ostrego meczu
pomiędzy rangą a wartością E, jeśli wartości E są dokładnie oszacowane.

--plik
Wyprowadź plik „mocy filtra” do : dla każdego modelu linia z trzema polami:
nazwa modelu, liczba sekwencji przekraczających próg wartości P i ułamek
sekwencje przekraczające próg wartości P. Widzieć --pthresh do ustawiania wartości P
próg, który domyślnie wynosi 0.02 (domyślny próg filtra MSV w H3). P-
wartości są określone przez domyślne procedury H3 (parametry pmu,plabda w
tabela wyjściowa). Jeśli wszystko jest w porządku, spodziewana jest moc filtra równa
przewidywane ustawienie wartości P progu.

--pplik
Wyprowadź skumulowane wykresy przeżycia (P(S>x)) do pliku w formacie XMGRACE xy. Tam
są trzy wykresy: (1) zaobserwowany rozkład wyników; (2) maksymalne prawdopodobieństwo
dopasowana dystrybucja; (3) maksymalne prawdopodobieństwo dopasowania do parametru lokalizacji
(mu/tau) podczas
zakładając, że lambda=log_2.

--xplik
Wyprowadź wyniki bitów jako tablicę binarną liczb zmiennoprzecinkowych o podwójnej precyzji (8 bajtów na
wynik) do pliku . Programy takie jak Easel's esl-histplot może czytać takie pliki binarne.
Jest to przydatne przy generowaniu próbek o bardzo dużych rozmiarach.

OPCJE KONTROLOWANIE MODEL KONFIGURACJA (TRYB)


H3 używa tylko lokalnego wyrównania z wieloma trafieniami ( --fs tryb) i właśnie w tym miejscu wierzymy, że
pasuje statystycznie. Wyniki lokalnego wyrównania Unihit (Smith/Waterman; --południowy zachód mode) również przestrzegaj naszych
domysły statystyczne. Statystyki globalnego wyrównania (albo multihit, albo unihit) są
nadal nie są odpowiednio poznane i odpowiednio dopasowane.

--fs Zbieraj wyniki wielu trafień w lokalnym wyrównaniu. To jest ustawienie domyślne. wyrównanie jako
„tryb wyszukiwania fragmentów”.

--południowy zachód Zbieraj wyniki pojedynczych trafień w lokalnym wyrównaniu. Stan H3 J jest wyłączony. wyrównanie jako
„Tryb wyszukiwania Smitha/Watermana”.

--ls Zbieraj wyniki wielu trafień glokalnych. W wyrównaniu globalnym (globalnym/lokalnym)
cały model musi być dopasowany do podciągu celu. Lokalne wejście/wyjście H3
prawdopodobieństwa przejścia są wyłączone. „ls” pochodzi z historii HMMER2
terminologia dotycząca lokalnego wyrównania z wieloma trafieniami jako „tryb wyszukiwania lokalnego”.

--S Zbieraj wyniki unihit glokalnego wyrównania. Zarówno stan H3 J, jak i lokalne wejście/wyjście
prawdopodobieństwa przejścia są wyłączone. „s” pochodzi z historii HMMER2
terminologia dotycząca wyrównania glokalnego unihit.

OPCJE KONTROLOWANIE PUNKTACJA ALGORYTM


--wit Zbieraj wyniki dopasowania maksymalnego prawdopodobieństwa Viterbiego. To jest ustawienie domyślne.

--prz Zbieraj wyniki prawdopodobieństwa logarytmów szans forward, zsumowane na podstawie zestawu wyrównań.

--hyb Zbieraj wyniki „hybrydowe”, jak opisano w artykułach Yu i Hwa (na przykład
Bioinformatyka 18:864, 2002). Obejmują one obliczenie macierzy Forward i przyjęcie
maksymalna wartość komórki. Sama liczba jest statystycznie nieco pozbawiona motywacji,
ale oczekuje się, że rozkład będzie dobrze zachowanym rozkładem wartości ekstremalnych
(Gumbel).

--msv Zbierz wyniki MSV (wiele segmentów bez przerw Viterbiego), korzystając z głównego H3
Heurystyka przyspieszenia.

--szybki W przypadku dowolnej z powyższych opcji użyj zoptymalizowanej implementacji produkcyjnej H3 (przy użyciu
wektoryzacja SIMD). Domyślnie stosuje się małe ofiary z implementacji
ilość dokładności numerycznej. Może to spowodować wprowadzenie zakłócającego hałasu
symulacje statystyczne i dopasowania, więc gdy ktoś bardzo przejmuje się dokładnością
szczegółów, lepiej jest uwzględnić to źródło hałasu.

OPCJE KONTROLOWANIE WYPOSAŻONE OGON SZEROKIE RZESZE DLA NAPRZÓD


W niektórych eksperymentach przydatne było dopasowanie wyników Forward do zakresu różnych ogonów
masy, a nie tylko jedna. Opcje te zapewniają mechanizm umożliwiający równomierne dopasowanie
rozstawiony zakres różnych mas ogona. Dla każdej innej masy ogona generowana jest linia
na wyjściu.

--t min
Ustaw dolną granicę rozkładu masy ogona. (Domyślna wartość to 0.02 dla
domyślna masa pojedynczego ogona.)

--tmaks
Ustaw górną granicę rozkładu masy ogona. (Domyślna wartość to 0.02 dla
domyślna masa pojedynczego ogona.)

--tpunktów
Ustaw liczbę mas ogonów do pobrania, zaczynając od --t min i kończąc na --tmaks.
(Domyślna wartość to 1, dla domyślnej masy pojedynczego ogona 0.02.)

--tliniowy
Próbuj szereg mas końcowych z jednolitymi odstępami liniowymi. Domyślnym ustawieniem jest użycie
jednolite odstępy logarytmiczne.

OPCJE KONTROLOWANIE H3 PARAMETR OSZACOWAĆ METODY


H3 wykorzystuje trzy krótkie symulacje sekwencji losowych do oszacowania parametrów lokalizacji
oczekiwane rozkłady wyników dla wyników MSV, wyników Viterbiego i wyników Forward. Te
Opcje pozwalają na modyfikację tych symulacji.

--EmL
Ustawia długość sekwencji w symulacji, dla której szacuje się parametr lokalizacji mu
Wartości E MSV. Wartość domyślna to 200.

--EmN
Ustawia liczbę sekwencji w symulacji, która szacuje parametr lokalizacji mu
dla wartości E MSV. Wartość domyślna to 200.

--EvL
Ustawia długość sekwencji w symulacji, dla której szacuje się parametr lokalizacji mu
Wartości E Viterbiego. Wartość domyślna to 200.

--EvN
Ustawia liczbę sekwencji w symulacji, która szacuje parametr lokalizacji mu
dla wartości E Viterbiego. Wartość domyślna to 200.

--EfL
Ustawia długość sekwencji w symulacji, która szacuje parametr lokalizacji tau
dla Forward E-wartości. Wartość domyślna to 100.

--EfN
Ustawia liczbę sekwencji w symulacji, która szacuje parametr lokalizacji
tau dla Forward E-wartości. Wartość domyślna to 200.

--Eft
Ustawia ułamek masowy ogona, aby pasował do symulacji, która szacuje lokalizację
parametr tau dla wartości Forward. Wartość domyślna to 0.04.

DEBUGOWANIE OPCJE


--stoisko
W przypadku debugowania wersji master/worker MPI: wstrzymaj po uruchomieniu, aby włączyć
programistę, aby dołączyć debugery do działających procesów głównych i roboczych. Wysłać
Sygnał SIGCONT zwalniający pauzę. (W gdb: (Gdb) sygnał SYGKONT) (Tylko
dostępne, jeśli opcjonalna obsługa MPI była włączona w czasie kompilacji.)

--nasionko
Ustaw ziarno liczby losowej na . Wartość domyślna to 0, co oznacza liczbę losową
generator używa dowolnego materiału siewnego, dzięki czemu można uzyskać różne przebiegi hmmm prawie
z pewnością wygeneruje inną próbkę statystyczną. Do debugowania przydatne jest
wymusić powtarzalność wyników poprzez ustalenie losowego ziarna liczbowego.

EKSPERYMENTALNE OPCJE


Opcje te wykorzystano w niewielkiej liczbie różnych eksperymentów eksploracyjnych.

--bgflat
Ustaw rozkład pozostałości tła na równomierny rozkład, zarówno dla
celów modelu zerowego używanego do obliczania wyników oraz do generowania
losowe sekwencje. Domyślnie używana jest standardowa częstotliwość tła aminokwasów
d

--bgkomp
Ustaw rozkład pozostałości tła na średni skład profilu.
Wykorzystano to do zbadania niektórych skutków stronniczej kompozycji.

--x-bez-długościmodel
Wyłącz model długości sekwencji docelowej H3. Ustaw automatyczne przejścia dla N, C, J
a zamiast tego model zerowy na 350/351; to emuluje HMMER2. Nie jest to dobry pomysł
ogólny. Wykorzystano to do zademonstrowania jednej z głównych różnic H2 i H3.

--nie
Ustaw parametr nu dla algorytmu MSV — oczekiwaną liczbę miejsc lokalnych bez przerw
dopasowania na sekwencję docelową. Wartość domyślna to 2.0, co odpowiada E->J
prawdopodobieństwo przejścia 0.5. Wykorzystano to do sprawdzenia, czy ma zmienne nu
znaczący wpływ na wynik (wydaje się, że nie w granicach rozsądku). Tylko ta opcja
działa, jeśli --msv jest zaznaczona (dotyczy tylko MSV) i nie będzie działać --szybki
(ponieważ zoptymalizowane implementacje są na stałe zakładane, aby założyć nu = 2.0).

--pthresh
Ustaw próg wartości P filtra, który będzie używany przy generowaniu plików mocy filtra
--plik. Wartość domyślna to 0.02 (co byłoby odpowiednie do testowania wyników MSV,
ponieważ jest to domyślny próg filtra MSV w potoku przyspieszania H3.)
Inne odpowiednie opcje (dopasowanie ustawień domyślnych w potoku akceleracji) to
0.001 dla Viterbiego i 1e-5 dla napastnika.

Użyj hmmsim online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

Komendy systemu Linux

Ad