Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

cmbuild - Online w chmurze

Uruchom polecenie cmbuild w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

Jest to polecenie cmbuild, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


cmbuild - konstruuj modele kowariancji z wielu sekwencji RNA z adnotacjami strukturalnymi
wyrównanie (y)

STRESZCZENIE


cmbudowa [opcje]

OPIS


Dla każdego wielokrotnego dopasowania sekwencji w zbuduj model kowariancji i zapisz go w formacie
nowy plik .

Plik wyrównania musi być w formacie sztokholmskim lub SELEX i musi zawierać konsensus
adnotacja dotycząca struktury drugorzędnej. cmbudowa wykorzystuje strukturę konsensusu do określenia
architektura CM.

może być „-” (myślnik), co oznacza odczytywanie tego wejścia z stdin zamiast pliku.
Aby użyć „-”, musisz także określić format pliku wyrównania --informuj , jak w
--informuj Sztokholm (ze względu na obecne ograniczenia w naszej implementacji plik MSA
formaty nie mogą zostać automatycznie wykryte w strumieniu wejściowym, którego nie można przewijać.)

Nie może być '-' (wyjście standardowe), ponieważ wysyłanie pliku CM do stdout kolidowałoby
z innym wyjściem tekstowym programu.

Oprócz zapisywania CM(ów) do , cmbudowa wyświetla również pojedynczą linię dla każdego
model utworzony na standardowe wyjście. W każdej linii znajdują się następujące pola: „aln”: indeks pliku
wyrównanie użyte do zbudowania CM; „idx”: indeks CM w pliku ; "nazwa":
nazwa CM; „nseq”: liczba sekwencji w dopasowaniu wykorzystanych do zbudowania CM;
„eff_nseq”: efektywna liczba sekwencji wykorzystanych do zbudowania modelu; „alen”: długość
linii trasowania użytej do zbudowania CM; „clen”: liczba kolumn z wyrównania
zdefiniowane jako kolumny konsensusu (dopasowania); „bps”: liczba par zasad w CM; „bify”:
liczba rozwidleń w CM; „rel entropia: CM”: całkowita entropia względna
model podzielony przez liczbę kolumn konsensusu; „rel entropia: HMM”: całkowita wartość względna
entropia modelu ignorując strukturę drugorzędową podzielona przez liczbę konsensusu
kolumny. „opis”: opis modelu/ustawienia.

OPCJE


-h Pomoc; wydrukuj krótkie przypomnienie o użyciu wiersza poleceń i dostępnych opcjach.

-n Nazwij nowego CM . Domyślnie używana jest nazwa linii trasowania (jeśli taka jest
obecny w ), lub, w przypadku jego braku, nazwa . If
zawiera więcej niż jedno wyrównanie, -n nie działa i każde wyrównanie
musi posiadać adnotację w nazwie (jak w Sztokholmie #= adnotacja ID GF).

-F Dopuszczać zostać nadpisane. Bez tej opcji, jeśli już
istnieje, cmbudowa wychodzi z błędem.

-o Skieruj wynik podsumowania do pliku , raczej niż wyjście.

-O Po zbudowaniu każdego modelu zapisz ponownie opatrzone przypisami źródła trasowania w pliku
w formacie sztokholmskim. Sekwencje są oznaczone względnymi wagami sekwencji
został przydzielony. Linie trasowania są również opisywane za pomocą linii adnotacji odniesienia
wskazując, które kolumny zostały przypisane jako konsensus. Jeśli wyrównanie źródła miało
adnotacja referencyjna („#=GC RF”) zostanie zastąpiona resztą konsensusową
model kolumn konsensusu i „.” dla kolumn wstawiania, chyba że --ręka
do określenia stanowisk konsensusowych wykorzystano opcję, w którym to przypadku tak będzie
bez zmian.

--pomoc programistyczna Wydrukuj pomoc, jak w przypadku -h , ale obejmują także opcje eksperckie, które nimi nie są
wyświetlane z -h . Oczekuje się, że te opcje eksperckie nie będą istotne dla
zdecydowanej większości użytkowników i dlatego nie są opisane na stronie podręcznika. Jedyny
zasoby umożliwiające zrozumienie tego, czym faktycznie się zajmują, to krótka jednowierszowa informacja
opisy są wyświetlane, gdy --pomoc programistyczna jest włączona, a kod źródłowy.

OPCJE KONTROLOWANIE MODEL BUDOWA


Opcje te kontrolują sposób definiowania kolumn konsensusu w linii trasowania.

--szybki Zdefiniuj kolumny konsensusu automatycznie jako te, które mają ułamek >= symfrak of
pozostałości zamiast luk. (Zobacz poniżej --symfrac opcja.) To jest
domyślna.

--ręka Użyj adnotacji o współrzędnych odniesienia (#= linia GC RF w Sztokholmie), aby określić, które
kolumny są konsensusem, a które są wstawkami. Każdy znak niebędący przerwą oznacza a
kolumna konsensusu. (Na przykład zaznacz kolumny konsensusu „x” i wstaw kolumny
z „.”.) Ta opcja została wywołana --rf w poprzednich wersjach Infernal (0.1)
do 1.0.2).

--symfrac
Zdefiniuj próg frakcji pozostałości niezbędny do zdefiniowania kolumny konsensusu kiedy
nie używać --ręka. Wartość domyślna to 0.5. Ułamek symboliczny w każdej kolumnie to
obliczone po uwzględnieniu względnego ważenia sekwencji. Ustawienie tego na
Wartość 0.0 oznacza, że ​​każda kolumna wyrównania zostanie przypisana jako konsensus, co może być
przydatne w niektórych przypadkach. Ustawienie na 1.0 oznacza, że ​​tylko kolumny zawierające 0 przerw
zostaną przyjęte w drodze konsensusu. Ta opcja zastępuje --gapthresh opcja
z poprzednich wersji Infernal (0.1 do 1.0.2), z równy (1.0 -
). Na przykład, aby odtworzyć zachowanie dla polecenia cmbudowa --gapthresh 0.8
w poprzedniej wersji użyj cmbudowa --symfrac 0.2 z tą wersją.

--nie Zignoruj ​​adnotację dotyczącą struktury drugorzędnej, jeśli istnieje, w i zbuduj CM za pomocą
zero par zasad. Model ten będzie podobny do profilu HMM i cmwyszukiwarka i
cmskan programy będą używać do tego algorytmów HMM, które są szybsze niż algorytmy CM
Model. Ponadto nie ma potrzeby kalibracji modelu zerowej pary zasad cmkalibracja
przed biegiem cmwyszukiwarka z tym. The --nie należy użyć tej opcji, jeśli jej nie ma
Adnotacja struktury drugorzędnej w .

--rszukaj
Sparametryzuj wyniki emisji a la RSEARCH, używając macierzy RIBOSUM w pliku .
Z --rszukaj włączone, wszystkie wyrównania w musi zawierać dokładnie jeden
sekwencja lub --połączenie opcja również musi być włączona. Wszystkie pozycje w każdej sekwencji
będą uważane za „kolumny” konsensusu. Właściwie, wyniki emisji dla nich
modele nie będą identyczne z wynikami RIBOSUM ze względu na różnice w modelowaniu
strategię pomiędzy Infernal i RSEARCH, ale będą one możliwie najbardziej podobne.
Pliki matrix RIBOSUM są dołączone do Infernal w podkatalogu "matrices/".
katalog najwyższego poziomu „infernal-xxx”. Macierze RIBOSUM są wynikiem podstawienia
matryce wytrenowane specjalnie pod kątem strukturalnych RNA z oddzielnymi jednoniciowymi
wyniki podstawienia reszt i par zasad. Więcej informacji znajdziesz w BADANIACH
publikacja (Klein i Eddy, BMC Bioinformatics 4:44, 2003).

INNE MODEL BUDOWA OPCJE


--zero
Przeczytaj model zerowy z . Model zerowy określa prawdopodobieństwo każdego RNA
nukleotyd w sekwencji tła, domyślnie używa się 0.25 dla każdego nukleotydu.
Format plików null jest określony w instrukcji obsługi.

--wcześniejszy
Przeczytaj Dirichleta przed , zastępując domyślną mieszankę Dirichlet. The
format wcześniejszych plików jest określony w instrukcji obsługi.

Zastosowanie --pomoc programistyczna aby zobaczyć dodatkowe, w przeciwnym razie nieudokumentowane opcje konstrukcji modelu.

OPCJE KONTROLOWANIE KREWNY WAGI


cmbudowa wykorzystuje algorytm ważenia sekwencji ad hoc w celu zmniejszenia wartości ściśle powiązanych
sekwencje i upiększone, odlegle powiązane. Powoduje to zmniejszenie liczby modeli
obciążony nierówną reprezentacją filogenetyczną. Na przykład dwie identyczne sekwencje
zazwyczaj każdy otrzymuje połowę wagi, jaką miałaby jedna sekwencja. Te opcje kontrolują
jaki algorytm zostanie użyty.

--wpb Użyj schematu ważenia sekwencji opartego na pozycji Henikoffa [Henikoff i Henikoff,
J. Mol. Biol. 243:574, 1994]. To jest ustawienie domyślne.

--wgsc Użyj algorytmu ważenia Gerstein/Sonnhammer/Chothia [Gerstein i in., J. Mol.
Biol. 235:1067, 1994].

--nie wiem
Wyłącz ważenie sekwencji; np. jawnie ustaw wszystkie wagi sekwencji na 1.0.

--w danych
Użyj wag sekwencji podanych w adnotacji w wejściowym pliku wyrównania. Jeśli nie
podano wagi, załóżmy, że wszystkie wynoszą 1.0. Domyślnie określane jest nowe
wagi sekwencji według algorytmu Gersteina/Sonnhammera/Chothii, ignorując wszelkie
opisane wagi.

--wkwiat
Do ważenia sekwencji użyj algorytmu filtrowania BLOSUM zamiast domyślnego
Ważenie GSC. Skup sekwencje o zadanej procentowej identyczności (patrz --wid);
przypisz każdemu klasterowi całkowitą wagę 1.0, rozdzieloną równo pomiędzy elementy
tego klastra.

--wid
Kontroluje zachowanie --wkwiat możliwość ważenia poprzez ustawienie procentu
tożsamość dla grupowania wyrównania do .

OPCJE KONTROLOWANIE EFEKTYWNY SEKWENCJA LICZBA


Po określeniu względnych wag są one normalizowane, aby sumować się do całkowitej efektywnej
numer sekwencji, eff_nseq. Liczba ta może być rzeczywistą liczbą sekwencji w pliku
wyrównanie, ale prawie zawsze jest mniejsze. Domyślne ważenie entropii
metoda (--ent) zmniejsza efektywny numer sekwencyjny, aby zredukować zawartość informacji
(względna entropia lub średni oczekiwany wynik na prawdziwych homologach) na stanowisko konsensusu. The
docelowa względna entropia jest kontrolowana przez funkcję dwuparametrową, gdzie dwa
parametry można ustawić za pomocą --tam i --esigma.

--eent Użyj strategii ważenia entropii, aby określić efektywny numer sekwencyjny
daje docelową średnią entropię stanu dopasowania. Ta opcja jest domyślna i
można wyłączyć za pomocą --enon. Domyślny docelowy średni względny stan dopasowania
entropia wynosi 0.59 bita dla modeli z co najmniej 1 parą zasad i 0.38 bita dla modeli
z zerowymi parami zasad, ale zmienionymi za pomocą --tu. Domyślną wartością jest 0.59 lub 0.38 bitu
automatycznie zmieniana, jeśli całkowita względna entropia modelu (zsumowane dopasowanie
względna entropia stanu) jest mniejsza niż wartość odcięcia, która domyślnie wynosi 6.0 bitów, ale
można zmienić u specjalisty, bez dokumentów --były opcja. Jeśli naprawdę tego chcesz
pobaw się tą opcją, sprawdź kod źródłowy.

--enon
Wyłącz strategię ważenia entropii. Efektywny numer kolejny to po prostu
liczba sekwencji w dopasowaniu.

--tam
Ustaw docelową średnią entropię stanu dopasowania jako . Domyślnie cel
względna entropia na pozycję dopasowania wynosi 0.59 bitu dla modeli z co najmniej 1
pary zasad i 0.38 dla modeli z zerową parą zasad.

--eminsek
Zdefiniuj minimalny dozwolony efektywny numer kolejny jako .

--ehmm
Ustaw docelową średnią entropię względną stanu dopasowania HMM jako . Entropia dla
Stany dopasowania par zasad oblicza się przy użyciu marginalizowanej emisji par zasad
prawdopodobieństwa.

--set
Ustaw efektywny numer kolejny dla ważenia entropii jako .

OPCJE KONTROLOWANIE FILTER P7 HMM BUDOWA


Dla każdego CM to cmbudowa konstruktów, z danych wejściowych budowany jest towarzyszący filtr p7 HMM
również wyrównanie. Opcje te kontrolują konstrukcję filtra HMM:

--p7ere
Ustaw docelową średnią entropię względną stanu dopasowania dla filtra p7 HMM as . By
domyślnie docelowa entropia względna na pozycję dopasowania wynosi 0.38 bitu.

--p7ml Użyj HMM p7 o maksymalnej wiarygodności zbudowanego z CM jako HMM filtra. Ten HMM będzie
być jak najbardziej podobny do CM (choć koniecznie nieświadomy drugorzędnych
Struktura).

Zastosowanie --pomoc programistyczna aby zobaczyć dodatkowe, w przeciwnym razie nieudokumentowane opcje konstrukcji filtra HMM.

OPCJE KONTROLOWANIE FILTER P7 HMM KALIBROWANIE


Po zbudowaniu każdego filtra HMM, cmbudowa określa odpowiednie parametry wartości E, które należy zastosować
podczas filtrowania cmwyszukiwarka i cmskan poprzez próbkowanie zestawu sekwencji i przeszukiwanie ich
z każdą konfiguracją i algorytmem filtra HMM.

--EmN Ustaw liczbę próbkowanych sekwencji dla lokalnej kalibracji HMM filtra MSV na .
200 domyślnie.

--EvN Ustaw liczbę próbkowanych sekwencji dla lokalnej kalibracji HMM filtra Viterbiego na
. 200 domyślnie.

--ElfN Ustaw liczbę próbkowanych sekwencji dla lokalnej kalibracji HMM z filtrem w przód
. 200 domyślnie.

--EgfN Ustaw liczbę próbkowanych sekwencji do globalnej kalibracji filtra w przód HMM
do . 200 domyślnie.

Zastosowanie --pomoc programistyczna aby zobaczyć dodatkowe, w przeciwnym razie nieudokumentowane opcje kalibracji filtra HMM.

OPCJE DLA RAFINACJA THE WEJŚCIE WYRÓWNANIE


--oczyścić
Spróbuj udoskonalić wyrównanie przed zbudowaniem CM, używając oczekiwań-
maksymalizacja (EM). CM jest najpierw budowany od początkowego ustawienia, jak zwykle. Następnie,
sekwencje w dopasowaniu są optymalnie dopasowane (z pasmem HMM CYK
algorytm, optymalny oznacza optymalny, biorąc pod uwagę pasma) do CM i budowany jest nowy CM
z powstałego wyrównania. Sekwencje są następnie ponownie dopasowywane do nowego CM i a
nowy CM jest zbudowany z tego wyrównania. Trwa to aż do zbieżności,
szczególnie wtedy, gdy wyrównania dla dwóch kolejnych iteracji nie są
znacząco różne (zsumowane wyniki bitowe wszystkich sekwencji w pliku
wyrównanie zmienia się o mniej niż 1% pomiędzy dwiema kolejnymi iteracjami). Finał
wyrównanie (wyrównanie używane do budowania CM, do którego jest zapisywany ) is
zapisywane .

-l Z --oczyścić, włącz lokalny algorytm wyrównania, który umożliwia wyrównanie do
jeśli to konieczne, rozciągnij dwa lub więcej podciągów (np. jeśli struktury zapytania
model i sekwencja docelowa są tylko częściowo wspólne), co pozwala na pewne duże
wpisy i usunięcia w strukturze będą karane inaczej niż zwykle
indele. Wartość domyślna polega na globalnym wyrównaniu modelu zapytania do sekwencji docelowych.

--gibbs
Modyfikuje zachowanie --oczyścić dlatego zamiast EM używane jest próbkowanie Gibbsa. The
różnica polega na tym, że na etapie wyrównywania wyrównanie nie jest koniecznie
optymalne, zamiast tego próbkowane jest dopasowanie (drzewo parsetu) dla każdej sekwencji z
Późniejszy rozkład dopasowań określony przez algorytm Inside. Wskutek
ten etap pobierania próbek --gibbs jest niedeterministyczny, więc różne działają z tym samym
wyrównanie może dać różne wyniki. To nie jest prawdą, kiedy --oczyścić służy
bez --gibbs opcję, w którym to przypadku ostateczne wyrównanie i CM będą zawsze takie same
ten sam. Gdy --gibbs jest włączony, plik --nasionko opcji można użyć do zaszczepienia
generator liczb losowych w przewidywalny sposób, dzięki czemu wyniki są powtarzalne. Celem
dotychczasowy --gibbs opcją jest pomoc ekspertom kuratorom zajmującym się dopasowaniem RNA w udoskonalaniu struktury
wyrównania, umożliwiając im obserwację alternatywnych dopasowań o wysokiej punktacji.

--nasionko
Rozpocznij generator liczb losowych za pomocą , liczba całkowita >= 0. Ta opcja może tylko
być używane w połączeniu z --gibbs. If jest niezerowe, stochastyczne próbkowanie
wyrównania będą odtwarzalne; to samo polecenie da te same wyniki. Gdyby
ma wartość 0, generator liczb losowych jest rozstawiony arbitralnie, a stochastyczny
próbki mogą się różnić w zależności od uruchomienia tego samego polecenia. Domyślny ziarno to 0.

--cyk Z --oczyścić, zgodne z algorytmem CYK. Domyślnie optymalna dokładność
używany jest algorytm. Więcej informacji na ten temat znajdziesz w cmwyrównaj strony podręcznika.

--notrunc
Z --oczyścić, wyłącz algorytm obciętego wyrównania. Jest więcej
informacje na ten temat w cmwyrównaj strony podręcznika.

Zastosowanie --pomoc programistyczna aby zobaczyć dodatkowe, w przeciwnym razie nieudokumentowane opcje udoskonalenia wyrównania jako
a także inne opcje plików wyjściowych i opcje budowania wielu modeli dla jednego
wyrównanie.

Użyj cmbuild online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    BiuroPiętro
    BiuroPiętro
    OfficeFloor zapewnia odwrócenie
    sterowanie sprzężeniem, z jego: - zależnością
    wtrysk - kontynuacja wtrysku -
    iniekcja nici Więcej informacji
    odwiedzić...
    Pobierz OfficeFloor
  • 2
    DivKit
    DivKit
    DivKit jest oprogramowaniem open source opartym na serwerze
    Struktura interfejsu użytkownika (SDUI). Pozwala na to
    wdrażaj aktualizacje pochodzące z serwera
    różne wersje aplikacji. Może tak być
    używany do...
    Pobierz DivKita
  • 3
    podkonwerter
    podkonwerter
    Narzędzie do konwersji między różnymi
    forma subskrypcji. Użytkownicy Shadowrocket
    powinien używać ss, ssr lub v2ray jako celu.
    Możesz dodać &remark= do
    Telegram-podobny HT...
    Pobierz subkonwerter
  • 4
    PLUSK
    PLUSK
    SWASH to liczba ogólnego przeznaczenia
    narzędzie do symulacji niestabilności,
    niehydrostatyczny, o swobodnej powierzchni,
    przepływ wirowy i zjawiska transportu
    na wodach przybrzeżnych jako...
    Pobierz SWASH
  • 5
    VBA-M (zarchiwizowane — teraz na Github)
    VBA-M (zarchiwizowane — teraz na Github)
    Projekt został przeniesiony do
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Cechy:Tworzenie cheatów zapisywanie stanówmulti
    system, obsługuje gba, gbc, gb, sgb,
    sgb2Tu...
    Pobierz VBA-M (zarchiwizowane — teraz na Github)
  • 6
    Stacer
    Stacer
    Optymalizator i monitorowanie systemu Linux
    Repozytorium Github:
    https://github.com/oguzhaninan/Stacer.
    Odbiorcy: użytkownicy końcowi/komputery. Użytkownik
    interfejs: Qt. Programowanie La...
    Pobierz Stacera
  • więcej »

Komendy systemu Linux

Ad