EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

cmbuild - Online în cloud

Rulați cmbuild în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda cmbuild care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


cmbuild - construiți modele de covarianță din secvența multiplă de ARN adnotată structural
aliniere(e)

REZUMAT


cmbuild [Opțiuni]

DESCRIERE


Pentru fiecare aliniere de secvențe multiple în construiți un model de covarianță și salvați-l în
un dosar nou .

Fișierul de aliniere trebuie să fie în format Stockholm sau SELEX și trebuie să conțină consens
adnotarea structurii secundare. cmbuild folosește structura consensului pentru a determina
arhitectura CM.

poate fi „-” (liniuță), ceea ce înseamnă că citiți această intrare de la stdin mai degrabă decât un dosar.
Pentru a utiliza „-”, trebuie să specificați și formatul fișierului de aliniere cu --informat , ca în
--informat Stockholm (din cauza unei limitări actuale în implementarea noastră, fișierul MSA
formatele nu pot fi detectate automat într-un flux de intrare nerebobinabil.)

S-ar putea să nu fie '-' (stdout), deoarece trimiterea fișierului CM către stdout ar intra în conflict
cu cealaltă ieşire text a programului.

Pe lângă scrierea CM(e) la , cmbuild de asemenea, scoate o singură linie pentru fiecare
model creat pentru stdout. Fiecare linie are următoarele câmpuri: "aln": indexul
alinierea utilizată la construirea CM; „idx”: indicele CM în ; "Nume":
denumirea CM; „nseq”: numărul de secvențe din aliniament folosit pentru a construi CM;
"eff_nseq": numărul efectiv de secvențe utilizate pentru a construi modelul; „alen”: lungimea
a aliniamentului utilizat la construirea CM; „clen”: numărul de coloane din aliniament
definite ca coloane de consens (potrivire); „bps”: numărul de perechi de baze din CM; "bifs":
numărul de bifurcații în CM; "rel entropy: CM": entropia relativă totală a
model împărțit la numărul de coloane de consens; „rel entropy: HMM”: relativă totală
entropia modelului ignorând structura secundară împărțită la numărul de consens
coloane. „descriere”: descrierea modelului/alinierii.

OPŢIUNI


-h Ajutor; imprimați un scurt memento cu privire la utilizarea liniei de comandă și la opțiunile disponibile.

-n Denumiți noul CM . Implicit este utilizarea numelui aliniamentului (dacă unul este
prezent în ), sau, în lipsă, numele . If
conține mai mult de o aliniere, -n nu funcționează și fiecare aliniere
trebuie să aibă un nume adnotat în (ca în Stockholm #=Adnotare ID GF).

-F Permite a fi suprascris. Fără această opțiune, dacă deja
exista, cmbuild iese cu o eroare.

-o Direcționați rezultatul rezumat către fișier , mai degrabă decât la stdout.

-O După ce fiecare model este construit, salvați din nou aliniamentele sursei adnotate într-un fișier
în format Stockholm. Secvențele sunt adnotate cu ce pondere relativă a secvenței
au fost atribuite. Aliniamentele sunt, de asemenea, adnotate cu o linie de adnotare de referință
indicând ce coloane au fost atribuite ca consens. Dacă alinierea sursei avea
adnotarea de referință ("#=GC RF") va fi înlocuită cu reziduul de consens al
modelul pentru coloanele de consens și '.' pentru inserarea coloanelor, cu excepția cazului în care --mână
opțiunea a fost folosită pentru precizarea pozițiilor de consens, caz în care va fi
neschimbat.

--devhelp Ajutor pentru imprimare, ca și cu -h , dar includeți și opțiunile experților care nu sunt
afisat cu -h . Aceste opțiuni ale experților nu sunt de așteptat să fie relevante pentru
marea majoritate a utilizatorilor și, prin urmare, nu sunt descrise în pagina de manual. Singurul
resursele pentru înțelegerea a ceea ce fac ei de fapt sunt pe scurt
descrierile ies când --devhelp este activat și codul sursă.

OPŢIUNI CONTROLUL MODEL CONSTRUCTIE


Aceste opțiuni controlează modul în care sunt definite coloanele de consens într-o aliniere.

--rapid Definiți automat coloanele de consens ca acelea care au o fracție >= simfrac of
reziduuri spre deosebire de goluri. (Vezi mai jos pentru --simfrac opțiunea.) Acesta este
Mod implicit.

--mână Utilizați adnotarea coordonatelor de referință (#=linia GC RF, în Stockholm) pentru a determina care
coloanele sunt de consens și care sunt inserții. Orice caracter fără gol indică a
coloana de consens. (De exemplu, marcați coloanele de consens cu „x” și inserați coloanele
cu „.”.) Această opțiune a fost apelată --rf în versiunile anterioare de Infernal (0.1
prin 1.0.2).

--simfrac
Definiți pragul de fracțiune de reziduu necesar pentru a defini o coloană de consens când
nu folosesc --mână. Valoarea implicită este 0.5. Fracția simbol din fiecare coloană este
calculat după luarea în considerare a ponderării secvenței relative. Setarea acestui lucru la
0.0 înseamnă că fiecare coloană de aliniere va fi atribuită ca consens, ceea ce poate fi
util în unele cazuri. Setarea lui la 1.0 înseamnă că numai coloanele care includ 0 goluri
va fi atribuit ca consens. Această opțiune înlocuiește --gapthresh opțiune
din versiunile anterioare de Infernal (0.1 prin 1.0.2), cu egal cu (1.0 -
). De exemplu, pentru a reproduce comportamentul pentru o comandă de cmbuild --gapthresh 0.8
într-o versiune anterioară, utilizați cmbuild --simfrac 0.2 cu această versiune.

--noss Ignorați adnotarea structurii secundare, dacă există, în și construiți un CM cu
zero perechi de baze. Acest model va fi similar cu un profil HMM și cu cmsearch și
cmscan programele vor folosi algoritmi HMM care sunt mai rapidi decât cei CM pentru aceasta
model. În plus, nu trebuie calibrat un model de perechi de bază zero cmcalibrare
înainte de alergare cmsearch Cu acesta. --noss opțiunea trebuie utilizată dacă nu există
adnotarea structurii secundare în .

--cercetare
Parametrizați scorurile de emisie la CĂUTARE, folosind matricea RIBOSUM din fișier .
cu --cercetare activat, toate aliniamentele în trebuie să conțină exact unul
secvența sau --apel opțiunea trebuie de asemenea activată. Toate pozițiile din fiecare secvență
vor fi considerate „coloane” de consens. De fapt, scorurile de emisie pentru acestea
modelele nu vor fi identice cu scorurile RIBOSUM din cauza diferențelor de modelare
strategie între Infernal și CERCETARE, dar vor fi cât mai asemănătoare.
Fișierele matrice RIBOSUM sunt incluse cu Infernal în subdirectorul „matrice/” al
directorul de nivel superior „infernal-xxx”. Matricele RIBOSUM sunt scor de substituție
matrici antrenate special pentru ARN-uri structurale cu monocatenar separat
scorurile de substituție de reziduuri și perechi de baze. Pentru mai multe informații consultați CĂUTARE
publicaţie (Klein şi Eddy, BMC Bioinformatics 4:44, 2003).

ALTE MODEL CONSTRUCTIE OPŢIUNI


--nul
Citiți un model nul din . Modelul nul definește probabilitatea fiecărui ARN
nucleotide în secvența de fundal, implicit este utilizarea 0.25 pentru fiecare nucleotidă.
Formatul fișierelor nul este specificat în ghidul utilizatorului.

--înainte
Citiți un Dirichlet anterior de la , înlocuind amestecul implicit Dirichlet. The
formatul fișierelor anterioare este specificat în ghidul utilizatorului.

Utilizare --devhelp pentru a vedea opțiuni suplimentare de construcție a modelului, altfel nedocumentate.

OPŢIUNI CONTROLUL RELATIV GREUTĂȚI


cmbuild folosește un algoritm de ponderare a secvenței ad-hoc pentru a reduce ponderea în strânsă legătură
secvențe și cele mai înrudite la distanță. Acest lucru are ca efect reducerea modelelor
părtinit de reprezentarea filogenetică neuniformă. De exemplu, două secvențe identice ar fi
de obicei, fiecare primește jumătate din greutatea unei secvențe. Aceste opțiuni controlează
care algoritm este utilizat.

--wpb Utilizați schema de ponderare a secvenței bazată pe poziție Henikoff [Henikoff și Henikoff,
J. Mol. Biol. 243:574, 1994]. Aceasta este valoarea implicită.

--wgsc Utilizați algoritmul de ponderare Gerstein/Sonnhammer/Chothia [Gerstein și colab., J. Mol.
Biol. 235:1067, 1994].

--nici unul
Dezactivați ponderarea secvenței; de exemplu, setați în mod explicit toate greutățile secvenței la 1.0.

--w dat
Utilizați greutățile secvenței așa cum sunt date în adnotare în fișierul de aliniere de intrare. Daca nu
au fost date ponderi, presupunem că toate sunt 1.0. Implicit este de a determina noi
ponderile secvenței de către algoritmul Gerstein/Sonnhammer/Chothia, ignorând oricare
greutăți adnotate.

--wblosum
Utilizați algoritmul de filtrare BLOSUM pentru a pondere secvențele, în loc de cel implicit
Ponderarea GSC. Grupați secvențele la un anumit procent de identitate (vezi --wid);
atribuiți fiecărui grup o pondere totală de 1.0, distribuită în mod egal între membri
a acelui cluster.

--lată
Controlează comportamentul --wblosum opțiunea de ponderare prin setarea procentului
identitate pentru gruparea alinierii la .

OPŢIUNI CONTROLUL EFECTIV SECVENŢĂ NUMĂR


După ce ponderile relative sunt determinate, acestea sunt normalizate pentru a se însuma la un efectiv total
număr de secvență, eff_nseq. Acest număr poate fi numărul real de secvențe din
aliniament, dar este aproape întotdeauna mai mic decât atât. Ponderea implicită a entropiei
metodă (--eent) reduce numărul efectiv de secvență pentru a reduce conținutul informației
(entropia relativă sau scorul mediu așteptat pe omologi adevărați) pe poziție de consens. The
Entropia relativă țintă este controlată de o funcție cu doi parametri, unde cei doi
parametrii sunt setabili cu --aici și --esigma.

--eent Utilizați strategia de ponderare a entropiei pentru a determina numărul efectiv de secvență care
oferă o entropie relativă a stării de potrivire medie țintă. Această opțiune este implicită și
poate fi oprit cu --enone. Starea de potrivire medie țintă implicită relativă
entropia este de 0.59 biți pentru modelele cu cel puțin 1 pereche de bază și 0.38 biți pentru modele
cu zero perechi de baze, dar schimbat cu --aici. Valoarea implicită de 0.59 sau 0.38 biți este
schimbat automat dacă entropia relativă totală a modelului (potrivire însumată
entropia relativă de stare) este mai mică decât o limită, care este implicit de 6.0 biți, dar
poate fi schimbat cu expertul, nedocumentat --eX opțiune. Dacă chiar vrei
jucați cu acea opțiune, consultați codul sursă.

--enone
Dezactivați strategia de ponderare a entropiei. Numărul de secvență efectiv este doar
numărul de secvențe din aliniament.

--aici
Setați entropia relativă a stării de potrivire medie țintă ca . În mod implicit, ținta
Entropia relativă per poziție de potrivire este de 0.59 biți pentru modelele cu cel puțin 1
perechi de bază și 0.38 pentru modelele cu zero perechi de baze.

--eminseq
Definiți numărul de secvență efectiv minim permis ca .

--ehmmre
Setați entropia relativă a stării de potrivire medie a HMM țintă ca . Entropie pentru
stările de potrivire a perechii de baze sunt calculate utilizând emisia marginalizată de perechi de baze
probabilități.

--eset
Setați numărul de secvență efectiv pentru ponderarea entropiei ca .

OPŢIUNI CONTROLUL FILTRU P7 HMM CONSTRUCTIE


Pentru fiecare CM care cmbuild constructii, un filtru însoțitor p7 HMM este construit din intrare
alinierea de asemenea. Aceste opțiuni controlează construcția filtrului HMM:

--p7ere
Setați entropia relativă a stării de potrivire medie țintă pentru filtrul p7 HMM ca . By
implicit, entropia relativă țintă per poziție de potrivire este de 0.38 biți.

--p7ml Utilizați o probabilitate maximă p7 HMM construită din CM ca filtru HMM. Acest HMM va
să fie cât mai asemănător cu CM (deși neapărat ignorant de secundar
structura).

Utilizare --devhelp pentru a vedea opțiuni de construcție HMM suplimentare, altfel nedocumentate.

OPŢIUNI CONTROLUL FILTRU P7 HMM CALIBRARE


După construirea fiecărui filtru HMM, cmbuild determină parametrii valorii E adecvați de utilizați
în timpul filtrării cmsearch și cmscan prin eșantionarea unui set de secvențe și căutarea acestora
cu fiecare configurație de filtru HMM și algoritm.

--EmN Setați numărul de secvențe eșantionate pentru calibrarea filtrului MSV local HMM la .
200 implicit.

--EvN Setați numărul de secvențe eșantionate pentru calibrarea locală a filtrului Viterbi HMM la
. 200 implicit.

--ElfN Setați numărul de secvențe eșantionate pentru calibrarea locală a filtrului Forward HMM la
. 200 implicit.

--EgfN Setați numărul de secvențe eșantionate pentru calibrarea glocal Forward filter HMM
la . 200 implicit.

Utilizare --devhelp pentru a vedea opțiuni de calibrare HMM suplimentare, altfel nedocumentate.

OPŢIUNI PENTRU RAFINARE THE INTRARE ALINIERE


--rafina
Încercați să rafinați alinierea înainte de a construi CM folosind așteptările-
maximizare (EM). Un CM este mai întâi construit din alinierea inițială, ca de obicei. Atunci,
secvențele din aliniere sunt realiniate optim (cu banda HMM CYK
algoritm, optim înseamnă optim având în vedere benzile) către CM, și se construiește un nou CM
din alinierea rezultată. Secvențele sunt apoi realiniate la noul CM și a
noul CM este construit din acel aliniament. Aceasta se continuă până la convergență,
în special atunci când aliniamentele pentru două iterații succesive nu sunt
semnificativ diferit (scorurile de biți însumate ale tuturor secvențelor din
alinierea se modifică cu mai puțin de 1% între două iterații succesive). Finala
aliniere (alinierea utilizată pentru a construi CM-ul în care este scris ) is
scris .

-l cu --rafina, activați algoritmul de aliniere locală, care permite alinierea la
cuprinde două sau mai multe subsecvențe dacă este necesar (de exemplu, dacă structurile interogării
modelul și secvența țintă sunt doar parțial partajate), permițând anumite mari
inserțiile și ștergerile în structură să fie penalizate diferit decât în ​​mod normal
indelii. Implicit este alinierea globală a modelului de interogare la secvențele țintă.

--gibbs
Modifică comportamentul --rafina deci eșantionarea Gibbs este utilizată în loc de EM. The
diferența este că în timpul etapei de aliniere alinierea nu este neapărat
optim, în schimb o aliniere (parsetree) pentru fiecare secvență este eșantionată din
distribuția posterioară a aliniamentelor determinată de algoritmul Inside. Din cauza
acest pas de eșantionare --gibbs este nedeterministă, deci rulează diferite cu același
alinierea poate da rezultate diferite. Acest lucru nu este adevărat când --rafina este utilizat
fara --gibbs opțiunea, caz în care alinierea finală și CM vor fi întotdeauna
la fel. Cand --gibbs este activat, fișierul --samanta opțiunea poate fi folosită pentru a însămânța
generator de numere aleatorii în mod previzibil, făcând rezultatele reproductibile. Scopul de
il --gibbs opțiunea este de a ajuta curatorii experți de aliniere a ARN-ului să perfecționeze structural
aliniamente, permițându-le să observe aliniamente alternative cu scor mare.

--samanta
Seed generatorul de numere aleatorii cu , un întreg >= 0. Această opțiune poate doar
fi folosit în combinație cu --gibbs. If este diferit de zero, eșantionarea stocastică a
aliniamentele vor fi reproductibile; aceeași comandă va da aceleași rezultate. Dacă
este 0, generatorul de numere aleatoare este însămânțat în mod arbitrar și stocastic
eșantioanele pot varia de la o rulare la alta a aceleiași comenzi. Semințele implicite sunt 0.

--cyk cu --rafina, aliniați cu algoritmul CYK. În mod implicit, precizia optimă
se folosește algoritmul. Există mai multe informații despre aceasta în cmalign pagina de manual.

--notrunc
cu --rafina, dezactivați algoritmul de aliniere trunchiată. Există mai mult
informații despre aceasta în cmalign pagina de manual.

Utilizare --devhelp pentru a vedea opțiuni suplimentare de rafinare a alinierii, altfel nedocumentate, ca
precum și alte opțiuni de fișiere de ieșire și opțiuni pentru construirea mai multor modele pentru un singur
aliniere.

Utilizați cmbuild online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    OfficeFloor
    OfficeFloor
    OfficeFloor oferă inversarea
    controlul cuplajului, cu: - dependenta
    injectare - continuare injectare -
    injecție filet Pentru mai multe informații
    Viziteaza...
    Descărcați OfficeFloor
  • 2
    DivKit
    DivKit
    DivKit este o sursă deschisă bazată pe server
    cadru UI (SDUI). Îți permite
    lansați actualizările provenite de la server la
    diferite versiuni de aplicație. De asemenea, poate fi
    folosit pentru ...
    Descărcați DivKit
  • 3
    subconvertor
    subconvertor
    Utilitate pentru a converti între diverse
    format de abonament. Utilizatori Shadowrocket
    ar trebui să folosească ss, ssr sau v2ray ca țintă.
    Puteți adăuga &remark= la
    HT apreciat de Telegram...
    Descărcați subconvertorul
  • 4
    SPĂLARE
    SPĂLARE
    SWASH este o valoare numerică de uz general
    instrument pentru simularea instabilității,
    nehidrostatic, cu suprafață liberă,
    flux rotaţional şi fenomene de transport
    în apele de coastă ca...
    Descărcați SWASH
  • 5
    VBA-M (arhivat - Acum pe Github)
    VBA-M (arhivat - Acum pe Github)
    Proiectul s-a mutat la
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Caracteristici:Creații de înșelăciune salvează stări multiple
    sistem, acceptă gba, gbc, gb, sgb,
    sgb2Tu...
    Descărcați VBA-M (arhivat - Acum pe Github)
  • 6
    Stacer
    Stacer
    Optimizator și monitorizare de sistem Linux
    Depozitul Github:
    https://github.com/oguzhaninan/Stacer.
    Public: utilizatori finali/desktop. Utilizator
    interfață: Qt. Programare La...
    Descărcați Stacer
  • Mai mult »

Comenzi Linux

Ad