EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

cmalign - Online în cloud

Rulați cmalign în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda cmalign care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


cmalign - aliniază secvențele la un model de covarianță

REZUMAT


cmalign
[Opțiuni]

DESCRIERE


cmalign aliniază secvențele de ARN în la modelul de covarianță (CM) în .
Noua aliniere este trimisă către stdout în format Stockholm, dar poate fi redirecționat către un fișier
cu -o opțiune.

Fie or (dar nu ambele) poate fi „-” (liniuță), ceea ce înseamnă că citiți acest lucru
intrare de la stdin mai degrabă decât un dosar.

Fișierul secvenței trebuie să fie în format FASTA sau Genbank.

cmalign folosește o tehnică de bandă HMM pentru a accelera alinierea în mod implicit, așa cum este descris
mai jos pentru --hbanded opțiune. Bandingul HMM poate fi dezactivat cu ajutorul --nebandate opțiune.

În mod implicit, cmalign calculează alinierea cu precizia maximă așteptată, adică
în concordanță cu constrângerile (benzile) derivate dintr-un HMM, folosind o versiune cu bandă a
Algoritm de precizie optimă Durbin/Holmes. Acest comportament poate fi schimbat cu --cyk or
--probă opțiuni.

cmalign are o grijă deosebită pentru a alinia corect secvențele trunchiate, unde unele nucleotide
de la începutul (5') şi/sau sfârşitul (3') al secvenţei biologice de lungime completă reală sunt
nu este prezent în secvența de intrare (vezi DL Kolbe și SR Eddy, Bioinformatics, 25:1236-1243,
2009). Acest comportament este activat în mod implicit, dar poate fi dezactivat cu --notrunc. În precedent
versiuni de cmalign il --sub era necesară opțiunea pentru a trata în mod corespunzător trunchiul
secvente. The --sub opțiunea este încă disponibilă în această versiune, dar noua metodă implicită
pentru manipularea secvențelor trunchiate ar trebui să fie la fel de bună sau superioară metodei secundare în aproape
toate cazurile.

--mapali opțiunea permite includerea aliniamentului de antrenament fix utilizat pentru a construi
CM din fișier în cadrul alinierii de ieşire a cmalign.

Este posibil să îmbinați două sau mai multe aliniamente create de același CM folosind șevalet
miniaplicație esl-alimerge (inclus în șevalet/miniaplicații/subdirectorul Infernal). Anterior
versiuni de cmalign au inclus opțiuni de îmbinare a aliniamentelor, dar au fost depreciate
dezvoltare a esl-alimerge, care este semnificativ mai eficient în memorie.

În mod implicit, cmalign va scoate alinierea la stdout. Alinierea poate fi redirecționată
la un fișier de ieșire cu -o opțiune. Cu -o, informații despre fiecare aliniat
secvența, inclusiv granițele de aliniere a scorului și modelului vor fi tipărite în stdout (mai mult
pe aceasta mai jos).

Alinierea de ieșire va fi implicit în format Stockholm. Acesta poate fi schimbat în Pfam,
formatul aliniat FASTA (AFA), A2M, Clustal sau Phylip folosind --outformat opțiune,
Unde este numele formatului dorit. Ca un caz special, dacă alinierea de ieșire
este mare (mai mult de 10,000 de secvențe sau mai mult de 10,000,000 de nucleotide totale) decât
formatul de ieșire va fi formatul Pfam, fiecare secvență apărând pe o singură linie, pt
motive ale eficienței memoriei. Pentru aliniamente mai mari decât aceasta, folosiți --am plecat va forța
formatul Stockholm intercalat, dar utilizatorul ar trebui să fie conștient de faptul că acest lucru poate necesita mult
memorie. --am plecat va funcționa numai pentru alinieri de până la 100,000 de secvențe sau 100,000,000
nucleotide totale.

Dacă formatul de aliniere de ieșire este Stockholm sau Pfam, alinierea de ieșire va fi
adnotate cu probabilități posterioare care estimează nivelul de încredere al fiecărui aliniat
nucleotide. Această adnotare apare ca linii care încep cu „#=GR PP”, unul per
secvență, fiecare imediat sub secvența aliniată corespunzătoare " ".
Caracterele din liniile PP au 12 valori posibile: „0-9”, „*” sau „.”. Dacă „.”, poziția
corespunde unui decalaj în succesiune. O valoare de „0” indică o probabilitate posterioară de
între 0.0 și 0.05, „1” indică între 0.05 și 0.15, „2” indică între 0.15 și
0.25 și așa mai departe până la „9” care indică între 0.85 și 0.95. O valoare de „*” indică a
probabilitate posterioară cuprinsă între 0.95 și 1.0. Probabilități posterioare mai mari corespund
la o mai mare încredere că nucleotida aliniată aparține acolo unde apare în
aliniere. Cu --fără bandă, calculul probabilităţilor posterioare are în vedere toate
posibile aliniamente ale secvenței țintă la CM. Fără --nebandate (adică în mod implicit
modul), calculul ia în considerare numai aliniamente posibile în benzile HMM. Mai departe,
probabilitățile posterioare sunt condiționate de modul de trunchiere al aliniamentului. Pentru
de exemplu, dacă alinierea secvenței este trunchiată la 5’, o valoare PP de „9” indică între
0.85 și 0.95 din toate aliniamentele trunchiate 5' includ nucleotida dată la data dată
poziţie. Adnotarea posterioară poate fi dezactivată cu ajutorul butonului --noprob opțiune. Dacă --mic
este activată, adnotarea posterioară trebuie, de asemenea, dezactivată folosind --noprob.

Ieșirea tabelară care este tipărită în stdout dacă -o opțiunea este utilizată include o linie
pe secvență și douăsprezece câmpuri pe linie: „idx”: indexul secvenței din intrare
fișier, „nume secvență”: numele secvenței; „lungime”: lungimea secvenței; „cm de la” și
„cm la”: pozițiile de început și de sfârșit ale modelului ale aliniamentului; „trunc”: „nu” dacă secvența
nu este trunchiat, „5’” dacă începutul secvenței este trunchiat 5’, „3’” dacă sfârșitul
secvența este trunchiată și „5’&3’” dacă atât începutul, cât și sfârșitul sunt trunchiați;
„bit sc”: scorul de biți al alinierii, „avg pp” probabilitatea posterior medie a
toate nucleotidele aliniate din aliniament; „band calc”, „alignment” și „total”: timpul
în secunde necesare pentru calcularea benzilor HMM, calcularea alinierii și finalizarea
procesarea secvenței, respectiv; „mem (Mb)”: dimensiunea în Mb a tuturor dinamicilor
matrice de programare necesare pentru alinierea secvenței. Aceste date tabelare pot fi salvate
la dosar cu --file opțiune.

OPŢIUNI


-h Ajutor; imprimați un scurt memento cu privire la utilizarea liniei de comandă și la opțiunile disponibile.

-o Salvați alinierea în format Stockholm într-un fișier . Implicit este să-l scrieți
la ieșirea standard.

-g Configurați modelul pentru alinierea globală a modelului de interogare la țintă
secvente. În mod implicit, modelul este configurat pentru alinierea locală. Local
aliniamentele pot conține inserții și ștergeri mari numite „capete locale” în
structura să fie penalizată diferit de indelurile normale. Acestea sunt adnotate ca
coloanele „~” în linia RF a aliniamentului de ieșire. The -g opțiunea poate fi folosită pentru
interzice aceste scopuri locale. The -g opțiunea este necesară dacă --sub opțiunea este de asemenea
folosit.

OPŢIUNI PENTRU CONTROLUL THE ALINIERE ALGORITM


--optacc
Aliniați secvențele folosind algoritmul de precizie optimă Durbin/Holmes. Acesta este
Mod implicit. Alinierea optimă de precizie va fi constrânsă de benzi HMM pentru
accelerație cu excepția cazului în care --nebandate opțiunea este activată. Precizia optimă
algoritmul determină alinierea care maximizează probabilitățile posterioare ale
nucleotidele aliniate din ea. Probabilitățile posterioare sunt determinate folosind
(posibil cu bandă HMM) variante ale algoritmilor Inside și Outside.

--cyk Nu utilizați alinierea de precizie optimă Durbin/Holmes pentru a alinia secvențele,
utilizați în schimb algoritmul CYK care determină scorul optim (maxim
probabilitate) alinierea secvenței la model, având în vedere benzile HMM (cu excepția cazului în care
--nebandate este de asemenea activat).

--probă
Eșantionați un aliniament din distribuția posterioară a aliniamentelor. Posterioara
distribuția este determinată folosind o bandă HMM (cu excepția cazului în care --fără bandă) varianta
Algoritmul din interior.

--samanta
Seed generatorul de numere aleatorii cu , un întreg >= 0. Această opțiune poate doar
fi folosit în combinație cu --probă. If este diferit de zero, eșantionarea stocastică a
aliniamentele vor fi reproductibile; aceeași comandă va da aceleași rezultate. Dacă
este 0, generatorul de numere aleatoare este însămânțat în mod arbitrar și stocastic
eșantioanele pot varia de la o rulare la alta a aceleiași comenzi. Semințele implicite sunt 181.

--notrunc
Dezactivați algoritmii de aliniere trunchiați. Toate secvențele din fișierul de intrare vor fi
presupus a fi de lungime întreagă, cu excepția cazului în care --sub este de asemenea folosit, caz în care programul poate
se ocupă în continuare de secvențe trunchiate, dar vor folosi o strategie alternativă pentru acestea
aliniere.

--sub Porniți procedura de construcție și aliniere a submodelului. Pentru fiecare secvență, an
HMM este folosit mai întâi pentru a prezice coloanele de consens de început și de sfârșit al modelului și un nou
sub CM este construit că doar modelează coloanele de consens de la început până la sfârșit. The
secvența este apoi aliniată la acest sub CM. Subalinierea este o metodă mai veche decât
unul implicit pentru alinierea secvențelor care sunt eventual trunchiate. În mod implicit, cmalign
folosește algoritmi speciali DP pentru a gestiona secvențele trunchiate care ar trebui să fie mai multe
mai precisă decât submetoda în majoritatea cazurilor. --sub este încă inclusă ca opțiune
în principal pentru testarea acestei manipulări implicite a secvenței trunchiate. Acest „sub CM”
procedura nu este aceeași cu „sub-CM-urile” descrise de Weinberg și Ruzzo.

OPŢIUNI PENTRU CONTROLUL SPEED AND MEMORIE CERINȚE


--hbanded
Această opțiune este activată implicit. Accelerați alinierea prin tăierea regiunilor
ale matricei CM DP care sunt considerate neglijabile de către un HMM. În primul rând, fiecare secvență este
punctat cu un plan CM 9 HMM derivat din CM folosind HMM înainte și înapoi
algoritmi pentru a calcula probabilitățile posterioare ca fiecare nucleotidă să se alinieze la fiecare
starea HMM. Aceste probabilități posterioare sunt utilizate pentru a deriva constrângeri
(benzi) pe matricea CM DP. În cele din urmă, secvența țintă este aliniată la CM
folosind matricea DP cu bandă, timp în care celulele din afara benzilor sunt ignorate.
De obicei, cea mai mare parte a matricei DP se află în afara benzilor (adesea mai mult de 95%),
făcând această tehnică mai rapidă, deoarece sunt necesare mai puține calcule DP și mai mult
memorie eficientă, deoarece numai celulele din benzi trebuie alocate.

Important, bandarea HMM sacrifică garanția determinării optime
alinierea precisă sau optimă, care va fi ratată dacă se află în afara benzilor.
Parametrul tau este cantitatea de masă probabilă considerată neglijabilă în timpul
calculul benzii HMM; valorile mai mici ale tau produc viteze mai mari, dar și o mai mare
șansa de a pierde alinierea optimă. Tau implicit este 1E-7, determinat
empiric, ca un bun compromis între sensibilitate și viteză, deși această valoare poate
fi schimbat cu --tau opțiune. Nivelul de accelerație crește odată cu
atât lungimea cât și nivelul de conservare a secvenței primare a familiei. De exemplu,
cu tau implicit de 1E-7, modele de ARNt (conservare scăzută a secvenței primare cu
lungime de aproximativ 75 de nucleotide) prezintă o accelerație de aproximativ 10X și ARNr bacterian SSU
modele (conservare mare a secvenței primare cu lungime de aproximativ 1500 de nucleotide)
arată aproximativ 700X. Bandingul HMM poate fi dezactivat cu ajutorul --nebandate opțiune.

--tau
Setați probabilitatea de pierdere a cozii utilizată în timpul calculului benzii HMM la . Aceasta este
cantitatea de masă de probabilitate în cadrul probabilităților posterioare HMM, adică
considerat neglijabil. Valoarea implicită este 1E-7. În general, valorile mai mari vor
duce la o accelerație mai mare, dar crește șansa de a rata optimul
alinierea datorată benzilor HMM.

--mxsize
Setați dimensiunea maximă admisă a matricei DP la megaocteți. Implicit aceasta
dimensiunea este de 1028 Mb. Acesta ar trebui să fie suficient de mare pentru marea majoritate a aliniamentelor,
cu toate acestea, dacă nu este cmalign va încerca să strângă iterativ benzile HMM
folosește pentru a constrânge alinierea prin creșterea parametrului tau și recalculând
benzi până când dimensiunea totală necesară a matricei scade sub megaocteți sau maxim
valoarea tau permisă (0.05 în mod implicit, dar modificabilă cu --maxtau) este atins. La
fiecare iterație de strângere a benzii, tau este înmulțită cu 2.0. Strângerea benzii
strategia poate fi dezactivată cu --fixedtau opțiune. Dacă tau maxim este
atins și dimensiunea necesară a matricei încă depășește sau dacă HMM banding nu este
fiind utilizat și dimensiunea matricei necesară depășește apoi cmalign va ieși
prematur și raportați un mesaj de eroare că matricea și-a depășit maximul
dimensiunea admisă. În acest caz, --mxsize poate fi folosit pentru a ridica limita de dimensiune sau
se poate ridica tau maxim cu --maxtau. Limita va fi de obicei depășită
când --nebandate opțiunea este utilizată fără --mic opțiune, dar poate apărea în continuare
cand --nebandate nu este folosit. Rețineți că dacă cmalign este rulat multiplu
fire de execuție pe o mașină multicore, atunci fiecare fir poate avea o matrice alocată de sus
la dimensiune Mb la un moment dat.

--fixedtau
Opriți strategia de strângere a benzii HMM descrisă în explicația
--mxsize opțiunea de mai sus.

--maxtau
Setați valoarea maximă permisă pentru tau în timpul strângerii benzii, descrisă în
explicatie a --mxsize mai sus, la . În mod implicit, această valoare este 0.05.

--nebandate
Dezactivează banda HMM. Alinierea returnată este garantată a fi la nivel global
cel optim precis (în mod implicit) sau cel cu punctaj optim global (dacă --cyk
este activat). The --mic opțiunea este recomandată în combinație cu această opțiune,
deoarece alinierea standard fără bandă HMM necesită multă memorie (vezi
--mic ).

--mic
Utilizați algoritmul de aliniere CYK împarte și cuceri descris în SR Eddy, BMC
Bioinformatica 3:18, 2002. The --nebandate opțiunea trebuie utilizată în combinație cu
aceste opțiuni. De asemenea, este recomandat oricând --nebandate este folosit ca --mic is
folosit și pentru că alinierea CM standard fără bandă HMM necesită mult
memorie, în special pentru ARN-urile mari. --mic permite alinierea CM în cadrul practic
limitele de memorie, reducând memoria necesară pentru alinierea LSU rRNA, cea mai mare
ARN-uri cunoscute, de la 150 Gb la mai puțin de 300 Mb. Această opțiune poate fi utilizată numai în
în combinație cu --fără bandă, --notrunc, și --cyk.

OPTIONAL REZULTATE DOSARE


--file
Descarcă scorul de aliniere pe secvență și informațiile timig în fișier . Formatul
acest fișier este descris mai sus (sunt aceleași date în același format ca și tabelul
ieșire stdout atunci când -o este utilizată opțiunea).

--tfile
Transferați urmărirea secvenței tabelare pentru fiecare secvență individuală într-un fișier .
Util în primul rând pentru depanare.

--ifile
Descarcă informațiile de inserare pe secvență în fișier . Formatul fișierului este
descrisă de linii de comentariu cu prefix „#” incluse în partea de sus a fișierului .
inserarea informațiilor este valabilă chiar și atunci când --potrivit este folosită opțiunea.

--elfile
Dumpează pe secvență starea EL (sfârșit local) inserează informații în fișier . Formatul
al fișierului este descrisă de linii de comentariu cu prefix „#” incluse în partea de sus a fișierului
fişier . Informațiile de inserare EL sunt valide chiar și atunci când --potrivit opțiunea este
folosit.

ALTE OPŢIUNI


--mapali
Citește alinierea din fișier folosit pentru a construi modelul îl aliniază ca unic
obiect la CM; ex. alinierea în este ținut fix. Acest lucru vă permite să
aliniază secvențele la un model cu cmalign și le vedeți în contextul unui existent
aliniere multiplă de încredere. trebuie să fie fișierul de aliniere pe care a fost construit CM-ul
din. Programul verifică dacă suma de control a fișierului se potrivește cu cea a fișierului
folosit la construirea CM. A fost numită o opțiune similară cu aceasta --withali in
versiunile anterioare ale cmalign.

--mapstr
Trebuie utilizat în combinație cu --mapali . Propagă informații structurale
pentru orice pseudonoduri care există în la alinierea ieșirii. O opțiune similară cu
acesta se numea --cu str în versiunile anterioare ale cmalign.

--informat
Afirmați că intrarea este în format . Nu rulați formatul Babelfish
autodetectare. Acest lucru crește oarecum fiabilitatea programului, deoarece
Babelfish poate face greșeli; recomandat în special pentru nesupravegheate, înalte
debitul rulajelor Infernal. Formatele acceptabile sunt: ​​FASTA, GENBANK și DDBJ.
este insensibil la majuscule.

--outformat
Specificați formatul de aliniere de ieșire ca . Formatele acceptabile sunt: ​​Pfam, AFA,
A2M, Clustal și Phylip. AFA este aliniat rapid. Doar alinierea Pfam și Stockholm
formatele vor include adnotarea structurii de consens și probabilitatea posterioară
adnotarea reziduurilor aliniate.

--dnaout
Ieșiți aliniamentele ca alinieri ale secvenței ADN, în loc de cele ARN.

--noprob
Nu adnotați alinierea ieșirii cu probabilități posterioare.

--potrivit
Includeți numai coloane de potrivire în alinierea de ieșire, nu includeți nicio inserție
raportat la modelul de consens. Această opțiune poate fi utilă atunci când creați foarte mari
aliniamente care necesită multă memorie și spațiu pe disc, dintre care majoritatea sunt necesare
doar pentru a face față coloanelor de inserare care sunt lacune în majoritatea secvențelor.

--am plecat
Ieșiți alinierea în format Stockholm intercalat cu o lățime fixă ​​care poate fi
mai convenabil pentru examinare. Acesta a fost formatul implicit de aliniere a ieșirii
versiunile anterioare ale cmalign. Rețineți că cmalign necesită mai multă memorie atunci când acest lucru
este folosită opțiunea. Din acest motiv, --am plecat va funcționa numai pentru aliniamente de până la
100,000 de secvențe sau un total de 100,000,000 de nucleotide aliniate.

--regres
Salvați o copie suplimentară a alinierii de ieșire fără informații despre autor pentru fișier
.

--verbos
Afișați informații suplimentare în rezultatul scorurilor tabelare (ieșire la stdout dacă -o
este folosit, sau la if --file este folosit). Acestea sunt utile în principal pentru testare și
depanare.

--CPU
Specificați asta să fie utilizați lucrători paraleli cu CPU. Dacă este setat ca „0”, apoi
programul va fi rulat în modul serial, fără a utiliza fire. De asemenea, puteți controla
acest număr prin setarea unei variabile de mediu, INFERNAL_NCPU. Această opțiune va
să fie disponibil numai dacă mașina pe care a fost construit Infernal este capabilă să o folosească
Filetarea POSIX (consultați secțiunea Instalare a ghidului utilizatorului pentru mai multe
informație).

--mpi Rulați ca un program paralel MPI. Această opțiune va fi disponibilă numai dacă Infernal are
a fost configurat și construit cu indicatorul „--enable-mpi” (consultați Instalarea
secțiunea ghidului utilizatorului pentru mai multe informații).

Utilizați cmalign online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    Alt-F
    Alt-F
    Alt-F oferă o sursă gratuită și deschisă
    firmware alternativ pentru DLINK
    DNS-320/320L/321/323/325/327L and
    DNR-322L. Alt-F are Samba și NFS;
    suportă ext2/3/4...
    Descărcați Alt-F
  • 2
    usm
    usm
    Usm este un pachet slackware unificat
    manager care se ocupă automat
    rezolvarea dependenței. Se unifică
    diverse depozite de pachete, inclusiv
    slackware, slacky, p...
    Descărcați usm
  • 3
    Chart.js
    Chart.js
    Chart.js este o bibliotecă Javascript care
    permite designerilor și dezvoltatorilor să deseneze
    tot felul de diagrame folosind HTML5
    element de pânză. Chart js oferă o excelentă
    matrice...
    Descărcați Chart.js
  • 4
    iReport-Designer pentru JasperReports
    iReport-Designer pentru JasperReports
    NOTĂ: Asistență iReport/Jaspersoft Studio
    Anunț: Începând cu versiunea 5.5.0,
    Jaspersoft Studio va fi oficial
    client de proiectare pentru JasperReports. raportez
    voi...
    Descărcați iReport-Designer pentru JasperReports
  • 5
    PostInstallerF
    PostInstallerF
    PostInstallerF va instala toate
    software pe care Fedora Linux și altele
    nu include implicit, după
    rulează Fedora pentru prima dată. Este
    usor pentru ...
    Descărcați PostInstallerF
  • 6
    strace
    strace
    Proiectul strace a fost mutat la
    https://strace.io. strace is a
    diagnostic, depanare și instruire
    userspace tracer pentru Linux. Este folosit
    a monitoriza un...
    Descărcați strace
  • Mai mult »

Comenzi Linux

Ad