EngelsFransSpaans

Ad


OnWorks-favicon

cmbuild - Online in de cloud

Voer cmbuild uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht cmbuild die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


cmbuild - construeer covariantiemodel(len) uit structureel geannoteerde RNA-meerdere sequenties
uitlijning(en)

KORTE INHOUD


cmbuild [Opties]

PRODUCTBESCHRIJVING


Voor elke uitlijning van meerdere reeksen in bouw een covariantiemodel en sla het op
een nieuw bestand .

Het uitlijningsbestand moet in Stockholm- of SELEX-formaat zijn en moet consensus bevatten
annotatie van de secundaire structuur. cmbuild gebruikt de consensusstructuur om de
architectuur van de CM.

kan '-' (streepje) zijn, wat betekent dat deze invoer wordt gelezen van stdin in plaats van een bestand.
Om '-' te gebruiken, moet u ook het formaat van het uitlijningsbestand specificeren met --informeren , zoals in
--informeren Stockholm (vanwege een huidige beperking in onze implementatie, MSA-bestand
formaten kunnen niet automatisch worden gedetecteerd in een niet-terugspoelbare invoerstroom.)

is misschien niet '-' (stdout), omdat het CM-bestand wordt verzonden naar stdout zou conflicteren
met de andere tekstuitvoer van het programma.

Naast het schrijven van CM(s) naar , cmbuild voert ook voor elk een enkele regel uit
model gemaakt om te stdout. Elke regel heeft de volgende velden: "aln": de index van de
uitlijning gebruikt om de CM te bouwen; "idx": de index van de CM in de ; "naam":
de naam van de CM; "nseq": het aantal sequenties in de uitlijning gebruikt om de CM op te bouwen;
"eff_nseq": het effectieve aantal reeksen dat is gebruikt om het model te bouwen; "alen": de lengte
van de uitlijning die is gebruikt om de CM te bouwen; "clen": het aantal kolommen uit de uitlijning
gedefinieerd als consensuskolommen (match); "bps": het aantal basenparen in de CM; "bif":
het aantal vertakkingen in de CM; "rel entropie: CM": de totale relatieve entropie van de
model gedeeld door het aantal consensuskolommen; "rel entropie: HMM": het totale relatieve
entropie van het model waarbij de secundaire structuur wordt genegeerd, gedeeld door het aantal consensus
kolommen. "description": beschrijving van het model/uitlijning.

OPTIES


-h Hulp; druk een korte herinnering af over het gebruik van de opdrachtregel en de beschikbare opties.

-n Geef de nieuwe CM een naam . Standaard wordt de naam van het alignement gebruikt (als dat het geval is
Aanwezig in de ), of, bij gebrek daaraan, de naam van de . If
bevat meer dan één uitlijning, -n werkt niet, en elke uitlijning
moet een naam hebben die is vermeld in het (zoals in Stockholm #=GF ID annotatie).

-F Allow overschreven worden. Zonder deze optie, als al
bestaat, cmbuild wordt afgesloten met een fout.

-o Leid de samenvattingsuitvoer naar het bestand , in plaats van naar stevig.

-O Nadat elk model is samengesteld, slaat u de geannoteerde bronuitlijningen opnieuw op in een bestand
in Stockholm-formaat. Reeksen worden geannoteerd met de relatieve reeksgewichten
werden toegewezen. De uitlijningen worden ook geannoteerd met een referentieannotatielijn
geeft aan welke kolommen als consensus zijn toegewezen. Als de bronuitlijning dat wel had gedaan
referentieannotatie ("#=GC RF") zal worden vervangen door de consensusresidu van
het model voor consensuskolommen en '.' voor invoegkolommen, tenzij de --hand
optie werd gebruikt voor het specificeren van consensusposities, in welk geval dit ook het geval zal zijn
onveranderd.

--ontwikkelen Druk hulp af, zoals bij -h , maar omvat ook expertopties die dat niet zijn
weergegeven met -h . Deze expertopties zijn naar verwachting niet relevant voor de
overgrote meerderheid van de gebruikers en worden daarom niet beschreven op de handleidingpagina. De enige
bronnen om te begrijpen wat ze feitelijk doen zijn de korte one-line
beschrijvingen worden uitgevoerd wanneer --ontwikkelen is ingeschakeld, en de broncode.

OPTIES CONTROLEREN MODEL CONSTRUCTIE


Deze opties bepalen hoe consensuskolommen worden gedefinieerd in een uitlijning.

--snel Definieer consensuskolommen automatisch als kolommen met een breuk >= symfrac of
resten in plaats van gaten. (Zie hieronder voor de --symfrac optie.) Dit is de
standaard.

--hand Gebruik de annotatie van de referentiecoördinaten (#=GC RF-lijn, in Stockholm) om te bepalen welke
kolommen zijn consensus, en welke zijn inserts. Elk teken zonder tussenruimte geeft a aan
consensuskolom. (Markeer consensuskolommen bijvoorbeeld met "x" en voeg kolommen in
met ".".) Deze optie werd aangeroepen --rf in eerdere versies van Infernal (0.1
tot 1.0.2).

--symfrac
Definieer de residufractiedrempel die nodig is om een ​​consensuskolom te definiëren wanneer
niet gebruiken --hand. De standaardwaarde is 0.5. De symboolfractie in elke kolom is
berekend nadat rekening is gehouden met de relatieve reeksweging. Dit instellen op
0.0 betekent dat elke uitlijningskolom wordt toegewezen als consensus, wat mogelijk het geval is
in sommige gevallen nuttig. Als u dit instelt op 1.0, betekent dit dat alleen kolommen geen gaten bevatten
zal als consensus worden toegewezen. Deze optie vervangt de --gaftresh optie
uit eerdere versies van Infernal (0.1 tot en met 1.0.2), met gelijk aan (1.0 -
). Bijvoorbeeld om gedrag te reproduceren voor een opdracht cmbuild --gaftresh 0.8
in een eerdere versie, gebruik cmbuild --symfrac 0.2 met deze versie.

--nos Negeer de eventuele annotatie van de secundaire structuur in en bouw er een CM mee
nul basenparen. Dit model zal vergelijkbaar zijn met een profiel HMM en de cmzoeken en
cmscan programma's zullen hiervoor HMM-algoritmen gebruiken die sneller zijn dan CM-algoritmen
model. Bovendien hoeft er niet met een nul-basepaarmodel te worden gekalibreerd cmkalibreren
voordat u gaat hardlopen cmzoeken ermee. De --nos optie moet worden gebruikt als er geen is
annotatie van de secundaire structuur in .

--onderzoek
Parameteriseer emissiescores a la RSEARCH, met behulp van de RIBOSUM-matrix in het bestand .
met --onderzoek ingeschakeld, alle uitlijningen in moet er precies één bevatten
volgorde of de --telefoongesprek optie moet ook ingeschakeld zijn. Alle posities in elke reeks
worden beschouwd als consensus-"kolommen". Eigenlijk de emissiescores hiervoor
modellen zullen niet identiek zijn aan RIBOSUM-scores vanwege verschillen in de modellering
strategie tussen Infernal en RSEARCH, maar ze zullen zo veel mogelijk op elkaar lijken.
RIBOSUM-matrixbestanden worden bij Infernal meegeleverd in de submap "matrices/" van
de map "infernal-xxx" op het hoogste niveau. RIBOSUM-matrices zijn vervangingsscores
matrices die specifiek zijn getraind voor structurele RNA's met afzonderlijke enkelstrengs
residu- en basenpaarsubstitutiescores. Voor meer informatie zie het RSEARCH
publicatie (Klein en Eddy, BMC Bioinformatics 4:44, 2003).

ANDERE MODEL CONSTRUCTIE OPTIES


--nul
Lees een nulmodel uit . Het nulmodel definieert de waarschijnlijkheid van elk RNA
nucleotide in de achtergrondsequentie, de standaardwaarde is om 0.25 voor elk nucleotide te gebruiken.
Het formaat van nulbestanden wordt gespecificeerd in de gebruikershandleiding.

--voorafgaand
Lees een Dirichlet voorafgaand aan , ter vervanging van het standaardmengsel Dirichlet. De
formaat van eerdere bestanden wordt gespecificeerd in de gebruikershandleiding.

Te gebruiken --ontwikkelen om aanvullende, anders ongedocumenteerde, modelbouwopties te zien.

OPTIES CONTROLEREN FAMILIELID GEWICHTEN


cmbuild gebruikt een ad-hocvolgordewegingsalgoritme om nauw verwante waarden te verlagen
reeksen en veraf verwante reeksen een groter gewicht geven. Dit heeft tot gevolg dat er minder modellen worden gemaakt
beïnvloed door ongelijke fylogenetische representatie. Twee identieke reeksen zouden dat bijvoorbeeld doen
doorgaans ontvangen ze elk de helft van het gewicht dat één reeks zou krijgen. Deze opties bepalen
welk algoritme wordt gebruikt.

--wpb Gebruik het Henikoff positiegebaseerde sequentiewegingsschema [Henikoff en Henikoff,
J Mol. Biol. 243:574, 1994]. Dit is de standaardinstelling.

--wgsc Gebruik het Gerstein/Sonnhammer/Chothia-wegingsalgoritme [Gerstein et al, J. Mol.
Biol. 235:1067, 1994].

--geen
Schakel reeksweging uit; Stel bijvoorbeeld expliciet alle reeksgewichten in op 1.0.

--wgegeven
Gebruik reeksgewichten zoals aangegeven in de annotatie in het invoeruitlijningsbestand. Als Nee
Er zijn gewichten gegeven, neem aan dat ze allemaal 1.0 zijn. De standaardinstelling is om nieuw te bepalen
reeksgewichten door het Gerstein/Sonnhammer/Chothia-algoritme, waarbij eventuele gewichten worden genegeerd
geannoteerde gewichten.

--wblosum
Gebruik het BLOSUM-filteralgoritme om de reeksen te wegen, in plaats van de standaardwaarde
SGR-weging. Cluster de sequenties met een bepaald percentage identiteit (zie --breed);
ken aan elk cluster een totaalgewicht van 1.0 toe, gelijkelijk verdeeld over de leden
van dat cluster.

--breed
Controleert het gedrag van de --wblosum wegingsoptie door het percentage in te stellen
identiteit voor het clusteren van de uitlijning .

OPTIES CONTROLEREN EFFECTIEF VOLGORDE NUMMER


Nadat relatieve gewichten zijn bepaald, worden ze genormaliseerd om op te tellen tot een totaal effectief
volgnummer, eff_nseq. Dit aantal kan het werkelijke aantal reeksen in de
uitlijning, maar het is bijna altijd kleiner dan dat. De standaard entropieweging
methode (--ent) vermindert het effectieve volgnummer om de informatie-inhoud te verminderen
(relatieve entropie, of gemiddelde verwachte score op echte homologen) per consensuspositie. De
doel relatieve entropie wordt bestuurd door een functie met twee parameters, waarbij de twee
parameters zijn instelbaar met --er en --esigma.

--eens Gebruik de entropiewegingsstrategie om het effectieve volgnummer te bepalen
geeft een relatieve entropie van de beoogde gemiddelde matchstatus. Deze optie is de standaard, en
kan worden uitgeschakeld met --enon. De standaarddoelgemiddelde matchstatus relatief
entropie is 0.59 bits voor modellen met minimaal 1 basepaar en 0.38 bits voor modellen
met nul basenparen, maar veranderd met --eer. De standaardwaarde is 0.59 of 0.38 bits
automatisch gewijzigd als de totale relatieve entropie van het model (opgetelde overeenkomst
status relatieve entropie) is minder dan een grenswaarde, die standaard 6.0 ​​bits bedraagt, maar
kan bij de deskundige worden gewijzigd, zonder papieren --ex keuze. Als je dat echt wilt
speel met die optie, raadpleeg de broncode.

--een
Schakel de entropiewegingsstrategie uit. Het effectieve volgnummer is slechts het
aantal sequenties in de uitlijning.

--er
Stel de relatieve entropie van de beoogde gemiddelde matchstatus in als . Standaard het doel
de relatieve entropie per matchpositie is 0.59 bits voor modellen met minimaal 1
basenparen en 0.38 voor modellen zonder basenparen.

--eminseq
Definieer het minimaal toegestane effectieve volgnummer als .

--ehmmm
Stel de relatieve entropie van de doel-HMM-gemiddelde matchstatus in als . Entropie voor
De matchtoestanden van basenparen worden berekend met behulp van gemarginaliseerde basenparenemissie
waarschijnlijkheden.

--set
Stel het effectieve volgnummer voor entropieweging in als .

OPTIES CONTROLEREN FILTER P7 HMM CONSTRUCTIE


Voor elke CM dat cmbuild constructen, wordt een bijbehorend filter p7 HMM opgebouwd uit de invoer
uitlijning ook. Deze opties regelen de filter HMM-constructie:

--p7ere
Stel de relatieve entropie van de beoogde gemiddelde matchstatus voor het filter p7 HMM in als . By
standaard is de relatieve doel-entropie per matchpositie 0.38 bits.

--p7ml Gebruik een maximale waarschijnlijkheid p7 HMM opgebouwd uit de CM als filter HMM. Deze HMM wel
zo veel mogelijk vergelijkbaar zijn met de CM (hoewel noodzakelijkerwijs onwetend van secundair
structuur).

Te gebruiken --ontwikkelen om aanvullende, anders ongedocumenteerde, filter-HMM-constructieopties te zien.

OPTIES CONTROLEREN FILTER P7 HMM KALIBRATIE


Na het bouwen van elk filter HMM, cmbuild bepaalt de juiste E-waardeparameters die moeten worden gebruikt
tijdens het infiltreren cmzoeken en cmscan door een reeks reeksen te bemonsteren en deze te doorzoeken
bij elke HMM-filterconfiguratie en algoritme.

--EmN Stel het aantal bemonsterde sequenties voor lokale MSV-filter-HMM-kalibratie in op .
200 standaard.

--EvN Stel het aantal bemonsterde sequenties voor lokale Viterbi-filter HMM-kalibratie in op
. 200 standaard.

--ElfN Stel het aantal bemonsterde sequenties voor lokale Voorwaartse filter HMM-kalibratie in op
. 200 standaard.

--EgfN Stel het aantal bemonsterde sequenties in voor de glokale Voorwaartse filter HMM-kalibratie
naar . 200 standaard.

Te gebruiken --ontwikkelen om aanvullende, anders ongedocumenteerde, filteropties voor HMM-kalibratie te zien.

OPTIES VOOR VERFIJNING HET INVOER UITLIJNING


--verfijnen
Probeer de uitlijning te verfijnen voordat u de CM bouwt, met behulp van verwachtings-
maximalisatie (EM). Zoals gebruikelijk wordt eerst een CM opgebouwd vanaf de initiële uitlijning. Dan,
de sequenties in de uitlijning worden optimaal opnieuw uitgelijnd (met de HMM-gebande CYK
algoritme, optimaal betekent optimaal gezien de banden) naar de CM, en er wordt een nieuwe CM gebouwd
uit de resulterende uitlijning. De sequenties worden vervolgens opnieuw uitgelijnd met de nieuwe CM, en a
vanuit die uitlijning wordt nieuwe CM opgebouwd. Dit wordt voortgezet tot convergentie,
vooral wanneer de uitlijningen voor twee opeenvolgende iteraties dat niet zijn
significant verschillend (de opgetelde bitscores van alle reeksen in de
uitlijning verandert minder dan 1% tussen twee opeenvolgende iteraties). De laatste
uitlijning (de uitlijning die wordt gebruikt om de CM te bouwen waarnaar wordt geschreven ) is
geschreven .

-l met --verfijnen, schakel het lokale uitlijningsalgoritme in, dat de uitlijning mogelijk maakt
indien nodig twee of meer subreeksen omspannen (bijvoorbeeld als de structuur van de query
model en doelsequentie worden slechts gedeeltelijk gedeeld), waardoor bepaalde grote hoeveelheden mogelijk zijn
invoegingen en verwijderingen in de structuur worden anders bestraft dan normaal
indels. De standaardinstelling is om het querymodel globaal uit te lijnen met de doelreeksen.

--gibbs
Wijzigt het gedrag van --verfijnen dus Gibbs-sampling wordt gebruikt in plaats van EM. De
Het verschil is dat tijdens de uitlijningsfase de uitlijning niet noodzakelijkerwijs plaatsvindt
optimaal is, wordt in plaats daarvan een uitlijning (parsetree) voor elke sequentie bemonsterd uit de
posterieure verdeling van uitlijningen zoals bepaald door het Inside-algoritme. Vanwege
deze bemonsteringsstap --gibbs is niet-deterministisch, dus verschillende runs met hetzelfde
uitlijning kan verschillende resultaten opleveren. Dit is niet waar wanneer --verfijnen is gebruikt
zonder de --gibbs optie, in welk geval de uiteindelijke uitlijning en CM altijd zullen zijn
hetzelfde. Wanneer --gibbs is ingeschakeld, de --zaad optie kan worden gebruikt om de
generator voor willekeurige getallen, waardoor de resultaten reproduceerbaar zijn. Het doel van
de --gibbs De optie is om deskundige curatoren van RNA-uitlijning te helpen de structuur te verfijnen
uitlijningen door hen in staat te stellen alternatieve, hoog scorende uitlijningen te observeren.

--zaad
Zaai de generator voor willekeurige getallen met , een geheel getal >= 0. Deze optie kan alleen
te gebruiken in combinatie met --gibbs. If is niet nul, stochastische bemonstering van
uitlijningen zullen reproduceerbaar zijn; hetzelfde commando geeft dezelfde resultaten. Als
0 is, wordt de generator voor willekeurige getallen willekeurig en stochastisch geplaatst
bemonsteringen kunnen variëren van uitvoering tot uitvoering van dezelfde opdracht. Het standaardzaad is 0.

--cyk met --verfijnen, afstemmen op het CYK-algoritme. Standaard de optimale nauwkeurigheid
algoritme wordt gebruikt. Meer informatie hierover vindt u in de cmuitlijnen handleiding pagina.

--nietrunc
met --verfijnen, schakel het afgeknotte uitlijningsalgoritme uit. Er is meer
informatie hierover in de cmuitlijnen handleiding pagina.

Te gebruiken --ontwikkelen om aanvullende, anders ongedocumenteerde, opties voor verfijning van de uitlijning te zien
evenals andere uitvoerbestandsopties en opties voor het bouwen van meerdere modellen voor één
uitlijning.

Gebruik cmbuild online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

  • 1
    KantoorVloer
    KantoorVloer
    OfficeFloor biedt inversie van
    koppelingsbesturing, met zijn: - afhankelijkheid
    injectie - vervolg injectie -
    schroefdraadinjectie Voor meer informatie
    bezoek de...
    OfficeFloor downloaden
  • 2
    DivKit
    DivKit
    DivKit is een open source servergestuurd programma
    UI (SDUI)-framework. Het staat je toe
    server-source updates uitrollen naar
    verschillende app-versies. Het kan ook zo zijn
    gebruikt voor...
    DivKit downloaden
  • 3
    subconverter
    subconverter
    Hulpprogramma om te converteren tussen verschillende
    abonnement formaat. Shadowrocket-gebruikers
    moet ss, ssr of v2ray als doel gebruiken.
    U kunt &opmerking= toevoegen aan
    Telegram-geliefde HT...
    Subconverter downloaden
  • 4
    SWASH
    SWASH
    SWASH is een numerieke waarde voor algemeen gebruik
    hulpmiddel voor het simuleren van instabiele,
    niet-hydrostatisch, vrij oppervlak,
    rotatiestroming en transportverschijnselen
    in kustwateren als ...
    SWASH downloaden
  • 5
    VBA-M (gearchiveerd - nu op Github)
    VBA-M (gearchiveerd - nu op Github)
    Project is verplaatst naar
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Functies:Cheat creaties opslaan van statenmulti
    systeem, ondersteunt gba, gbc, gb, sgb,
    sgb2Tu...
    VBA-M downloaden (gearchiveerd - nu op Github)
  • 6
    Stacer
    Stacer
    Linux-systeemoptimalisatie en -bewaking
    Github-opslagplaats:
    https://github.com/oguzhaninan/Stacer.
    Doelgroep: eindgebruikers/desktop. Gebruiker
    interface: Qt. Programmeerla...
    Stacer downloaden
  • Meer "

Linux-commando's

Ad