Dit is de opdracht cmemit die kan worden uitgevoerd in de gratis hostingprovider OnWorks met behulp van een van onze verschillende gratis online werkstations, zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
cmemit - voorbeeldsequenties uit een covariantiemodel
KORTE INHOUD
uitgeven [Opties]
PRODUCTBESCHRIJVING
De uitgeven programma bemonstert (zendt) sequenties uit het/de covariantiemodel(len) in , en
schrijft ze naar uitvoer. Bemonsteringssequenties kunnen voor verschillende doeleinden nuttig zijn,
inclusief het creëren van synthetische true positives voor benchmarks of tests.
Standaard worden tien niet-uitgelijnde sequenties van elke CM bemonsterd. Als alternatief kunt u met de -c
optie, kunt u een enkele meerderheidsregelconsensusreeks uitzenden; of met de -a optie, jij
kan een uitlijning uitzenden.
De kan een bibliotheek van CM's bevatten, in welk geval elke CM op zijn beurt wordt gebruikt.
kan '-' (streepje) zijn, wat betekent dat deze invoer wordt gelezen van stdin in plaats van een bestand.
Voor modellen met nul baseparen worden sequenties in plaats daarvan bemonsterd via het profiel HMM-filter
van de CM. Aangezien deze modellen echter vrijwel identiek zullen zijn (tenzij er speciale opties zijn
werden gebruikt in cmbuild om dit te voorkomen) zal het gebruik van de HMM in plaats van de CM de
output op significante wijze, tenzij de -l optie wordt gebruikt. Met -ik, de HMM zal zijn
geconfigureerd voor equiprobable model begin- en eindposities, terwijl de CM dat niet zal doen. U kunt
dwingen uitgeven om altijd te bemonsteren uit de CM met de --neehm optie.
OPTIES
-h Hulp; druk een korte herinnering af over het gebruik van de opdrachtregel en de beschikbare opties.
-o Sla de synthetische sequenties op in een bestand in plaats van ze naar stdout te schrijven.
-N Genereer een sequenties. De standaardwaarde voor is 10.
-u Schrijf de gegenereerde sequenties in niet-uitgelijnde indeling (FASTA). Dit is de standaard
gedrag.
-a Schrijf de gegenereerde sequenties in een uitgelijnd formaat (STOCKHOLM) met consensus
structuurannotatie in plaats van FASTA. Andere uitvoerformaten zijn mogelijk met de
--uitformatteren optie.
-c Voorspel een enkele consensusreeks op meerderheidsbasis in plaats van bemonsteringsreeksen
van de CM´s waarschijnlijkheidsverdeling. Sterk geconserveerde residuen (basenpaar
residuen die hoger scoren dan 3.0 bits, of enkelstrengs residuen die hoger scoren dan XNUMX bits
groter dan 1.0 bits) worden in hoofdletters weergegeven; andere worden in kleine letters weergegeven.
-e Sluit de CM-uitgezonden sequenties in een grotere willekeurig gegenereerde sequentie van lengte in
gegenereerd vanuit een HMM die is getraind op echte genomische sequenties met verschillende
GC-inhoud (dezelfde HMM die wordt gebruikt door cmkalibreren). U kunt gebruik maken van de --id optie om
genereer in plaats daarvan 25% A, C, G en U-sequentie. De CM-uitgezonden sequentie begint
op een willekeurige positie binnen de grotere reeks en zal in de reeks worden opgenomen
geheel tenzij de --u5p or --u3p opties worden gebruikt. Wanneer -e wordt gebruikt
combinatie met --u5p, de CM-uitgezonden sequentie zal altijd beginnen op positie 1 van
de grotere sequentie en zal 5' worden afgekapt. Wanneer gebruikt in combinatie --u3p de CM
De uitgezonden sequentie eindigt altijd op positie van de grotere reeks en zal zijn
afgeknot 3'.
-l Configureer de CM's in de lokale modus voordat u sequenties uitzendt. Standaard is het model
zal in globale modus zijn. In lokale modus zijn grote invoegingen en verwijderingen meer
algemener dan in de globale modus.
OPTIES VOOR AFKORTING UITGEZONDEN OPEENVOLGINGEN
--u5p Alle uitgezonden sequenties op een willekeurig gekozen startpositie afkappen , door alleen
het uitgeven van residuen beginnend bij . Er wordt willekeurig een ander startpunt gekozen
voor elke sequentie.
--u3p Alle uitgezonden sequenties op een willekeurig gekozen eindpositie afkappen , door alleen
restanten uitgeven tot positie . Er wordt willekeurig een ander eindpunt gekozen
voor elke sequentie.
--a5p
In combinatie met de -a optie, de uitgezonden uitlijning willekeurig afkappen
gekozen startwedstrijdpositie , door alleen uitlijningskolommen voor posities uit te voeren
na wedstrijd staat - 1. moet een geheel getal zijn tussen 0 en de consensus
lengte van het model (die kan worden bepaald met behulp van de cmstat programma. Als een speciale
geval, met behulp van 0 als resulteert in een willekeurig gekozen startpositie.
--a3p
In combinatie met de -a optie, de uitgezonden uitlijning willekeurig afkappen
gekozen eindwedstrijdpositie , door alleen uitlijningskolommen voor posities uit te voeren
voor wedstrijd staat + 1. moet een geheel getal zijn tussen 1 en de consensus
lengte van het model (die kan worden bepaald met behulp van de cmstat programma). Als een
speciaal geval, met 0 als resulteert in een willekeurig gekozen eindpositie.
ANDERE OPTIES
--zaad
Zaai de generator voor willekeurige getallen met , een geheel getal >= 0. Als is niet nul,
stochastische bemonstering van sequenties zal reproduceerbaar zijn; dezelfde opdracht zal geven
dezelfde resultaten. Als is 0, de willekeurige getallengenerator wordt willekeurig geplaatst,
en stochastische bemonsteringen zullen variëren van run tot run van dezelfde opdracht.
Standaard seed is 0.
--id met -e, Genereer de grotere sequenties als 25% van elk A, C, G en U.
--na Geef aan dat de uitgezonden sequenties worden uitgevoerd als RNA-sequenties. Dit is waar door
standaard.
--DNA Geef aan dat de uitgezonden sequenties als DNA-sequenties worden uitgevoerd. Standaard is de
Het uitvoeralfabet is RNA.
--idx
Geef aan dat de uitgezonden sequenties een naam moeten krijgen die begint met . . By
verzuim is 1.
--uitformatteren
met -een, Geef het uitvoeruitlijningsformaat op als . Acceptabele formaten zijn: Pfam,
AFA, A2M, Clustal en Phylip. AFA is fasta uitgelijnd. Alleen Pfam en Stockholm
Uitlijningsformaten bevatten consensusstructuurannotatie.
--tbestand
Dump tabelvormige sequentie-parsetrees (tracebacks) voor elke uitgezonden sequentie naar een bestand
. Vooral handig voor het debuggen.
--exp
Exponentiseer de emissie- en overgangswaarschijnlijkheden van de CM door en
normaliseer deze distributies opnieuw voordat u sequenties uitzendt. Deze optie verandert de
CM-waarschijnlijkheidsverdeling van parsetrees ten opzichte van standaard. Met minder dan
1.0 De uitgezonden sequenties zullen de neiging hebben om lagere bitscores te hebben bij uitlijning op de
CM. Met groter dan 1.0, de uitgezonden sequenties zullen de neiging hebben om een hogere bitsnelheid te hebben
scores bij uitlijning met de CM. Dit bitscoreverschil zal toenemen naarmate
beweegt verder weg van 1.0 in beide richtingen. Als is gelijk aan 1.0, deze optie
heeft geen effect ten opzichte van de standaardinstelling. Deze optie is handig voor het genereren van sequenties
die ofwel moeilijker zijn ( < 1.0) of gemakkelijker ( > 1.0) voor de CM om
onderscheid maken tussen homogeen en achtergrond, willekeurige sequentie.
--hmmm
Uitzenden vanuit het filterprofiel HMM in plaats van CM.
--neehm
Zend nooit uit vanuit het filterprofiel HMM, gebruik altijd de CM, zelfs voor modellen met
nul basenparen.
Gebruik cmemit online met behulp van onworks.net-services