EngelsFransSpaans

Ad


OnWorks-favicon

cmkalibreren - Online in de cloud

Voer cmkalibrate uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is het commando cmcalibrate dat kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


cmcalibrate - pas exponentiële staarten aan voor bepaling van de E-waarde van het covariantiemodel

KORTE INHOUD


cmkalibreren [Opties] cmbestand

PRODUCTBESCHRIJVING


cmkalibreren bepaalt exponentiële staartparameters voor bepaling van de E-waarde door te genereren
willekeurige reeksen, doorzoek ze met de CM en verzamel de scores van de resulterende reeks
hits. Een histogram van de bitscores van de treffers wordt passend gemaakt voor een exponentiële staart, en de
parameters van de gemonteerde staart worden opgeslagen in het CM-bestand. De exponentiële staartparameters
worden vervolgens gebruikt om de statistische significantie van gevonden treffers te schatten cmzoeken en
cmscan.

Een CM-bestand moet worden gekalibreerd met cmkalibreren voordat het gebruikt kan worden cmzoeken or cmscan,
met één uitzondering: het is niet nodig om CM-bestanden te kalibreren die alleen
modellen zonder basenparen voordat ze worden uitgevoerd cmzoeken.

cmkalibreren is erg traag. Het duurt een paar uur om één gemiddelde maat te kalibreren
CM op één CPU. cmkalibreren zal parallel draaien op alle beschikbare cores als Infernal
is gebouwd op een systeem dat POSIX-threading ondersteunt (zie het installatiegedeelte van de
gebruikershandleiding voor meer informatie). Gebruik makend van kernen zullen ongeveer resulteren in -Vouwen
acceleratie versus een enkele CPU. MPI (Message Passing Interface) kan ook worden gebruikt
parallellisatie met de --mpi optie als Infernal is gebouwd met MPI ingeschakeld, maar gebruikt
meer dan 161 processors wordt niet aanbevolen, omdat het verhogen van meer dan 161 niet zal versnellen
de kalibratie. Zie het hoofdstuk Installatie van de gebruikershandleiding voor meer informatie.

De --voorspelling optie kan worden gebruikt om te schatten hoe lang het duurt voordat het programma wordt uitgevoerd
gegeven cmbestand op de huidige machine. Om de looptijd te voorspellen verwerkers met
MPI, gebruik bovendien de --nvoorspelling optie.

De willekeurige reeksen waarin wordt gezocht cmkalibreren worden gegenereerd door een HMM waarop is getraind
echte genomische sequenties met verschillende GC-inhouden. Het doel is om de GC-distributies te hebben
in de willekeurige sequenties vergelijkbaar zijn met die in werkelijke genomische sequenties.

Er worden vier ronden van zoekopdrachten en daaropvolgende exponentiële staartpassingen uitgevoerd, elk één voor
de vier verschillende CM-algoritmen die kunnen worden gebruikt cmzoeken en cmscan: glokale CYK,
glokaal Inside, lokaal CYK en lokaal Inside.

De E-waardenparameters bepaald door cmkalibreren worden alleen gebruikt door de cmzoeken en cmscan
programma's. Als u deze programma's niet gaat gebruiken, verspil dan geen tijd met kalibreren
jouw modellen.

OPTIES


-h Hulp; druk een korte herinnering af over het gebruik van de opdrachtregel en de beschikbare opties.

-L Stel de totale lengte in van willekeurige reeksen waarnaar moet worden gezocht megabasen (Mb). Door
standaard, is 1.6 MB. Toenemend zorgt ervoor dat de exponentiële staart beter past
nauwkeuriger en E-waarden nauwkeuriger, maar zal langer duren (verdubbeling). zal ongeveer
verdubbel de looptijd). Afnemend wordt niet aanbevolen omdat het de
past minder precies en de E-waarden minder nauwkeurig.

OPTIES VOOR VOORSPELLEN VERPLICHT TIJD EN GEHEUGEN


--voorspelling
Voorspel de looptijd van de kalibratie van cmbestand (met meegeleverde opties) aan
de huidige machine en sluit af. De kalibratie wordt niet uitgevoerd. De voorspellingen
moeten als ruwe schattingen worden beschouwd. Als multithreading is ingeschakeld (zie
Installatiegedeelte van de gebruikershandleiding), zal de timing rekening houden met het nummer
van beschikbare kernen.

--nvoorspelling
met --voorspelling, specificeer dat Voor de kalibratie zullen processoren worden gebruikt.
Dit kan handig zijn voor het voorspellen van de looptijd van een MPI-run
processors.

--memreq
Voorspel de hoeveelheid vereist geheugen voor kalibratie cmbestand (met voorzien
opties) op de huidige machine en sluit af. De kalibratie wordt niet uitgevoerd.

OPTIES CONTROLEREN EXPONENTIEEL TAIL PAST BIJ


--gtailn
pas de exponentiële staart aan voor glocal Inside en glocal CYK voor de hoogste scores
in de histogramstaart, waar is maal het aantal Mb dat wordt gezocht. De
standaardwaarde van is 250. De waarde 250 is gekozen omdat deze goed werkt
empirisch relatief ten opzichte van andere waarden.

--Ltailn
pas de exponentiële staart voor lokale Inside en lokale CYK aan de hoogste scores
in de histogramstaart, waar is maal het aantal Mb dat wordt gezocht. De
standaardwaarde van is 750. De waarde 750 is gekozen omdat deze goed werkt
empirisch relatief ten opzichte van andere waarden.

--staartp
Negeer de --gtailn en --Ltailn vooraf ingestelde opties en pas de fractie staart van
het histogram naar een exponentiële staart, voor alle zoekmodi.

OPTIONELE OUTPUT FILES


--hbestand
Sla de histogrammen op die geschikt zijn voor bestand . Het formaat van dit bestand is twee spaties
gescheiden kolommen per regel. De eerste kolom bevat de x-aswaarden van bitscores van
elke bak. De tweede kolom bevat de y-aswaarden van het aantal treffers per bak. Elk
reeks wordt begrensd door een regel met één teken "&". Het bestand zal bevatten
één reeks voor elk van de vier exponentiële staarten past in de volgende volgorde:
glokale CYK, glokale Inside, lokale CYK en lokale Inside.

--sbestand
Bewaar overlevingsplotinformatie in een bestand . Het formaat van dit bestand is twee spaties
gescheiden kolommen per regel. De eerste kolom bevat de x-aswaarden van bitscores van
elke bak. De tweede kolom bevat de waarden op de y-as van het deel van de treffers dat voldoet aan of
hoger zijn dan de score voor elke bak. Elke reeks wordt begrensd door een lijn met een enkele
karakter "&". Het bestand bevat drie gegevensreeksen voor elk van de vier CM
zoekmodi in de volgende volgorde: glokale CYK, glokale Inside, lokale CYK en
lokaal binnen. De eerste serie is de empirische overlevingsplot uit het histogram
aantal treffers in de willekeurige volgorde. De tweede reeks past bij de exponentiële staart
de empirische distributie. De derde serie is de exponentiële staartpassing als lambda
werden vastgesteld en ingesteld als de natuurlijke log van 2 (0.691314718).

--qqbestand
Sla kwantiel-kwantiel plotinformatie op in een bestand . Het formaat van dit bestand is
twee door spaties gescheiden kolommen per regel. De eerste kolom bevat de waarden op de x-as, en
de tweede kolom zijn de y-aswaarden. De afstand van de punten tot de
identiteitslijn (y=x) is een maatstaf voor hoe goed de exponentiële staartpassing is, de
Hoe dichter de punten bij de identiteitslijn liggen, hoe beter de pasvorm is. Elke serie is
gescheiden door een regel met één teken "&". Het bestand bevat één serie
van empirische gegevens voor elk van de vier exponentiële staarten past in het volgende
volgorde: glokaal CYK, glokaal Inside, lokaal CYK en lokaal Inside.

--fbestand
Bespaar ruimte-gescheiden statistieken van verschillende exponentiële staartaanpassingen in een bestand .
Het bestand bevat de lambda- en mu-waarden voor exponentiële staarten die passen
histogramstaarten van verschillende grootte. De velden in het bestand zijn gelabeld
informatief.

--xbestand
Bewaar een lijst met de scores in elke passende histogramstaart in een bestand . Elke regel van
dit bestand zal een andere score hebben, wat aangeeft dat er één treffer in de staart zat
dat scoren. Elke reeks wordt begrensd door een regel met één teken "&". De
-bestand bevat één reeks voor elk van de vier exponentiële staartpassingen in de
volgende volgorde: glokale CYK, glokale Inside, lokale CYK en lokale Inside.

ANDERE OPTIES


--zaad
Zaai de generator voor willekeurige getallen met , een geheel getal >= 0. Als is niet nul,
stochastische simulaties zullen reproduceerbaar zijn; hetzelfde commando zal hetzelfde geven
resultaten. Als 0 is, wordt de generator van willekeurige getallen willekeurig geplaatst, en
stochastische simulaties variëren van run tot run van hetzelfde commando. De standaard
zaad is 181.

--bèta
Standaard wordt query-dependent banding (QDB) gebruikt om de CM-zoekopdracht te versnellen
algoritmen met een bètastaartverlieskans van 1E-15. Deze bètawaarde kan zijn
veranderd naar Met --bèta . De bètaparameter is de hoeveelheid waarschijnlijkheid
massa uitgesloten tijdens bandberekening, hogere bètawaarden geven grotere versnellingen
maar offer meer nauwkeurigheid op dan lagere waarden. De standaardwaarde die wordt gebruikt is 1E-15.
(Voor meer informatie over QDB zie Nawrocki en Eddy, PLoS Computational Biology
3(3): e56.)

--niet-gestreept
Schakel QDB uit tijdens E-waardekalibratie. Dit zal de kalibratie vertragen.

--nul3
Schakel het post-hoc aanvullende null-model null3 uit. Dit wordt niet aanbevolen tenzij
u van plan bent dezelfde optie te gebruiken cmzoeken en / of cmscan.

--willekeurig
Gebruik in plaats daarvan het achtergrondnulmodel van de CM om de willekeurige reeksen te genereren
van het meer realistische HMM. Tenzij de CM is gebouwd met behulp van de --nul optie om
cmbouwen, het achtergrondnulmodel zal 25% zijn voor zowel A, C, G als U.

--gc
Genereer de willekeurige sequenties met behulp van de nucleotideverdeling uit de sequentie
filet .

--processor
Specificeer dat parallelle CPU-werkers worden gebruikt. Als is ingesteld op "0", dan wordt de
het programma wordt in seriële modus uitgevoerd, zonder gebruik te maken van threads. Je kunt ook controleren
dit aantal door een omgevingsvariabele in te stellen, INFERNAL_NCPU. Deze optie zal
alleen beschikbaar zijn als de machine waarop Infernal is gebouwd, kan worden gebruikt
POSIX-inrijgen (zie het gedeelte Installatie van de gebruikershandleiding voor meer informatie).
informatie).

--mpi Uitvoeren als een parallel MPI-programma. Deze optie is alleen beschikbaar als Infernal dat heeft
is geconfigureerd en gebouwd met de vlag "--enable-mpi" (zie Installatie
sectie van de gebruikershandleiding voor meer informatie).

Gebruik cmkalibrate online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad