EngelsFransSpaans

Ad


OnWorks-favicon

maq - Online in de cloud

Voer maq uit in OnWorks gratis hostingprovider via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is het commando maq dat kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


Maq - Mapping en montage met eigenschappen

KORTE INHOUD


maar Q commando [opties] argumenten

maq.mv commando [opties] argumenten

PRODUCTBESCHRIJVING


Maq is software die mapping-assemblies bouwt op basis van korte reads die worden gegenereerd door de volgende-
generatie sequencing machines. Het is speciaal ontworpen voor Illumina-Solexa 1G Genetic
Analyzer, en heeft een voorlopige functionaliteit om AB SOLiD-gegevens te verwerken.

Met Maq kunt u:

· Illumina/SOLiD-uitlezingen snel afstemmen op het referentiegenoom. Met de standaardopties, een
miljoen paar reads kunnen worden toegewezen aan het menselijk genoom in ongeveer 10 CPU-uren met minder
dan 1G geheugen.

· Meet nauwkeurig de foutkans van de uitlijning van elke afzonderlijke uitlezing.

· Noem de consensus genotypen, inclusief homozygote en heterozygote polymorfismen, met
een Phred probabilistische kwaliteit toegewezen aan elke base.

· Vind korte indels met gepaarde eindlezingen.

· Vind nauwkeurig grootschalige genomische deleties en translocaties met gepaarde einduitlezingen.

· Ontdek potentiële CNV's door de leesdiepte te controleren.

· Evalueer de nauwkeurigheid van de ruwe basiskwaliteiten van sequencers en help de
systematische fouten.

Maq kan echter NIET:

· Doen de nieuw samenkomst. (Maq kan de consensus alleen oproepen door reads toe te wijzen aan een bekende
referentie.)

· Kaart shorts leest tegen zichzelf. (Maq kan alleen volledige overlap tussen lezingen vinden.)

· Lijn capillaire meetwaarden of 454 meetwaarden uit met de referentie. (Maq kan reads niet langer uitlijnen dan
63 bp.)

MAQ COMMANDO'S


sleutel commando's

snel2bfa maar Q snel2bfa in.ref.fasta uit.ref.bfa

Converteer sequenties in FASTA-indeling naar Maq's BFA (binaire FASTA) -indeling.

snelq2bfq maar Q snelq2bfq [-n nraden] in.lezen.snelq uit.lezen.bfquit.voorvoegsel

Converteer reads in FASTQ-formaat naar Maq's BFQ (binaire FASTQ)-formaat.

OPTIES:

-n INT aantal reads per bestand [niet gespecificeerd]

kaart maar Q kaart [-n nmi's] [-a maximaal] [-c] [-1 len1] [-2 len2] [-d adapt3] [-m muteren]
[-u niet in kaart gebracht] [-e maxerr] [-M c⎪g] [-N] [-H alle hits] [-C maxhits] uit.aln.map
in.ref.bfa in.lees1.bfq [in.lees2.bfq] 2> uit.map.log

Kaart leest naar de referentiesequenties.

OPTIES:

-n INT Aantal maximale mismatches dat altijd kan worden gevonden [2]

-a INT Maximale buitenafstand voor een correct leespaar [250]

-A INT Maximale buitenafstand van twee RF betaald lezen (0 voor uitschakelen) [0]

-c Kaart leest in de kleurruimte (alleen voor SOLiD)

-1 INT Leeslengte voor de eerste lezing, 0 voor auto [0]

-2 INT Leeslengte voor de tweede lezing, 0 voor auto [0]

-m FLOAT Mutatiesnelheid tussen de referentiesequenties en de uitlezingen [0.001]

-d FILE Specificeer een bestand dat een enkele regel van de 3'-adapterreeks bevat
[nul]

-u FILE Dump niet-toegewezen reads en reads die meer dan . bevatten nmi's komt niet overeen met
een apart bestand [null]

-e INT Drempel op de som van niet-overeenkomende basiskwaliteiten [70]

-H FILE Meerdere/alle 01-mismatch treffers dumpen naar FILE [nul]

-C INT Maximaal aantal treffers om uit te voeren. Onbeperkt indien groter dan 512. [250]

-M c⎪g methylering uitlijningsmodus. Alle C (of G) op de voorwaartse streng zijn
veranderd in T (of A). Deze optie is alleen voor testen.

-N sla de niet-overeenkomende positie op in het uitvoerbestand uit.aln.map. Wanneer dit
optie in gebruik is, is de maximaal toegestane leeslengte 55bp.

NOTITIE:

* Gepaarde eindlezingen moeten worden voorbereid in twee bestanden, één voor elk uiteinde, met
leest worden in dezelfde volgorde gesorteerd. Dit betekent dat de k-de in de eerste wordt gelezen
bestand is gekoppeld aan de k-de gelezen in het tweede bestand. De bijbehorende lees
namen moeten identiek zijn tot aan de staart `/1' of `/2'. Bijvoorbeeld, zo'n
paar leesnamen zijn toegestaan: `EAS1_1_5_100_200/1' en
`EAS1_1_5_100_200/2'. De staart `/[12]' wordt meestal gegenereerd door de
GAPipeline om de twee uiteinden in een paar te onderscheiden.

* De uitvoer is een gecomprimeerd binair bestand. Het wordt beïnvloed door de endianness.

* De beste manier om deze opdracht uit te voeren is om ongeveer 1 tot 3 miljoen keer gelezen te worden als
invoer. Meer lezen kost meer geheugen.

* Keuze -n regelt de gevoeligheid van de uitlijning. Standaard een hit met
er kunnen altijd maximaal 2 mismatches worden gevonden. Hoger -n vindt meer hits en ook
verbetert de nauwkeurigheid van karteringskwaliteiten. Dit gebeurt echter tegen kostprijs
van snelheid.

* Afstemmingen met veel mismatches van hoge kwaliteit moeten worden weggegooid als onwaar
uitlijningen of mogelijke verontreinigingen. Dit gedrag wordt bepaald door optie
-e. De -e drempel wordt slechts bij benadering berekend omdat basiskwaliteiten
worden in een bepaald stadium van de uitlijning door 10 gedeeld. De -Q optie in het
monteren commando precies de drempel instellen.

* Er wordt gezegd dat een paar uitlezingen correct is gekoppeld als en alleen als de
oriëntatie is FR en de buitenafstand van het paar is niet groter dan
maximaal. Er is geen limiet op de minimale wisselplaatmaat. Deze instelling is
bepaald door het gepaarde einduitlijningsalgoritme dat wordt gebruikt in Maq. vereist een
minimale wisselplaatgrootte zal leiden tot een aantal verkeerde uitlijningen met zeer hoge
overschatte karteringskwaliteiten.

* Momenteel hebben leesparen van Illumina/Solexa long-insert-bibliotheek RF-lezen
oriëntatie. De maximale wisselplaatgrootte wordt ingesteld door optie -A. Echter, lang-
insert-bibliotheek wordt ook gemengd met een kleine fractie van korte-insert read
paren. -a moet ook correct worden ingesteld.

* Soms kan het 5'-uiteinde of zelfs de gehele 3'-adaptersequentie worden gesequenced.
Het verstrekken van -d maakt Maq om de adapterverontreinigingen te elimineren.

* Gegeven 2 miljoen reads als input, maar Q neemt meestal 800 MB geheugen in beslag.

samenvoegen maar Q samenvoegen uit.aln.map in.aln1.kaart in.aln2.kaart [...]

Voeg een batch leesuitlijningen samen.

NOTITIE:

* In theorie kan dit commando een onbeperkt aantal uitlijningen samenvoegen. Echter, zoals
mapmerge zal alle invoer tegelijkertijd lezen, het kan de raken
limiet van het maximale aantal geopende bestanden dat is ingesteld door het besturingssysteem. Op dit moment is dit
handmatig moet worden opgelost door eindgebruikers.

* Commando samenvoegen kan worden gebruikt om uitlijningsbestanden samen te voegen met verschillende lees
lengtes. Alle volgende analyses gaan niet meer uit van een vaste lengte.

rmdup maar Q rmdup out.rmdup.map in.ori.kaart

Verwijder paren met identieke buitenste coördinaten. In principe paren met
identieke buitenste coördinaten zouden zelden voorkomen. Echter, door de
amplificatie bij monstervoorbereiding, dit komt veel vaker voor dan bij
kans. Praktische analyses tonen aan dat het verwijderen van duplicaten helpt om de
algehele nauwkeurigheid van SNP-oproepen.

monteren maar Q monteren [-sp] [-m maximaal] [-Q maxerr] [-r het tarief] [-t coef] [-q minQ] [-N
nHap] uit.cns in.ref.bfa in.aln.kaart 2> uit.cns.log

Roep de consensussequenties op uit leestoewijzing.

OPTIES:

-t FLOAT Foutafhankelijkheidscoëfficiënt [0.93]

-r FLOAT Fractie van heterozygoten onder alle sites [0.001]

-s Neem single end mapping kwaliteit als de uiteindelijke mapping kwaliteit;
anders wordt de kwaliteit van de gekoppelde eindtoewijzing gebruikt

-p Gooi gepaarde einduitlezingen weg die niet in de juiste paren zijn toegewezen

-m INT Maximaal aantal mismatches dat is toegestaan ​​om een ​​read te gebruiken in
consensus roeping [7]

-Q INT Maximaal toegestane som van kwaliteitswaarden van niet-overeenkomende basen [60]

-q INT Minimale toewijzingskwaliteit toegestaan ​​voor gebruik in consensus
bellen [0]

-N INT Aantal haplotypes in de pool (>=2) [2]

NOTITIE:

* Keuze -Q stelt een limiet aan de maximale som van niet-overeenkomende basiskwaliteiten.
Reads die veel mismatches van hoge kwaliteit bevatten, moeten worden weggegooid.

* Keuze -N stelt het aantal haplotypes in een pool in. Het is ontworpen voor
resequencing van monsters door meerdere stammen/individuen samen te voegen. Voor
diploïde genoom resequencing, deze optie is gelijk aan 2.

glfgen maar Q glfgen [-sp] [-m maximaal] [-Q maxerr] [-r het tarief] [-t coef] [-q minQ] [-N
nHap] uit.cns in.ref.bfa in.aln.kaart 2> uit.cns.log

Bereken de log-waarschijnlijkheid voor alle genotypen en sla de resultaten op in GLF-formaat
(Genotyperingswaarschijnlijkheidsformaat). Controleer de MAQ-website voor meer informatie!
beschrijvingen van het bestandsformaat en de bijbehorende hulpprogramma's.

indelpe maar Q indelpe in.ref.bfa in.aln.kaart > uit.indelpe

Roep consistente indels op van gepaarde eindlezingen. De uitvoer is door TAB gescheiden met
elke regel bestaande uit chromosoom, startpositie, type indel, nummer
van uitlezingen over de indel, grootte van de indel en ingevoegde/verwijderde nucleotiden
(gescheiden door dubbele punt), aantal indels op de omgekeerde streng, aantal indels
op de voorwaartse streng, 5'-reeks vóór de indel, 3'-reeks volgend
de indel, het aantal uitlezingen uitgelijnd zonder indels en drie extra kolommen
voor filters.

In de 3e kolom, type indel, geeft een ster aan dat de indel is bevestigd
door reads van beide strengen, betekent een plus dat de indel wordt geraakt door ten minste twee reads
maar van dezelfde streng, toont een minteken dat de indel alleen wordt gevonden bij één keer lezen,
en een punt betekent dat de indel te dicht bij een andere indel staat en wordt uitgefilterd.

Gebruikers wordt aangeraden om `maq.pl indelpe' te doorlopen om het aantal
leest in kaart gebracht zonder indels. Voor meer details, zie de `maq.pl indelpe'
pagina.

indelsoa maar Q indelsoa in.ref.bfa in.aln.kaart > uit.indelsoa

Roep potentiële homozygote indels en breekpunten op door het abnormale te detecteren
uitlijningspatroon rond indels en breekpunten. De uitvoer is ook TAB
begrensd met elke lijn bestaande uit chromosoom, geschatte coördinaat,
lengte van het abnormale gebied, aantal reads dat in kaart is gebracht over de positie,
aantal reads aan de linkerkant van de positie en aantal reads aan
de rechterkant. De laatste kolom kan worden genegeerd.

De uitvoer bevat veel valse positieven. Een aanbevolen filter zou kunnen zijn:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

Merk op dat dit commando niet bedoeld is om een ​​nauwkeurige indeldetector te zijn, maar:
helpt voornamelijk om een ​​aantal valse positieven te voorkomen bij het bellen van substitutie. In
bovendien werkt het alleen goed gezien de diepe diepte (~40X bijvoorbeeld); anders de
het percentage fout-negatieven zou zeer hoog zijn.

Formaat Het omzetten

sol2sanger maar Q sol2sanger in.sol.fastq uit.sanger.fastq

Zet Solexa FASTQ om naar standaard/Sanger FASTQ-formaat.

bfq2fastq maar Q bfq2fastq in.lees.bfq uit.lezen.fastq

Converteer het BFQ-formaat van Maq naar het standaard FASTQ-formaat.

mapas2maq maar Q mapas2maq in.mapass2.map uit.maq.map

Converteer het verouderde kaartformaat van mapas2 naar het kaartformaat van Maq. Het oude formaat wel
geen gelezen namen bevatten.

Informatie Het extraheren

Kaartweergave maar Q Kaartweergave [-bN] in.aln.kaart > uit.aln.txt

Geef de leesuitlijning weer in platte tekst. Voor leest uitgelijnd vóór de Smith-
Waterman-uitlijning, elke regel bestaat uit gelezen naam, chromosoom, positie,
streng, voeg grootte in vanaf de buitenste coorniates van een paar, gepaarde vlag, mapping
kwaliteit, single-end mapping kwaliteit, alternatieve mapping kwaliteit, aantal
mismatches van de beste hit, som van kwaliteiten van niet-overeenkomende bases van de beste
hit, aantal 0-mismatch-treffers van de eerste 24bp, aantal 1-mismatch-treffers van
de eerste 24bp op de referentie, lengte van de lees-, leesreeks en zijn
kwaliteit. Alternatieve kaartkwaliteit is altijd gelijk aan kaartkwaliteit als de
leest zijn niet gekoppeld. Als uitlezingen zijn gekoppeld, is dit gelijk aan de kleinere toewijzing
kwaliteit van de twee uiteinden. Deze alternatieve kaartkwaliteit is eigenlijk de
kaartkwaliteit van een abnormaal paar.

De vijfde kolom, gepaarde vlag, is een bitsgewijze vlag. De onderste 4 bits geven de
oriëntatie: 1 staat voor FF, 2 voor FR, 4 voor RF en 8 voor RR, waarbij FR betekent
dat de gelezen met kleinere coördinaat op de voorwaartse streng is, en zijn partner is
op de omgekeerde streng. Alleen FR is toegestaan ​​voor een correct paar. De hogere bits
van deze vlag geven meer informatie. Als het paar het gepaarde einde ontmoet
vereiste, zullen er 16 worden ingesteld. Als de twee uitlezingen zijn toegewezen aan verschillende
chromosomen, 32 worden ingesteld. Als een van de twee uitlezingen helemaal niet kan worden toegewezen,
64 wordt ingesteld. De vlag voor een correct paar is altijd gelijk aan 18.

Voor uitlezingen die achteraf zijn uitgelijnd door de Smith-Waterman-uitlijning, is de vlag:
altijd 130. Een regel bestaat uit gelezen naam, chromosoom, positie, streng, insert
grootte, vlag (altijd 130), positie van de indel op de gelezen (0 indien geen indel),
lengte van de indels (positief voor inserties en negatief voor deleties),
mapping kwaliteit van zijn partner, aantal mismatches van de beste hit, som van
kwaliteiten van niet-overeenkomende basen van de beste hit, twee nullen, lengte van de gelezen,
leesvolgorde en de kwaliteit ervan. De mate van een 130-vlaggen read krijgt altijd een
vlag 18.

Vlag 192 geeft aan dat de read niet in kaart is gebracht, maar zijn partner wel. voor zulke
een leespaar, één gelezen heeft vlag 64 en de andere heeft 192.

OPTIES:

-b de leesvolgorde en de kwaliteit niet weergeven

-N de posities weergeven waar mismatches voorkomen. Deze vlag werkt alleen
met een .map-bestand gegenereerd door `maq map -N'.

kaartcontrole maar Q kaartcontrole [-s] [-m maximaal] [-q minQ] in.ref.bfa in.aln.kaart > out.mapcheck

Lees kwaliteitscontrole. De mapcheck meldt eerst de samenstelling en de diepte van
de referentie. Daarna is er een formulier. De eerste kolom geeft de . aan
positie op een gelezen. Volgende vier kolommen die het nucleotide tonen:
samenstelling, substitutiepercentages tussen de referentie en leest worden gegeven.
Deze tarieven en de getallen in de volgende kolommen zijn geschaald naar 999 en
afgerond op het dichtstbijzijnde gehele getal. De volgende groep kolommen toont de verdeling van
basiskwaliteiten langs de uitlezingen met een kwaliteitsinterval van 10. Een achteruitgang in kwaliteit
kan meestal worden waargenomen, wat betekent dat de bases aan het einde van het lezen minder zijn
nauwkeurig. De laatste groep kolommen geeft de fractie van vervangingen voor
lees basen met een kwaliteitsinterval. Dit meet de nauwkeurigheid van de basiskwaliteit
schatting. Idealiter verwachten we 1 op de 3 te zien? kolom, 10 in de 2? kolom
en 100 in de 1? kolom.

OPTIES:

-s Neem single end mapping kwaliteit als de uiteindelijke mapping kwaliteit

-m INT Maximaal aantal mismatahces dat mag worden geteld om een ​​gelezen te tellen [4]

-q INT Minimale toewijzingskwaliteit die is toegestaan ​​om een ​​gelezen te tellen [30]

opstapelen maar Q opstapelen [-spvP] [-m maximaal] [-Q maxerr] [-q minQ] [-l sitebestand] in.ref.bfa
in.aln.kaart > uit.opstapelen

Geef de uitlijning weer in een `pileup' tekstformaat. Elke regel bestaat uit:
chromosoom, positie, referentiebasis, diepte en de basen op leest die dekken
deze positie. Indien -v wordt toegevoegd op de opdrachtregel, basiskwaliteiten en mapping
kwaliteiten worden op volgorde in de zesde en zevende kolom gepresenteerd.

De vijfde kolom begint altijd met `@'. In deze kolom, lees bases identiek
naar de verwijzing worden getoond in komma `,' of punt `.', en lees basen verschillend
uit de verwijzing in brieven. Een komma of een hoofdletter geeft aan dat het grondtal
komt van een read uitgelijnd op de voorwaartse streng, terwijl een punt of een kleine letter op
de omgekeerde streng.

Deze opdracht is bedoeld voor gebruikers die hun eigen SNP-bellers willen ontwikkelen.

OPTIES:

-s Neem single end mapping kwaliteit als de uiteindelijke mapping kwaliteit

-p Gooi gepaarde einduitlezingen weg die niet als juiste paren zijn toegewezen

-v Voer uitgebreide informatie uit, inclusief basiskwaliteiten en mapping
kwaliteiten

-m INT Maximaal aantal mismatches dat is toegestaan ​​om een ​​leesbewerking te gebruiken [7]

-Q INT Maximaal toegestaan ​​aantal kwaliteitswaarden van mismatches [60]

-q INT Minimale toewijzingskwaliteit die mag worden gebruikt voor een leesbewerking [0]

-l FILE Bestand met de locaties waar pileup wordt afgedrukt. In deze
bestand geeft de eerste kolom de namen van de referentie en de tweede
de coördinaten. Extra kolommen worden genegeerd. [nul]

-P voer ook de basispositie uit op de lees

cns2fq maar Q cns2fq [-Q minKaartQ] [-n minNeiQ] [-d minDiepte] [-D maximale diepte] in.cns >
uit.cns.fastq

Pak de consensussequenties uit in FASTQ-formaat. In de sequentielijnen, basen
in kleine letters zijn in wezen herhalingen of hebben onvoldoende dekking; basissen
in hoofdletters geven regio's aan waar SNP's betrouwbaar kunnen worden aangeroepen. In de
kwaliteitslijnen, ASCII van een teken minus 33 geeft de PHRED-kwaliteit.

OPTIES:

-Q INT Minimale kaartkwaliteit [40]

-d INT Minimale leesdiepte [3]

-n INT Minimale buurkwaliteit [20]

-D INT Maximale leesdiepte. >=255 voor onbeperkt. [255]

cns2snp maar Q cns2snp in.cns > uit.snp

SNP-sites extraheren. Elke lijn bestaat uit chromosoom, positie, referentiebasis,
consensusbasis, Phred-achtige consensuskwaliteit, leesdiepte, het gemiddelde aantal
hits van reads die deze positie bestrijken, de hoogste toewijzingskwaliteit van de reads
die de positie dekt, de minimale consensuskwaliteit in de 3bp-flankering
regio's aan elke kant van de site (6 bp in totaal), de op één na beste oproep, log
waarschijnlijkheidsratio van de op één na beste en de op twee na beste oproep, en de op twee na beste
noemen.

De 5e kolom is het belangrijkste criterium wanneer u de betrouwbaarheid van een SNP beoordeelt.
Omdat deze kwaliteit echter alleen wordt berekend in de veronderstelling dat de site onafhankelijk is,
zou ook andere kolommen moeten overwegen om nauwkeurigere SNP-oproepen te krijgen. Script
commando `maq.mv SNP-filter' is hiervoor ontworpen (zie hieronder).

De 7e kolom geeft aan of de site in een repetitief gebied valt. Als Nee
lees die de site bedekt, kan in kaart worden gebracht met een hoge kaartkwaliteit, de flankerende
regio is mogelijk repetitief of bij gebrek aan goede reads. Een SNP op zo'n site
is meestal niet betrouwbaar.

De 8e kolom geeft ruwweg het kopienummer van het flankerende gebied in de
referentie genoom. In de meeste gevallen benadert dit aantal de 1.00, wat betekent dat de
regio is zo ongeveer uniek. Soms ziet u een leesdiepte die niet nul is, maar 0.00 bij
de 7e kolom. Dit geeft aan dat alle reads die betrekking hebben op de positie at . hebben
minimaal twee mismatches. Maq telt alleen het aantal 0- en 1-mismatch-treffers tot
de referentie. Dit komt door een ingewikkeld technisch vraagstuk.

De 9e kolom geeft de aangrenzende kwaliteit. Filteren op deze kolom is ook:
vereist om betrouwbare SNP's te krijgen. Dit idee is geïnspireerd door NQS, hoewel NQS is
oorspronkelijk ontworpen voor een enkele lezing in plaats van een consensus.

cns2weergave maar Q cns2weergave in.cns > uit.zicht

Toon gedetailleerde informatie op alle sites. Het uitvoerformaat is identiek aan
cns2snp melden.

cns2ref maar Q cns2ref in.cns > uit.ref.fasta

Pak de referentiereeks uit.

cns2win maar Q cns2win [-w winmaat] [-c chr] [-b beginnen] [-e einde] [-q minQ] in.cns >
uit.win

Extraheer informatie gemiddeld in een bewerkingsvenster. De uitvoer is door TAB gescheiden,
die bestaat uit referentienaam, coördinaat gedeeld door 1,000,000, SNP-tarief,
het tarief, onbewerkte leesdiepte, leesdiepte in ongeveer unieke regio's, de
gemiddeld aantal treffers van gelezen in het venster en percentage GC.

OPTIES:

-w INT Grootte van een raam [1000]

-c STR Bestemming referentiesequentie; anders worden alle referenties gebruikt
[nul]

-b INT Startpositie, 0 voor geen beperking [0]

-e INT Eindpositie, 0 voor geen beperking [0]

-q INT Minimale consensuskwaliteit van de te gebruiken sites [0]

Simulatie Verwant

nepmut maar Q nepmut [-r muteren] [-R onzelfstandig] in.ref.fasta > uit.fakeref.fasta 2>
uit.nep.snp

Voeg willekeurig substituties en indels toe aan de referentie. wissels en
enkele basenpaar-indels kunnen worden toegevoegd.

OPTIES:

-r FLOAT Mutatiesnelheid [0.001]

-R FLOAT Fractie van mutaties moet indels zijn [0.1]

simutrain maar Q simutrain uit.simupars.dat in.lezen.snelq

Schat/trein parameters voor leessimulatie.

simuleren maar Q simuleren [-d inmaat] [-s stdev] [-N nLeest] [-1 leesLen1] [-2 leesLen2] [-r
MutRate] [-R indelFrac] [-h] uit.lezen1.fastq uit.lezen2.fastq in.ref.fasta
in.simupars.dat

Simuleer gepaarde eindlezingen. Bestand in.simupars.dat bepaalt de leeslengtes en
kwaliteitsdistributie. Het wordt gegenereerd uit simutrain, of kan worden gedownload van
Maq website. In de uitvoerleesbestanden bestaat een leesnaam uit de referentie
reeksnaam en de buitenste coördinaten van het paar gesimuleerde uitlezingen. Door
standaard, simuleren gaat ervan uit dat reads afkomstig zijn van een diploïde reeks die wordt gegenereerd
door twee verschillende sets mutaties, waaronder één basenpaar indels, toe te voegen aan
in.ref.fasta.

OPTIES:

-d INT gemiddelde van de buitenafstand van wisselplaatmaten [170]

-s INT standaarddeviatie van wisselplaatmaten [20]

-N INT aantal leesparen dat moet worden gegenereerd [1000000]

-1 INT lengte van de eerste lezing [ingesteld door in.simupars.dat]

-2 INT lengte van de tweede lees [ingesteld door in.simupars.dat]

-r FLOAT mutatiesnelheid [0.001]

-R FLOAT fractie van 1bp indels [0.1]

-h voeg alle mutaties toe aan in.ref.fasta en genereer reads van de single
gemuteerde sequentie (haploïde modus)

NOTITIE:

* Lezingen die met dit commando worden gegenereerd, zijn onafhankelijk, wat afwijkt van de
waarheid. Waar afstemmingsevaluatie hier minder door wordt beïnvloed, is evaluatie op
SNP-oproepen moeten met de nodige voorzichtigheid worden uitgevoerd. Foutafhankelijkheid kan een van zijn:
de belangrijkste oorzaken van verkeerde SNP-oproepen.

simulatie maar Q simulatie in.simu-aln.map > uit.simustat

Evalueer kaartkwaliteiten van gesimuleerde uitlezingen.

Stevig Verwant

fasta2csfa maar Q fasta2csfa in.nucl-ref.fasta > uit.kleur-ref.fasta

Zet nucleotide FASTA om in kleurgecodeerde FASTA. Vlag -c moet dan worden toegepast
naar kaart opdracht. In de uitvoer staat de letter 'A' voor kleur 0, 'C' voor 1, 'G'
voor 2 en `T' voor 3. Elke reeks in de uitvoer is 1 bp korter dan de invoer.

csmap2nt maar Q csmap2nt uit.nt.kaart in.ref.nt.bfa in.cs.map

Zet kleuruitlijning om in nucleotide-uitlijning. de ingang in.ref.nt.bfa is de
nucleotide binair FASTA-referentiebestand. Het moet overeenkomen met het originele bestand
waaruit de kleurreferentie wordt geconverteerd. Nucleotideconsensus kan worden genoemd
van de resulterende uitlijning.

Diversen/Geavanceerd commando's

subkaart maar Q subkaart [-q minKaartQ] [-Q maxSumErr] [-m maxMM] [-p] uit.map in.kaart

Filter slechte uitlijningen in in.kaart. Opdrachtregelopties worden beschreven in de
`monteren' commando.

eland2maq maar Q eland2maq [-q defqual] uit.map in lijst in.eland

Converteer eland-uitlijning naar het .map-formaat van maq. Bestand in lijst bestaat uit de
reeksnamen die verschijnen in de zevende kolom van het eland-uitlijningsbestand
in.eland en de naam die u verwacht te zien in maq-uitlijning. Het volgende is een
voorbeeld:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Als u uitlezingen in meerdere batches uitlijnt met behulp van eland, is het belangrijk om:
gebruik hetzelfde in lijst voor de conversie. Bovendien laadt maq alle
uitlijningen en sorteer ze in het geheugen. Als je meerdere elanden hebt aaneengeschakeld
uitvoer in één enorm bestand, moet u het in kleinere bestanden opsplitsen om
voorkomen dat maq al uw machinegeheugen opeet.

Dit commando is eigenlijk bedoeld om Eland-uitlijning in Maqview te tonen. Als geen kwaliteit
informatie beschikbaar is, mag het resulterende maq-uitlijningsbestand niet worden gebruikt
consensus genotypen noemen.

export2maq maar Q export2maq [-1 lees1len] [-2 lees2len] [-a maxdist] [-n] uit.map in lijst
in.export

Converteer Illumina's exportformaat naar Maq's .kaart formaat. Exportformaat is nieuw
uitlijningsformaat sinds SolexaPipeline-0.3.0 die ook mapping berekent
kwaliteiten zoals maq. Het resulterende bestand kan worden gebruikt om consensus-genotypen aan te roepen
aangezien de meeste noodzakelijke informatie beschikbaar is voor maq om dit nauwkeurig te doen.

OPTIES:

-1 INT Lengte van de eerste lezing [0]

-2 INT Lengte van de tweede lezing [0]

-a INT Maximale buitenafstand voor een correct leespaar [250]

-n Gefilterde lezingen behouden

MAQ-PERL COMMANDO'S


demonstratie maq.mv demonstratie [-h] [-s] [-N nParen] [-d uitDir] in.fasta in.simudat

Demonstreer het gebruik van maar Q en de bijbehorende scripts. Dit commando zal
simuleer leesbewerkingen uit een FASTA-bestand in.fasta. De reekslengte en -kwaliteiten:
worden bepaald door in.simudat die wordt gegenereerd uit maar Q simutrain of kan zijn
gedownload van de Maq-website. De gesimuleerde uitlezingen worden dan in kaart gebracht met:
maq.mv gemakkelijk rennen. De nauwkeurigheid van de uitlijning wordt geëvalueerd door: maar Q simulatie
consensus nauwkeurigheid door maar Q simucns, en de SNP-nauwkeurigheid door maq_eval.pl.

Standaard worden gepaarde eindaflezingen gesimuleerd en wordt een diploïde reeks
gegenereerd uit de invoer door mutaties toe te voegen aan elk haploïde type. de invoeging
grootte en mutatiesnelheid worden bepaald door: maar Q simuleren.

OPTIES:

-h simuleer een haploïde reeks in plaats van een diploïde reeks

-s gebruik de single-end-modus om uitlezingen uit te lijnen in plaats van de paired-end-modus

-N INT aantal te simuleren uitlezingen [1000000]

-d DIR uitvoermap [maqdemo]

NOTITIE:

* De uitvoerbestanden van maq_eval.pl zijn niet gedocumenteerd, maar u kunt
een goede gok op sommige van deze bestanden.

* Deze opdracht demonstreert alleen het gebruik van de maq suite. De nauwkeurigheid op echt
data is bijna altijd lager dan wat je ziet bij pure simulatie.

gemakkelijk rennen maq.mv gemakkelijk rennen [-1 lees1Len] [-d uit.dir] [-n nLeest] [-A 3adapter] [-e minDep]
[-q minCnsQ] [-p] [-2 lees2Len] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

Analyseert pijplijn voor kleine genomen. De opdracht Easyrun voert de meeste analyses uit
geïmplementeerd in maar Q. Standaard, gemakkelijk rennen neemt alle invoerleessequenties aan
bestanden zijn single-end en onafhankelijk; wanneer -p is opgegeven, twee leesvolgorde
bestanden zijn vereist, één voor elk uiteinde.

Er worden verschillende bestanden gegenereerd in uit.dir, waaronder de volgende bestanden:
de toetsuitgang:

cns.final.snp laatste SNP-oproepen met uitgefilterde oproepen van lage kwaliteit

cns.fq consensussequenties en kwaliteiten in het FASTQ-formaat

OPTIES:

-d DIR uitvoermap [easyrun]

-n INT aantal uitlezingen/paren in één batch uitlijning [2000000]

-S pas split-read-analyse van korte indels toe (misschien erg traag)

-N INT aantal haplotypes/stammen in de pool (>=2) [2]

-A FILE bestand voor 3'-adapter. Het bestand moet een enkele regel met een reeks bevatten
[nul]

-1 INT lengte van de eerste lezing, 0 voor auto [0]

-e INT minimale leesdiepte vereist om een ​​SNP aan te roepen (voor SNPfilter) [3]

-q INT minimale consensuskwaliteit voor SNP's in cns.final.snp [30]

-p overschakelen naar de modus voor gekoppelde einduitlijning

-2 INT lengte van de tweede gelezen wanneer -p wordt toegepast [0]

-a INT maximale inzetgrootte wanneer: -p wordt toegepast [250]

OPMERKINGEN:

* Voor SNP-aanroepen op gepoolde monsters, moeten gebruikers de juiste `-N' net zoals
`-E 0'.

* Het invoerbestand kan het binaire formaat van maq zijn. maq.mv zal automatisch detecteren
het bestandsformaat.

SNP-filter maq.mv SNP-filter [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s minScore] [-m
maxOver] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
uit.gefilterd.snp

Sluit SNP's uit die worden gedekt door weinig leesbewerkingen (gespecificeerd door -d), door te veel
leest (gespecificeerd door -D), dichtbij (gespecificeerd door -w) naar een potentiële indel, dalend
in een mogelijke repetitieve regio (gekenmerkt door -Q), of van lage kwaliteit
naburige bases (gespecificeerd door -n). Als maxWinSNP of meer SNP's verschijnen in elke
densWinSize venster, worden ze ook samen uitgefilterd.

OPTIES:

-d INT Minimale leesdiepte vereist om een ​​SNP aan te roepen [3]

-D INT Maximale leesdiepte vereist om een ​​SNP aan te roepen (<255, anders genegeerd)
[256]

-Q INT Vereiste maximale toewijzingskwaliteit van uitlezingen voor de SNP [40]

-q INT Minimale consensuskwaliteit [20]

-n INT Minimale aangrenzende consensuskwaliteit [20]

-w INT Grootte van het venster rond de potentiële indels. SNP's die dichtbij zijn
naar indels worden onderdrukt [3]

-F FILE De indelpe uitvoer [null]

-f FILE De indelsoa uitvoer [null]

-s INT Minimumscore voor een te overwegen soa-indel [3]

-m INT Maximaal aantal uitlezingen dat kan worden toegewezen over een soa-indel [1]

-a Alternatief filter voor uitlijning aan één uiteinde

indelpe maq.mv indelpe in.indelpe > uit.indelpe

Corrigeer het aantal reads dat is toegewezen zonder indels voor homopolymere traktaten. Dit
commando wijzig de 4e, 10e en de laatste drie kolommen van in.indelpe en
voer het resultaat uit in uit.indelpe. Na de correctie het volgende: awk
commando geeft vermeende homozygote indels:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

en het volgende geeft heterozygoten:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Houdt u er rekening mee dat deze indelpe command implementeert gewoon verschillende heuristische regels.
Het corrigeert niet voor onzuivere homopolymeerruns of di-nucleotide/triplet
herhaalt. Bijgevolg geven de twee awk-commando's slechts bij benadering hom/het
indels.

Voorbeelden


· Easyrun-script:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Belangrijkste commando's achter easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq deel1.fastq deel1.bfq;
maq fastq2bfq deel2.fastq deel2.bfq;
maq kaart part1.map ref.bfa part1.bfq;
maq kaart part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq assembleren cns.cns ref.bfa aln.map;

Gebruik maq online met onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

  • 1
    Phaser
    Phaser
    Phaser is een snelle, gratis en leuke open
    source HTML5-gameframework dat biedt
    WebGL- en Canvas-weergave overdwars
    desktop- en mobiele webbrowsers. Spellen
    kan samen zijn...
    Phaser downloaden
  • 2
    VASSAL-motor
    VASSAL-motor
    VASSAL is een game-engine om te creëren
    elektronische versies van traditioneel bord
    en kaartspellen. Het biedt ondersteuning voor
    weergave en interactie van speelstukken,
    en...
    VASSAL-engine downloaden
  • 3
    OpenPDF - Vork van iText
    OpenPDF - Vork van iText
    OpenPDF is een Java-bibliotheek voor het maken van
    en het bewerken van PDF-bestanden met een LGPL en
    MPL open source-licentie. OpenPDF is de
    LGPL/MPL open source opvolger van iText,
    een...
    Download OpenPDF - Vork van iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - Systeem voor geautomatiseerd
    Geowetenschappelijke analyses - is een geografische
    Informatie Systeem (GIS) software met
    enorme mogelijkheden voor geodata
    verwerking en analyse...
    SAGA GIS downloaden
  • 5
    Toolbox voor Java/JTOpen
    Toolbox voor Java/JTOpen
    De IBM Toolbox voor Java / JTOpen is een
    bibliotheek van Java-klassen die de
    client/server- en internetprogrammering
    modellen naar een systeem met OS/400,
    i5/OS, o...
    Toolbox voor Java/JTOpen downloaden
  • 6
    D3.js
    D3.js
    D3.js (of D3 voor gegevensgestuurde documenten)
    is een JavaScript-bibliotheek waarmee u
    om dynamische, interactieve gegevens te produceren
    visualisaties in webbrowsers. Met D3
    u...
    D3.js downloaden
  • Meer "

Linux-commando's

  • 1
    abidiff
    abidiff
    abidiff - vergelijk ABI's van ELF-bestanden
    abidiff vergelijkt de Application Binary
    Interfaces (ABI) van twee gedeelde bibliotheken
    in ELF-formaat. Het straalt een betekenis uit
    verslag...
    Voer abidiff uit
  • 2
    blijf
    blijf
    abidw - serialiseer de ABI van een ELF
    bestand abidw leest een gedeelde bibliotheek in ELF
    formaat en verzendt een XML-representatie
    van zijn ABI naar standaarduitvoer. De
    uitgestoten ...
    Voer abidw uit
  • 3
    copac2xml
    copac2xml
    bibutils - conversie van bibliografie
    nutsvoorzieningen ...
    Voer copac2xml uit
  • 4
    Copt
    Copt
    copt - kijkgaatje-optimizer SYSNOPIS:
    copt-bestand.. BESCHRIJVING: copt is een
    kijkgaatje-optimizer voor algemeen gebruik. Het
    leest code van zijn standaardinvoer en
    schrijft een...
    Kopt uitvoeren
  • 5
    collect_stx_titles
    collect_stx_titles
    collect_stx_titles - titel verzamelen
    verklaringen van Stx-documenten ...
    Voer collect_stx_titles uit
  • 6
    gatling-bank
    gatling-bank
    bank - http-benchmark ...
    Run gatling-bank
  • Meer "

Ad