EngelsFransSpaans

Ad


OnWorks-favicon

gmap - Online in de cloud

Voer gmap uit in OnWorks gratis hostingprovider via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht gmap die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


gmap - Programma voor genomische mapping en afstemming

KORTE INHOUD


gmap [OPTIES<FASTA bestanden...>, or kat | gmap [OPTIES...]

OPTIES


Invoer opties (moeten omvatten -d or -g)
-D, -- richt=directory
Genoom directory. Standaard (zoals gespecificeerd door --met-gmapdb naar het configuratieprogramma)
is /var/cache/gmap

-d, --db=STRING
Genoom database. Als argument is '?' (met de aanhalingstekens), dit commando geeft een lijst weer
beschikbare databanken.

-k, --kmer=INT
kmer-grootte die in de genoomdatabase moet worden gebruikt (toegestane waarden: 16 of minder). Als niet
gespecificeerd, zal het programma de hoogst beschikbare kmer-grootte in het genoom vinden
databank

--bemonstering=INT
Monstername voor gebruik in genoomdatabase. Indien niet gespecificeerd, zal het programma de
kleinste beschikbare bemonsteringswaarde in de genoomdatabase binnen geselecteerde k-mer-grootte

-G, --genoomvol
Gebruik het volledige genoom (alle ASCII-tekens toegestaan; expliciet gebouwd tijdens de installatie), niet
gecomprimeerde versie

-g, --gseg=bestandsnaam
Door de gebruiker geleverd genomisch segment

-1, --zelf uitlijnen
Lijn één reeks uit met zichzelf in FASTA-formaat via stdin (handig om
eiwittranslatie van een nucleotidesequentie)

-2, --paaruitlijnen
Lijn twee sequenties uit in FASTA-formaat via stdin, de eerste is genomisch en de tweede
een daarvan is cDNA

--cmdlijn=STRING,SNAAR
Lijn deze twee sequenties op de opdrachtregel uit, de eerste is genomisch en
tweede is cDNA

-q, --deel=INT/INT
Verwerk alleen de i-de van elke n reeksen, bijv. 0/100 of 99/100 (handig voor
het verdelen van banen naar een computerboerderij).

--invoer-buffergrootte=INT
Grootte van invoerbuffer (programma leest zoveel reeksen tegelijk voor efficiëntie)
(standaard 1000)

Berekeningsopties

-B, --partij=INT
Batch-modus (standaard = 2)

Modus Offsets Posities Genoom
0 zie opmerking mmap mmap
1 zie opmerking mmap & preload mmap
(standaard) 2 zie opmerking mmap & preload mmap & preload
3 zie opmerking toewijzen mmap & preload
4 zie opmerking toewijzen toewijzen
5 uitbreiden toewijzen toewijzen

Opmerking: voor een enkele reeks gebruiken alle gegevensstructuren mmap
Als mmap niet beschikbaar is en toewijzing niet is gekozen, zal fileio worden gebruikt (zeer traag)

Opmerking over --partij en offsets: Uitbreiding van offsets kan worden gecontroleerd
zelfstandig door de --uitbreiden-offsets vlag. De --partij=5 optie is gelijk aan
--partij=4 plus --uitbreiden-offsets=1

--uitbreiden-offsets=INT
Of de index voor genomische offsets moet worden uitgebreid. Waarden: 0 (nee, standaard) of 1 (ja).
Uitbreiding zorgt voor snellere uitlijning, maar vereist meer geheugen

--neusplicing
Schakelt splicing uit (handig voor het uitlijnen van genomische sequenties op een genoom)

--min-intronlengte=INT
Min. lengte voor één intern intron (standaard 9). Beneden deze grootte, een genomic gap
zal eerder als een deletie dan als een intron worden beschouwd.

-K, --intronlengte=INT
Max lengte voor één interne intron (standaard 200000)

-w, --lokale splicedist=INT
Max. lengte voor bekende splitsingsplaatsen aan het einde van de reeks (standaard 2000000)

-L, --totale lengte=INT
Maximale totale intronlengte (standaard 2400000)

-x, --chimera-marge=INT
Hoeveelheid niet-uitgelijnde reeks die het zoeken naar de resterende reeks activeert
(standaard 30). Maakt uitlijning van chimerische uitlezingen mogelijk en kan bij sommige helpen
niet-chimerische leest. Zet op nul om uit te schakelen.

--geen hersenspinsels
Schakelt het vinden van chimera's uit. Zelfde effect als --chimera-marge=0

-t, --nthreads=INT
Aantal werkthreads

-c, --chrsubset=snaar
Zoekopdracht beperken tot gegeven chromosoom

-z, --richting=STRING
cDNA-richting (sense_force, antisense_force, sense_filter, antisense_filter, of
automatisch (standaard))

-H, --trimendexonen=INT
Trim end exons met minder dan het opgegeven aantal overeenkomsten (in nt, standaard 9)

--canonieke-modus=INT
Beloning voor canonieke en semi-canonieke introns 0=lage beloning, 1=hoge beloning
(standaard), 2=lage beloning voor reeksen met hoge identiteit en anders hoge beloning

--cross-soorten
Gebruik een meer gevoelige zoekopdracht voor canonieke splitsing, wat vooral helpt voor
uitlijning tussen soorten en andere moeilijke gevallen

--sta-close-indels toe=INT
Sta een invoeging en verwijdering dicht bij elkaar toe (0=nee, 1=ja (standaard), 2=alleen
voor hoogwaardige uitlijningen)

--microexon-spliceprob=FLOAT
Sta micro-exons alleen toe als een van de kansen op de splitsingsplaats groter is dan dit
waarde (standaard 0.95)

--cmetdir=STRING
Directory voor methylcytosine-indexbestanden (gemaakt met cmmetindex) (standaard is
locatie van genoomindexbestanden gespecificeerd met -D, -V en -d)

--atoidir=STRING
Directory voor A-naar-I RNA-bewerkingsindexbestanden (gemaakt met atoiindex) (standaard is
locatie van genoomindexbestanden gespecificeerd met -D, -V en -d)

--modus=STRING
Uitlijningsmodus: standaard (standaard), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi-non-stranded, ttoc-stranded, of ttoc-non-stranded. Niet-standaard modi vereist:
u eerder de programma's cmmetindex of atoiindex hebt uitgevoerd (die ook betrekking hebben op
de ttoc-modi) op ​​het genoom

-p, --pruneniveau
Snoeiniveau: 0=geen snoei (standaard), 1=slechte seqs, 2=repetitieve seqs, 3=slechte en
herhalende

Uitgangstypes

-S, --samenvatting
Alleen samenvatting van uitlijningen weergeven

-A, --uitlijnen
Uitlijningen weergeven

-3, --continu
Uitlijning weergeven in drie ononderbroken lijnen

-4, --continu-door-exon
Toon uitlijning in drie regels per exon

-Z, --samenpersen
Afdrukuitvoer in gecomprimeerd formaat

-E, --exonen=STRING
Exons afdrukken ("cdna" of "genomisch")

-P, --proteïne_dna
Print eiwitsequentie (cDNA)

-Q, --proteïne_gen
Print eiwitsequentie (genomisch)

-f, --formaat=INT
Ander formaat voor uitvoer (let ook op de -A en -S opties en andere opties vermeld
onder Uitgangstypes):
psl (of 1) = PSL (BLAT) formaat,
gff3_gene (of 2) = GFF3-genformaat,
gff3_match_cdna (of 3) = GFF3 cDNA_match-formaat,
gff3_match_est (of 4) = GFF3 EST_match formaat,
splicesites (of 6) = output splicesites (voor GSNAP-splitsingsbestand),
introns = introns-uitvoer (voor GSNAP-splitsingsbestand),
map_exons (of 7) = IIT FASTA exon-kaartformaat,
map_ranges (of 8) = IIT FASTA-bereikkaartformaat,
coördinaten (of 9) = coördinaten in tabelformaat,
sampe = SAM-formaat (instelling paired_read bit in vlag),
samse = SAM-formaat (zonder paired_read bit in te stellen)

Uitvoer opties

-n, --npaden=INT
Maximaal aantal paden om weer te geven (standaard 5). Indien ingesteld op 1, rapporteert GMAP niet
chimere uitlijningen, aangezien die twee paden impliceren. Als u een enkele uitlijning wilt
plus chimere uitlijningen, stel dit dan in op 0.

--suboptimale-score=INT
Rapporteer alleen paden waarvan de score binnen deze waarde van het beste pad ligt. Standaard,
als deze optie niet wordt geboden,
het programma drukt alle gevonden paden af.

-O, --besteld
Print uitvoer in dezelfde volgorde als invoer (alleen relevant als er meer dan één werknemer is)
draad)

-5, --md5
MD5-controlesom afdrukken voor elke queryreeks

-o, --hersenschim-overlap
Overlap om te tonen, indien aanwezig, bij chimera breekpunt

--alleen mislukt
Print alleen mislukte uitlijningen, die zonder resultaat

--geen fouten
Afdrukken van mislukte uitlijningen uitsluiten

-V, --snpsdir=STRING
Directory voor SNP-indexbestanden (gemaakt met snpindex) (standaard is locatie van
genoomindexbestanden gespecificeerd met -D en -d)

-v, --gebruik-snps=STRING
Gebruik database met bekende SNP's (in .iit, eerder gebouwd met
snpindex) voor tolerantie voor SNP's

--gesplitste uitvoer=STRING
Basisnaam voor uitvoer van meerdere bestanden, afzonderlijk voor nomapping,
uniq, mult, (en chimera, if --chimera-marge is geselecteerd)

--mislukte invoer=STRING
Print volledig mislukte uitlijningen als invoer FASTA of FASTQ formaat naar de gegeven
het dossier. Als de --gesplitste uitvoer vlag wordt ook gegeven, dit bestand wordt bovendien gegenereerd
naar de uitvoer in het .nomapping-bestand.

--toevoegen-uitvoer
. --gesplitste uitvoer or --mislukte invoer wordt gegeven, zal deze vlag de uitvoer toevoegen aan de
bestaande bestanden. Anders is de standaardinstelling om nieuwe bestanden te maken.

--uitvoer-buffergrootte=INT
Buffergrootte, in query's, voor uitvoerthread (standaard 1000). Wanneer het aantal
resultaten die moeten worden afgedrukt groter zijn dan deze grootte, worden de werkthreads gestopt totdat de
achterstand is weggewerkt

-F, --volledige lengte
Neem aan dat het eiwit van volledige lengte is, te beginnen met Met

-a, --cdsstart=INT
Codons vertalen van gegeven nucleotide (1-gebaseerd)

-T, --afkappen
Afkappen van uitlijning rond eiwit van volledige lengte, Met to Stop Implies -F vlag.

-Y, --verdraagzaam
Vertaalt cDNA met correcties voor frameshifts

Opties voor GFF3-uitvoer

--gff3-toevoegen-scheidingstekens=INT
Of er een ###-scheidingsteken moet worden toegevoegd na elke queryreeks Waarden: 0 (nee), 1 (ja,
standaard)

Opties voor SAM-uitgang

--no-sam-headers
Druk geen koppen af ​​die beginnen met '@'

--sam-gebruik-0M
Voeg 0M in SIGAR in tussen aangrenzende invoegingen en weglatingen Vereist door Picard,
maar kan fouten veroorzaken in andere tools

--force-xs-dir
Voor RNA-Seq-uitlijningen, staat XS:A:? wanneer de zintuigrichting onduidelijk is, en
vervangt deze waarde willekeurig door XS:A:+. Kan handig zijn voor sommige programma's, zoals:
als manchetknopen, die XS:A:? niet aankunnen. Als u deze vlag echter gebruikt, wordt de
gerapporteerde waarde van XS:A:+ is in deze gevallen niet zinvol.

--md-kleine letters-snp
In MD-tekenreeks, wanneer bekende SNP's worden gegeven door de -v vlag,
drukt verschil-nucleotiden af ​​als kleine letters wanneer ze,
verschillen van referentie maar komen overeen met een bekend alternatief allel

--actie-als-sigaar-fout
Te ondernemen actie als er een verschil is tussen de lengte van de sigaar en de lengte van de reeks
Toegestane waarden: negeren, waarschuwing (standaard), afbreken

--lees-groep-id=STRING
Waarde die in het leesgroep-ID (RG-ID) veld moet worden geplaatst

--lees-groepsnaam=STRING
Waarde die in het veld leesgroepnaam (RG-SM) moet worden geplaatst

--lees-groep-bibliotheek=STRING
Waarde die in het veld leesgroepbibliotheek (RG-LB) moet worden geplaatst

--lees-groep-platform=STRING
Waarde om in leesgroepbibliotheek (RG-PL) veld te plaatsen

Opties voor kwaliteitsscores

--kwaliteitsprotocol=STRING
Protocol voor inputkwaliteitsscores. Toegestane waarden: illumina (ASCII 64-126)
(gelijk aan -J 64 -j -31) sanger (ASCII 33-126) (gelijk aan -J 33 -j 0)

Standaard is sanger (geen kwaliteitsafdrukverschuiving)
SAM-uitvoerbestanden moeten kwaliteitsscores hebben in het Sanger-protocol

Of u kunt de printshift specificeren met deze vlag:

-j, --kwaliteit-afdruk-shift=INT
Shift FASTQ-kwaliteitsscores met deze hoeveelheid in uitvoer (standaard is 0 voor sanger
protocol; om de Illumina-invoer te wijzigen in Sanger-uitvoer, selecteer -31)

Opties voor externe kaartbestanden

-M, --mapdir=directory
Map map

-m, --kaart=iitbestand
Kaart bestand. Als argument is '?' (met de aanhalingstekens),
dit geeft de beschikbare kaartbestanden weer.

-e, --mapexonen
Breng elk exon afzonderlijk in kaart

-b, --mapbeide
Rapporteer hits van beide strengen van het genoom

-u, --flankerend=INT
Toon flankerende treffers (standaard 0)

--afdruk-commentaar
Toon commentaarregel voor elke hit

Uitlijning uitvoer opties

-N, --geen lengtes
Geen intronlengtes in uitlijning

-I, --inverteermodus=INT
Modus voor uitlijning met genomische (-) streng: 0=Keer het cDNA niet om (standaard)
1=CDNA omkeren en genomische (-) streng afdrukken 2=cDNA omkeren en genomisch afdrukken (+)
streng

-i, --inrongap=INT
Nucleotiden die aan elk uiteinde van intron worden weergegeven (standaard 3)

-l, --omslaglengte=INT
Wikkellengte voor uitlijning (standaard 50)

Uitvoeropties filteren

--min-bijgesneden-dekking=FLOAT
Druk geen uitlijningen af ​​met bijgesneden dekking minder dan deze waarde (standaard=0.0, die
betekent geen filtering) Merk op dat chimere uitlijningen ongeacht dit worden uitgevoerd
filter

--min-identiteit=FLOAT
Druk geen alignementen af ​​met identiteit minder dan deze waarde (standaard=0.0, wat betekent nee
filtering) Merk op dat chimere uitlijningen worden uitgevoerd ongeacht dit filter
Help-opties

--rekening
Controleer de aannames van de compiler

--versie
Toon versie

--help Dit helpbericht weergeven

Andere tools van de GMAP-suite bevinden zich in /usr/lib/gmap

Gebruik gmap online met onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad


Enter