EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

maq - Online în cloud

Rulați maq în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda maq care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


Maq - Cartografiere și Asamblare cu Calități

REZUMAT


Maq comandă [Opțiuni] argumente

maq.pl comandă [Opțiuni] argumente

DESCRIERE


Maq este un software care construiește ansambluri de cartografiere din citiri scurte generate de următorul
mașini de secvențiere de generație. Este conceput în special pentru Illumina-Solexa 1G Genetic
Analizor și are o funcționalitate preliminară pentru a gestiona datele AB SOLiD.

Cu Maq puteți:

· Alinierea rapidă a citirilor Illumina/SOLiD la genomul de referință. Cu opțiunile implicite, una
milioane de perechi de citiri pot fi mapate la genomul uman în aproximativ 10 ore CPU cu mai puțin
decât memorie 1G.

· Măsurați cu precizie probabilitatea de eroare a alinierii fiecărei citiri individuale.

· Numiți genotipurile de consens, inclusiv polimorfismele homozigote și heterozigote, cu
o calitate probabilistică Phred atribuită fiecărei baze.

· Găsiți indeluri scurte cu citiri de sfârșit asociate.

· Găsiți cu precizie ștergeri și translocații genomice la scară largă cu citiri de sfârșit pereche.

· Descoperiți CNV potențiale verificând adâncimea de citire.

· Evaluați acuratețea calităților de bază brute de la secvențiere și ajutați la verificarea
erori sistematice.

Cu toate acestea, Maq poate NU:

· Faceți de nou asamblare. (Maq poate apela la consens doar prin maparea citirilor la un cunoscut
referinţă.)

· Pe hartă scurte se citesc împotriva lor. (Maq poate găsi doar o suprapunere completă între citiri.)

· Aliniați citirile capilare sau 454 citirile la referință. (Maq nu poate alinia citirile mai mult decât
63 pb.)

MAQ COMANDE


Cheie Comenzi

fasta2bfa Maq fasta2bfa in.ref.fasta afară.ref.bfa

Convertiți secvențele în format FASTA în formatul BFA (FASTA binar) al lui Maq.

fastq2bfq Maq fastq2bfq [-n nreads] in.read.fastq afară.citeşte.bfqafară.prefix

Convertiți citirile în format FASTQ în formatul BFQ (binar FASTQ) al lui Maq.

OPȚIUNI:

-n INT numărul de citiri pe fișier [nespecificat]

Hartă Maq Hartă [-n nmis] [-a maxins] [-c] [-1 len1] [-2 len2] [-d adapt3] [-m mutra]
[-u necartografiate] [-e maxerr] [-M c⎪g] [-N] [-H toate hiturile] [-C maxhits] afară.aln.hartă
în.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

Harta citește secvențele de referință.

OPȚIUNI:

-n INT Numărul maxim de nepotriviri care pot fi întotdeauna găsite [2]

-a INT Distanța exterioară maximă pentru o pereche de citire corectă [250]

-A INT Distanța exterioară maximă de două citire RF plătită (0 pentru dezactivare) [0]

-c Citirile hărții în spațiul de culoare (numai pentru SOLiD)

-1 INT Lungimea citirii pentru prima citire, 0 pentru auto [0]

-2 INT Lungimea citirii pentru a doua citire, 0 pentru auto [0]

-m PLUTI Rata de mutație între secvențele de referință și citirile [0.001]

-d FILE Specificați un fișier care conține o singură linie din secvența adaptorului 3'
[nul]

-u FILE Eliminați citirile nemapate și citirile care conțin mai mult decât nmis nepotriviri la
un fișier separat [null]

-e INT Prag pentru suma calităților de bază nepotrivite [70]

-H FILE Transferați mai multe/toate accesările cu nepotrivire 01 la FILE [nul]

-C INT Numărul maxim de accesări la ieșire. Nelimitat dacă este mai mare de 512. [250]

-M c⎪g modul de aliniere de metilare. Toate C (sau G) de pe firul înainte vor fi
schimbat în T (sau A). Această opțiune este doar pentru testare.

-N stocați poziția nepotrivită în fișierul de ieșire afară.aln.hartă. Când aceasta
opțiunea este în uz, lungimea maximă de citire permisă este de 55 bp.

NOTĂ:

* Citirile perechi ale finalului ar trebui să fie pregătite în două fișiere, câte unul pentru fiecare capăt, cu
citirile sunt sortate în aceeași ordine. Aceasta înseamnă a k-a citit în prima
fișierul este asociat cu a k-a citită în al doilea fișier. Lectura corespunzătoare
Numele trebuie să fie identice până la coada „/1” sau „/2”. De exemplu, un astfel de
sunt permise perechi de nume citite: „EAS1_1_5_100_200/1” și
„EAS1_1_5_100_200/2”. Tailing `/[12]' este de obicei generat de
GAPipeline pentru a distinge cele două capete dintr-o pereche.

* Ieșirea este un fișier binar comprimat. Este afectat de endian.

* Cel mai bun mod de a rula această comandă este de a oferi aproximativ 1 până la 3 milioane de citiri ca
intrare. Mai multe citiri consumă mai multă memorie.

* Opțiune -n controlează sensibilitatea alinierii. În mod implicit, o lovitură cu
se pot găsi întotdeauna până la 2 nepotriviri. Superior -n găsește mai multe hit-uri și, de asemenea
îmbunătățește acuratețea calităților de cartografiere. Cu toate acestea, acest lucru se face cu costul
de viteză.

* Aliniamentele cu multe nepotriviri de înaltă calitate ar trebui eliminate ca false
aliniamente sau posibile contaminari. Acest comportament este controlat de opțiune
-e. -e pragul este calculat doar aproximativ deoarece calitățile de bază
sunt împărțite la 10 la o anumită etapă a alinierii. The -Q opțiune în
asambla comanda setează cu precizie pragul.

* Se spune că o pereche de citiri este împerecheată corect dacă și numai dacă
orientarea este FR iar distanța exterioară a perechii nu este mai mare decât
maxins. Nu există limită pentru dimensiunea minimă a inserției. Această setare este
determinată de algoritmul de aliniere la capăt pereche utilizat în Maq. Necesită a
dimensiunea minimă a inserției va duce la unele aliniamente greșite cu extrem
calități cartografice supraestimate.

* În prezent, perechile de citire din biblioteca de inserții lungi Illumina/Solexa au citire RF
orientare. Dimensiunea maximă a inserției este setată de opțiune -A. Cu toate acestea, de mult-
Biblioteca de inserare este, de asemenea, amestecată cu o mică fracțiune de citire cu inserare scurtă
perechi. -a ar trebui, de asemenea, setat corect.

* Uneori, capătul 5’ sau chiar întreaga secvență adaptor 3’ poate fi secvențial.
Furnizarea -d face Maq pentru a elimina contaminarea adaptorului.

* Având în vedere 2 milioane de citiri ca intrare, Maq de obicei are o memorie de 800 MB.

mapmerge Maq mapmerge afară.aln.hartă în.aln1.hartă în.aln2.hartă [...]

Îmbinați un lot de aliniamente citite împreună.

NOTĂ:

* În teorie, această comandă poate îmbina un număr nelimitat de aliniamente. Cu toate acestea, ca
mapmerge va citi toate intrările în același timp, poate lovi
limita numărului maxim de fișiere de deschidere stabilite de sistemul de operare. În prezent, aceasta
trebuie rezolvată manual de către utilizatorii finali.

* Comanda mapmerge poate fi folosit pentru a îmbina fișierele de aliniere cu citiri diferite
lungimi. Toate analizele ulterioare nu mai presupun lungime fixă.

rmdup Maq rmdup out.rmdup.map in.ori.harta

Eliminați perechile cu coordonate exterioare identice. În principiu, perechi cu
coordonatele exterioare identice ar trebui să apară rar. Cu toate acestea, din cauza
amplificare în pregătirea probei, aceasta apare mult mai frecvent decât prin
şansă. Analizele practice arată că eliminarea duplicatelor ajută la îmbunătățirea
acuratețea generală a apelării SNP.

asambla Maq asambla [-sp] [-m maxmis] [-Q maxerr] [-r hetrat] [-t coef] [-q minQ] [-N
nHap] out.cns în.ref.bfa în.aln.hartă 2> out.cns.log

Apelați secvențele de consens din cartografierea citită.

OPȚIUNI:

-t PLUTI Coeficient de dependență de eroare [0.93]

-r PLUTI Fracția de heterozigoți dintre toate situsurile [0.001]

-s Luați calitatea cartografierii cu un singur capăt ca calitate finală a cartografierii;
în caz contrar, va fi utilizată calitatea de cartografiere finală pereche

-p Eliminați citirile de sfârșit pereche care nu sunt mapate în perechi corecte

-m INT Numărul maxim de nepotriviri permise pentru utilizarea unei citiri
apel de consens [7]

-Q INT Suma maximă permisă a valorilor de calitate ale bazelor nepotrivite [60]

-q INT Calitatea minimă de cartografiere a permis ca o citire să fie utilizată în consens
apelând [0]

-N INT Numărul de haplotipuri din grup (>=2) [2]

NOTĂ:

* Opțiune -Q stabilește o limită a sumei maxime de calități de bază nepotrivite.
Citirile care conțin multe nepotriviri de înaltă calitate ar trebui eliminate.

* Opțiune -N stabilește numărul de haplotipuri dintr-un grup. Este conceput pentru
resecvențierea probelor prin reunirea mai multor tulpini/indivizi împreună. Pentru
resecvențierea genomului diploid, această opțiune este egală cu 2.

glfgen Maq glfgen [-sp] [-m maxmis] [-Q maxerr] [-r hetrat] [-t coef] [-q minQ] [-N
nHap] out.cns în.ref.bfa în.aln.hartă 2> out.cns.log

Calculați log-probabilitatea pentru toate genotipurile și stocați rezultatele în format GLF
(Format de probabilitate de genotipizare). Vă rugăm să verificați site-ul web MAQ pentru detalii
descrieri ale formatului de fișier și utilitățile aferente.

indelpe Maq indelpe în.ref.bfa în.aln.hartă > afară.indelpe

Apelați indel-uri consecvente din citirile finale asociate. Ieșirea este delimitată cu TAB
fiecare linie constând din cromozom, poziție de început, tipul indelului, număr
de citiri peste indel, dimensiunea indel și nucleotidele inserate/șterse
(separate prin două puncte), numărul de indeluri de pe firul invers, numărul de indeluri
pe firul înainte, secvența 5’ înainte de indel, secvența 3’ urmând
indel, numărul de citiri aliniate fără indel și trei coloane suplimentare
pentru filtre.

La a 3-a coloană, tipul indelului, o stea indică faptul că indel este confirmat
de citirile din ambele componente, un plus înseamnă că indel este lovit de cel puțin două citiri
dar din aceeași componentă, un minus arată că indelul se găsește doar la o citire,
iar un punct înseamnă că indel este prea aproape de un alt indel și este filtrat.

Utilizatorilor li se recomandă să ruleze prin „maq.pl indelpe” pentru a corecta numărul de
citește mapat fără indels. Pentru mai multe detalii, consultați `maq.pl indelpe'
secţiune.

indelsoa Maq indelsoa în.ref.bfa în.aln.hartă > afară.indelsoa

Apelați potențialele indeluri homozigote și punctele de rupere prin detectarea anormalului
model de aliniere în jurul indel-urilor și punctelor de întrerupere. Ieșirea este, de asemenea, TAB
delimitat cu fiecare linie formată din cromozom, coordonată aproximativă,
lungimea regiunii anormale, numărul de citiri mapate pe poziție,
numărul de citiri din partea stângă a poziției și numărul de citiri în continuare
partea dreaptă. Ultima coloană poate fi ignorată.

Ieșirea conține multe false pozitive. Un filtru recomandat ar putea fi:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

Rețineți că această comandă nu își propune să fie un detector indel precis, dar
ajută în principal la evitarea unor fals pozitive în apelul de substituție. În
În plus, funcționează bine doar având în vedere adâncimea adâncă (~40X de exemplu); altfel cel
rata fals negative ar fi foarte mare.

Format Conversia

sol2sanger Maq sol2sanger în.sol.rapidq out.sanger.fastq

Convertiți Solexa FASTQ în format standard/Sanger FASTQ.

bfq2fastq Maq bfq2fastq în.citeşte.bfq afară.citeşte.rapidq

Convertiți formatul BFQ al lui Maq în formatul standard FASTQ.

mapas2maq Maq mapas2maq în.mapass2.map afară.maq.hartă

Convertiți formatul de hartă învechit al lui mapapass2 în formatul de hartă al lui Maq. Vechiul format o face
nu conțin nume citite.

Informații Extragerea

vizualizarea hartii Maq vizualizarea hartii [-bN] în.aln.hartă > out.aln.txt

Afișați alinierea citită în text simplu. Pentru citirile aliniate înainte de Smith-
Alinierea Waterman, fiecare linie constă din citire nume, cromozom, poziție,
șuviță, dimensiunea inserării din coorniile exterioare ale unei perechi, steag pereche, cartografiere
calitate, calitate de cartografiere single-end, calitate de cartografiere alternativă, număr de
nepotriviri ale celor mai bune lovituri, suma de calități ale bazelor nepotrivite ale celor mai buni
lovitură, numărul de accesări cu nepotrivire 0 ale primelor 24 pb, numărul de accesări cu nepotrivire 1 din
primii 24 bp pe referință, lungimea citirii, secvența de citire și a acesteia
calitate. Calitatea de cartografiere alternativă este întotdeauna egală cu calitatea de cartografiere dacă
citirile nu sunt asociate. Dacă citirile sunt împerecheate, aceasta este egală cu maparea mai mică
calitatea celor două capete. Această calitate alternativă de cartografiere este de fapt
calitatea cartografierii unei perechi anormale.

A cincea coloană, steag pereche, este un steag pe biți. Cei 4 biți inferiori dau
orientare: 1 înseamnă FF, 2 pentru FR, 4 pentru RF și 8 pentru RR, unde FR înseamnă
că citirea cu coordonatele mai mici este pe șuvița înainte, iar partenerul său este
pe firul invers. Doar FR este permis pentru o pereche corectă. Biții mai înalți
din acest steag oferă informații suplimentare. Dacă perechea se întâlnește cu capătul pereche
cerință, se va stabili 16. Dacă cele două citiri sunt mapate la diferite
cromozomii, 32 vor fi setati. Dacă una dintre cele două citiri nu poate fi mapată deloc,
64 va fi stabilit. Steagul pentru o pereche corectă este întotdeauna egal cu 18.

Pentru citirile aliniate după alinierea Smith-Waterman, steagul este
întotdeauna 130. O linie este formată din citire nume, cromozom, poziție, fir, insert
dimensiune, steag (întotdeauna 130), poziția indel pe citire (0 dacă nu există indel),
lungimea indelilor (pozitiv pentru inserții și negativ pentru ștergeri),
calitatea cartografierii partenerului său, numărul de nepotriviri ale celei mai bune lovituri, suma de
calitățile bazelor nepotrivite ale celei mai bune lovituri, două zerouri, lungimea citirii,
secvența de citire și calitatea acesteia. Partenerul unei citiri cu 130 de steaguri primește întotdeauna un
steag 18.

Indicatorul 192 indică faptul că citirea nu este mapată, dar perechea sa este mapată. Pentru așa
o pereche de citire, una de citit are steag 64 și cealaltă are 192.

OPȚIUNI:

-b nu afișați secvența de citire și calitatea

-N afișați pozițiile în care apar nepotriviri. Acest steag funcționează numai
cu un fișier .map generat de `maq map -N'.

verificare hartă Maq verificare hartă [-s] [-m maxmis] [-q minQ] în.ref.bfa în.aln.hartă > out.mapcheck

Citiți verificarea calității. Mapcheck raportează mai întâi compoziția și adâncimea
referinta. După aceea există o formă. Prima coloană indică
poziție pe o citire. Urmează patru coloane care arată nucleotida
vor fi date compoziția, ratele de înlocuire între referință și citiri.
Aceste rate și numerele din coloanele următoare sunt scalate la 999 și
rotunjit la cel mai apropiat număr întreg. Următorul grup de coloane arată distribuția
calități de bază de-a lungul citirilor la un interval de calitate de 10. O scădere a calității
de obicei, pot fi observate, ceea ce înseamnă că bazele la sfârșitul citirii sunt mai puține
exacte. Ultimul grup de coloane prezintă fracția de substituții pentru
citiți bazele la un interval de calitate. Aceasta măsoară acuratețea calității de bază
estimare. În mod ideal, ne așteptăm să vedem 1 din 3? coloana, 10 în 2? coloană
și 100 în 1? coloană.

OPȚIUNI:

-s Luați calitatea cartografierii cu un singur capăt ca calitate finală a cartografierii

-m INT Numărul maxim de erori permise pentru contorizarea unei citiri [4]

-q INT Calitatea minimă de cartografiere permisă pentru ca o citire să fie numărată [30]

acumulare Maq acumulare [-spvP] [-m maxmis] [-Q maxerr] [-q minQ] [-l sitefile] în.ref.bfa
în.aln.hartă > afară.îngrămădirea

Afișați alinierea într-un format de text „aglomerat”. Fiecare linie este formată din
cromozomul, poziția, baza de referință, adâncimea și bazele pe citirile care acoperă
această poziție. Dacă -v este adăugat pe linia de comandă, calități de bază și mapare
calitățile vor fi prezentate în ordinea coloanelor a șasea și a șaptea.

A cincea coloană începe întotdeauna cu „@”. În această coloană, citiți baze identice
la referință sunt afișate cu virgulă `,' sau punct `.', iar bazele citite sunt diferite
din referința din litere. O virgulă sau o literă mare indică faptul că baza
provine dintr-o citire aliniată pe firul înainte, în timp ce un punct sau o literă mică pe
firul invers.

Această comandă este pentru utilizatorii care doresc să-și dezvolte propriii apelanți SNP.

OPȚIUNI:

-s Luați calitatea cartografierii cu un singur capăt ca calitate finală a cartografierii

-p Eliminați citirile de sfârșit pereche care nu sunt mapate ca perechi corecte

-v Produceți informații detaliate, inclusiv calitățile de bază și maparea
calităţi

-m INT Numărul maxim de nepotriviri permise pentru utilizarea unei citiri [7]

-Q INT Numărul maxim permis de valori de calitate ale nepotrivirilor [60]

-q INT Calitatea minimă de cartografiere permisă pentru utilizarea unei citiri [0]

-l FILE Fișier care conține site-urile pe care va fi tipărit pileup-ul. In acest
fisier prima coloana da numele referintei si a doua
coordonatele. Coloanele suplimentare vor fi ignorate. [nul]

-P de asemenea, afișați poziția de bază pe citire

cns2fq Maq cns2fq [-Q minMapQ] [-n minNeiQ] [-d minAdâncime] [-D adancime maxima] in.cns >
out.cns.fastq

Extrageți secvențele de consens în format FASTQ. În liniile de succesiune, baze
în litere mici sunt în esență repetări sau nu au o acoperire suficientă; bazele
în majuscule indicați regiunile în care SNP-urile pot fi apelate în mod fiabil. În
linii de calitate, ASCII cu un caracter minus 33 oferă calitatea PHRED.

OPȚIUNI:

-Q INT Calitate minimă de cartografiere [40]

-d INT Adâncime minimă de citire [3]

-n INT Calitate minimă învecinată [20]

-D INT Dpeth maximă de citire. >=255 pentru nelimitat. [255]

cns2snp Maq cns2snp in.cns > afară.snp

Extrageți site-urile SNP. Fiecare linie constă din cromozom, poziție, bază de referință,
bază de consens, Phred-cum ar fi calitatea consensului, citiți adâncimea, numărul mediu de
hit-uri de citiri care acoperă această poziție, cea mai înaltă calitate de cartografiere a citirilor
acoperind pozitia, calitatea minima de consens in flancarea 3bp
regiuni de pe fiecare parte a site-ului (6bp în total), al doilea cel mai bun apel, jurnal
raportul de probabilitate al celui de-al doilea cel mai bun și al treilea cel mai bun apel și al treilea cel mai bun
apel.

A 5-a coloană este criteriul cheie atunci când judeci fiabilitatea unui SNP.
Cu toate acestea, deoarece această calitate este calculată doar presupunând independența site-ului, dvs
ar trebui să ia în considerare și alte coloane pentru a obține apeluri SNP mai precise. Scenariul
comanda `maq.pl SNPfilter' este conceput pentru aceasta (vezi mai jos).

Coloana a 7-a implică dacă site-ul se încadrează într-o regiune repetitivă. Daca nu
citit care acoperă site-ul poate fi mapat cu o calitate ridicată a cartografierii, flancare
regiunea este posibil repetitivă sau în lipsa de lecturi bune. Un SNP la un astfel de site
de obicei nu este de încredere.

Coloana a 8-a oferă aproximativ numărul de copii al regiunii de flancare în
genomului de referință. În cele mai multe cazuri, acest număr se apropie de 1.00, ceea ce înseamnă
regiunea este aproximativ unică. Uneori este posibil să vedeți o adâncime de citire diferită de zero, dar 0.00 la
coloana a 7-a. Aceasta indică faptul că toate citirile care acoperă poziția au la
cel puțin două nepotriviri. Maq numără doar numărul de accesări nepotrivite 0 și 1 până la
referinta. Acest lucru se datorează unei probleme tehnice complexe.

Coloana a 9-a dă calitatea vecină. Filtrarea pe această coloană este, de asemenea
necesare pentru a obține SNP-uri fiabile. Această idee este inspirată de NQS, deși NQS este
conceput inițial pentru o singură lectură în loc de un consens.

cns2view Maq cns2view in.cns > afară.vedere

Afișați informații detaliate pe toate site-urile. Formatul de ieșire este identic cu
cns2snp raport.

cns2ref Maq cns2ref in.cns > out.ref.fasta

Extrageți secvența de referință.

cns2win Maq cns2win [-w winsize] [-c b.c] [-b începe] [-e capăt] [-q minQ] in.cns >
out.win

Extrageți informații media într-o fereastră de lucru. Ieșirea este delimitată prin TAB,
care constă din numele de referință, coordonatele împărțite la 1,000,000, rata SNP,
rata het, adâncimea de citire brută, adâncimea de citire în regiuni aproximativ unice, the
numărul mediu de accesări ale citirilor în fereastră și procentul GC.

OPȚIUNI:

-w INT Dimensiunea unei ferestre [1000]

-c STR Secvență de referință destinată; în caz contrar se vor folosi toate referinţele
[nul]

-b INT Poziția de pornire, 0 pentru nicio constrângere [0]

-e INT Poziția finală, 0 pentru nicio constrângere [0]

-q INT Calitatea de consens minim a site-urilor care urmează să fie utilizate [0]

Simulare Legate de

fakemut Maq fakemut [-r mutra] [-R indelfrac] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Introduceți aleatoriu substituții și indeluri la referință. Inlocuiri si
pot fi adăugate indeluri de perechi de bază.

OPȚIUNI:

-r PLUTI Rata de mutație [0.001]

-R PLUTI Fracția de mutații să fie indels [0.1]

simutrain Maq simutrain out.simupars.dat in.read.fastq

Estimare/antrenează parametrii pentru simularea citirii.

simula Maq simula [-d in marime] [-s stdev] [-N nCituri] [-1 citeșteLen1] [-2 citeșteLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

Simulați citirile finale asociate. Fişier in.simupars.dat determină lungimile de citit şi
distributie de calitate. Este generat din simutrain, sau poate fi descărcat de pe
Site-ul web Maq. În fișierele de citire de ieșire, un nume de citit constă din referință
numele secvenței și coordonatele exterioare ale perechii de citiri simulate. De
Mod implicit, simula presupune că citirile provin dintr-o secvență diploidă care este generată
prin adăugarea a două seturi diferite de mutații, inclusiv o pereche de baze indels, la
in.ref.fasta.

OPȚIUNI:

-d INT media distanței exterioare a dimensiunilor plăcuței [170]

-s INT abaterea standard a dimensiunilor insertului [20]

-N INT numărul de perechi de citiri care urmează să fie generate [1000000]

-1 INT lungimea primei citiri [setat de in.simupars.dat]

-2 INT lungimea celei de-a doua citiri [setat de in.simupars.dat]

-r PLUTI rata de mutație [0.001]

-R PLUTI fracțiune de indels de 1 pb [0.1]

-h adăugați toate mutațiile la in.ref.fasta și generează citiri din single
secvență mutantă (mod haploid)

NOTĂ:

* Citirile generate de această comandă sunt independente, ceea ce se abate de la
adevăr. În timp ce evaluarea alinierii este mai puțin afectată de acest lucru, evaluarea continuă
Apelarea SNP trebuie efectuată cu prudență. Dependența de eroare poate fi una dintre
cauzele majore ale apelurilor SNP greșite.

simustat Maq simustat in.simu-aln.map > out.simustat

Evaluați calitățile de cartografiere din citiri simulate.

Solid Legate de

fasta2csfa Maq fasta2csfa in.nucl-ref.fasta > out.colour-ref.fasta

Conversia nucleotidei FASTA în FASTA codificat pe culori. Steag -c ar trebui aplicat apoi
la Hartă comanda. În rezultat, litera „A” reprezintă culoarea 0, „C” pentru 1, „G”
pentru 2 și „T” pentru 3. Fiecare secvență din ieșire este cu 1 bp mai scurtă decât intrarea.

csmap2nt Maq csmap2nt afară.nt.hartă în.ref.nt.bfa in.cs.map

Convertiți alinierea culorilor în alinierea nucleotidelor. Intrarea în.ref.nt.bfa este
fișier de referință FASTA binar de nucleotide. Trebuie să corespundă fișierului original
din care este convertită referința de culoare. Poate fi numit consens nucleotidic
din alinierea rezultată.

Diverse/Avansate Comenzi

subhartă Maq subhartă [-q minMapQ] [-Q maxSumErr] [-m maxMM] [-p] afară.hartă în.hartă

Filtrați aliniamentele proaste în.hartă. Opțiunile liniei de comandă sunt descrise în
`asambla'comandă.

eland2maq Maq eland2maq [-q defqual] afară.hartă în.listă in.eland

Convertiți alinierea eland în formatul .map al maq. Fişier în.listă constă din
nume de secvențe care apar la a șaptea coloană a fișierului de aliniere eland
in.eland și numele pe care vă așteptați să-l vedeți în alinierea maq. Următorul este un
exemplu:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Dacă aliniați citirile în mai multe loturi folosind eland, este important să faceți
folosiți la fel în.listă pentru conversie. În plus, maq va încărca toate
aliniamente și sortați-le în memorie. Daca ai concatenat mai multe eland
iese într-un fișier uriaș, ar trebui să îl separați în fișiere mai mici
împiedicați maq să vă consume toată memoria mașinii.

Această comandă își propune de fapt să arate alinierea Eland în Maqview. Ca fără calitate
informațiile sunt disponibile, fișierul de aliniere maq rezultat nu trebuie utilizat
a numi genotipuri de consens.

export2maq Maq export2maq [-1 read1len] [-2 read2len] [-a maxdist] [-n] afară.hartă în.listă
în.export

Convertiți formatul de export Illumina în formatul Maq .Hartă format. Formatul de export este nou
formatul de aliniere de la SolexaPipeline-0.3.0 care calculează și maparea
calități precum maq. Fișierul rezultat poate fi utilizat pentru a apela genotipuri de consens
deoarece majoritatea informațiilor necesare sunt disponibile pentru ca maq să facă acest lucru cu precizie.

OPȚIUNI:

-1 INT Lungimea primei citiri [0]

-2 INT Lungimea celei de-a doua citiri [0]

-a INT Distanța exterioară maximă pentru o pereche de citire corectă [250]

-n Păstrați citirile filtrate

MAQ-PERL COMANDE


Demo maq.pl Demo [-h] [-s] [-N nPerechi] [-d outDir] in.fasta in.simudat

Demonstrați utilizarea Maq și scripturile sale însoțitoare. Această comandă va
simularea citirilor dintr-un fișier FASTA in.fasta. Lungimea și calitățile secvenței
sunt determinate de in.simudat care este generat din Maq simutrain sau poate fi
descărcat de pe site-ul web Maq. Citirile simulate vor fi apoi mapate cu
maq.pl easyrun. Precizia alinierii este evaluată prin Maq simustat,
acuratețea consensului de către Maq simcns, iar precizia SNP de maq_eval.pl.

În mod implicit, citirile de sfârșit pereche vor fi simulate și va fi o secvență diploidă
generate de la intrare prin adăugarea de mutații la oricare dintre tipurile haploid. Inserția
dimensiunea și rata mutațiilor sunt controlate de Maq simula.

OPȚIUNI:

-h simulează o secvență haploidă în loc de o secvență diploidă

-s utilizați modul single-end pentru a alinia citirile în loc de modul paired-end

-N INT numărul de perechi de citiri de simulat [1000000]

-d DIR director de ieșire [maqdemo]

NOTĂ:

* Fișierele de ieșire de la maq_eval.pl nu au fost documentate, dar puteți face
o presupunere bună la unele dintre aceste fișiere.

* Această comandă demonstrează doar utilizarea suitei maq. Precizia pe real
datele sunt aproape întotdeauna mai mici decât ceea ce vedeți din simulare pură.

easyrun maq.pl easyrun [-1 citeste1Len] [-d out.dir] [-n nCituri] [-A 3adaptor] [-e minDep]
[-q minCnsQ] [-p] [-2 citeste2Len] [-a maxIns] [-S] [-N] in.ref.fasta în1.rapidq
[în2.rapidq]

Analizează conducta pentru genomi mici. Comanda Easyrun va rula majoritatea analizelor
implementat în Maq. În mod implicit, easyrun presupune toate secvențele de citire de intrare
fișierele sunt single-end și independente; cand -p este specificată, două secvențe de citire
sunt necesare fișiere, câte unul pentru fiecare capăt.

Mai multe fișiere vor fi generate în out.dir, printre care se numără următoarele fișiere
ieșirea cheie:

cns.final.snp apelurile finale SNP cu cele de calitate scăzută filtrate

cns.fq secvențe și calități de consens în formatul FASTQ

OPȚIUNI:

-d DIR director de ieșire [easyrun]

-n INT numărul de citiri/perechi într-un singur lot de aliniere [2000000]

-S aplicați analiza de citire divizată a indelelor scurte (poate foarte lent)

-N INT numărul de haplotipuri/tulpini din grup (>=2) [2]

-A FILE dosar pentru adaptor de 3'. Fișierul ar trebui să conțină o singură linie de secvență
[nul]

-1 INT lungimea primei citiri, 0 pentru auto [0]

-e INT adâncimea minimă de citire necesară pentru a apela un SNP (pentru SNPfilter) [3]

-q INT calitate minimă de consens pentru SNP-uri în cns.final.snp [30]

-p comutați la modul de aliniere la capăt pereche

-2 INT lungimea celei de-a doua citiri când -p este aplicat [0]

-a INT dimensiunea maximă a inserției când -p este aplicat [250]

NOTE:

* Pentru apelarea SNP pe mostre grupate, utilizatorii ar trebui să seteze corect `-N' precum și
`-E 0“.

* Fișierul de intrare poate fi formatul binar al lui maq. maq.pl va detecta automat
formatul de fișier.

SNPfilter maq.pl SNPfilter [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s minScore] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
afară.filtrat.snp

Excludeți SNP-urile care sunt acoperite de puține citiri (specificate de -d), de prea mulți
citește (specificat de -D), aproape (specificat de -w) la un potențial indel, cădere
într-o posibilă regiune repetitivă (caracterizată de -Q), sau având calitate scăzută
baze învecinate (specificate de -n). dacă maxWinSNP sau mai multe SNP apar în oricare
densWinSize fereastră, vor fi, de asemenea, filtrate împreună.

OPȚIUNI:

-d INT Adâncimea minimă de citire necesară pentru a apela un SNP [3]

-D INT Adâncimea maximă de citire necesară pentru a apela un SNP (<255, altfel ignorat)
[256]

-Q INT Calitatea maximă de cartografiere necesară a citirilor care acoperă SNP [40]

-q INT Calitatea consensului minim [20]

-n INT Calitatea consensului adiacent minim [20]

-w INT Dimensiunea ferestrei din jurul potențialelor indels. SNP care sunt aproape
la indels vor fi suprimate [3]

-F FILE indelpe ieșire [null]

-f FILE indelsoa ieșire [null]

-s INT Scorul minim pentru un soa-indel care trebuie luat în considerare [3]

-m INT Numărul maxim de citiri care pot fi mapate într-un soa-indel [1]

-a Filtru alternativ pentru alinierea unui singur capăt

indelpe maq.pl indelpe in.indelpe > afară.indelpe

Corectați numărul de citiri mapate fără indeluri pentru tracturile homopolimer. Acest
comanda modifica a 4-a, a 10-a și ultimele trei coloane ale in.indelpe și
scoateți rezultatul în afară.indelpe. După corectare, următoarele Wow
comanda oferă indeluri homozigote presupuse:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

iar următoarele dă heterozigoți:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Vă rugăm să rețineți că acest lucru indelpe comanda doar implementează câteva reguli euristice.
Nu corectează cursurile de homopolimer impur sau di-nucleotide/triplet
se repetă. În consecință, cele două comenzi awk oferă doar aproximativ hom/het
indelii.

EXEMPLE


· Script Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Comenzi cheie din spatele easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
harta maq part1.map ref.bfa part1.bfq;
harta maq part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq assemble cns.cns ref.bfa aln.map;

Utilizați maq online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    Phaser
    Phaser
    Phaser este o deschidere rapidă, gratuită și distractivă
    cadru de joc HTML5 sursă care oferă
    Redare WebGL și Canvas
    browsere web desktop și mobile. Jocuri
    poate fi co...
    Descărcați Phaser
  • 2
    Motor VASSAL
    Motor VASSAL
    VASSAL este un motor de joc pentru creare
    versiuni electronice ale plăcii tradiționale
    și jocuri de cărți. Oferă suport pentru
    redarea și interacțiunea pieselor de joc,
    și ...
    Descărcați VASSAL Engine
  • 3
    OpenPDF - Furk of iText
    OpenPDF - Furk of iText
    OpenPDF este o bibliotecă Java pentru creare
    și editarea fișierelor PDF cu un LGPL și
    Licență open source MPL. OpenPDF este
    Succesorul LGPL/MPL open source al iText,
    o ...
    Descărcați OpenPDF - Furk of iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - Sistem pentru automatizare
    Analize Geoștiințifice - este un Geografic
    Sistemul informatic (GIS) software cu
    capacități imense pentru geodate
    procesare și ana...
    Descărcați SAGA GIS
  • 5
    Caseta de instrumente pentru Java/JTOpen
    Caseta de instrumente pentru Java/JTOpen
    IBM Toolbox for Java / JTOpen este un
    biblioteca de clase Java care acceptă
    programare client/server și internet
    modele către un sistem care rulează OS/400,
    i5/OS, o...
    Descărcați Toolbox pentru Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (sau D3 pentru documente bazate pe date)
    este o bibliotecă JavaScript care vă permite
    pentru a produce date dinamice, interactive
    vizualizări în browsere web. Cu D3
    tu...
    Descărcați D3.js
  • Mai mult »

Comenzi Linux

  • 1
    abidiff
    abidiff
    abidiff - comparați ABI-urile fișierelor ELF
    abidiff compară aplicația binară
    Interfețe (ABI) a două biblioteci partajate
    în format ELF. Emite un sens
    repor ...
    Fugi abidiff
  • 2
    abidw
    abidw
    abidw - serializați ABI-ul unui ELF
    fișierul abidw citește o bibliotecă partajată în ELF
    format și emite o reprezentare XML
    a ABI-ului său la ieșirea standard. The
    emis...
    Run abidw
  • 3
    copac2xml
    copac2xml
    bibutils - conversie bibliografie
    utilitati...
    Rulați copac2xml
  • 4
    Copt
    Copt
    copt - optimizator peephole SYSNOPIS:
    fișier copt.. DESCRIERE: copt este a
    optimizator de uz general pentru vizor. Aceasta
    citește codul din intrarea sa standard și
    scrie un...
    Fugi copt
  • 5
    gather_stx_titles
    gather_stx_titles
    gather_stx_titles - aduna titlul
    declarații din documentele Stx...
    Rulați gather_stx_titles
  • 6
    gatling-banc
    gatling-banc
    bench - http benchmark...
    Alerga gatling-bench
  • Mai mult »

Ad