InglesPransesEspanyol

Ad


OnWorks favicon

maq - Online sa Cloud

Patakbuhin ang maq sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command maq na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


Maq - Pagmamapa at Pagpupulong na may Mga Katangian

SINOPSIS


magkasundo utos [pagpipilian] argumento

maq.pl utos [pagpipilian] argumento

DESCRIPTION


Ang Maq ay isang software na bumubuo ng mga mapping assemblies mula sa mga maikling pagbasa na nabuo ng susunod na-
generation sequencing machine. Ito ay partikular na idinisenyo para sa Illumina-Solexa 1G Genetic
Analyzer, at may paunang functionality para pangasiwaan ang AB SOLiD data.

Sa Maq maaari kang:

· Mabilis na ihanay ang Illumina/SOLiD reads sa reference genome. Gamit ang mga default na opsyon, isa
milyon-milyong pares ng mga nabasa ang maaaring imapa sa genome ng tao sa loob ng humigit-kumulang 10 oras ng CPU nang mas kaunti
kaysa sa 1G memory.

· Tumpak na sukatin ang error na posibilidad ng pagkakahanay ng bawat indibidwal na nabasa.

· Tawagan ang consensus genotypes, kabilang ang homozygous at heterozygous polymorphism, na may
isang Phred probabilistic na kalidad na itinalaga sa bawat base.

· Maghanap ng mga maiikling indel na may mga ipinares na dulong nabasa.

· Tumpak na maghanap ng malalaking sukat na genomic na mga pagtanggal at pagsasalin na may ipinares na mga dulong nabasa.

· Tuklasin ang mga potensyal na CNV sa pamamagitan ng pagsuri sa lalim ng pagbasa.

· Suriin ang katumpakan ng mga hilaw na katangian ng base mula sa mga sequencer at tumulong upang suriin ang
sistematikong mga pagkakamali.

Gayunpaman, kaya ni Maq HINDI:

· Gawin de bago pagpupulong. (Maaari lamang tawagan ng Maq ang pinagkasunduan sa pamamagitan ng pagmamapa ng mga nabasa sa isang kilala
sanggunian.)

· Mapa shorts bumabasa laban sa kanilang sarili. (Ang Maq ay makakahanap lang ng kumpletong overlap sa pagitan ng mga nabasa.)

· Ihanay ang mga capillary reads o 454 reads sa reference. (Hindi ma-align ng Maq ang mga nabasa nang mas mahaba kaysa sa
63bp.)

MAQ UTOS


Key Command

fasta2bfa magkasundo fasta2bfa in.ref.fasta out.ref.bfa

I-convert ang mga sequence sa FASTA na format sa Maq's BFA (binary FASTA) na format.

mabilisq2bfq magkasundo mabilisq2bfq [-n nreads] in.read.fastq out.read.bfqout.prefix

I-convert ang mga nabasa sa FASTQ na format sa Maq's BFQ (binary FASTQ) na format.

OPSYON:

-n Int bilang ng mga nabasa sa bawat file [hindi tinukoy]

mapa magkasundo mapa [-n nmis] [-a maxins] [-c] [-1 len1] [-2 len2] [-d adapt3] [-m magbago]
[-u walang mapa] [-e maxer] [-M c⎪g] [-N] [-H allhits] [-C maxhits] out.aln.map
in.ref.bfa sa.read1.bfq [sa.read2.bfq] 2> out.map.log

Binabasa ng mapa ang mga reference sequence.

OPSYON:

-n Int Bilang ng maximum na hindi pagkakatugma na laging mahahanap [2]

-a Int Pinakamataas na panlabas na distansya para sa tamang pares ng nabasa [250]

-A Int Pinakamataas na panlabas na distansya ng dalawang binabayarang RF read (0 para sa disable) [0]

-c Binabasa ang mapa sa espasyo ng kulay (para sa SOLiD lang)

-1 Int Haba ng pagbasa para sa unang nabasa, 0 para sa auto [0]

-2 Int Haba ng pagbasa para sa pangalawang pagbasa, 0 para sa auto [0]

-m Lumutang Rate ng mutation sa pagitan ng mga reference sequence at mga reads [0.001]

-d FILE Tukuyin ang isang file na naglalaman ng isang linya ng 3'-adapter sequence
[wala]

-u FILE Itapon ang mga hindi naka-map na nabasa at mga nabasa na naglalaman ng higit sa nmis hindi tugma sa
isang hiwalay na file [null]

-e Int Threshold sa kabuuan ng hindi tugmang mga batayang katangian [70]

-H FILE Itapon ang maramihan/lahat ng 01-mismatch na hit sa FILE [wala]

-C Int Maximum na bilang ng mga hit sa output. Walang limitasyon kung mas malaki sa 512. [250]

-M c⎪g methylation alignment mode. Ang lahat ng C (o G) sa forward strand ay magiging
binago sa T (o A). Ang pagpipiliang ito ay para sa pagsubok lamang.

-N iimbak ang hindi tugmang posisyon sa output file out.aln.map. Kapag ito
ginagamit ang opsyon, ang maximum na pinapayagang haba ng pagbasa ay 55bp.

TANDAAN:

* Ang mga pinagpares na dulong nabasa ay dapat ihanda sa dalawang file, isa para sa bawat dulo, na may
ang mga nabasa ay pinagsunod-sunod sa parehong pagkakasunud-sunod. Ibig sabihin ang k-th read sa una
Ang file ay ipinares sa k-th read sa pangalawang file. Ang kaukulang pagbasa
dapat magkapareho ang mga pangalan hanggang sa tailing `/1' o `/2'. Halimbawa, tulad ng isang
pinapayagan ang pares ng mga nabasang pangalan: `EAS1_1_5_100_200/1' at
`EAS1_1_5_100_200/2'. Ang tailing `/[12]' ay kadalasang nabubuo ng
GAPipeline upang makilala ang dalawang dulo sa isang pares.

* Ang output ay isang naka-compress na binary file. Ito ay apektado ng endianness.

* Ang pinakamahusay na paraan upang patakbuhin ang utos na ito ay magbigay ng humigit-kumulang 1 hanggang 3 milyong reads bilang
input. Ang mas maraming pagbabasa ay kumonsumo ng mas maraming memorya.

* Pagpipilian -n kinokontrol ang sensitivity ng pagkakahanay. Bilang default, isang hit na may
hanggang 2 mismatches ang laging mahahanap. Mas mataas -n nakakahanap ng higit pang mga hit at gayundin
nagpapabuti sa katumpakan ng mga katangian ng pagmamapa. Gayunpaman, ito ay ginagawa sa halaga
ng bilis.

* Ang mga alignment na may maraming mataas na kalidad na hindi pagkakatugma ay dapat na itapon bilang false
pagkakahanay o posibleng mga kontaminasyon. Ang pag-uugali na ito ay kinokontrol ng opsyon
-e. ang -e ang threshold ay tinatayang lamang dahil sa mga pangunahing katangian
ay hinati ng 10 sa isang tiyak na yugto ng pagkakahanay. Ang -Q na opsyon sa
magtipon utos na tiyak na itakda ang threshold.

* Ang isang pares ng mga nabasa ay sinasabing tama ang pagkakapares kung at kung ang
ang oryentasyon ay FR at ang panlabas na distansya ng pares ay hindi mas malaki kaysa sa
maxins. Walang limitasyon sa pinakamababang laki ng insert. Ang setting na ito ay
tinutukoy ng ipinares na end alignment algorithm na ginamit sa Maq. Nangangailangan ng a
Ang pinakamababang laki ng insert ay hahantong sa ilang maling pagkakahanay na may mataas
overestimated na mga katangian ng pagmamapa.

* Sa kasalukuyan, ang mga pares ng read mula sa Illumina/Solexa long-insert library ay may RF read
oryentasyon. Ang maximum na laki ng insert ay itinakda ng opsyon -A. Gayunpaman, matagal-
Ang insert library ay hinaluan din ng maliit na bahagi ng short-insert read
pares. -a dapat ding itakda nang tama.

* Minsan 5'-end o kahit na ang buong 3'-adapter sequence ay maaaring sequenced.
Pagbibigay -d nag-render ng Maq upang alisin ang mga kontaminasyon ng adaptor.

* Nabigyan ng 2 milyong pagbabasa bilang input, magkasundo karaniwang tumatagal ng 800MB memory.

mapmerge magkasundo mapmerge out.aln.map sa.aln1.map sa.aln2.map [...]

Pagsamahin ang isang batch ng mga read alignment nang magkasama.

TANDAAN:

* Sa teorya, maaaring pagsamahin ng command na ito ang walang limitasyong bilang ng mga alignment. Gayunpaman, bilang
Ang mapmerge ay magbabasa ng lahat ng mga input nang sabay-sabay, maaari itong pindutin ang
limitasyon ng maximum na bilang ng pagbubukas ng mga file na itinakda ng OS. Sa kasalukuyan, ito
kailangang manu-manong lutasin ng mga enduser.

* Utos mapmerge ay maaaring gamitin upang pagsamahin ang mga file ng pagkakahanay na may iba't ibang nabasa
mga haba. Ang lahat ng mga kasunod na pagsusuri ay hindi na ipinapalagay na nakapirming haba pa.

rmdup magkasundo rmdup out.rmdup.map in.ori.map

Alisin ang mga pares na may magkaparehong panlabas na coordinate. Sa prinsipyo, pares sa
bihirang mangyari ang magkaparehong panlabas na coordinate. Gayunpaman, dahil sa
amplification sa paghahanda ng sample, ito ay nangyayari nang mas madalas kaysa sa
pagkakataon. Ipinapakita ng mga praktikal na pagsusuri na ang pag-aalis ng mga duplicate ay nakakatulong upang mapabuti ang
pangkalahatang katumpakan ng pagtawag sa SNP.

magtipon magkasundo magtipon [-sp] [-m maxmis] [-Q maxer] [-r magpainit] [-t coef] [-q minQ] [-N
nHap] out.cns in.ref.bfa sa.aln.map 2> out.cns.log

Tawagan ang consensus sequence mula sa read mapping.

OPSYON:

-t Lumutang Error dependency coefficient [0.93]

-r Lumutang Fraction ng heterozygotes sa lahat ng mga site [0.001]

-s Kunin ang solong dulo ng kalidad ng pagmamapa bilang panghuling kalidad ng pagmamapa;
kung hindi, gagamitin ang ipinares na kalidad ng end mapping

-p Itapon ang ipinares na pagtatapos na mga pagbasa na hindi nakamapa sa mga tamang pares

-m Int Maximum na bilang ng mga mismatch na pinapayagan para magamit ang isang read
pagtawag ng pinagkasunduan [7]

-Q Int Pinakamataas na pinapayagang kabuuan ng mga halaga ng kalidad ng mga hindi tugmang base [60]

-q Int Pinakamababang kalidad ng pagmamapa na pinapayagan para sa isang pagbabasa upang magamit sa pinagkasunduan
tumatawag [0]

-N Int Bilang ng mga haplotype sa pool (>=2) [2]

TANDAAN:

* Pagpipilian -Q nagtatakda ng limitasyon sa maximum na kabuuan ng hindi pagtutugma ng mga batayang katangian.
Ang mga nabasang naglalaman ng maraming mataas na kalidad na hindi pagkakatugma ay dapat na itapon.

* Pagpipilian -N nagtatakda ng bilang ng mga haplotype sa isang pool. Ito ay dinisenyo para sa
resequencing ng mga sample sa pamamagitan ng pagsasama-sama ng maraming strain/indibidwal. Para sa
diploid genome resequencing, ang opsyong ito ay katumbas ng 2.

glfgen magkasundo glfgen [-sp] [-m maxmis] [-Q maxer] [-r magpainit] [-t coef] [-q minQ] [-N
nHap] out.cns in.ref.bfa sa.aln.map 2> out.cns.log

Kalkulahin ang log-likelihood para sa lahat ng genotypes at iimbak ang mga resulta sa GLF format
(Genotyping Likelihood Format). Pakitingnan ang website ng MAQ para sa detalyado
mga paglalarawan ng format ng file at ang mga kaugnay na kagamitan.

indelpe magkasundo indelpe in.ref.bfa sa.aln.map > labas.indelpe

Tumawag sa mga pare-parehong indels mula sa mga pinagpares na end read. Ang output ay TAB delimited sa
bawat linya na binubuo ng chromosome, panimulang posisyon, uri ng indel, numero
ng mga nabasa sa buong indel, laki ng indel at nakapasok/natanggal na mga nucleotide
(separated by colon), bilang ng indels sa reverse strand, bilang ng indels
sa forward strand, 5' sequence sa unahan ng indel, 3' sequence na kasunod
ang indel, bilang ng mga nabasa na nakahanay nang walang mga indel at tatlong karagdagang column
para sa mga filter.

Sa ika-3 haligi, uri ng indel, ang isang bituin ay nagpapahiwatig na ang indel ay nakumpirma
sa pamamagitan ng mga pagbabasa mula sa parehong mga hibla, ang isang plus ay nangangahulugan na ang indel ay tinamaan ng hindi bababa sa dalawang nabasa
ngunit mula sa parehong strand, ang isang minus ay nagpapakita na ang indel ay matatagpuan lamang sa isang nabasa,
at ang isang tuldok ay nangangahulugan na ang indel ay masyadong malapit sa isa pang indel at na-filter out.

Ang mga gumagamit ay inirerekomenda na tumakbo sa `maq.pl indelpe' upang itama ang bilang ng
bumabasa na nakamapang walang indels. Para sa higit pang mga detalye, tingnan ang `maq.pl indelpe'
seksyon.

indelsoa magkasundo indelsoa in.ref.bfa sa.aln.map > labas.indelsoa

Tawagan ang mga potensyal na homozygous indels at mga break point sa pamamagitan ng pag-detect ng abnormal
pattern ng pagkakahanay sa paligid ng mga indel at mga break point. Ang output ay TAB din
delimited sa bawat linya na binubuo ng chromosome, tinatayang coordinate,
haba ng abnormal na rehiyon, bilang ng mga nabasa na nakamapa sa buong posisyon,
bilang ng mga nabasa sa kaliwang bahagi ng posisyon at bilang ng mga nabasa sa
ang kanang bahagi. Maaaring balewalain ang huling column.

Ang output ay naglalaman ng maraming maling positibo. Ang isang inirerekomendang filter ay maaaring:

awk '$5+$6-$4 >= 3 at& $4 <= 1' in.indelsoa

Tandaan na ang utos na ito ay hindi naglalayong maging isang tumpak na indel detector, ngunit
pangunahing nakakatulong upang maiwasan ang ilang maling positibo sa pagpapalit na pagtawag. Sa
karagdagan, ito ay gumagana lamang ng maayos na ibinigay ng malalim na lalim (~ 40X halimbawa); kung hindi man ang
ang maling negatibong rate ay magiging napakataas.

format Pag-convert

sol2sanger magkasundo sol2sanger in.sol.fastq out.sanger.fastq

I-convert ang Solexa FASTQ sa standard/Sanger FASTQ na format.

bfq2fastq magkasundo bfq2fastq sa.read.bfq out.read.fastq

I-convert ang BFQ format ng Maq sa karaniwang FASTQ na format.

mapass2maq magkasundo mapass2maq sa.mapass2.map out.maq.map

I-convert ang hindi na ginagamit na format ng mapa ng mapass2 sa format ng mapa ng Maq. Ginagawa ng lumang format
hindi naglalaman ng mga nabasang pangalan.

Impormasyon Extracting

view ng mapa magkasundo view ng mapa [-bN] sa.aln.map > out.aln.txt

Ipakita ang read alignment sa plain text. Para sa mga nabasang nakahanay bago ang Smith-
Waterman alignment, bawat linya ay binubuo ng read name, chromosome, posisyon,
strand, ipasok ang laki mula sa mga panlabas na coorniates ng isang pares, ipinares na bandila, pagmamapa
kalidad, kalidad ng single-end na pagmamapa, kalidad ng alternatibong pagmamapa, bilang ng
hindi tugma ng pinakamahusay na hit, kabuuan ng mga katangian ng hindi tugmang mga base ng pinakamahusay
hit, bilang ng 0-mismatch hit ng unang 24bp, bilang ng 1-mismatch hit ng
ang unang 24bp sa sanggunian, haba ng binasa, pagkakasunod-sunod ng pagbasa at nito
kalidad. Ang kalidad ng alternatibong pagmamapa ay palaging katumbas ng kalidad ng pagmamapa kung ang
hindi ipinares ang mga nabasa. Kung ang mga nabasa ay ipinares, ito ay katumbas ng mas maliit na pagmamapa
kalidad ng dalawang dulo. Ang alternatibong kalidad ng pagmamapa na ito ay talagang ang
kalidad ng pagmamapa ng isang abnormal na pares.

Ang ikalimang hanay, ipinares na bandila, ay isang bitwise na bandila. Ang mas mababang 4 bits nito ay nagbibigay ng
oryentasyon: 1 ay kumakatawan sa FF, 2 para sa FR, 4 para sa RF, at 8 para sa RR, kung saan FR ay nangangahulugan
na ang read na may mas maliit na coordinate ay nasa forward strand, at ang mate nito ay
sa reverse strand. FR lang ang pinapayagan para sa tamang pares. Ang mas mataas na mga bit
ng watawat na ito ay nagbibigay ng karagdagang impormasyon. Kung ang pares ay nakakatugon sa paired end
kinakailangan, 16 ang itatakda. Kung ang dalawang nabasa ay nakamapang magkaiba
chromosome, 32 ang itatakda. Kung ang isa sa dalawang nabasa ay hindi maimapa,
64 ang itatakda. Ang bandila para sa isang tamang pares ay palaging katumbas ng 18.

Para sa mga pagbabasa na nakahanay sa pagkakahanay ng Smith-Waterman pagkatapos, ang bandila ay
palaging 130. Ang isang linya ay binubuo ng binasang pangalan, chromosome, posisyon, strand, insert
laki, bandila (laging 130), posisyon ng indel sa nabasa (0 kung walang indel),
haba ng indels (positibo para sa mga pagpapasok at negatibo para sa mga pagtanggal),
kalidad ng pagmamapa ng kanyang kapareha, bilang ng mga hindi pagkakatugma ng pinakamahusay na hit, kabuuan ng
mga katangian ng hindi tugmang mga base ng pinakamahusay na hit, dalawang zero, haba ng nabasa,
pagkakasunud-sunod ng pagbasa at kalidad nito. Ang kapareha ng isang 130-flagged read ay palaging nakakakuha ng a
bandila 18.

Ang Flag 192 ay nagpapahiwatig na ang nabasa ay hindi nakamapa ngunit ang kanyang kapareha ay nakamapa. Para sa mga ganyan
isang read pair, ang isang read ay may flag 64 at ang isa ay may 192.

OPSYON:

-b huwag ipakita ang read sequence at ang kalidad

-N ipakita ang mga posisyon kung saan nagaganap ang mga hindi pagkakatugma. Gumagana lang ang flag na ito
na may .map file na nabuo ng `maq map -N'.

mapcheck magkasundo mapcheck [-s] [-m maxmis] [-q minQ] in.ref.bfa sa.aln.map > out.mapcheck

Basahin ang pagsusuri sa kalidad. Ang mapcheck ay unang nag-uulat ng komposisyon at ang lalim ng
ang basehan. Pagkatapos nito ay may isang form. Ang unang hanay ay nagpapahiwatig ng
posisyon sa isang nabasa. Kasunod ng apat na column na nagpapakita ng nucleotide
komposisyon, mga rate ng pagpapalit sa pagitan ng sanggunian at mga nabasa ay ibibigay.
Ang mga rate na ito at ang mga numero sa mga sumusunod na column ay naka-scale sa 999 at
bilugan sa pinakamalapit na integer. Ang susunod na pangkat ng mga hanay ay nagpapakita ng pamamahagi ng
batayang katangian kasama ang mga nabasa sa pagitan ng kalidad na 10. Isang pagkabulok sa kalidad
kadalasang mapapansin, na nangangahulugan na ang mga base sa dulo ng pagbasa ay mas kaunti
tumpak. Ang huling pangkat ng mga column ay nagpapakita ng fraction ng mga pamalit para sa
basahin ang mga base sa isang kalidad na pagitan. Sinusukat nito ang katumpakan ng kalidad ng base
pagtatantya. Sa isip, inaasahan naming makita ang 1 sa 3? column, 10 sa 2? hanay
at 100 sa 1? hanay.

OPSYON:

-s Kunin ang kalidad ng solong dulo ng pagmamapa bilang panghuling kalidad ng pagmamapa

-m Int Maximum na bilang ng mga mismatahces na pinapayagan para sa isang read na mabilang [4]

-q Int Pinakamababang kalidad ng pagmamapa na pinapayagan para mabilang ang isang nabasa [30]

pileup magkasundo pileup [-spvP] [-m maxmis] [-Q maxer] [-q minQ] [-l sitefile] in.ref.bfa
sa.aln.map > out.pileup

Ipakita ang pagkakahanay sa isang `pileup' na format ng teksto. Ang bawat linya ay binubuo ng
chromosome, posisyon, reference base, depth at ang mga base sa mga read na sumasaklaw
itong posisyon. Kung -v ay idinagdag sa command line, mga batayang katangian at pagmamapa
ipapakita ang mga katangian sa ikaanim at ikapitong hanay ayon sa pagkakasunod-sunod.

Palaging nagsisimula sa `@' ang ikalimang column. Sa column na ito, basahin ang mga base na magkapareho
sa sanggunian ay ipinapakita sa kuwit `,' o tuldok `.', at iba ang mga base sa pagbasa
mula sa sanggunian sa mga titik. Ang kuwit o malaking titik ay nagpapahiwatig na ang base
ay mula sa isang read na nakahanay sa forward strand, habang ang isang tuldok o maliit na titik sa
ang reverse strand.

Ang utos na ito ay para sa mga user na gustong bumuo ng sarili nilang mga tumatawag sa SNP.

OPSYON:

-s Kunin ang kalidad ng solong dulo ng pagmamapa bilang panghuling kalidad ng pagmamapa

-p Itapon ang mga pinagpares na dulong nabasa na hindi nakamapa bilang mga tamang pares

-v Mag-output ng verbose na impormasyon kasama ang mga batayang katangian at pagmamapa
katangian

-m Int Maximum na bilang ng mga hindi pagkakatugma na pinapayagan para magamit ang isang read [7]

-Q Int Pinakamataas na pinapayagang bilang ng mga halaga ng kalidad ng hindi pagkakatugma [60]

-q Int Pinakamababang kalidad ng pagmamapa na pinapayagan para sa isang read na gagamitin [0]

-l FILE File na naglalaman ng mga site kung saan ipi-print ang pileup. Dito sa
file ang unang hanay ay nagbibigay ng mga pangalan ng sanggunian at ang pangalawa
ang mga coordinate. Hindi papansinin ang mga karagdagang column. [wala]

-P output din ang base na posisyon sa nabasa

cns2fq magkasundo cns2fq [-Q minMapQ] [-n minNeiQ] [-d minLalim] [-D maxDepth] sa.cns >
out.cns.fastq

I-extract ang consensus sequence sa FASTQ na format. Sa mga linya ng pagkakasunod-sunod, mga base
sa maliit na titik ay mahalagang inuulit o walang sapat na saklaw; mga base
sa upper case ay nagpapahiwatig ng mga rehiyon kung saan maaasahang tawagan ang mga SNP. Nasa
mga linya ng kalidad, ang ASCII ng isang character na minus 33 ay nagbibigay ng kalidad ng PHRED.

OPSYON:

-Q Int Pinakamababang kalidad ng pagmamapa [40]

-d Int Minimum na lalim ng pagbasa [3]

-n Int Pinakamababang kalapit na kalidad [20]

-D Int Maximum read dpeth. >=255 para sa walang limitasyon. [255]

cns2snp magkasundo cns2snp sa.cns > out.snp

I-extract ang mga site ng SNP. Ang bawat linya ay binubuo ng chromosome, posisyon, reference base,
consensus base, Phred-like consensus quality, read depth, ang average na bilang ng
mga hit ng mga nabasa na sumasaklaw sa posisyong ito, ang pinakamataas na kalidad ng pagmamapa ng mga nabasa
sumasaklaw sa posisyon, ang pinakamababang kalidad ng pinagkasunduan sa 3bp flanking
rehiyon sa bawat panig ng site (6bp sa kabuuan), ang pangalawang pinakamahusay na tawag, log
ratio ng posibilidad ng pangalawang pinakamahusay at ang ikatlong pinakamahusay na tawag, at ang pangatlong pinakamahusay
tawagan

Ang 5th column ay ang pangunahing criterion kapag hinuhusgahan mo ang pagiging maaasahan ng isang SNP.
Gayunpaman, dahil ang kalidad na ito ay kinakalkula lamang sa pag-aakala ng kalayaan ng site, ikaw
dapat ding isaalang-alang ang iba pang column para makakuha ng mas tumpak na mga tawag sa SNP. Script
utos `maq.pl SNPfilter' ay dinisenyo para dito (tingnan sa ibaba).

Ang ika-7 column ay nagpapahiwatig kung ang site ay nasa paulit-ulit na rehiyon. Kung hindi
read covering ang site ay maaaring ma-map na may mataas na kalidad ng pagmamapa, ang flanking
rehiyon ay posibleng paulit-ulit o sa kakulangan ng magandang pagbabasa. Isang SNP sa naturang site
ay karaniwang hindi maaasahan.

Ang ika-8 column ay halos nagbibigay ng numero ng kopya ng flanking region sa
sangguniang genome. Sa karamihan ng mga kaso, ang bilang na ito ay lumalapit sa 1.00, na nangangahulugang ang
rehiyon ay tungkol sa natatangi. Minsan maaari mong makita ang non-zero read depth ngunit 0.00 sa
ang ika-7 kolum. Ito ay nagpapahiwatig na ang lahat ng mga nabasa na sumasaklaw sa posisyon ay nasa
hindi bababa sa dalawang hindi pagkakatugma. Binibilang lang ng Maq ang bilang ng 0- at 1-mismatch na hit
ang basehan. Ito ay dahil sa isang kumplikadong teknikal na isyu.

Ang ika-9 na hanay ay nagbibigay ng kalapit na kalidad. Ang pag-filter sa column na ito ay din
kinakailangan upang makakuha ng mga maaasahang SNP. Ang ideyang ito ay inspirasyon ng NQS, bagaman ang NQS ay
unang idinisenyo para sa isang pagbabasa sa halip na isang pinagkasunduan.

cns2view magkasundo cns2view sa.cns > out.view

Ipakita ang detalyadong impormasyon sa lahat ng mga site. Ang format ng output ay magkapareho sa
cns2snp ulat.

cns2ref magkasundo cns2ref sa.cns > out.ref.fasta

I-extract ang reference sequence.

cns2win magkasundo cns2win [-w winsize] [-c chr] [-b simulan] [-e dulo] [-q minQ] sa.cns >
out.win

I-extract ang impormasyon na na-average sa isang tilling window. Ang output ay TAB delimited,
na binubuo ng reference na pangalan, coordinate na hinati sa 1,000,000, SNP rate,
het rate, raw read depth, read depth sa humigit-kumulang natatanging rehiyon, ang
average na bilang ng mga hit ng mga nabasa sa window at porsyento ng GC.

OPSYON:

-w Int Sukat ng isang window [1000]

-c STR Destined reference sequence; kung hindi, lahat ng sanggunian ay gagamitin
[wala]

-b Int Panimulang posisyon, 0 para walang hadlang [0]

-e Int Posisyon ng pagtatapos, 0 para sa walang limitasyon [0]

-q Int Pinakamababang kalidad ng pinagkasunduan ng mga site na gagamitin [0]

Kapanggapan kaugnay

fakemut magkasundo fakemut [-r magbago] [-R indelfrac] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Random na ipasok ang mga pagpapalit at indel sa reference. Mga pagpapalit at
Sinlge base-pair indels ay maaaring idagdag.

OPSYON:

-r Lumutang Rate ng mutation [0.001]

-R Lumutang Fraction ng mutations na magiging indels [0.1]

simutrain magkasundo simutrain out.simupars.dat in.read.fastq

Tantyahin/train ang mga parameter para sa read simulation.

gayahin magkasundo gayahin [-d insize] [-s stdev] [-N nBasa] [-1 basahinLen1] [-2 basahinLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

Gayahin ang ipinares na pagtatapos na mga pagbasa. file in.simupars.dat tinutukoy ang haba ng pagbasa at
kalidad ng pamamahagi. Ito ay nabuo mula sa simutrain, o maaaring i-download mula sa
Maq website. Sa mga output read file, ang isang read name ay binubuo ng reference
pangalan ng pagkakasunud-sunod at ang mga panlabas na coordinate ng pares ng mga simulate na pagbabasa. Sa pamamagitan ng
default, gayahin Ipinapalagay na ang mga nabasa ay nagmula sa isang diploid sequence na nabuo
sa pamamagitan ng pagdaragdag ng dalawang magkaibang set ng mutations, kabilang ang isang base-pair indels, sa
in.ref.fasta.

OPSYON:

-d Int ibig sabihin ng panlabas na distansya ng mga laki ng insert [170]

-s Int karaniwang paglihis ng mga laki ng insert [20]

-N Int bilang ng mga pares ng mga babasahin na mabubuo [1000000]

-1 Int haba ng unang binasa [itinakda ni in.simupars.dat]

-2 Int haba ng ikalawang binasa [itinakda ni in.simupars.dat]

-r Lumutang rate ng mutation [0.001]

-R Lumutang fraction ng 1bp indels [0.1]

-h idagdag ang lahat ng mutasyon sa in.ref.fasta at bumuo ng mga nabasa mula sa single
mutated sequence (haploid mode)

TANDAAN:

* Ang mga nabasang nabuo mula sa utos na ito ay independyente, na lumilihis mula sa
katotohanan. Samantalang ang pagsusuri sa pagkakahanay ay hindi gaanong apektado nito, ang pagsusuri sa
Ang pagtawag sa SNP ay dapat gawin nang may pag-iingat. Ang error dependency ay maaaring isa sa
ang mga pangunahing sanhi ng mga maling tawag sa SNP.

simustat magkasundo simustat in.simu-aln.map > out.simustat

Suriin ang mga katangian ng pagmamapa mula sa mga simulate na pagbabasa.

SOLID kaugnay

fasta2csfa magkasundo fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

I-convert ang nucleotide FASTA sa color-coded na FASTA. Bandila -c dapat pagkatapos ay ilapat
sa mapa utos. Sa output, ang titik `A' ay kumakatawan sa kulay 0, `C' para sa 1, `G'
para sa 2 at `T' para sa 3. Ang bawat sequence sa output ay 1bp na mas maikli kaysa sa input.

csmap2nt magkasundo csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

I-convert ang pagkakahanay ng kulay sa pagkakahanay ng nucleotide. Ang input in.ref.nt.bfa ay ang
nucleotide binary FASTA reference file. Dapat itong tumutugma sa orihinal na file
mula sa kung saan ang sanggunian ng kulay ay na-convert. Maaaring tawagin ang nucleotide consensus
mula sa resultang pagkakahanay.

Miscellaneous/Advanced Command

submap magkasundo submap [-q minMapQ] [-Q maxSumErr] [-m maxMM] [-p] out.mapa sa.mapa

I-filter ang masasamang alignment sa sa.mapa. Ang mga opsyon sa command-line ay inilarawan sa
`magtipon' utos.

eland2maq magkasundo eland2maq [-q walang katumbas] out.mapa sa.listahan sa.eland

I-convert ang eland alignment sa .map na format ng maq. file sa.listahan binubuo ng
mga sequence name na lumalabas sa ikapitong column ng eland alignment file
sa.eland at ang pangalan na inaasahan mong makita sa maq alignment. Ang sumusunod ay isang
halimbawa:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Kung inihanay mo ang mga nabasa sa ilang mga batch gamit ang eland, mahalaga na
gumamit ng pareho sa.listahan para sa conversion. Bilang karagdagan, ilo-load ng maq ang lahat ng
pagkakahanay at pag-uri-uriin ang mga ito sa memorya. Kung pinagdugtong mo ang ilang eland
mga output sa isang malaking file, dapat mong paghiwalayin ito sa mas maliliit na file sa
pigilan ang maq na kainin ang lahat ng memorya ng iyong makina.

Ang utos na ito ay talagang naglalayong ipakita ang pagkakahanay ng Eland sa Maqview. Bilang walang kalidad
ang impormasyon ay magagamit, ang resultang maq alignment file ay hindi dapat gamitin
upang tawagan ang consensus genotypes.

export2maq magkasundo export2maq [-1 read1len] [-2 read2len] [-a maxdist] [-n] out.mapa sa.listahan
sa.export

I-convert ang format ng Export ng Illumina sa Maq's .mapa pormat. Ang format ng pag-export ay bago
alignment format mula noong SolexaPipeline-0.3.0 na kinakalkula din ang pagmamapa
katangian tulad ng maq. Ang resultang file ay maaaring gamitin upang tawagan ang consensus genotypes
dahil karamihan sa mga kinakailangang impormasyon ay magagamit para sa maq upang gawin ito nang tumpak.

OPSYON:

-1 Int Haba ng unang nabasa [0]

-2 Int Haba ng ikalawang pagbasa [0]

-a Int Pinakamataas na panlabas na distansya para sa tamang pares ng nabasa [250]

-n Panatilihin ang mga na-filter na nabasa

MAQ-PERL UTOS


demo maq.pl demo [-h] [-s] [-N nPares] [-d outDir] sa.fasta sa.simudat

Ipakita ang paggamit ng magkasundo at mga kasamang script nito. Ang utos na ito ay
gayahin ang mga nabasa mula sa isang FASTA file sa.fasta. Ang haba ng pagkakasunud-sunod at mga katangian
ay tinutukoy ng sa.simudat na nabuo mula sa magkasundo simutrain o maaaring maging
na-download mula sa website ng Maq. Ang mga simulate na pagbabasa ay imamapa sa
maq.pl easyrun. Ang katumpakan ng pagkakahanay ay sinusuri ng magkasundo simustat, ang
consensus accuracy by magkasundo mga simucns, at ang katumpakan ng SNP ni maq_eval.pl.

Bilang default, ang mga ipinares na pagbabasa sa dulo ay magiging simulate at isang diploid sequence ang magiging
nabuo mula sa input sa pamamagitan ng pagdaragdag ng mga mutasyon sa alinman sa uri ng haploid. Ang insert
laki at mutation rate ay kinokontrol ng magkasundo gayahin.

OPSYON:

-h gayahin ang isang haploid sequence sa halip na isang diploid sequence

-s gumamit ng single-end mode para i-align ang mga reads sa halip na paired-end mode

-N Int bilang ng mga pares ng mga babasahin na gayahin [1000000]

-d DIR direktoryo ng output [maqdemo]

TANDAAN:

* Ang mga output file mula sa maq_eval.pl ay hindi naidokumento, ngunit maaari mong gawin
isang magandang hula sa ilan sa mga file na ito.

* Ang utos na ito ay nagpapakita lamang ng paggamit ng maq suite. Ang katumpakan sa tunay
halos palaging mas mababa ang data kaysa sa nakikita mo mula sa purong simulation.

easyrun maq.pl easyrun [-1 basahin1Len] [-d out.dir] [-n nBasa] [-A 3adapter] [-e minDep]
[-q minCnsQ] [-p] [-2 basahin2Len] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

Sinusuri ang pipeline para sa maliliit na genome. Ang utos ng Easyrun ay tatakbo sa karamihan ng mga pagsusuri
ipinatupad sa magkasundo. Bilang default, easyrun Ipinagpapalagay ang lahat ng input read sequences
ang mga file ay single-end at independiyente; kailan -p ay tinukoy, dalawang read sequence
kailangan ang mga file, isa para sa bawat dulo.

Maraming mga file ang bubuo sa out.dir, kung saan ang mga sumusunod na file ay
ang pangunahing output:

cns.final.snp panghuling mga tawag sa SNP na may mga mababang kalidad na na-filter out

cns.fq consensus sequence at katangian sa FASTQ na format

OPSYON:

-d DIR direktoryo ng output [easyrun]

-n Int bilang ng mga nabasa/pares sa isang batch ng pagkakahanay [2000000]

-S ilapat ang split-read analysis ng mga maikling indels (marahil napakabagal)

-N Int bilang ng mga haplotype/strain sa pool (>=2) [2]

-A FILE file para sa 3'-adapter. Ang file ay dapat maglaman ng isang linya ng sequence
[wala]

-1 Int haba ng unang nabasa, 0 para sa auto [0]

-e Int minimum na lalim ng pagbasa na kinakailangan upang tumawag sa isang SNP (para sa SNPfilter) [3]

-q Int pinakamababang kalidad ng pinagkasunduan para sa mga SNP sa cns.final.snp [30]

-p lumipat sa paired end alignment mode

-2 Int haba ng ikalawang binasa kung kailan -p ay inilapat [0]

-a Int maximum insert size kapag -p ay inilapat [250]

NOTA:

* Para sa pagtawag ng SNP sa mga pinagsama-samang sample, dapat itakda ng mga user ang tama `-N' pati na rin ang
`-E 0 '.

* Ang input file ay maaaring binary na format ng maq. maq.pl ay awtomatikong makikita
ang format ng file.

SNPfilter maq.pl SNPfilter [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F sa.indelpe] [-f sa.indelsoa] [-s minScore] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

Alisin ang mga SNP na sakop ng ilang mga pagbabasa (tinukoy ng -d), ng napakarami
bumabasa (tinukoy ni -D), malapit (tinukoy ng -w) sa isang potensyal na indel, bumabagsak
sa isang posibleng paulit-ulit na rehiyon (nailalarawan ng -Q), o pagkakaroon ng mababang kalidad
mga kalapit na base (tinukoy ng -n). Kung maxWinSNP o higit pang mga SNP ang lumalabas sa alinman
densWinSize window, sasalain din sila nang magkasama.

OPSYON:

-d Int Kinakailangan ang minimum na lalim ng pagbasa upang tumawag sa isang SNP [3]

-D Int Kinakailangan ang maximum na lalim ng pagbasa upang tumawag sa isang SNP (<255, kung hindi man ay hindi pinansin)
[256]

-Q Int Kinakailangan ang pinakamataas na kalidad ng pagmamapa ng mga nabasa na sumasaklaw sa SNP [40]

-q Int Pinakamababang kalidad ng pinagkasunduan [20]

-n Int Pinakamababang katabing kalidad ng pinagkasunduan [20]

-w Int Sukat ng bintana sa paligid ng mga potensyal na indels. Mga SNP na malapit
to indels ay pipigilan [3]

-F FILE Ang indelpe output [null]

-f FILE Ang indelsoa output [null]

-s Int Pinakamababang marka para sa isang soa-indel na isasaalang-alang [3]

-m Int Pinakamataas na bilang ng mga nabasa na maaaring ma-map sa isang soa-indel [1]

-a Alternatibong filter para sa single end alignment

indelpe maq.pl indelpe sa.indelpe > labas.indelpe

Iwasto ang bilang ng mga nabasang nakamapang walang indels para sa mga homopolymer tract. Ito
utos na baguhin ang ika-4, ika-10 at ang huling tatlong hanay ng sa.indelpe at
ilabas ang resulta sa labas.indelpe. Pagkatapos ng pagwawasto, ang mga sumusunod ang awkward
Ang utos ay nagbibigay ng putative homozygous indels:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

at ang mga sumusunod ay nagbibigay ng heterozygotes:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Mangyaring tandaan na ito indelpe nagpapatupad lang ang command ng ilang heuristic rules.
Hindi ito tama para sa hindi malinis na homopolymer run o di-nucleotide/triplet
umuulit. Dahil dito, ang dalawang awk command ay nagbibigay lamang ng tinatayang hom/het
indels.

HALIMBAWA


· Easyrun script:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Mga pangunahing utos sa likod ng easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
maq mapa part1.map ref.bfa part1.bfq;
maq mapa part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq assemble cns.cns ref.bfa aln.map;

Gamitin ang maq online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    Phaser
    Phaser
    Ang Phaser ay isang mabilis, libre, at masayang bukas
    source HTML5 game framework na nag-aalok
    WebGL at Canvas rendering sa kabuuan
    desktop at mobile web browser. Mga laro
    pwede maging co...
    I-download ang Phaser
  • 2
    VASSAL Engine
    VASSAL Engine
    Ang VASSAL ay isang game engine para sa paglikha
    mga elektronikong bersyon ng tradisyonal na board
    at mga laro ng card. Nagbibigay ito ng suporta para sa
    pag-render ng piraso ng laro at pakikipag-ugnayan,
    at ...
    I-download ang VASSAL Engine
  • 3
    OpenPDF - Fork ng iText
    OpenPDF - Fork ng iText
    Ang OpenPDF ay isang Java library para sa paglikha
    at pag-edit ng mga PDF file gamit ang LGPL at
    Lisensya ng open source ng MPL. Ang OpenPDF ay ang
    LGPL/MPL open source na kahalili ng iText,
    isang ...
    I-download ang OpenPDF - Fork ng iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - System para sa Automated
    Geoscientific Analyzes - ay isang Geographic
    Information System (GIS) software na may
    napakalawak na kakayahan para sa geodata
    pagproseso at ana...
    I-download ang SAGA GIS
  • 5
    Toolbox para sa Java/JTOpen
    Toolbox para sa Java/JTOpen
    Ang IBM Toolbox para sa Java / JTOpen ay isang
    library ng mga klase ng Java na sumusuporta sa
    client/server at internet programming
    mga modelo sa isang system na tumatakbo sa OS/400,
    i5/OS, o...
    I-download ang Toolbox para sa Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (o D3 para sa Data-Driven Documents)
    ay isang JavaScript library na nagbibigay-daan sa iyo
    upang makabuo ng dynamic, interactive na data
    visualization sa mga web browser. Sa D3
    ikaw...
    I-download ang D3.js
  • Marami pa »

Linux command

Ad