InglesPransesEspanyol

Ad


OnWorks favicon

blasr - Online sa Cloud

Patakbuhin ang blasr sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command blasr na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


blasr - Map SMRT Sequences sa isang reference genome.

SINOPSIS


blasr nagbabasa.bam genome.fasta -bam -labas out.bam

blasr nagbabasa.fasta genome.fasta

blasr nagbabasa.fasta genome.fasta -sa genome.fasta.sa

blasr nagbabasa.bax.h5 genome.fasta [-sa genome.fasta.sa]

blasr nagbabasa.bax.h5 genome.fasta -sa genome.fasta.sa -maxScore -100 -minMatch 15 ...

blasr nagbabasa.bax.h5 genome.fasta -sa genome.fasta.sa -nproc 24 -labas alignment.out ...

DESCRIPTION


blasr ay isang read mapping program na nagmamapa ng mga reads sa mga posisyon sa isang genome sa pamamagitan ng clustering
maikling eksaktong tugma sa pagitan ng nabasa at genome, at mga kumpol ng pagmamarka gamit ang pagkakahanay.
Ang mga tugma ay nabuo sa pamamagitan ng paghahanap sa lahat ng suffix ng isang read laban sa genome gamit ang a
hanay ng suffix. Ginagamit ang mga pandaigdigang paraan ng pag-chain sa pag-iskor ng mga kumpol ng mga laban.

Ang tanging kinakailangang input sa blasr ay isang file ng mga nabasa at isang reference na genome. Ito ay
lubhang kapaki-pakinabang na basahin ang impormasyon sa pag-filter, at maaaring bumaba ang runtime ng pagmamapa
malaki kapag ang isang precomputed suffix array index sa reference sequence ay
tinukoy.

Bagama't ang mga nabasa ay maaaring input sa FASTA na format, ang inirerekomendang input ay PacBio BAM file
dahil naglalaman ang mga ito ng qualtiy value na impormasyon na ginagamit sa alignment at produces
mas mataas na kalidad na pagtuklas ng variant. Bagama't maaaring i-output ang mga alignment sa iba't ibang format,
ang inirerekomendang format ng output ay PacBio BAM. Magiging suporta para sa bax.h5 at plx.h5 na mga file
DEPRECATE NA. Ang suporta para sa mga talahanayan ng rehiyon para sa mga h5 na file ay magiging DEPRECATE NA.

Kapag ang suffix array index ng isang genome ay hindi tinukoy, ang suffix array ay binuo bago
paggawa ng pagkakahanay. Ito ay maaaring napakabagal kapag ang genome ay malaki (hal. Tao).
Pinakamainam na i-precompute ang suffix array ng isang genome gamit ang program sawriter(1), at
pagkatapos ay tukuyin ang suffix array sa command line gamit ang -sa genome.fa.sa.

Ang mga opsyonal na parameter ay halos nahahati sa tatlong kategorya: kontrol sa pag-angkla,
alignment scoring, at output.

Ang mga default na parameter ng pag-angkla ay pinakamainam para sa maliliit na genome at sample na may hanggang 5%
divergence mula sa reference genome. Ang pangunahing parameter na namamahala sa bilis at sensitivity
ay ang -minMatch parameter. Para sa mga alignment ng genome ng tao, ang halaga na 11 o mas mataas ay
inirerekomenda. Maraming mga paraan ang maaaring gamitin upang mapabilis ang mga pagkakahanay, sa gastos ng
posibleng bumababa ng sensitivity.

Ang mga rehiyon na masyadong paulit-ulit ay maaaring balewalain sa panahon ng pagmamapa sa pamamagitan ng paglilimita sa bilang ng
posisyon ng isang basahin ang mga mapa sa may -maxAnchorsPerPosition opsyon. Mga halaga sa pagitan ng 500 at
1000 ay epektibo sa genome ng tao.

Para sa maliliit na genome gaya ng bacterial genome o BAC, sapat na ang mga default na parameter
para sa pinakamataas na sensitivity at mahusay na bilis.

Opsyon


input File

Binabasa

nagbabasa.bam
Isang PacBio BAM file ng mga nabasa. Ito ang ginustong input sa blasr
dahil mayamang kalidad na halaga (insertion, deletion, at substitution
mga halaga ng kalidad) pinapanatili ang impormasyon. Ang sobrang kalidad
pinapabuti ng impormasyon ang pagtuklas ng variant at bilis ng pagmamapa.

nagbabasa.fasta
Isang multi-fasta na file ng mga reads, kahit na anumang fasta file ay valid na input

nagbabasa.bax.h5|reads.plx.h5
ang matanda DEPRECATE NA output format ng SMRT reads.

input.fofn
File ng mga pangalan ng file

-sa suffixArrayFile
Gamitin ang suffix array 'sa' para sa pag-detect ng mga tugma sa pagitan ng mga reads at ng
sanggunian. Ang suffix array ay inihanda ng sawriter(1) programa.

-ctab tab
Isang talahanayan ng mga bilang ng tuple na ginagamit upang tantyahin ang kahalagahan ng pagtutugma. Ito ay sa pamamagitan ng
program na 'printTupleCountTable'. Habang mabilis itong makabuo,
kung maraming invocations ng blasr, ito ay kapaki-pakinabang na precompute ang ctab.

-regionTable mesa (DEPRECATE NA)
Magbasa sa isang read-region table sa HDF na format para sa pag-mask ng mga bahagi ng mga nabasa.
Ito ay maaaring isang talahanayan kung mayroon lamang isang input file, o isang fofn. Kailan
isang talahanayan ng rehiyon ay tinukoy, anumang talahanayan ng rehiyon sa loob ng reads.plx.h5 o
binabalewala ang mga reads.bax.h5 file.
(IHINDI NA) Options para Binabago bumabasa.

Mayroong pantulong na impormasyon tungkol sa mga substring ng mga nabasa na nakaimbak sa a
'region table' para sa bawat read file. Dahil ginagamit ang HDF, maaaring ang talahanayan ng rehiyon
bahagi ng .bax.h5 o .plx.h5 file, o isang hiwalay na file. Isang magkasunod na pagbasa
Ang substring mula sa template ay isang subread, at anumang nabasa ay maaaring maglaman ng maramihan
mga subread. Ang mga hangganan ng mga subread ay maaaring mahinuha mula sa talahanayan ng rehiyon
direkta man o sa pamamagitan ng kahulugan ng mga hangganan ng adaptor. Karaniwang mga talahanayan ng rehiyon
naglalaman din ng impormasyon para sa lokasyon ng mataas at mababang kalidad na mga rehiyon ng
nagbabasa. Ang mga pagbabasa na ginawa ng mga huwad na pagbabasa mula sa mga walang laman na ZMW ay may mataas na kalidad ng simula
coordinate na katumbas ng mataas na kalidad na dulo, na ginagawang hindi magagamit na basahin.

-useccs
I-align ang circular consensus sequence (ccs), pagkatapos ay iulat ang mga alignment ng
Nag-subread ang ccs sa window kung saan nakamapa ang ccs. Mga alignment lamang ng
ang mga subread ay iniulat.

-useccsall
Kapareho ng -useccs, maliban sa lahat ng mga subread ay nakahanay, sa halip na ang
mga subread na ginamit para tawagan ang ccs. Isasama rito ang mga babasahin na sumasaklaw lamang sa bahagi
ng template.

-useccsdenovo
Ihanay ang circular consensus, at iulat lamang ang pagkakahanay ng mga cc
pagkakasunod-sunod.

-noSplitSubreads (mali)
Huwag hatiin ang mga subread sa mga adaptor. Ito ay karaniwang kapaki-pakinabang lamang kapag ang
genome sa isang nakabukas na bersyon ng isang kilalang template, at naglalaman ng template-
adapter-reverse_template sequence.

-ignoreRegions (mali)
Huwag pansinin ang anumang impormasyon sa talahanayan ng rehiyon.

-ignoreHQRegions (mali)
Huwag pansinin ang anumang hq na rehiyon sa talahanayan ng rehiyon.
Mga pagkakahanay Upang ulat

-bestn n (10)
Iulat ang tuktok n mga pagkakahanay.

-hitPolicy (lahat)
Tumukoy ng isang patakaran upang tratuhin ang maramihang mga hit mula sa [all, allbest, random,
randombest, pinakakaliwa]

lahat iulat ang lahat ng pagkakahanay.

allbest
iulat ang lahat ng pantay na pagkakahanay sa nangungunang pagmamarka.

walang pili mag-ulat ng random na pagkakahanay.

randombest
mag-ulat ng random na pagkakahanay mula sa maramihang pantay na nangungunang pagmamarka
mga pagkakahanay.

pinakakaliwa
mag-ulat ng alignment na may pinakamahusay na alignmentscore at mayroong
pinakamaliit na mapping coordinate sa anumang sanggunian.

-placeRepeatsRandomly (mali)
DEPRECATE NA! Kung totoo, katumbas ng -hitPolicy randombest.

-randomSeed (0)
Seed para sa random number generator. Bilang default (0), gamitin ang kasalukuyang oras bilang seed.

-noSortRefinedAlignments (mali)
Kapag nabuo at namarkahan ang mga alignment ng kandidato sa pamamagitan ng sparse dynamic
programming, ang mga ito ay nire-rescore gamit ang lokal na pagkakahanay na tumutukoy
iba't ibang mga profile ng error. Maaaring magbago ang resorting batay sa lokal na pagkakahanay
ang pagkakasunud-sunod na ibinalik ang mga hit.

-allowAdjacentIndels
Kapag tinukoy, pinapayagan ang katabing pagpapasok o pagtanggal. kung hindi,
Ang katabing pagpapasok at pagtanggal ay pinagsama sa isang operasyon. Gamit
ang mga halaga ng kalidad upang gabayan ang mga pairwise alignment ay maaaring magdikta na mas mataas
Ang probability alignment ay naglalaman ng mga katabing pagpapasok o pagtanggal. Kasalukuyan
Ang mga tool tulad ng GATK ay hindi pinahihintulutan ito at kaya hindi sila iniuulat ng
default.
Pagbubuhos Format ng at File

-labas Palabas (terminal)
Isulat ang output sa Palabas.

-sam Isulat ang output sa SAM na format.

-m t Kung hindi nagpi-print ng SAM, baguhin ang output ng alignment.

Kailan t ay:

0 Print blast tulad ng output na may |'s connecting matched nucleotides.

1 Mag-print lamang ng buod: puntos at pos.

2 Mag-print sa Compare.xml na format.

3 I-print sa bulgar na format (DEPRECATE NA).

4 Mag-print ng mas mahabang tabular na bersyon ng alignment.

5 Mag-print sa isang machine-parsable na format na binabasa ni
compareSequences.py.

-header
Mag-print ng header bilang unang linya ng output file na naglalarawan sa mga nilalaman
ng bawat hanay.

-titleTable tab (WALA)
Bumuo ng talahanayan ng mga pamagat ng pagkakasunud-sunod ng sanggunian. Ang mga reference sequence ay
enumerated by row, 0,1,... Ang reference index ay naka-print sa alignment
mga resulta sa halip na ang buong reference na pangalan. Ginagawa nitong maigsi ang output,
lalo na kapag mayroong mga pamagat na may salita sa mga reference na pangalan.

-hindi nakahanay file
Mga nabasang output na hindi nakahanay sa file

-pag-clip [wala|mahirap|subread|malambot] (wala)

Gumamit ng no/hard/subread/soft clipping, LAMANG para sa SAM/BAM na output.

-printSAMQV (mali)
I-print ang mga halaga ng kalidad sa output ng SAM.

-cigarUseSeqMatch (mali)
Ang mga string ng CIGAR sa output ng SAM/BAM ay gumagamit ng '=' at 'X' upang kumatawan sa pagkakatugma ng sequence
at mismatch sa halip na 'M'.
Options para angkora pagkakahanay rehiyon.

Ito ay magkakaroon ng pinakamalaking epekto sa bilis at sensitivity.

-minMatch m (12)
Pinakamababang haba ng buto. Ang mas mataas na minMatch ay magpapabilis ng pagkakahanay, ngunit bababa
pagkamapagdamdam.

-maxMatch l (inf)
Ihinto ang pagmamapa ng isang read sa genome kapag umabot na ang lcp length l. Ito ay
kapaki-pakinabang kapag ang query ay bahagi ng sanggunian, halimbawa kapag
pagbuo ng pairwise alignment para sa de novo assembly.

-maxLCPLength l (inf)
Katulad ng -maxMatch.

-maxAnchorsPerPosition m (10000)
Huwag magdagdag ng mga anchor mula sa isang posisyon kung tumutugma ito sa higit sa m lokasyon sa
ang target

-advanceExactMatches E (0)
Isa pang trick para sa pagpapabilis ng mga alignment na may tugma - E mas kaunting mga anchor.
Sa halip na maghanap ng mga anchor sa pagitan ng read at genome sa bawat isa
posisyon sa nabasa, kapag ang isang anchor ay natagpuan sa posisyon i sa isang read ng
haba L, ang susunod na posisyon sa isang read para makahanap ng anchor ay nasa i+LE. Gamitin
ito kapag nag-align ng mga naka-assemble na contigs.

-nMga Kandidato n (10)
Panatilihin hanggang sa n mga kandidato para sa pinakamahusay na pagkakahanay. Isang malaking halaga ng n kalooban
mabagal na pagmamapa dahil ang mas mabagal na dynamic na mga hakbang sa programming ay inilalapat sa
mas maraming kumpol ng mga anchor na maaaring maging hakbang sa paglilimita sa rate kapag ang mga nabasa ay
napakatagal.

-kaayon (mali)
Imapa ang lahat ng subread ng isang zmw (hole) kung saan ang pinakamahabang full pass subread ng
nakahanay ang zmw sa. Kinakailangan nitong gamitin ang talahanayan ng rehiyon at mga hq na rehiyon.
Gumagana lang ang opsyong ito kapag nasa base o pulse h5 na format ang mga nabasa.

-concordantTemplate (mediansubread)
Pumili ng full pass subread ng zmw bilang template para sa concordant mapping.
longestsubread - gamitin ang pinakamahabang full pass subread mediansubread - gamitin ang
median length full pass subread typicalsubread - gamitin ang pangalawang pinakamahabang full
pass subread kung ang haba ng pinakamahabang full pass subread ay outlier

-fastMaxInterval (mali)
Mabilis na paghahanap ng maximum na pagtaas ng mga pagitan bilang mga kandidato sa pagkakahanay. Ang paghahanap
ay hindi kasing kumpleto ng default, ngunit mas mabilis.

-agresiboIntervalCut (mali)
Sumasang-ayon na i-filter ang hindi nangangako na mga kandidato sa pagkakahanay, kung mayroon
kahit isang promising candidate. Kung naka-on ang opsyong ito, blasr is
malamang na balewalain ang mga maikling pagkakahanay ng mga elemento ng ALU.

-fastSDP (mali)
Gumamit ng mabilis na heuristic algorithm upang mapabilis ang kalat-kalat na dynamic na programming.
Options para Pagpapino Hits

-sdpTupleSize K (11)
Gumamit ng mga tugma ng haba K upang mapabilis ang mga dynamic na pagkakahanay ng programming. Ito
kinokontrol ang katumpakan ng pagtatalaga ng mga puwang sa magkapares na pagkakahanay sa sandaling isang pagmamapa
ay natagpuan, sa halip na pagmamapa ng sensitivity mismo.

-scoreMatrix puntos matris pisi
Tumukoy ng alternatibong score matrix para sa pagmamarka ng mga fasta read. Ang matrix ay
sa format

ACGTN
Isang abcde
C fghij
G klmno
T pqrst
N uvwxy

Ang mga halaga a...y ay dapat na input bilang isang naka-quote na space separated string: "abc
... y". Ang mas mababang mga marka ay mas mahusay, kaya ang mga tugma ay dapat na mas mababa kaysa sa mga hindi pagkakatugma
hal a,g,m,s = -5 (tugma), mismatch = 6.

-afineBuksan halaga (10)
Itakda ang parusa para sa pagbubukas ng affine alignment.

-afineExtend a (0)
Baguhin ang affine (extension) gap penalty. Ang mas mababang halaga ay nagbibigay-daan sa mas maraming gaps.
Options para overlap/dynamic programming mga pagkakahanay at magkapares nagsasapawan para de bago
pagpupulong.

-gamitin ang Kalidad (mali)
Gumamit ng mga halaga ng kalidad ng pagpapalit/insertion/pagtanggal/pagsamahin upang makakuha ng gap at
mismatch na mga parusa sa magkapares na pagkakahanay. Dahil ang insertion at
Ang mga rate ng pagtanggal ay mas mataas kaysa sa pagpapalit, ito ay makakagawa ng marami
pinapaboran ng mga alignment ang pagpapasok/pagtanggal kaysa sa pagpapalit.nNaive consensus
Ang mga paraan ng pagtawag ay madalas na makaligtaan ang mga polymorphism ng pagpapalit. Ang pagpipiliang ito
dapat gamitin kapag tumatawag ng consensus gamit ang Quiver method. At saka,
kapag hindi gumagamit ng mga halaga ng kalidad sa mga alignment ng puntos, magkakaroon ng mas mababa
katumpakan ng pinagkasunduan sa mga rehiyon ng homolymer.

-afineAlign (mali)
Pinuhin ang alignment gamit ang affine guided align.
Options para pagsasala bumabasa at mga pagkakahanay

-minReadLength l (50)
Laktawan ang mga pagbabasa na may buong haba na mas mababa sa l. Maaaring mas maikli ang mga subread.

-minSubreadLength l (0)
Huwag ihanay ang mga subread na mas mababa sa haba l.

-minRawSubreadScore m (0)
Huwag ihanay ang mga subread na ang marka ng kalidad sa talahanayan ng rehiyon ay mas mababa sa m
(Ang mga marka ng kalidad ay dapat nasa hanay [0, 1000]).

-maxScore m (-200)
Pinakamataas na marka sa output (mataas ay masama, negatibong mabuti).

-minAlnLength
(0) Mag-ulat lamang ng mga pagkakahanay kung ang kanilang mga haba ay mas malaki kaysa sa minAlnLength.

-minPctSimilarity (0) Mag-ulat lamang ng mga pagkakahanay kung ang kanilang porsyento ay pagkakatulad
mas malaki kaysa sa minPctSimilarity.

-minPctAccuracy
(0) Mag-ulat lamang ng mga pagkakahanay kung ang kanilang porsyento na katumpakan ay mas malaki kaysa sa
minKatumpakan.
Options para pagtularin pagkakahanay

-nproc N (1)
Ihanay gamit N mga proseso. Lahat ng malalaking istruktura ng data gaya ng suffix array
at tuple count table ay ibinabahagi.

-simula S (0)
Index ng unang nabasa upang simulan ang paghahanay. Ito ay kapaki-pakinabang kapag marami
ang mga pagkakataon ay tumatakbo sa parehong data, halimbawa kapag nasa isang multi-rack
kumpol.

-hakbang S (1)
Ihanay ang isang babasahin bawat S bumabasa.
Options para subsampling bumabasa.

-subsample (0)
Proporsyon ng mga nabasa sa random na subsample (ipinahayag bilang isang decimal) at
ihanay.

-holeNumbers LIST
Kapag tinukoy, ihanay lamang ang mga nabasa kung saan ang mga numero ng ZMW hole ay nasa LIST. LIST
ay isang comma-delimited string ng mga hanay, gaya ng '1,2,3,10-13'. Ang pagpipiliang ito
gumagana lang kapag ang mga nabasa ay nasa bam, bax.h5 o plx.h5 na format.

-h Mag-print ng impormasyon ng tulong.

CITATION


Upang banggitin ang BLASR, mangyaring gamitin ang: Chaisson MJ, at Tesler G., Pagma-map ng solong molekula
sequencing reads gamit ang Basic Local Alignment with Successive Refinement (BLASR): Theory
at Application, BMC Bioinformatics 2012, 13:238.

Gamitin ang blasr online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad