InglesPransesEspanyol

Ad


OnWorks favicon

ipdSummary - Online sa Cloud

Patakbuhin ang ipdSummary sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na ipdSummary na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


ipdSummary - I-detect ang mga base-modification ng DNA mula sa mga kinetic signature.

DESCRIPTION


Ang kineticsTool ay naglo-load ng mga IPD na naobserbahan sa bawat posisyon sa genome, at inihahambing ang mga IPD na iyon
sa halagang inaasahan para sa hindi nabagong DNA, at naglalabas ng resulta ng istatistikal na pagsubok na ito.
Ang inaasahang halaga ng IPD para sa hindi nabagong DNA ay maaaring magmula sa alinman sa isang sa silico kontrol o isang
amplified kontrol. Ang in silico control ay sinanay ng PacBio at ipinadala kasama ng
pakete. Hinuhulaan nito ang mga hula sa IPD gamit ang konteksto ng lokal na sequence sa paligid ng kasalukuyang
posisyon. Ang isang amplified control dataset ay nabuo sa pamamagitan ng sequencing ng hindi nabagong DNA gamit ang
parehong pagkakasunud-sunod ng sample ng pagsubok. Ang isang amplified control sample ay karaniwang nabubuo ng
buong-genome amplification ng orihinal na sample.

Pagbabago Paniniktik
Ang pangunahing mode ng kineticsTools ay gumagawa ng independiyenteng paghahambing ng mga IPD sa bawat posisyon sa
genome, para sa bawat strand, at naglalabas ng iba't ibang istatistika sa CSV at GFF (pagkatapos mag-apply ng
filter ng kahalagahan).

Mga kaunting pagbabago Pagkakakilanlan
kineticsTools Rin ay a Pagbabago Pagkakakilanlan paraan na maaari mabasa multi-site IPD
'mga fingerprint' sa a binawasan itakda of tawag of tiyak mga pagbabago ito tampok ay ang
sumusunod benepisyo:

· Iba't ibang pagbabagong nagaganap sa parehong base ay maaaring makilala (para sa
halimbawa m5C at m4C)

· Ang signal mula sa isang pagbabago ay pinagsama sa isang istatistika, pagpapabuti
sensitivity, pag-alis ng mga dagdag na peak, at wastong pagsentro sa tawag

Opsyon


Mangyaring tawagan ang programang ito kasama ang - Tumulong upang makita ang mga magagamit na pagpipilian.

ALGORITMO


Sintetiko Kontrolin
Ang mga pag-aaral ng kaugnayan sa pagitan ng IPD at konteksto ng pagkakasunud-sunod ay nagpapakita na karamihan sa mga
Ang pagkakaiba-iba sa ibig sabihin ng IPD sa isang genome ay maaaring mahulaan mula sa isang 12-base sequence na konteksto
nakapalibot sa aktibong site ng DNA polymerase. Ang mga hangganan ng nauugnay na konteksto
window ay tumutugma sa window ng DNA na nakikipag-ugnayan sa polymerase, tulad ng nakikita sa
Mga istrukturang kristal ng DNA/polymerase. Upang gawing simple ang proseso ng paghahanap ng mga pagbabago sa DNA
gamit ang data ng PacBio, ang tool ay may kasamang pre-trained lookup table na pagmamapa ng 12-mer DNA
mga pagkakasunud-sunod sa ibig sabihin ng mga IPD na naobserbahan sa kimika ng C2.

Pagsasala at Pagbugso
Ginagamit ng kineticsTools ang Mapping QV na nabuo ng BLASR at naka-store sa cmp.h5 file upang
huwag pansinin ang mga nabasa na hindi kumpiyansa na nakamapa. Ang default na minimum Mapping QV na kinakailangan ay
10, na nagpapahiwatig na mayroon ang BLASR 90\% kumpiyansa na tama ang pagkakamapa ng binasa. Dahil sa
ang hanay ng mga readlength na likas sa PacBio dataMaaari itong baguhin sa paggamit ng
--mapQvThreshold command line argument, o sa pamamagitan ng SMRTPortal configuration dialog para sa
Pagtukoy sa Pagbabago.

Mayroong ilang mga tampok ng data ng PacBio na nangangailangan ng espesyal na atensyon upang makamit
mahusay na pagganap ng pagtuklas ng pagbabago. Sinusuri ng kineticsTools ang pagkakahanay sa pagitan ng
naobserbahang mga base at ang pagkakasunud-sunod ng sanggunian -- upang maging ang pagsukat ng IPD
kasama sa pagsusuri, ang PacBio read sequence ay dapat tumugma sa reference sequence para sa k
sa paligid ng cognate base. Sa kasalukuyang modyul k = 1 Ang pamamahagi ng IPD sa ilang lugar ay
naisip bilang isang halo sa pagitan ng 'normal' na proseso ng pagsasama ng IPD, na sensitibo
sa konteksto ng lokal na pagkakasunud-sunod at mga pagbabago sa DNA at isang nakakahawa na proseso ng 'pause'
IPD na may mas matagal na tagal (mean >10x na mas mahaba kaysa sa normal), ngunit bihira itong mangyari
(~1% ng mga IPD). Tandaan: Ang aming kasalukuyang pag-unawa ay ang mga pag-pause ay hindi nagdadala ng kapaki-pakinabang
impormasyon tungkol sa estado ng methylation ng DNA, gayunpaman ang isang mas maingat na pagsusuri ay maaaring
ginagarantiyahan. Tandaan din na ang mga pagbabago na lubhang nagpapataas ng Humigit-kumulang 1% ng
ang mga naobserbahang IPD ay nabuo sa pamamagitan ng mga kaganapan sa pag-pause. Inobserbahan ni Capping ang mga IPD sa pandaigdigang ika-99
percentile ay motivated sa pamamagitan ng teorya mula sa matatag na pagsubok hypothesis. Ilang mga konteksto ng pagkakasunud-sunod
maaaring may natural na mas mahahabang IPD, upang maiwasan ang pag-cap ng masyadong maraming data sa mga kontekstong iyon, ang cap
ang threshold ay inaayos sa bawat konteksto tulad ng sumusunod: capThreshold = max(global99,
5*modelPrediction, percentile(ipdObservations, 75))

Estatistiko Pagsubok
Sinusubukan namin ang hypothesis na ang mga IPD na naobserbahan sa isang partikular na locus sa sample ay may a
mas matagal kaysa sa mga IPD na naobserbahan sa parehong locus sa hindi binagong DNA. Kung nakabuo tayo
isang Whole Genome Amplified dataset, na nag-aalis ng mga pagbabago sa DNA, gumagamit kami ng case-control,
dalawang-sample na t-test. Nagbibigay din ang tool na ito ng pre-calibrated na 'synthetic control' na modelo
na hinuhulaan ang hindi nabagong IPD, na binigyan ng 12 base sequence na konteksto. Sa gawa ng tao
control case gumagamit kami ng one-sample na t-test, na may pagsasaayos para i-account ang error sa
modelo ng sintetikong kontrol.

MGA INPUT


aligned_reads.cmp.h5
Ang isang karaniwang cmp.h5 file ay naglalaman ng mga alignment at ang impormasyon ng IPD ay nagbibigay ng kinetic data
ginagamit upang magsagawa ng pagtuklas ng pagbabago. Ang karaniwang cmp.h5 file ng isang SMRTportal na trabaho ay
data/aligned_read.cmp.h5.

Sanggunian Pagkakasunud-sunod
Ang tool ay nangangailangan ng reference sequence na ginamit upang magsagawa ng mga alignment. Sa kasalukuyan ito ay dapat
ay ibibigay sa pamamagitan ng landas patungo sa isang entry sa repositoryo ng sanggunian ng SMRTportal.

Output


Ang tool sa pagtukoy ng pagbabago ay nagbibigay ng mga resulta sa iba't ibang mga format na angkop para sa
malalim na pagsusuri sa istatistika, mabilis na sanggunian, at pagkonsumo ng mga tool sa visualization
tulad ng PacBio SMRTView. Karaniwang ini-index ang mga resulta ayon sa posisyon ng sanggunian at
reference strand. Sa lahat ng kaso ang strand value ay tumutukoy sa strand na nagdadala ng
pagbabago sa sample ng DNA. Tandaan na ang kinetic effect ng pagbabago ay
naobserbahan sa mga read sequence na nakahanay sa kabaligtaran na strand. Kaya nagbabasa ng paghahanay sa
positive strand ay nagdadala ng impormasyon tungkol sa pagbabago sa negatibong strand at vice
versa, ngunit sa toolkit na ito palagi naming iniuulat ang strand na naglalaman ng putative
pagbabago.

modifications.csv
Ang modifications.csv file ay naglalaman ng isang row para sa bawat (reference na posisyon, strand) na pares
na lumabas sa dataset na may saklaw ng hindi bababa sa x. x default sa 3, ngunit ay
maaaring i-configure gamit ang flag na '--minCoverage' sa ipdSummary.py. Ang index ng reference na posisyon ay
1-based para sa compatibility sa gff file sa R ​​environment.

Pagbubuhos haligi
sa silico kontrol paraan

┌────────────────┬──────────────────────────────── ──┐
│Haligi │ Paglalarawan │
├────────────────┼──────────────────────────────── ──┤
│refId │ reference sequence ID nitong │
│ │ pagmamasid │
├────────────────┼──────────────────────────────── ──┤
│tpl │ 1-based na posisyon ng template │
├────────────────┼──────────────────────────────── ──┤
│strand │ native sample strand kung saan │
│ │ kinetics ay nabuo. Ang '0' ay │
│ │ ang strand ng orihinal │
│ │ FASTA, '1' ay nasa tapat ng strand │
│ │ mula sa FASTA │
├────────────────┼──────────────────────────────── ──┤
│base │ ang cognate base dito │
│ │ posisyon sa reference │
├────────────────┼──────────────────────────────── ──┤
│iskor │ Phred-transformed pvalue na isang │
│ │ umiiral ang kinetic deviation dito │
│ │ posisyon │
└────────────────┴──────────────────────────────── ──┘

│tMean │ nalimitahan na mean ng mga normalized na IPD │
│ │ naobserbahan sa posisyong ito │
├────────────────┼──────────────────────────────── ──┤
│tErr │ nilimitahan ang karaniwang error ng │
│ │ na-normalize na mga IPD na naobserbahan dito │
│ │ posisyon (standard deviation / │
│ │ sqrt(saklaw) │
├────────────────┼──────────────────────────────── ──┤
│modelPrediction │ normalized ang ibig sabihin ng IPD na hinulaang ng │
│ │ ang synthetic control model para sa │
│ │ konteksto ng sequence na ito │
├────────────────┼──────────────────────────────── ──┤
│ipdRatio │ tMean / modelPrediction │
├────────────────┼──────────────────────────────── ──┤
│saklaw │ bilang ng mga balidong IPD dito │
│ │ posisyon (tingnan ang seksyon ng Pag-filter │
│ │ para sa mga detalye) │
├────────────────┼──────────────────────────────── ──┤
│frac │ pagtatantya ng fraction ng │
│ │ mga molekula na nagdadala ng │
│ │ pagbabago │
├────────────────┼──────────────────────────────── ──┤
│fracLow │ 2.5% confidence bound ng frac │
│ │ tantiya │
├────────────────┼──────────────────────────────── ──┤
│fracUpp │ 97.5% confidence bound ng frac │
│ │ tantiya │
└────────────────┴──────────────────────────────── ──┘

case-control paraan

┌────────────────┬──────────────────────────────── ──┐
│Haligi │ Paglalarawan │
├────────────────┼──────────────────────────────── ──┤
│refId │ reference sequence ID nitong │
│ │ pagmamasid │
├────────────────┼──────────────────────────────── ──┤
│tpl │ 1-based na posisyon ng template │
├────────────────┼──────────────────────────────── ──┤
│strand │ native sample strand kung saan │
│ │ kinetics ay nabuo. Ang '0' ay │
│ │ ang strand ng orihinal │
│ │ FASTA, '1' ay nasa tapat ng strand │
│ │ mula sa FASTA │
├────────────────┼──────────────────────────────── ──┤
│base │ ang cognate base dito │
│ │ posisyon sa reference │
├────────────────┼──────────────────────────────── ──┤
│iskor │ Phred-transformed pvalue na isang │
│ │ umiiral ang kinetic deviation dito │
│ │ posisyon │
├────────────────┼──────────────────────────────── ──┤
│caseMean │ ibig sabihin ng normalized case IPDs │
│ │ naobserbahan sa posisyong ito │
├────────────────┼──────────────────────────────── ──┤
│controlMean │ ibig sabihin ng normalized control IPDs │
│ │ naobserbahan sa posisyong ito │
├────────────────┼──────────────────────────────── ──┤
│caseStd │ karaniwang paglihis ng mga case IPD │
│ │ naobserbahan sa posisyong ito │
├────────────────┼──────────────────────────────── ──┤
│controlStd │ karaniwang paglihis ng kontrol │
│ │ Naobserbahan ang mga IPD sa posisyong ito │
└────────────────┴──────────────────────────────── ──┘

│ipdRatio │ tMean / modelPrediction │
├────────────────┼──────────────────────────────── ──┤
│testStatistic │ t-test statistic │
├────────────────┼──────────────────────────────── ──┤
│saklaw │ ibig sabihin ng kaso at kontrol │
│ │ saklaw │
├────────────────┼──────────────────────────────── ──┤
│controlCoverage │ bilang ng mga valid na control IPD sa │
│ │ posisyong ito (tingnan ang Pag-filter │
│ │ seksyon para sa mga detalye) │
├────────────────┼──────────────────────────────── ──┤
│caseCoverage │ bilang ng mga valid na case IPD dito │
│ │ posisyon (tingnan ang seksyon ng Pag-filter │
│ │ para sa mga detalye) │
└────────────────┴──────────────────────────────── ──┘

pagbabago.gff
Ang modifications.gff ay sumusunod sa GFF Version 3 na detalye (‐
http://www.sequenceontology.org/gff3.shtml). Ang bawat posisyon ng template / strand pair na kung saan
Ang p-value ay lumampas sa pvalue threshold na lumalabas bilang isang row. Ang posisyon ng template ay 1-based,
ayon sa spec ng GFF. Ang strand column ay tumutukoy sa strand na nagdadala ng nakita
pagbabago, na kung saan ay ang kabaligtaran na strand mula sa mga ginamit upang makita ang pagbabago. Ang
Ang column ng kumpiyansa ng GFF ay isang Phred-transformed pvalue ng detection.

nota on genome browser pagkakatugma

Ang modifications.gff file ay hindi gagana nang direkta sa karamihan ng mga genome browser. gagawin mo
malamang na kailangang gumawa ng kopya ng GFF file at i-convert ang _seqid_ column mula sa
generic na 'ref0000x' na mga pangalan na nabuo ng PacBio, sa mga FASTA header na nasa orihinal
reference FASTA file. Ang mapping table ay nakasulat sa header ng modifications.gff
file sa #sequence-header mga tag. Ang isyung ito ay malulutas sa 1.4 na paglabas ng
kineticsTools.

Ang auxiliary data column ng GFF file ay naglalaman ng iba pang mga istatistika na maaaring maging kapaki-pakinabang
downstream analysis o pagsala. Sa partikular ang antas ng saklaw ng mga nabasa na ginamit noon
tumawag, at +/- 20bp sequence context na nakapalibot sa site.

.
│Haligi │ Paglalarawan │
├───────────┼─────────────────┼─────────────────——․
│seqid │ Fasta contig name │
├───────────┼─────────────────┼─────────────────——․
│pinagmulan │ Pangalan ng tool -- 'kinModCall' │
├───────────┼─────────────────┼─────────────────——․
│uri │ Uri ng pagbabago -- sa │
│ │ identification mode ito ay magiging │
│ │ m6A, m4C, o m5C para sa natukoy na │
│ │ base, o ang generic na tag │
│ │ 'modified_base' kung isang kinetic │
│ │ kaganapan ay nakita na hindi │
│ │ tumugma sa isang kilalang pagbabago │
│ │ lagda │
├───────────┼─────────────────┼─────────────────——․
│simula │ Posisyon ng pagbabago sa contig │
├───────────┼─────────────────┼─────────────────——․
│end │ Posisyon ng pagbabago sa contig │
├───────────┼─────────────────┼─────────────────——․
│score │ Binago ni Phred ang p-value ng │
│ │ detection - ito ang │
│ │ single-site detection p-value │
├───────────┼─────────────────┼─────────────────——․
│strand │ Sample strand na naglalaman ng │
│ │ pagbabago │
.

│phase │ Hindi naaangkop │
├───────────┼─────────────────┼─────────────────——․
│mga katangian │ Mga karagdagang field na nauugnay sa base │
│ │ mga mod. Ang IPDRatio ay tradisyonal │
│ │ IPDRatio, ang konteksto ay ang │
│ │ reference sequence -20bp hanggang │
│ │ +20bp sa paligid ng pagbabago, │
│ │ at ang antas ng saklaw ay ang numero │
│ │ ng mga obserbasyon sa IPD na ginamit pagkatapos ng │
│ │ Pagmamapa ng QV filtering at │
│ │ pagsala ng katumpakan. Kung ang hilera │
│ │ resulta mula sa isang natukoy na │
│ │ pagbabago kasama rin namin ang isang │
│ │ identificationQv tag na may │
│ │ mula sa pagbabago │
│ │ pamamaraan ng pagkakakilanlan. │
│ │ identificationQv ay ang │
│ │ phred-transformed na posibilidad ng │
│ │ isang maling pagkakakilanlan, para sa │
│ │ base na natukoy bilang │
│ │ pagkakaroon ng partikular na │
│ │ pagbabago. frac, fracLow, │
│ │ fracUp ang tinantyang │
│ │ fraction ng mga molecule na nagdadala ng │
│ │ ang pagbabago, at ang 5% │
│ │ mga pagitan ng kumpiyansa ng │
│ │ tantiya. Ang methylated │
│ │ pagtatantya ng fraction ay isang │
│ │ beta-level na feature, at dapat │
│ │ gamitin lamang para sa eksplorasyon │
│ │ layunin. │
.

motifs.gff
Kung tatakbo ang tool na Motif Finder, bubuo ito ng motifs.gff, na isang reprocessed na bersyon
ng modifications.gff na may mga sumusunod na pagbabago. Kung may nakitang pagbabago sa a
motif na nakita ng motif finder, ang pagbabago ay nilagyan ng anotasyon ng motif data. An
Ang attribute na 'motif' ay idinagdag na naglalaman ng motif string, at isang attribute na 'id' ay idinagdag
na naglalaman ng motif id, na siyang motif string para sa hindi magkapares na motif o
'motifString1/motifString2' para sa mga nakapares na motif. Kung mayroong instance ng motif sa genome,
ngunit hindi nakita sa modifications.gff, may idinagdag na entry sa motifs.gff, na nagsasaad ng
presensya ng motif na iyon at ang kinetics na naobserbahan sa site na iyon.

motif_summary.csv
Kung ang Motif Finder tool ay pinapatakbo, ang motif_summary.csv ay nabuo, na nagbubuod sa binagong
mga motif na natuklasan ng tool. Ang CSV ay naglalaman ng isang row sa bawat nakitang motif, na may
sumusunod na mga hanay

┌───────────────────┬───────────────────────────── ─────┐
│Haligi │ Paglalarawan │
├───────────────────┼───────────────────────────── ─────┤
│motifString │ Natukoy na motif sequence │
├───────────────────┼───────────────────────────── ─────┤
│centerPos │ Posisyon sa motif ng │
│ │ pagbabago (0-based) │
├───────────────────┼───────────────────────────── ─────┤
│fraction │ Fraction ng mga pagkakataon nito │
│ │ motif na may pagbabago sa QV sa itaas │
│ │ ang QV threshold │
├───────────────────┼───────────────────────────── ─────┤
│nNatukoy │ Bilang ng mga pagkakataon nito │
│ │ motif na may mas mataas na threshold │
└───────────────────┴───────────────────────────── ─────┘

│nGenome │ Bilang ng mga pagkakataon nito │
│ │ motif sa reference sequence │
├───────────────────┼───────────────────────────── ─────┤
│groupTag │ Isang string na nagpapakilala sa motif │
│ │ pagpapangkat. Para sa magkapares na motif ito │
│ │ ay │
│ │" / ", │
│ │ Para sa mga hindi magkapares na motif ito ay katumbas ng │
│ │ motifString │
├───────────────────┼───────────────────────────── ─────┤
│partnerMotifString │ motifString ng nakapares na motif │
│ │ (motif na may │
│ │ reverse-complementary │
│ │ motifString) │
├───────────────────┼───────────────────────────── ─────┤
│meanScore │ Mean Modification Qv ng nakitang │
│ │ mga pagkakataon │
├───────────────────┼───────────────────────────── ─────┤
│meanIpdRatio │ Mean IPD ratio ng nakitang │
│ │ mga pagkakataon │
├───────────────────┼───────────────────────────── ─────┤
│meanCoverage │ Mean coverage ng nakitang │
│ │ mga pagkakataon │
├───────────────────┼───────────────────────────── ─────┤
│objectiveScore │ Layunin na marka ng motif na ito sa │
│ │ ang motif finder algorithm │
└───────────────────┴───────────────────────────── ─────┘

Gumamit ng ipdSummary online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    OfficeFloor
    OfficeFloor
    Nagbibigay ang OfficeFloor ng inversion ng
    kontrol ng pagkabit, kasama ang: - dependency
    iniksyon - pagpapatuloy ng iniksyon -
    thread injection Para sa karagdagang impormasyon
    bisitahin ang...
    I-download ang OfficeFloor
  • 2
    DivKit
    DivKit
    Ang DivKit ay isang open source na Server-Driven
    Framework ng UI (SDUI). Pinapayagan ka nitong
    ilunsad ang mga update mula sa server sa
    iba't ibang bersyon ng app. Gayundin, maaari itong maging
    ginagamit para...
    I-download ang DivKit
  • 3
    subconverter
    subconverter
    Utility upang i-convert sa pagitan ng iba't-ibang
    format ng subscription. Mga gumagamit ng Shadowrocket
    dapat gumamit ng ss, ssr o v2ray bilang target.
    Maaari mong idagdag ang &remark= sa
    Telegram-like na HT...
    I-download ang subconverter
  • 4
    SWASH
    SWASH
    Ang SWASH ay isang pangkalahatang layunin na numero
    tool para sa pagtulad sa hindi matatag,
    non-hydrostatic, free-surface,
    rotational flow at transport phenomena
    sa tubig sa baybayin bilang ...
    I-download ang SWASH
  • 5
    VBA-M (Naka-archive - Ngayon sa Github)
    VBA-M (Naka-archive - Ngayon sa Github)
    Lumipat ang proyekto sa
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Mga Tampok:Paglikha ng cheatsave statesmulti
    system, sumusuporta sa gba, gbc, gb, sgb,
    sgb2Tu...
    I-download ang VBA-M (Naka-archive - Ngayon sa Github)
  • 6
    Stacer
    Stacer
    Linux System Optimizer at Pagsubaybay
    Github Repository:
    https://github.com/oguzhaninan/Stacer.
    Audience: Mga End User/Desktop. Gumagamit
    interface: Qt. Programming La...
    I-download ang Stacer
  • Marami pa »

Linux command

Ad