InglesPransesEspanyol

Ad


OnWorks favicon

htseq-count - Online sa Cloud

Magpatakbo ng htseq-count sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na htseq-count na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


htseq-count - Bilangin ang bilang ng mga nabasa sa isang SAM alignment file na nagmamapa sa mga feature ng GFF

Dahil sa isang file na may nakahanay na pagkakasunud-sunod na mga pagbabasa at isang listahan ng mga genomic na tampok, isang karaniwang gawain
ay ang bilangin kung gaano karaming mga reads ang mapa sa bawat feature.

Ang isang tampok dito ay isang agwat (ibig sabihin, isang hanay ng mga posisyon) sa isang chromosome o isang unyon ng
ganoong mga pagitan.

Sa kaso ng RNA-Seq, ang mga tampok ay karaniwang mga gene, kung saan ang bawat gene ay isinasaalang-alang
dito bilang unyon ng lahat ng exon nito. Maaari ding isaalang-alang ng isa ang bawat exon bilang isang tampok, hal, sa
upang suriin para sa alternatibong splicing. Para sa paghahambing na ChIP-Seq, ang mga tampok ay maaaring
nagbubuklod na rehiyon mula sa isang paunang natukoy na listahan.

Ang espesyal na pangangalaga ay dapat gawin upang magpasya kung paano haharapin ang mga nabasa na nagsasapawan ng higit sa isa
tampok Ang htseq-bilang pinapayagan ng script na pumili sa pagitan ng tatlong mga mode. Siyempre, kung wala
sa mga ito ay akma sa iyong mga pangangailangan, maaari kang sumulat ng iyong sariling script gamit ang HTSeq. Tingnan ang kabanata paglilibot
para sa sunud-sunod na gabay kung paano ito gagawin.

Ang tatlong overlap na resolution mode ng htseq-bilang magtrabaho tulad ng sumusunod. Para sa bawat posisyon i in
ang nabasa, isang set S(i) ay tinukoy bilang ang hanay ng lahat ng mga tampok na magkakapatong na posisyon i. Pagkatapos,
isaalang-alang ang set S, na (kasama ang i tumatakbo sa lahat ng posisyon sa loob ng nabasa)

· ang unyon ng lahat ng set S(i) para sa mode unyon.

· ang intersection ng lahat ng set S(i) para sa mode intersection-strict.

· ang intersection ng lahat ng hindi walang laman na set S(i) para sa mode intersection-nonempty.

If S naglalaman ng tiyak na isang tampok, ang nabasa ay binibilang para sa tampok na ito. Kung naglalaman ito
higit sa isang tampok, ang nabasa ay binibilang bilang hindi siguradong (at hindi binibilang sa anuman
mga tampok), at kung S ay walang laman, ang nabasa ay binibilang bilang walang_tampok.

Ang sumusunod na figure ay naglalarawan ng epekto ng tatlong mga mode na ito: [larawan]

PAGGAMIT


Pagkatapos mong mai-install ang HTSeq (tingnan install), maaari kang tumakbo htseq-bilang mula sa utos
linya:

htseq-count [mga opsyon]

Kung ang file htseq-qa ay wala sa iyong landas, maaari mong, bilang kahalili, tawagan ang script gamit ang

python -m HTSeq.scripts.count [mga opsyon]

Ang naglalaman ng mga nakahanay na nabasa sa format na SAM. (Tandaan na ang SAMtools
naglalaman ng mga script ng Perl upang i-convert ang karamihan sa mga format ng pagkakahanay sa SAM.) Tiyaking gumamit ng a
splicing-aware aligner gaya ng TopHat. Ang HTSeq-count ay ganap na gumagamit ng impormasyon sa
ang patlang ng CIGAR.

Upang basahin mula sa karaniwang input, gamitin - as .

Kung mayroon kang paired-end na data, kailangan mong ayusin muna ang SAM file ayon sa read name. (Kung ang iyong
hindi kayang hawakan ng tool sa pag-uuri ang malalaking file, subukan hal. Ruan Jue's msort, makukuha mula sa SOAP
website.)

Ang naglalaman ng mga tampok sa GFF format.

Ang script ay naglalabas ng isang talahanayan na may mga bilang para sa bawat tampok, na sinusundan ng mga espesyal na counter,
na nagbibilang ng mga nabasa na hindi binilang para sa anumang tampok para sa iba't ibang dahilan, katulad ng:

· walang_tampok: mga nabasa na hindi maitalaga sa anumang feature (set S tulad ng inilarawan sa itaas
ay walang laman).

· hindi siguradong: mga nabasa na maaaring italaga sa higit sa isang tampok at samakatuwid ay
hindi binibilang para sa alinman sa mga ito (set S nagkaroon ng mroe kaysa sa isang elemento).

· masyadong_mababa_aQual: mga nabasa na hindi binilang dahil sa -a opsyon, tingnan sa ibaba

· hindi_nakahanay: bumabasa sa SAM file nang walang alignment

· pagkakahanay_hindi_natatangi: nagbabasa nang may higit sa isang naiulat na pagkakahanay. Ang mga babasahin na ito ay
kinikilala mula sa NH opsyonal na SAM field tag. (Kung hindi itinakda ng aligner ang field na ito,
ang multiply aligned reads ay mabibilang ng maraming beses.)

Mahalaga: Ang default para sa strandedness ay oo. Kung ang iyong RNA-Seq data ay hindi pa nagawa
na may strand-specific na protocol, nagiging sanhi ito ng pagkawala ng kalahati ng mga nabasa. Samakatuwid, gumawa
siguradong itakda ang pagpipilian --stranded=hindi maliban kung mayroon kang strand-specific na data!

Options
-m , --mode=
Mode upang mahawakan ang mga pagbabasa na nagsasapawan ng higit sa isang feature. Mga posibleng halaga para sa
ay unyon, intersection-strict at intersection-nonempty (default: unyon)

-s <oo, hindi or baligtarin>, --stranded= hindi or baligtarin>
kung ang data ay mula sa isang strand-specific na assay (default: oo)

Para sa stranded=no, ang isang nabasa ay itinuturing na magkakapatong sa isang tampok anuman ang
kung ito ay nakamapa sa pareho o sa kabaligtaran na strand bilang tampok. Para sa
stranded=yes at single-end reads, ang nabasa ay kailangang imapa sa parehong strand gaya ng
ang tampok. Para sa paired-end reads, ang unang read ay kailangang nasa parehong strand at
ang pangalawa ay binasa sa kabilang strand. Para sa stranded=reverse, ang mga patakarang ito ay
baliktad

-a , --a=
laktawan ang lahat ng mga nabasa na may kalidad ng pagkakahanay na mas mababa kaysa sa ibinigay na minimum na halaga (default:
0)

-t <tampok uri>, --type= uri>
uri ng feature (ika-3 column sa GFF file) na gagamitin, lahat ng feature ng ibang uri ay
hindi pinansin (default, angkop para sa RNA-Seq at Ensemble GTF file: exon)

-i <id katangian>, --idattr= katangian>
GFF attribute na gagamitin bilang feature ID. Ilang linya ng GFF na may parehong feature ID
ay ituturing bilang mga bahagi ng parehong tampok. Ginagamit ang feature ID sa pagkakakilanlan
ang mga bilang sa talahanayan ng output. Ang default, na angkop para sa RNA-SEq at Ensembl GTF
mga file, ay gene_id.

-o , --samout=
isulat ang lahat ng SAM alignment records sa isang output SAM file na tinatawag ,
pag-annotate sa bawat linya kasama ang pagtatalaga nito sa isang feature o isang espesyal na counter (bilang isang
opsyonal na field na may tag na 'XF')

-q, --tahimik
sugpuin ang ulat ng pag-unlad at mga babala

-h, - Tumulong
Magpakita ng buod ng paggamit at lumabas

Gumamit ng htseq-count online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad