InglesPransesEspanyol

Ad


OnWorks favicon

spidey - Online sa Cloud

Patakbuhin ang spidey sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command spidey na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


spidey - ihanay ang mga sequence ng mRNA sa isang genome

SINOPSIS


spidey [-] [-F N] [-G] [-L N] [-M filename] [-N filename] [-R filename] [-S p.m] [-T N]
[-X] [-a filename] [-c N] [-d] [-e X] [-f X] [-g X] -i filename [-j] [-k filename] [-l N]
-m filename [-n N] [-o STR] [-p N] [-r c/d/m/p/v] [-s] [-t filename] [-u] [-w]

DESCRIPTION


spidey ay isang tool para sa pag-align ng isa o higit pang mga mRNA sequence sa isang ibinigay na genomic sequence.
spidey ay isinulat na may dalawang pangunahing layunin sa isip: makahanap ng magagandang pagkakahanay anuman ang intron
laki; at iwasang malito ng mga kalapit na pseudogene at paralog. Patungo sa una
layunin, spidey gumagamit ng BLAST at Dot View (isa pang lokal na tool sa pag-align) upang mahanap ito
mga pagkakahanay; dahil pareho itong mga lokal na tool sa pag-align, spidey hindi intrinsically
pabor sa mas maikli o mas mahabang intron at walang maximum na laki ng intron. Para makaiwas sa mali
kabilang ang mga exon mula sa mga paralog at pseudogenes, spidey unang tumutukoy sa mga bintana sa genomic
sequence at pagkatapos ay isagawa ang mRNA-to-genomic alignment nang hiwalay sa loob ng bawat window.
Dahil sa paraan ng pagtatayo ng mga bintana, ang mga kalapit na paralog o pseudogenes ay dapat
nasa magkahiwalay na mga bintana at hindi dapat isama sa panghuling spliced ​​alignment.

Pauna mga pagkakahanay at konstruksyon of Genomic bintana
spidey tumatagal bilang input ng isang solong genomic sequence at isang set ng mRNA accessions o FASTA
mga pagkakasunod-sunod. Ang lahat ng pagproseso ay ginagawa ng isang pagkakasunud-sunod ng mRNA sa isang pagkakataon. Ang unang hakbang para sa bawat isa
Ang mRNA sequence ay isang high-stringency BLAST laban sa genomic sequence. Ang mga resultang hit
ay sinusuri upang mahanap ang genomic windows.

Ang mga BLAST alignment ay pinagbukud-bukod ayon sa marka at pagkatapos ay itinalaga sa mga window sa pamamagitan ng isang recursive
function na kumukuha ng unang alignment at pagkatapos ay bumaba sa listahan ng alignment upang mahanap ang lahat
mga alignment na pare-pareho sa una (parehong strand ng mRNA, parehong mRNA at
genomic coordinate ay nonoverlapping at linearly pare-pareho). Sa mga susunod na pass,
ang natitirang mga pagkakahanay ay sinusuri at inilalagay sa sarili nilang hindi magkakapatong,
pare-parehong mga bintana, hanggang sa walang mga alignment na natitira. Depende sa kung gaano karaming mga modelo ng gene
ninanais, ang tuktok n Pinipili ang mga bintana upang magpatuloy sa susunod na hakbang at ang iba ay
tinanggal.

Aligning in bawat bintana
Kapag ang genomic windows ay naitayo, ang mga paunang BLAST alignment ay mapapalaya at
isa pang BLAST na paghahanap ang ginagawa, sa pagkakataong ito kasama ang buong mRNA laban sa genomic
rehiyon na tinukoy ng window, at sa isang mas mababang stringency kaysa sa unang paghahanap. spidey
pagkatapos ay gumagamit ng isang matakaw na algorithm upang makabuo ng mataas na pagmamarka, hindi magkakapatong na subset ng
mga pagkakahanay mula sa pangalawang paghahanap sa BLAST. Ang pare-parehong set na ito ay maingat na sinusuri sa
siguraduhin na ang buong sequence ng mRNA ay sakop ng mga alignment. Kapag natagpuan ang mga puwang
sa pagitan ng mga alignment, hinahanap ang naaangkop na rehiyon ng genomic sequence laban sa
nawawalang mRNA, gumamit muna ng napakababang-stringency na BLAST at, kung nabigo ang BLAST na makahanap ng
pindutin, gamit ang mga function ng DotView upang mahanap ang pagkakahanay. Kapag may nakitang gaps sa dulo ng
ang mga alignment, ang BLAST at DotView na mga paghahanap ay talagang pinapayagang lumampas sa
mga hangganan ng bintana. Kung ang 3' dulo ng mRNA ay hindi ganap na nakahanay, ito ay
unang napagmasdan para sa pagkakaroon ng isang poly(A) na buntot. Walang ginawang pagtatangkang ihanay ang
bahagi ng mRNA na tila isang poly(A) na buntot; minsan may poly(A) tail
na nakahanay sa genomic sequence, at ang mga ito ay napapansin dahil ipinapahiwatig nila ang
posibilidad ng isang pseudogene.

Ngayon na ang mRNA ay ganap na sakop ng hanay ng mga pagkakahanay, ang mga hangganan ng
alignment (dapat may isang alignment sa bawat exon ngayon) ay nababagay upang ang
tumpak na magkadikit ang mga alignment at para magkatabi ang mga ito sa magandang splice donor
at mga site ng acceptor. Kadalasan, ang dalawang magkatabing alignment ng exon ay nagsasapawan ng kasing dami
20 o 30 base pairs sa mRNA sequence. Ang tunay na hangganan ng exon ay maaaring nasa kahit saan sa loob
overlap na ito, o (tulad ng nakita natin sa empirikal) kahit ilang base pairs sa labas ng overlap.
Upang iposisyon ang mga hangganan ng exon, ang overlap kasama ang ilang mga pares ng base sa bawat panig ay
sinuri para sa mga site ng splice donor, gamit ang mga function na may iba't ibang splice matrice
depende sa napiling organismo. Ang nangungunang ilang mga site ng splice donor (ayon sa marka) ay pagkatapos
sinusuri kung gaano kalaki ang epekto ng mga ito sa orihinal na mga hangganan ng pagkakahanay. Ang site na
nakakaapekto sa mga hangganan ang pinakamaliit ay pinili, at sinusuri sa pagkakaroon ng isang
site ng acceptor. Ang mga pagkakahanay ay pinutol o pinahaba kung kinakailangan upang sila
wakasan sa lugar ng donor ng splice at upang hindi sila mag-overlap.

Pangwakas resulta
Ang mga bintana ay maingat na sinusuri upang makuha ang porsyento ng pagkakakilanlan sa bawat exon, ang bilang ng
gaps sa bawat exon, ang kabuuang porsyento ng pagkakakilanlan, ang porsyento ng saklaw ng mRNA, pagkakaroon ng
isang aligning o non-aligning poly(A) tail, bilang ng mga splice donor site at ang presensya o
kawalan ng splice donor at acceptor site para sa bawat exon, at ang paglitaw ng isang mRNA
na may 5' o 3' dulo (o pareho) na hindi nakahanay sa genomic sequence. Kung ang
ang kabuuang porsyento ng pagkakakilanlan at porsyento ng haba ng saklaw ay higit sa mga cutoff na tinukoy ng gumagamit, a
Ang ulat ng buod ay naka-print, at, kung hiniling, isang pagkakahanay ng teksto na nagpapakita ng mga pagkakakilanlan at
nai-print din ang mga mismatches.

Interspecies mga pagkakahanay
spidey ay may kakayahang magsagawa ng mga interspecies na pagkakahanay. Ang pangunahing pagkakaiba sa
interspecies alignments ay ang mRNA-genomic na pagkakakilanlan ay hindi magiging malapit sa 100% dahil ito
ay nasa intraspecies alignments; gayundin, ang mga pagkakahanay ay may marami at mahahabang gaps. Kung
spidey ay ginagamit sa normal na mode nito upang gumawa ng mga interspecies na pagkakahanay, ito ay gumagawa ng mga modelo ng gene
na may marami, maraming maiikling exon. Kapag naitakda ang bandila ng interspecies, spidey gumagamit ng iba't ibang
Mga parameter ng BLAST upang hikayatin ang mas mahaba at mas maraming gaps at upang hindi maparusahan nang kasingbigat
hindi pagkakatugma. Sa ganitong paraan, ang mga alignment para sa mga exon ay mas mahaba at mas malapit
tantiyahin ang aktwal na istraktura ng gene.

Extracting CD mga pagkakahanay
Kailan spidey ay tumatakbo sa network-aware mode o kapag ang mga ASN.1 file ay ginagamit para sa mRNA
records, ito ay may kakayahang kumuha ng CDS alignment mula sa mRNA alignment at printing
ang impormasyon ng CDS din. Dahil ang CDS alignment ay isang subset lamang ng mRNA alignment,
medyo diretsong putulin ang mga pagkakahanay ng exon kung kinakailangan at sa
bumuo ng CDS alignment. Higit pa rito, ang mga hindi naisalin na rehiyon ay tinukoy na ngayon, kaya ang
kinakalkula din ang porsyento ng pagkakakilanlan para sa 5' at 3' na hindi naisaling mga rehiyon.

Opsyon


Ang isang buod ng mga opsyon ay kasama sa ibaba.

- I-print ang mensahe ng paggamit.

-F N Simula ng genomic interval na nais (mula sa; 0-based).

-G Ang input file ay isang listahan ng GI.

-L N Ang sobrang laki ng intron na gagamitin (default = 220000).

-M filename
File na may donor splice matrix.

-N filename
File na may acceptor splice matrix.

-R filename
File (kabilang ang path) para ulitin ang blast database para sa pag-filter.

-S p.m Limitahan sa plus (p) o minus (m) strand ng genomic sequence.

-T N Paghinto ng genomic interval na nais (sa; 0-based).

-X Gumamit ng napakalaking laki ng intron (tinataas ang limitasyon para sa mga inisyal at terminal na intron
mula 100kb hanggang 240kb at para sa lahat ng iba pa mula 35kb hanggang 120kb); maaaring magresulta sa
makabuluhang mas mahabang oras ng pag-compute.

-a filename
Output file para sa mga alignment kapag nakadirekta sa isang hiwalay na file na may -p 3 (default =
spidey.aln).

-c N Cutoff ng pagkakakilanlan, sa porsyento, para sa mga layunin ng kontrol sa kalidad.

-d Subukan din na ihanay ang mga pagkakasunud-sunod ng coding na tumutugma sa ibinigay na mga tala ng mRNA (maaaring
nangangailangan ng access sa network).

-e X First-pass e-value (default = 1.0e-10). Ang mas mataas na halaga ay nagpapataas ng bilis sa halaga
ng pagiging sensitibo.

-f X Second-pass e-value (default = 0.001).

-g X Third-pass na e-value (default = 10).

-i filename
Input file na naglalaman ng genomic sequence sa ASN.1 o FASTA na format. Kung ang iyong
Ang computer ay tumatakbo sa isang network na maaaring ma-access ang GenBank, maaari mong palitan ang
gustong accession number para sa filename.

-j I-print ang pagkakahanay ng ASN.1?

-k filename
File para sa ASN.1 na output na may -k (default = spidey.asn).

-l N Haba ng coverage cutoff, sa porsyento.

-m filename
Input file na naglalaman ng (mga) sequence ng mRNA sa ASN.1 o FASTA na format, o isang listahan ng
kanilang mga pagpasok (kasama ang -G). Kung ang iyong computer ay tumatakbo sa isang network na maaari
ma-access ang GenBank, maaari mong palitan ang isang solong accession number para sa filename.

-n N Bilang ng mga modelo ng gene na ibabalik sa bawat input mRNA (default = 1).

-o STR Pangunahing output file (default = stdout; mga nilalaman na kinokontrol ng -p).

-p N Print alignment?
0 buod at pagkakahanay nang magkasama (default)
1 summary lang
2 mga alignment lang
3 buod at pagkakahanay sa iba't ibang mga file

-r c/d/m/p/v
Organismo ng genomic sequence, na ginagamit upang matukoy ang mga splice matrice.
c C. elegans
d Drosophila
m Dictyostelium discoideum
p halaman
v vertebrate (default)

-s Tune para sa mga interspecies alignment.

-t filename
File na may feature table, sa 4 na tab-delimited na column:
seqid (halimbawa, NM_04377.1)
pangalan (lamang paulit-ulit na_rehiyon ay kasalukuyang sinusuportahan)
simula (0-based)
itigil (0-based)

-u Gumawa ng maraming alignment ng lahat ng input mRNAs (na dapat mag-overlap sa genomic
pagkakasunod-sunod).

-w Isaalang-alang ang mga maliliit na character sa input na mga sequence ng FASTA na naka-mask.

Gumamit ng spidey online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    mabusising paglilinis
    mabusising paglilinis
    Isang Kotlin script na binubuo ng lahat ng nukes
    mga cache mula sa mga proyekto ng Gradle/Android.
    Kapaki-pakinabang kapag hinahayaan ka ng Gradle o ng IDE
    pababa. Ang script ay nasubok sa
    macOS, ngunit ...
    I-download ang deep-clean
  • 2
    Eclipse Checkstyle Plug-in
    Eclipse Checkstyle Plug-in
    Ang Eclipse Checkstyle plug-in
    isinasama ang Checkstyle Java code
    auditor sa Eclipse IDE. Ang
    Ang plug-in ay nagbibigay ng real-time na feedback sa
    ang gumagamit tungkol sa viol...
    I-download ang Eclipse Checkstyle Plug-in
  • 3
    AstroOrzPlayer
    AstroOrzPlayer
    Ang AstroOrz Player ay isang libreng media player
    software, bahagi batay sa WMP at VLC. Ang
    ang player ay nasa isang minimalist na istilo, na may
    higit sa sampung kulay ng tema, at maaari rin
    b ...
    I-download ang AstroOrzPlayer
  • 4
    movistartv
    movistartv
    Ang Kodi Movistar+ TV ay isang ADDON para sa XBMC/
    Kodi que permite disponer de un
    decodificador de los servicios IPTV de
    Movistar integrado en uno de los
    mga mediacenter ma...
    I-download ang movistartv
  • 5
    Code :: Mga Pag-block
    Code :: Mga Pag-block
    Code::Blocks ay isang libre, open-source,
    cross-platform C, C++ at Fortran IDE
    binuo upang matugunan ang pinaka-hinihingi na mga pangangailangan
    ng mga gumagamit nito. Ito ay dinisenyo upang maging napaka
    mga extension...
    I-download ang Code::Blocks
  • 6
    Sa gitna
    Sa gitna
    Sa gitna o Advanced na Minecraft Interface
    at ang Pagsubaybay sa Data/Istruktura ay isang kasangkapan upang
    magpakita ng pangkalahatang-ideya ng isang Minecraft
    mundo, nang hindi aktwal na nilikha ito. Ito
    pwede...
    I-download sa gitna
  • Marami pa »

Linux command

Ad