InglesPransesEspanyol

Ad


OnWorks favicon

jellyfish - Online sa Cloud

Magpatakbo ng jellyfish sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na jellyfish na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


Ang jellyfish ay isang software upang mabilang ang mga k-mer sa mga pagkakasunud-sunod ng DNA.

SINOPSIS


bilang ng dikya [-ounlapi] [-mmerlength] [-tmga thread] [-slaki ng hash] [--parehong-strands] fasta
[fasta ... ]
sumanib ang dikya hash1 hash2 ...
tambakan ng dikya sumira
mga istatistika ng dikya sumira
dikya histo [-hmataas] [-lmababa] [-ipagtaas] sumira
tanong ng dikya sumira
dikya cite

Plus katumbas na bersyon para sa Quake mode: qhisto, qdump at qmerge.

DESCRIPTION


Ang dikya ay isang k-mer counter batay sa isang multi-threaded hash table na pagpapatupad.

PAG-ISA AT PAGSASANIB
Upang mabilang ang k-mers, gumamit ng command tulad ng:

bilang ng dikya -m 22 -o output -c 3 -s 10000000 -t 32 input.fasta

Bibilangin nito ang 22-mers sa input.fasta na may 32 thread. Ang counter field sa
Ang hash ay gumagamit lamang ng 3 bits at ang hash ay may hindi bababa sa 10 milyong mga entry.

Ang mga output file ay tatawaging output_0, output_1, atbp. (ang prefix ay tinukoy kasama ang
-o lumipat). Kung ang hash ay sapat na malaki (ay tinukoy ng -s switch) upang magkasya sa lahat ng
k-mers, magkakaroon lamang ng isang output file na pinangalanang output_0. Kung napuno ang hash dati
lahat ng mers ay nabasa, ang hash ay itinapon sa disk, na-zero out at nagbabasa sa mers
mga resume. Maramihang mga intermediary file ang makikita sa mga disk, na pinangalanang output_0,
output_1, atbp.

Upang makakuha ng mga tamang resulta mula sa iba pang mga sub-command (gaya ng histo, stats, atbp.), ang
maramihang mga output file, kung mayroon man, ay kailangang isama sa isa gamit ang merge command. Para sa
halimbawa na may sumusunod na utos:

jellyfish merge -o output.jf output\_*

Dapat kang makakuha ng maraming intermediary output file (sabihin ang daan-daan), ang laki ng hash table
sobrang maliit. Muling pagpapatakbo ng Jellyfish na may mas malaking sukat (opsyon -s) ay malamang na mas mabilis kaysa sa
pinagsasama ang lahat ng mga file na tagapamagitan.

ORIENTATION
Kapag hindi alam ang oryentasyon ng mga sequence sa input fasta file, hal
sequencing reads, gamit --parehong-strands (-C) ang pinakamahalaga.

Para sa anumang k-mer m, ang canonical na representasyon nito ay m mismo o ang reverse-complement nito,
alinman ang mauna sa leksikograpiya. Gamit ang opsyon -C, tanging ang canonical
Ang representasyon ng mga mer ay naka-imbak sa hash at ang bilang ng halaga ay ang bilang ng
mga paglitaw ng parehong mer at ang reverse-complement nito.

PUMILI ANG HASH SIZE
Upang makamit ang pinakamahusay na pagganap, isang minimum na bilang ng mga intermediary file ay dapat na nakasulat
sa disk. Kaya ang parameter -s dapat piliin upang magkasya sa maraming k-mer hangga't maaari (sa isip
lahat sila) habang akma pa sa memorya.

Isinasaalang-alang namin ang mga halimbawa: pagbibilang ng mga mer sa sequencing reads at sa isang natapos na genome.

Una, ipagpalagay na binibilang natin ang mga k-mer sa mga maikling sequencing na nabasa: mayroong n nabasa at mayroon
isang average ng 1 error sa bawat pagbabasa kung saan ang bawat error ay bumubuo ng k natatanging mer. Kung ang genome
ang laki ay G, ang laki ng hash (opsyon -s) upang magkasya sa lahat ng k-mer nang sabay-sabay ay tinatantya sa: $(G
+ k*n)/0.8$. Ang paghahati ng 0.8 ay nagbabayad para sa maximum na paggamit na humigit-kumulang $80%$
ng hash table.

Sa kabilang banda, kapag binibilang ang mga k-mers sa isang pinagsama-samang pagkakasunud-sunod ng haba G, ang setting -s
kay G ay angkop.

Bilang isang bagay ng kaginhawaan, naiintindihan ng Jellyfish ang mga ISO suffix para sa laki ng hash.
Kaya't ang '-s 10M' ay nangangahulugang 10 milyong mga entry habang ang '-s 50G' ay kumakatawan sa 50 bilyong mga entry.

Ang aktwal na paggamit ng memory ng hash table ay maaaring kalkulahin bilang sumusunod. Ang aktwal na laki ng
ang hash ay i-round up sa susunod na kapangyarihan ng 2: s=2^l. Ang parameter r ay ganoon
ang pinakamataas na halaga ng reprobe (-p) at ang isa ay mas mababa sa 2^r. Pagkatapos ay ang paggamit ng memorya sa bawat entry
sa hash ay (sa bits, hindi bytes) 2k-l+r+1. Ang kabuuang paggamit ng memory ng hash table sa
ang mga byte ay: 2^l*(2k-l+r+1)/8.

PUMILI ANG PAG-ISA LARANGAN SIZE
Para makatipid ng espasyo, sinusuportahan ng hash table ang variable length counter, ibig sabihin, isang k-mer na nagaganap
ilang beses lang gagamit ng maliit na counter, ang k-mer na nagaganap ng maraming beses ay gagamit ng maramihan
mga entry sa hash.

Mahalaga: HINDI binabago ng laki ng field ng couting ang resulta, nakakaapekto lamang ito sa
dami ng memory na ginamit. Sa partikular, walang maximum na halaga sa hash. Kahit na ang
Ang patlang ng pagbibilang ay gumagamit ng 5 bits, ang isang k-mer na nagaganap nang 2 milyong beses ay magkakaroon ng halagang naiulat
2 milyon (ibig sabihin, hindi ito nililimitahan sa 2^5).

Ang -c tukuyin ang haba (sa mga bit) ng field ng pagbibilang. Ang trade off ay ang mga sumusunod: a
ang mababang halaga ay makakatipid ng espasyo sa bawat entry sa hash ngunit maaaring potensyal na mapataas ang bilang ng
mga entry na ginamit, kaya maaaring nangangailangan ng mas malaking hash.

Sa pagsasagawa, gumamit ng halaga para sa -c para karamihan sa inyo mga k-mer ay nangangailangan lang ng 1 entry. Para sa
halimbawa, upang mabilang ang mga k-mer sa isang genome, kung saan ang karamihan sa pagkakasunod-sunod ay natatangi, gamitin -c1 or
-c2. Para sa sequencing reads, gumamit ng value para sa -c sapat na malaki upang mabilang ng hanggang dalawang beses ang
saklaw. Halimbawa, kung ang saklaw ay 10X, pumili ng haba ng counter na 5 (-c5) bilang $2^5
> 20$.

SUBCOMMANDS AT Opsyon


COUNT
Paggamit: bilang ng dikya [mga opsyon] file:path+

Bilangin ang k-mers o qmers sa fasta o fastq file

Mga Opsyon (default na halaga sa (), *kinakailangan):

-m, --mer-len=uint32
*Ang haba ng mer

-s, --laki=uint64
* Laki ng hash

-t, --mga thread=uint32
Bilang ng mga thread (1)

-o, --output= string
Output prefix (mer_counts)

-c, --kontra-len= Haba
sa bits Haba ng field ng pagbibilang (7)

--out-counter-len= Haba
sa bytes Haba ng counter field sa output (4)

-C,--parehong-strands
Bilangin ang parehong strand, canonical na representasyon (false)

-p, --reprobes=uint32
Pinakamataas na bilang ng mga reprobe (62)

-r,--hilaw
Sumulat ng hilaw na database (false)

-q,--lindol
Quake compatibility mode (false)

--kalidad-simula=uint32
Pagsisimula ng ASCII para sa mga halaga ng kalidad (64)

--min-kalidad=uint32
Pinakamababang kalidad. Ang isang base na may mas mababang kalidad ay nagiging isang N (0)

-L, --lower-count=uint64
Huwag i-output ang k-mer na may count < lower-count

-U, --upper-count=uint64
Huwag mag-output ng k-mer na may count > upper-count

--matrix=Matrix
file Hash function binary matrix

--timing= Timing
file Impormasyon sa timing ng pag-print

--stats=Mga istatistika
file Print stats

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

--buong-tulong
Detalyadong tulong

-V,--bersyon
bersyon

STATS
Paggamit: jellyfish stats [mga opsyon] db:path

Istatistika

Magpakita ng ilang istatistika tungkol sa mga k-mers sa hash:

Natatangi: Bilang ng mga k-mer na isang beses lang nangyayari. Distinct: Bilang ng k-mer, hindi binibilang
multiplicity. Kabuuan: Bilang ng mga k-mer, kabilang ang multiplicity. Max_count: Pinakamataas na numero
ng paglitaw ng isang k-mer.

Mga Opsyon (default na halaga sa (), *kinakailangan):

-L, --lower-count=uint64
Huwag isaalang-alang ang k-mer na may count < lower-count

-U, --upper-count=uint64
Huwag isaalang-alang ang k-mer na may count > upper-count

-v,--verbose
Verbose (false)

-o, --output= string
Output file

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

--buong-tulong
Detalyadong tulong

-V,--bersyon
bersyon

HISTO
Paggamit: jellyfish histo [mga opsyon] db:path

Gumawa ng histogram ng mga k-mer na pangyayari

Lumikha ng histogram na may bilang ng mga k-mer na may ibinigay na bilang. Sa bucket 'i' ay
itinaas ang mga k-mers na may bilang na 'c' na nagbibigay-kasiyahan sa 'low+i*inc <= c < low+(i+1)*inc'.
Ang mga bucket sa output ay may label ng mababang end point (mababa+i*inc).

Ang huling bucket sa output ay kumikilos bilang isang catchall: tinatala nito ang lahat ng k-mer na may bilang
mas malaki o katumbas ng mababang dulo ng bucket na ito.

Mga Opsyon (default na halaga sa (), *kinakailangan):

-l, --mababa=uint64
Mababang halaga ng histogram (1)

-h, --mataas=uint64
Mataas na bilang ng halaga ng histogram (10000)

-i, --pagdagdag=uint64
Pagdaragdag ng halaga para sa mga bucket (1)

-t, --mga thread=uint32
Bilang ng mga thread (1)

-f,--puno
Buong kasaysayan. Huwag laktawan ang bilang ng 0. (false)

-o, --output= string
Output file

-v,--verbose
Impormasyon sa output (false)

--gamit
Paggamit

- Tumulong
Ang mensaheng ito

--buong-tulong
Detalyadong tulong

-V,--bersyon
bersyon

DUMP
Paggamit: jellyfish dump [mga opsyon] db:path

Dump k-mer counts

Bilang default, dump sa isang fasta na format kung saan ang header ay ang bilang at ang sequence ay ang
pagkakasunod-sunod ng k-mer. Ang format ng column ay isang 2 column na output: k-mer count.

Mga Opsyon (default na halaga sa (), *kinakailangan):

-c,--kolum
Format ng column (false)

-t,--tab
Tab separator (false)

-L, --lower-count=uint64
Huwag i-output ang k-mer na may count < lower-count

-U, --upper-count=uint64
Huwag mag-output ng k-mer na may count > upper-count

-o, --output= string
Output file

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

-V,--bersyon
bersyon

Sumanib
Paggamit: pagsasama-sama ng dikya [mga opsyon] input:string+

Pagsamahin ang mga database ng dikya

Mga Opsyon (default na halaga sa (), *kinakailangan):

-s, --buffer-size=Buffer
haba Haba sa byte ng input buffer (10000000)

-o, --output= string
Output file (mer_counts_merged.jf)

--out-counter-len=uint32
Haba (sa bytes) ng field ng pagbibilang sa output (4)

--out-buffer-size=uint64
Sukat ng output buffer bawat thread (10000000)

-v,--verbose
Maging verbose (false)

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

-V,--bersyon
bersyon

TANONG
Paggamit: jellyfish query [mga opsyon] db:path

Query mula sa isang compact na database

Magtanong ng hash. Nagbabasa ito ng mga k-mer mula sa karaniwang input at isulat ang mga bilang sa pamantayan
output.

Mga Opsyon (default na halaga sa (), *kinakailangan):

-C,--parehong-strands
Parehong strand (false)

-c,--cary-bit
Value field bilang cary bit na impormasyon (false)

-i, --input=file
Input na file

-o, --output=file
Output file

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

-V,--bersyon
bersyon

QHISTO
Paggamit: dikya qhisto [mga opsyon] db:string

Gumawa ng histogram ng mga k-mer na pangyayari

Mga Opsyon (default na halaga sa (), *kinakailangan):

-l, --mababa=doble
Mababang halaga ng histogram (0.0)

-h, --mataas=doble
Mataas na bilang ng halaga ng histogram (10000.0)

-i, --pagdagdag=doble
Pagdaragdag ng halaga para sa mga bucket (1.0)

-f,--puno
Buong kasaysayan. Huwag laktawan ang bilang ng 0. (false)

--gamit
Paggamit

- Tumulong
Ang mensaheng ito

-V,--bersyon
bersyon

QDUMP
Paggamit: dikya qdump [mga opsyon] db:path

Itapon ang k-mer mula sa isang database ng qmer

Bilang default, dump sa isang fasta na format kung saan ang header ay ang bilang at ang sequence ay ang
pagkakasunod-sunod ng k-mer. Ang format ng column ay isang 2 column na output: k-mer count.

Mga Opsyon (default na halaga sa (), *kinakailangan):

-c,--kolum
Format ng column (false)

-t,--tab
Tab separator (false)

-L, --lower-count=doble
Huwag i-output ang k-mer na may count < lower-count

-U, --upper-count=doble
Huwag mag-output ng k-mer na may count > upper-count

-v,--verbose
Maging verbose (false)

-o, --output= string
Output file

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

-V,--bersyon
bersyon

QMERGE
Paggamit: pagsasama-sama ng dikya [mga opsyon] db:string+

Pagsamahin ang mga database ng lindol

Mga Opsyon (default na halaga sa (), *kinakailangan):

-s, --laki=uint64
*Laki ng talahanayan ng pinagsamang hash

-m, --mer-len=uint32
*Ang haba ko

-o, --output= string
Output file (merged.jf)

-p, --reprobes=uint32
Pinakamataas na bilang ng mga reprobe (62)

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

--buong-tulong
Detalyadong tulong

-V,--bersyon
bersyon

CITE
Paggamit: jellyfish cite [mga opsyon]

Paano banggitin ang papel ni Jellyfish

Sipi ng papel

Mga Opsyon (default na halaga sa (), *kinakailangan):

-b,--bibtex
Bibtex format (false)

-o, --output= string
Output file

--gamit
Paggamit

-h,- Tumulong
Ang mensaheng ito

-V,--bersyon
bersyon

VERSION


Bersyon: 1.1.4 ng 2010/10/1

Gumamit ng dikya online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    NSIS: Nullsoft Scriptable Install System
    NSIS: Nullsoft Scriptable Install System
    NSIS (Nullsoft Scriptable Install
    System) ay isang propesyonal na open source
    system upang lumikha ng mga installer ng Windows. Ito
    ay idinisenyo upang maging kasing liit at nababaluktot
    bilang posible...
    I-download ang NSIS: Nullsoft Scriptable Install System
  • 2
    authpass
    authpass
    Ang AuthPass ay isang open source na password
    manager na may suporta para sa sikat at
    napatunayang Keepass (kdbx 3.x AT kdbx 4.x ...
    I-download ang authpass
  • 3
    Zabbix
    Zabbix
    Ang Zabbix ay isang enterprise-class na bukas
    pinagmumulan na ibinahagi ng solusyon sa pagsubaybay
    dinisenyo upang subaybayan at subaybayan
    pagganap at pagkakaroon ng network
    mga server, device...
    I-download ang Zabbix
  • 4
    KDiff3
    KDiff3
    Hindi na pinapanatili ang repositoryong ito
    at iniingatan para sa mga layunin ng archival. Tingnan mo
    https://invent.kde.org/sdk/kdiff3 for
    ang pinakabagong code at
    https://download.kde.o...
    I-download ang KDiff3
  • 5
    USBLoaderGX
    USBLoaderGX
    Ang USBLoaderGX ay isang GUI para sa
    Ang USB Loader ni Waninkoko, batay sa
    libwiigui. Pinapayagan nito ang paglilista at
    paglulunsad ng mga Wii games, Gamecube games at
    homebrew sa Wii at WiiU...
    I-download ang USBLoaderGX
  • 6
    Firebird
    Firebird
    Nag-aalok ang Firebird RDBMS ng mga tampok ng ANSI SQL
    & tumatakbo sa Linux, Windows at
    ilang mga platform ng Unix. Mga tampok
    mahusay na pagkakatugma at pagganap
    at kapangyarihan...
    I-download ang Firebird
  • Marami pa »

Linux command

Ad