InglesPransesEspanyol

Ad


OnWorks favicon

axe-demux - Online sa Cloud

Patakbuhin ang axe-demux sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na axe-demux na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


palakol - palakol Dokumentasyon

Ang Ax ay isang read de-multiplexer, kapaki-pakinabang sa mga sitwasyon kung saan ang mga sequence read ay naglalaman ng
mga barcode na natatanging nakikilala ang mga sample. Gumagamit ang Ax ng mabilis at tumpak na algorithm batay
on hamming mismatch sumusubok na mapagkumpitensyang tumugma sa prefix ng isang sequencing read laban sa a
hanay ng mga barcode. Sinusuportahan ng Ax ang mga combinatorial barcoding scheme.

Nilalaman:

AX PAGGAMIT


TANDAAN:
For arcane reasons, ang pangalan ng palakol binary ay binago sa palakol-demux na may bersyon 0.3.0.
Paumanhin para sa abala, ito ay kinakailangan upang gawin palakol mai-install sa Debian
at mga derivatives nito. Hindi nagbago ang paggamit ng command-line.

Ang Ax ay may ilang mga mode ng paggamit. Ang pangunahing pagkakaiba ay sa pagitan ng dalawang kahalili
barcoding scheme, single at combinatorial barcoding. Ginagamit ang solong pagtutugma ng barcode
kapag ang unang nabasa lamang ay naglalaman ng mga pagkakasunud-sunod ng barcode. Ang combinatorial barcoding ay ginagamit kapag
ang parehong mga nabasa sa isang pares ng nabasa ay naglalaman ng mga independyente (karaniwang iba't ibang) pagkakasunud-sunod ng barcode.

Para sa maigsi na sanggunian, ang paggamit ng command-line ng palakol-demux ay muling ginawa sa ibaba:

PAGGAMIT:
axe-demux [-mzc2pt] -b (-f [-r] | -i) (-F [-R] | -I)
palakol-demux -h
palakol-demux -v

OPSYON:
-m, --mismatch Maximum na hamming distance mismatch. [int, default 1]
-z, --ziplevel Gzip compression level, o 0 para sa plain text [int, default 0]
-c, --combinatorial Gumamit ng combinatorial barcode na pagtutugma. [bandila, default OFF]
-p, --permissive Huwag mag-error sa barcode mismatch confict, tumutugma lang
eksakto para sa conficing barcodes. [bandila, default OFF]
-2, --trim-r2 I-trim ang barcode mula sa R2 read pati na rin ang R1. [bandila, default OFF]
-b, --barcodes Barcode file. Tingnan ang --help halimbawa. [file]
-f, --fwd-in Input forward read. [file]
-F, --fwd-out Output forward read prefix. [file]
-r, --rev-in Input reverse read. [file]
-R, --rev-out Output reverse read prefix. [file]
-i, --ilfq-in Input interleaved paired reads. [file]
-I, --ilfq-out Output interleaved paired reads prefix. [file]
-t, --table-file Mag-output ng buod na talahanayan ng mga istatistika ng demultiplexing na ihahain. [file]
-h, --help I-print ang paggamit na ito at karagdagang tulong.
-V, --version I-print ang string ng bersyon.
-v, --verbose Maging mas verbose. Additive, -vv ay mas vebose kaysa -v.
-q, --tahimik Maging napakatahimik.

Input at Output
Anuman ang read mode, tatlong input at output scheme ang sinusuportahan: single-end reads,
ipinares na mga pagbabasa (paghiwalayin ang R1 at R2 na mga file) at interleaved na ipinares na mga pagbabasa (isang file, na may R1
at R2 bilang magkasunod na pagbabasa). Kung ang mga single end read ay nai-input, dapat ay output ang mga ito bilang
single end reads. Kung binasa ang alinman sa ipinares o interleaved paired reads, maaari itong basahin
output bilang alinman sa ipinares na mga pagbasa o interleaved na ipinares na mga pagbasa. Nalalapat ito sa pareho
matagumpay na na-de-multiplex ang mga read at read na hindi ma-de-multiplex.

Ang -z flag ay maaaring gamitin upang tukuyin na ang mga output ay dapat i-compress gamit ang gzip
compression. Ang -z ang flag ay tumatagal ng isang integer argument sa pagitan ng 0 (ang default) at 9, kung saan 0
nagpapahiwatig ng plain text output (gzopen mode "wT"), at 1-9 ay nagpapahiwatig na ang kani
dapat gamitin ang antas ng compression, kung saan ang 1 ay pinakamabilis at 9 ang pinaka-compact.

Ang mga flag ng output ay dapat na mga prefix na ginagamit upang makabuo ng nakabatay sa pangalan ng output file
sa barcode's (o barcode pair's) ID. Ang mga pangalan ay nabuo bilang: unlapi + _ + barcode
ID + _ + basahin numero + .extension. Ang output file para sa mga pagbabasa na hindi maaaring
demultiplexed ay unlapi + _ + hindi kilala + _ + basahin numero + .extension. Ang nabasang numero ay
inalis maliban kung ang ipinares na read file scheme ay ginamit, at ito ay "il" para sa interleaved na output.
Ang extension ay "fastq"; Ang ".gz" ay idinagdag sa extension kung ang -z ginagamit ang bandila.

Ang katumbas CLI flag ay:

· -f at -F: Isang dulo o ipinares na R1 file input at output ayon sa pagkakabanggit.

· -r at -R: Nakapares na R2 file input at output.

· -i at -I: Interleaved paired input at output.

Ang barcode file
Ang barcode file ay isang tab-separated file na may opsyonal na header. Ito ay sapilitan, at ito ay
palaging ibinibigay gamit ang -b bandila ng command line. Ang eksaktong format ay nakasalalay sa barcoding
mode, at inilalarawan pa sa mga seksyon sa ibaba. Kung mayroong isang header, ang header
linya ay dapat magsimula sa alinman barcode or barcode, o ito ay bibigyang-kahulugan bilang isang barcode
linya, na humahantong sa isang error sa pag-parse. Anumang linya na nagsisimula sa ';' o '#' ay binabalewala, pinapayagan
mga komento na idaragdag alinsunod sa mga barcode. Pakitiyak na ang software na ginamit sa
gumawa ng barcode ay gumagamit ng ASCII encoding, at hindi naglalagay ng Byte-order Mark (BoM) bilang
maraming text editor ang maaaring tahimik na gumamit ng Unicode-based na mga encoding scheme. Inirerekomenda ko ang paggamit ng
LibreOffice Calc (bahagi ng libre at open source office suite) para bumuo ng mga barcode table;
Maaari ding gamitin ang Microsoft Excel.

Mismatch antas pagpili
Independiyente sa barcode mode, ang -m ginagamit ang watawat upang piliin ang maximum na pinapayagang hamming
distansya sa pagitan ng prefix ng isang read at isang barcode na ituring bilang isang tugma. Bilang "mutated"
Ang mga barcode ay dapat na natatangi, ang isang hamming distance ng isa ay ang default gaya ng karaniwang mga barcode
ay idinisenyo upang mag-iba sa pamamagitan ng distansya ng hamming na hindi bababa sa dalawa. Opsyonal, (gamit ang -p
flag), ang palakol ay magbibigay-daan sa mga piling antas ng mismatch, kung saan, kung ang mga pag-aaway ay naobserbahan, ang
Ang barcode ay itutugma lamang nang eksakto. Nagbibigay-daan ito sa isa na magproseso ng mga dataset na may mga barcode
na walang sapat na mataas na distansya sa pagitan nila.

Single barcode paraan
Ang solong barcode mode ay ang default na mode ng operasyon. Ang mga barcode ay itinugma laban sa nabasa
isa (pagkatapos nito ay pasulong na pagbasa), at ang barcode ay pinuputol mula lamang sa pasulong na pagbasa,
maliban kung -2 command line flag ay ibinigay, kung saan ang isang prefix ang parehong haba ng
Ang katugmang barcode ay pinuputol din mula sa pangalawa o reverse read. Tandaan na ang pagkakasunod-sunod ng
ang pangalawang pagbasa na ito ay hindi sinusuri bago i-trim.

Sa solong barcode mode, ang barcode file ay may dalawang column: barcode at ID.

Kombinatoryal barcode paraan
Ang combinatorial barcode mode ay isinaaktibo sa pamamagitan ng pagbibigay ng -c bandila sa command line. Pasulong
Ang mga read barcode ay itinutugma laban sa forward read, at ang mga reverse read na barcode ay itinutugma
laban sa reverse read. Ang pinakamainam na barcode ay pinili nang nakapag-iisa, at ang barcode
Ang pares ay pinili mula sa dalawang barcode na ito. Ang kani-kanilang mga barcode ay pinuputol mula sa pareho
nagbabasa; ang -2 Walang epekto ang command line flag sa combinatorial barcode mode.

Sa combinatorial barcode mode, ang barcode file ay may tatlong column: Barcode1, Barcode2 at
ID. Ang mga indibidwal na barcode ay maaaring mangyari nang maraming beses sa loob ng forward at reverse barcode, ngunit
Ang mga pares ng barcode ay dapat na mga natatanging kumbinasyon.

Ang Demultipexing Istatistika talaksan
Ang -t Binibigyang-daan ng opsyon ang output ng per-sample read count sa isang tab-separated file. Ang
Ang file ay magkakaroon ng header na naglalarawan sa format nito, at may kasamang linya para sa mga hindi naka-barcode na pagbabasa.

AXE'S PAGKAKITA ALGORITMO


Gumagamit ang Ax ng algorithm batay sa longest-prefix-in-trie na pagtutugma upang tumugma sa isang variable na haba
mula sa simula ng bawat pagbabasa laban sa isang set ng 'mutated' barcodes.

Hamming layo pagtutugma
Habang para sa karamihan ng mga aplikasyon sa high-throughput sequencing hamming distances ay a
nakasimangot sa sukatan, karaniwan para sa mga HTS read barcode na idinisenyo upang tiisin ang isang
ilang antas ng hindi pagkakatugma ng hamming. Dahil ang mga sequence na ito ay maikli at karaniwang nangyayari
sa 5' dulo ng mga pagbabasa, ang mga pagsingit at pagtanggal ay bihirang kailangang isaalang-alang, at ang
ang pagtaas ng rate ng pagtatalaga ng mga nabasa na may maraming mga error ay binabawasan ng panganib ng maling
pagtatalaga ng mga barcode sa isang maling sample. Sa anumang kaso, nagbabasa na may higit sa 1-2
Ang mga error sa pagkakasunud-sunod sa kanilang unang ilang mga base ay malamang na hindi maganda ang kalidad, at gagawin
basta mai-filter sa panahon ng downstream na kontrol sa kalidad.

Hamming mismatch sinusubukan
Karaniwan, ang mga nabasa ay itinutugma sa isang hanay ng mga barcode sa pamamagitan ng pagkalkula ng distansya ng hamming
sa pagitan ng barcode, at ang unang l base ng isang read para sa barcode na may haba na l. Ang
Ang "tama" na barcode ay pipiliin sa pamamagitan ng pagtatala ng alinman sa barcode na may pinakamababang hamming
distansya sa nabasa (competitive matching) o sa pamamagitan lamang ng pagtanggap sa unang barcode gamit ang
isang hamming na distansya sa ibaba ng isang tiyak na threshold. Ang mga diskarte na ito ay pareho
computationally mahal, at maaaring magkaroon ng mas mababang katumpakan kaysa sa algorithm na iminumungkahi ko.
Bukod pa rito, ang mga pagpapatupad ng mga paraang ito ay bihirang humawak ng mga barcode na may magkakaibang haba
at kombinatorial barcoding na rin, kung mayroon man.

Ang sentro ng algorithm ng Axe ay ang konsepto ng mga pagsubok sa hamming-mismatch. Ang isang pagsubok ay isang N-ary
puno para sa alpabeto ng letrang N. Sa kaso ng high-throughput sequencing reads, mayroon kami
ang alpabeto AGCT, na tumutugma sa apat na nucleotides ng DNA, plus N, ginamit upang kumatawan
hindi tiyak na mga batayang tawag. Sa halip na itugma ang bawat barcode sa bawat nabasa, paunang kalkulahin namin ang lahat
pinahihintulutang mga pagkakasunud-sunod sa bawat antas ng mismatch, at iimbak ang mga ito sa antas-matalino na mga pagsubok. Para sa
halimbawa, upang tumugma sa layo ng hamming na 2, gumawa kami ng tatlong pagsubok: Isa na naglalaman ng lahat
barcode, verbatim, at dalawang pagsubok kung saan ang bawat sequence ay nasa loob ng hamming distance na 1 at
2 ng bawat barcode ayon sa pagkakabanggit. Pagkatapos, ang mga pagsubok na ito ay tinutukoy bilang ang 0, 1 at
2-mm na mga pagsubok, para sa isang hamming distance (mismatch) na 0, 1 at 2. Pagkatapos, nakita namin ang pinakamahabang
prefix sa bawat sequence na nabasa sa 0mm trie. Kung ang prefix na ito ay hindi wastong dahon sa
0mm na pagsubok, nakita namin ang pinakamahabang prefix sa 1mm na pagsubok, at iba pa para sa lahat ng pagsubok sa pataas
utos. Kung walang prefix ng nabasa na isang kumpletong pagkakasunud-sunod sa anumang pagsubok, ang pagbabasa ay itatalaga
sa isang "non-barcoded" na output file.

Tinitiyak ng algorithm na ito ang pinakamainam na pagtutugma ng barcode sa maraming paraan, ngunit napakabilis din.
Sa mga sitwasyong may mga barcode na magkakaiba ang haba, tinitiyak namin na ang pinakamahabang kasiya-siya
barcode sa isang ibinigay na distansya ng hamming ay pinili; sa pag-aakalang random ang sequence pagkatapos ng
barcode, mababa ang posibilidad ng mga maling pagtatalaga gamit ang paraang ito. Tinitiyak din namin
na ang mga maiikling perpektong tugma ay mas gusto kaysa sa mas mahahabang hindi eksaktong mga tugma, dahil kami lang ang una
isaalang-alang ang mga barcode na walang error, pagkatapos ay 1 error, at iba pa. Tinitiyak nito na nagbabasa ng may
mga barcode na sinusundan ng random na pagkakasunud-sunod na nangyayari na hindi eksaktong tumutugma nang mas matagal
Ang barcode sa set ay hindi maling itinalaga sa mas mahabang barcode na ito.

Ang bilis ng algorithm na ito ay higit sa lahat dahil sa patuloy na pagtutugma ng algorithm sa oras
paggalang sa bilang ng mga barcode upang tumugma. Ang oras na kinuha upang tumugma sa bawat pagbasa ay
proporsyonal sa halip sa haba ng mga barcode, tulad ng para sa isang barcode na may haba l, sa pinakamaraming
l + 1 trie level descents ay kinakailangan upang makahanap ng entry sa trie. Tulad ng haba na ito
mas-o-mas mababa ang pare-pareho at maliit, ang pangkalahatang kumplikado ng algorithm ng palakol ay O(n) para sa n
reads, bilang kabaligtaran sa O(nm) para sa n reads at m barcodes gaya ng karaniwan para sa tradisyonal
pagtutugma ng mga algorithm

· genindex

Gumamit ng axe-demux online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    Clover EFI bootloader
    Clover EFI bootloader
    Lumipat ang proyekto sa
    https://github.com/CloverHackyColor/CloverBootloader..
    Mga Tampok: I-boot ang macOS, Windows, at Linux
    sa UEFI o legacy mode sa Mac o PC na may
    UE...
    I-download ang Clover EFI bootloader
  • 2
    unitedrpms
    unitedrpms
    Samahan kami sa Gitter!
    https://gitter.im/unitedrpms-people/Lobby
    Paganahin ang URPMS repository sa iyong
    sistema -
    https://github.com/UnitedRPMs/unitedrpms.github.io/bl...
    I-download ang unitedrpms
  • 3
    Palakasin ang Mga Aklatan ng C++
    Palakasin ang Mga Aklatan ng C++
    Nagbibigay ang Boost ng libreng portable
    peer-reviewed na mga aklatan ng C++. Ang
    ang diin ay sa mga portable na aklatan na
    gumana nang maayos sa C++ Standard Library.
    Tingnan ang http://www.bo...
    I-download ang Boost C++ Libraries
  • 4
    VirtualGL
    VirtualGL
    Ang VirtualGL ay nagre-redirect ng mga 3D na utos mula sa a
    Unix/Linux OpenGL application papunta sa a
    server-side GPU at kino-convert ang
    nag-render ng mga 3D na larawan sa isang video stream
    kung saan ...
    I-download ang VirtualGL
  • 5
    libusb
    libusb
    Library upang paganahin ang espasyo ng gumagamit
    mga programa ng aplikasyon upang makipag-usap
    Mga USB device. Audience: Mga Developer, End
    Mga user/Desktop. Wika ng Programming: C.
    Mga kategorya...
    I-download ang libusb
  • 6
    SWIG
    SWIG
    Ang SWIG ay isang software development tool
    na nag-uugnay sa mga programang nakasulat sa C at
    C++ na may iba't ibang mataas na antas
    mga programming language. Ang SWIG ay ginagamit kasama ng
    iba...
    I-download ang SWIG
  • Marami pa »

Linux command

Ad