Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

axe-demux - Online w chmurze

Uruchom axe-demux w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

To jest polecenie axe-demux, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


topór - dokumentacja topora

Ax jest demultiplekserem odczytu, przydatnym w sytuacjach, gdy odczyty sekwencji zawierają
kody kreskowe, które jednoznacznie odróżniają próbki. Axe wykorzystuje szybki i dokładny algorytm oparty
on Hamming mismatch próbuje konkurencyjnie dopasować przedrostek odczytu sekwencyjnego do a
zestaw kodów kreskowych. Axe obsługuje kombinatoryczne schematy kodów kreskowych.

Spis treści:

AX ZASTOSOWANIE


UWAGA:
Z tajemniczych powodów nazwa topór binarny zmieniony na topór-demux z wersją 0.3.0.
Przepraszamy za niedogodności, było to konieczne topór do zainstalowania w Debianie
i jego pochodne. Użycie wiersza poleceń nie uległo zmianie.

Axe ma kilka trybów użytkowania. Podstawowe rozróżnienie dotyczy dwóch alternatywnych
schematy kodowania kreskowego, kodowanie pojedyncze i kombinatoryczne. Stosowane jest dopasowywanie pojedynczego kodu kreskowego
gdy tylko pierwszy odczyt zawiera sekwencje kodów kreskowych. Kombinatoryczny kod kreskowy jest używany, gdy
oba odczyty w parze odczytów zawierają niezależne (zwykle różne) sekwencje kodów kreskowych.

Dla zwięzłego odniesienia, użycie wiersza poleceń topór-demux jest reprodukowany poniżej:

STOSOWANIE:
axe-demux [-mzc2pt] -b (-f [-r] | -i) (-F [-R] | -I)
topór-demux -h
axe-demux -v

OPCJE:
-m, --mismatch Maksymalna niedopasowana odległość Hamminga. [int, domyślnie 1]
-z, --ziplevel Poziom kompresji Gzip lub 0 dla zwykłego tekstu [int, domyślnie 0]
-c, --combinatorial Użyj kombinatorycznego dopasowywania kodów kreskowych. [flaga, domyślnie wyłączona]
-p, --permissive Nie powoduje błędu w przypadku niezgodności kodu kreskowego, tylko dopasowanie
dokładnie do fałszowania kodów kreskowych. [flaga, domyślnie wyłączona]
-2, --trim-r2 Przytnij kod kreskowy z odczytanego R2 i R1. [flaga, domyślnie wyłączona]
-b, --barcodes Plik kodu kreskowego. Zobacz na przykład --help. [plik]
-f, --fwd-in Wejście do odczytu do przodu. [plik]
-F, --fwd-out Przedrostek odczytu do przodu wyjścia. [plik]
-r, --rev-in Wprowadź odczyt odwrotny. [plik]
-R, --rev-out Wyprowadza przedrostek odczytu wstecznego. [plik]
-i, --ilfq-in Wejście przeplatanych sparowanych odczytów. [plik]
-I, --ilfq-out Wyjściowy przedrostek odczytu sparowanego z przeplotem. [plik]
-t, --table-file Wypisuje do pliku tabelę podsumowującą statystyki demultipleksowania. [plik]
-h, --help Wydrukuj to użycie wraz z dodatkową pomocą.
-V, --version Wydrukuj ciąg wersji.
-v, --verbose Bądź bardziej gadatliwy. Dodatek -vv jest bardziej szczegółowy niż -v.
-q, --quiet Bądź bardzo cichy.

Wejścia i Wyjścia
Niezależnie od trybu odczytu obsługiwane są trzy schematy wejścia i wyjścia: odczyty z jednego końca,
sparowane odczyty (oddzielne pliki R1 i R2) i przeplatane sparowane odczyty (jeden plik, z R1
i R2 jako kolejne odczyty). Jeśli wprowadzone zostaną odczyty z jednego końca, muszą one zostać wyprowadzone jako
czyta jeden koniec. Jeśli odczytywane są sparowane lub przeplatane sparowane odczyty, można to zrobić
wyjście jako sparowane odczyty lub przeplatane sparowane odczyty. Dotyczy to obu
pomyślnie demultipleksowano odczyty i odczyty, których nie można było demultipleksować.

Połączenia -z flagi można użyć do określenia, że ​​dane wyjściowe powinny być kompresowane przy użyciu programu gzip
kompresja. The -z flaga przyjmuje argument w postaci liczby całkowitej z zakresu od 0 (wartość domyślna) do 9, gdzie 0
wskazuje wynik w postaci zwykłego tekstu (gzopen tryb „wT”), a 1-9 oznaczają, że odpowiedni
należy zastosować poziom kompresji, gdzie 1 jest najszybszy, a 9 najbardziej kompaktowy.

Flagi wyjściowe powinny być przedrostkami używanymi do generowania nazwy pliku wyjściowego
na identyfikatorze kodu kreskowego (lub pary kodów kreskowych). Nazwy są generowane jako: prefiks + _ + kodów kreskowych
ID + _ + czytać numer + .rozszerzenie. Plik wyjściowy dla odczytów, których nie można odczytać
demultipleksowany jest prefiks + _ + nieznany + _ + czytać numer + .rozszerzenie. Odczytany numer to
pomijany, chyba że używany jest schemat sparowanego pliku do odczytu i ma wartość „il” dla danych wyjściowych z przeplotem.
Rozszerzenie to „fastq”; „.gz” jest dołączane do rozszerzenia, jeśli -z używana jest flaga.

Połączenia odpowiedni CLI Flagi należą:

· -f i -F: Odpowiednio pojedynczy koniec lub sparowane wejście i wyjście pliku R1.

· -r i -R: Sparowane wejście i wyjście pliku R2.

· -i i -I: Przeplatane sparowane wejście i wyjście.

Połączenia kodów kreskowych filet
Plik z kodem kreskowym jest plikiem rozdzielonym tabulatorami i ma opcjonalny nagłówek. Jest to obowiązkowe i jest
zawsze dostarczane przy użyciu -b flaga wiersza poleceń. Dokładny format zależy od kodu kreskowego
trybie i opisano je szczegółowo w poniższych sekcjach. Jeśli nagłówek jest obecny, header
linia musi zaczynać się od któregokolwiek kod kreskowy or kodów kreskowychlub zostanie zinterpretowany jako kod kreskowy
wiersza, co prowadzi do błędu analizy. Dowolna linia zaczynająca się od „;” lub „#” jest ignorowane, co pozwala
komentarze do dodania zgodnie z kodami kreskowymi. Upewnij się, że oprogramowanie używane do
do utworzenia kodu kreskowego używa kodowania ASCII i nie wstawia znacznika kolejności bajtów (BoM) jako
wielu edytorów tekstu może po cichu używać schematów kodowania opartych na Unicode. Polecam skorzystać
LibreOffice Calc (część bezpłatnego pakietu biurowego typu open source) do generowania tabel kodów kreskowych;
Można także używać programu Microsoft Excel.

Niedopasowanie poziom wybór
Niezależnie od trybu kodu kreskowego, -m flaga służy do wyboru maksymalnego dopuszczalnego młotkowania
odległość między prefiksem odczytu a kodem kreskowym, którą należy uznać za zgodną. Jako „zmutowany”
kody kreskowe muszą być unikalne. W przypadku typowych kodów kreskowych domyślną wartością jest odległość Hamminga wynosząca jeden
są zaprojektowane tak, aby różniły się odległością Hamminga wynoszącą co najmniej dwa. Opcjonalnie (za pomocą -p
flag), ax pozwoli na selektywne poziomy niedopasowania, gdzie w przypadku zaobserwowania kolizji,
kod kreskowy będzie tylko dokładnie dopasowany. Umożliwia to przetwarzanie zbiorów danych za pomocą kodów kreskowych
które nie mają między sobą wystarczająco dużej odległości.

Jedna kodów kreskowych tryb
Tryb pojedynczego kodu kreskowego jest domyślnym trybem działania. Kody kreskowe są dopasowywane do odczytu
jeden (zwany dalej odczytem do przodu), a kod kreskowy jest wycinany tylko z odczytu do przodu,
dopóki -2 podana jest flaga wiersza poleceń, w którym to przypadku przedrostek ma taką samą długość jak
dopasowany kod kreskowy jest również wycinany z drugiego lub odwrotnego odczytu. Zwróć uwagę na tę sekwencję
ten drugi odczyt nie jest sprawdzany przed przycięciem.

W trybie pojedynczego kodu kreskowego plik kodu kreskowego składa się z dwóch kolumn: kod kreskowy i ID.

Kombinatoryczny kodów kreskowych tryb
Tryb kombinatorycznego kodu kreskowego jest aktywowany poprzez podanie -c flagę w wierszu poleceń. Do przodu
odczytane kody kreskowe są dopasowywane do odczytu do przodu, a kody kreskowe do odczytu wstecznego są dopasowywane
wbrew odczytaniu odwrotnemu. Optymalne kody kreskowe są wybierane niezależnie od kodu kreskowego
para jest wybierana spośród tych dwóch kodów kreskowych. Z obu wycinane są odpowiednie kody kreskowe
czyta; the -2 flaga wiersza poleceń nie ma wpływu w trybie kombinatorycznego kodu kreskowego.

W trybie kombinatorycznego kodu kreskowego plik kodu kreskowego składa się z trzech kolumn: Kod kreskowy1, Kod kreskowy2 i
ID. Poszczególne kody kreskowe mogą występować wiele razy w kodach kreskowych do przodu i do tyłu, ale
pary kodów kreskowych muszą być unikalnymi kombinacjami.

Połączenia Demultipeksowanie Statistics filet
Połączenia -t Opcja umożliwia wyprowadzanie liczników odczytów dla każdej próbki do pliku oddzielonego tabulatorami. The
plik będzie miał nagłówek opisujący jego format i będzie zawierał linię dla odczytów niekodowanych.

AXE PASUJĄCY ALGORYTM


Axe używa algorytmu opartego na dopasowywaniu najdłuższego przedrostka w próbie, aby dopasować zmienną długość
od początku każdego odczytu względem zestawu „zmutowanych” kodów kreskowych.

Hamminga dystans dopasowywanie
Podczas gdy w większości zastosowań w sekwencjonowaniu o dużej przepustowości odległości Hamminga wynoszą a
metryczny, który nie jest mile widziany, typowe jest, że kody kreskowe do odczytu HTS są zaprojektowane tak, aby tolerować a
pewien poziom niedopasowań Hamminga. Biorąc pod uwagę, że te sekwencje są krótkie i zazwyczaj występują
na końcu 5' odczytów rzadko trzeba brać pod uwagę insercje i delecje, oraz
zwiększony współczynnik przypisania odczytów z dużą liczbą błędów jest równoważony przez ryzyko fałszywości
przypisanie kodów kreskowych do nieprawidłowej próbki. W każdym razie czyta więcej niż 1-2
Błędy w sekwencjonowaniu w kilku pierwszych zasadach będą prawdopodobnie niskiej jakości i tak będzie
zostać po prostu odfiltrowane podczas dalszej kontroli jakości.

Hamminga niedopasowanie próbuje
Zazwyczaj odczyty są dopasowywane do zestawu kodów kreskowych poprzez obliczenie odległości Hamminga
pomiędzy kodem kreskowym a pierwszymi l podstawami odczytu dla kodu kreskowego o długości l. The
Następnie wybierany jest „prawidłowy” kod kreskowy poprzez zapisanie kodu kreskowego o najniższym uderzeniu
odległość do odczytu (dopasowanie konkurencyjne) lub po prostu zaakceptowanie pierwszego kodu kreskowego
odległość Hamminga poniżej pewnego progu. Obydwa podejścia są bardzo
jest kosztowny obliczeniowo i może mieć niższą dokładność niż algorytm, który proponuję.
Ponadto implementacje tych metod rzadko obsługują kody kreskowe o różnej długości
i kombinatoryczne kodowanie kreskowe, jeśli w ogóle.

Najważniejszym elementem algorytmu Axe'a jest koncepcja prób niedopasowania Hamminga. Próba to N-ary
drzewo dla alfabetu z literą N. W przypadku odczytów sekwencyjnych o dużej przepustowości mamy
Alfabet AGCT, odpowiadający czterem nukleotydom DNA, plus N, używany do reprezentowania
niejednoznaczne wywołania podstawowe. Zamiast dopasowywać każdy kod kreskowy do każdego odczytu, wstępnie obliczamy wszystkie
dopuszczalne sekwencje na każdym poziomie niedopasowania i przechowuj je w próbach opartych na poziomie. Dla
na przykład, aby dopasować odległość Hamminga wynoszącą 2, tworzymy trzy próby: jedną zawierającą wszystko
kody kreskowe, dosłownie i dwie próby, gdzie każda sekwencja w odległości Hamminga wynoszącej 1 i
Odpowiednio 2 z każdego kodu kreskowego. W dalszej części te próby są określane jako 0, 1 i
Próby 2 mm dla odległości Hamminga (niedopasowania) wynoszącej 0, 1 i 2. Następnie znajdujemy najdłuższy
przedrostek w każdej sekwencji odczytywany w próbie 0mm. Jeśli ten przedrostek nie jest prawidłowym liściem w pliku
0 mm, najdłuższy przedrostek znajdujemy w próbie 1 mm i tak dalej dla wszystkich prób rosnąco
zamówienie. Jeżeli w żadnej próbie żaden przedrostek odczytu nie jest pełną sekwencją, odczyt zostaje przypisany
do pliku wyjściowego „bez kodu kreskowego”.

Algorytm ten zapewnia optymalne dopasowanie kodu kreskowego na wiele sposobów, ale jest też niezwykle szybki.
W sytuacjach, gdy kody kreskowe mają różną długość, zapewniamy, że najdłużej do przyjęcia
wybierany jest kod kreskowy w danej odległości Hamminga; zakładając, że sekwencja jest losowa po
kodu kreskowego, prawdopodobieństwo błędnego przypisania przy użyciu tej metody jest niskie. Zapewniamy również
że krótkie, idealne dopasowania są preferowane od dłuższych, niedokładnych dopasowań, jak to po pierwsze tylko robimy
rozważ kody kreskowe bez błędu, następnie 1 błąd i tak dalej. Zapewnia to, że czyta z
kody kreskowe, po których następuje losowa sekwencja, która zdarza się niedokładnie pasować do dłuższej
kod kreskowy w zestawie nie jest błędnie przypisany do tego dłuższego kodu kreskowego.

Szybkość tego algorytmu wynika w dużej mierze z algorytmu dopasowywania stałego czasu
w odniesieniu do liczby pasujących kodów kreskowych. Czas potrzebny na dopasowanie każdego odczytu wynosi
proporcjonalna zamiast tego do długości kodów kreskowych, jak w przypadku kodu kreskowego o długości co najwyżej l
Aby dostać się do trie, wymagane są zjazdy na poziomie l + 1 trie. Jak ta długość
mniej więcej stała i mała, ogólna złożoność algorytmu osi wynosi O(n) dla n
odczytów, w przeciwieństwie do O(nm) dla n odczytów i m kodów kreskowych, co jest typowe dla tradycyjnych
algorytmy dopasowujące

· indeks płci

Korzystaj z axe-demux online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    Program ładujący Clover EFI
    Program ładujący Clover EFI
    Projekt został przeniesiony do
    https://github.com/CloverHackyColor/CloverBootloader..
    Funkcje: Uruchom system macOS, Windows i Linux
    w trybie UEFI lub starszym na komputerze Mac lub PC z
    UE...
    Pobierz program ładujący Clover EFI
  • 2
    zjednoczone obroty
    zjednoczone obroty
    Dołącz do nas w Gitterze!
    https://gitter.im/unitedrpms-people/Lobby
    Włącz repozytorium URPMS w swoim
    system -
    https://github.com/UnitedRPMs/unitedrpms.github.io/bl...
    Pobierz unitedrpms
  • 3
    Zwiększ biblioteki C ++
    Zwiększ biblioteki C ++
    Boost zapewnia bezpłatne przenośne
    recenzowane biblioteki C++. The
    nacisk kładziony jest na przenośne biblioteki, które
    dobrze współpracuje z biblioteką standardową C++.
    Zobacz http://www.bo...
    Pobierz biblioteki Boost C++
  • 4
    WirtualnyGL
    WirtualnyGL
    VirtualGL przekierowuje polecenia 3D z a
    Unix/Linux OpenGL na a
    GPU po stronie serwera i konwertuje plik
    renderowane obrazy 3D do strumienia wideo
    z którym ...
    Pobierz VirtualGL
  • 5
    libusba
    libusba
    Biblioteka, aby włączyć przestrzeń użytkownika
    programy użytkowe do komunikacji
    Urządzenia USB. Publiczność: deweloperzy, koniec
    Użytkownicy/Pulpit. Język programowania: C.
    Kategorie...
    Pobierz plik libusb
  • 6
    HAUST
    HAUST
    SWIG to narzędzie do tworzenia oprogramowania
    która łączy programy napisane w C i
    C++ z różnymi wysokopoziomowymi
    języki programowania. SWIG jest używany z
    różne...
    Pobierz SWIG
  • więcej »

Komendy systemu Linux

Ad