Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

daligner - Online w chmurze

Uruchom daligner w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

To jest polecenie daligner, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


daligner - wyrównywarka długiego odczytu

STRESZCZENIE


danger [-vbAI][-kint(14)] [-wint(6)] [-hint(35)] [-tint] [-Mint] [-epodwójny(.70)]
[-lint(1000)] [-sint(100)] [-Hint] [-mśledzić]+ Temat:db|dam cel:db|dam ...

OPIS


Porównaj sekwencje w przyciętym przedmiot blokować względem tych z listy cel Bloki
wyszukiwanie lokalnych zestawień obejmujących co najmniej -l par zasad (domyślnie 1000) lub więcej,
które mają średni współczynnik korelacji wynoszący -e (domyślnie 70%). Znaleziono lokalne linie trasowania
będzie wyprowadzany w kodowaniu rzadkim, w którym co jakiś czas rejestrowany jest punkt śledzenia na wyrównaniu
-s pary zasad odczytu a (domyślnie 100 bp). Odczyty są porównywane w obu orientacjach i
lokalne linie trasowania spełniające kryteria są wyprowadzane do jednego z kilku opisanych utworzonych plików
poniżej. The -v opcja włącza szczegółowy tryb raportowania, który podaje statystyki dotyczące każdego z nich
główny etap obliczeń.

Opcje -k, -h, -w kontroluj wstępne wyszukiwanie filtracji pod kątem możliwych dopasowań
pomiędzy lekturami. W szczególności nasz kod wyszukiwania szuka pary ukośnych pasm szerokości
2^w (domyślnie 2^6 = 64), które zawierają zbiór dokładnie pasujących k-merów (domyślnie 14)
między dwoma odczytami, tak że całkowita liczba zasad objętych trafieniami k-mer wynosi h
(domyślnie 35). k nie może być większe niż 32 w bieżącej implementacji. Jeśli -b opcja
jest ustawiony, to danger zakłada, że ​​dane charakteryzują się silnym błędem składu (np. >65% AT
bogaty) i kosztem nieco większej ilości czasu, dynamicznie dostosowuje rozmiary k-merów w zależności od
błąd składu, tak że użyte mery mają efektywną specyficzność 4^k.

Jeśli za pomocą parametru określono jedną lub więcej ścieżek interwałowych -m opcję, a następnie odczyty
DB lub DB, do których odnosi się maska, są maskowane programowo poprzez sumę przedziałów
wszystkich stosowanych ścieżek interwałowych, czyli dowolnych k-merów zawierających jakiekolwiek zasady w którymkolwiek z
zamaskowane interwały są ignorowane na potrzeby rozstawienia meczu. Ścieżka interwałowa
to ścieżka, taka jak ścieżka „dust” stworzona przez DBdust, która koduje zestaw interwałów
nad nieprzyciętą lub przyciętą DB.

Niezmiennie niektóre k-mery są znacznie nadreprezentowane (np. serie homopolimerów).
Te k-mery tworzą nadmierną liczbę pasujących par k-merów, a pozostawienie ich bez rozwiązania
spowodować, że daligner przepełni dostępną pamięć fizyczną. Jednym ze sposobów poradzenia sobie z tym jest
wyraźnie ustawić -t parametr, który powstrzymuje użycie dowolnego k-meru, który występuje częściej
niż t razy w bloku przedmiotowym lub docelowym. Jednak lepszym sposobem radzenia sobie z
sytuacja polega na tym, aby program automatycznie wybrał wartość t który spełnia dane
limit wykorzystania pamięci określony (w Gb) przez -M parametr. Domyślnie danger będzie użyty
ilość pamięci fizycznej do wyboru -M. Jeśli chcesz używać mniej, powiedz tylko 8 Gb
na węźle klastra HPC 24 Gb, ponieważ chcesz uruchomić wersję 3 danger następnie zadania w węźle
sprecyzować -M8. Określanie -M0 zasadniczo wskazuje, że nie chcesz danger do siebie
dostosuj tłumienie k-merów, aby zmieściło się w danej ilości pamięci.

Dla każdego przedmiotu docelowa para bloków, powiedzmy X i Y, program raportuje wyrównanie gdzie
odczyt a jest w X, a odczyt b jest w Y i odwrotnie. Jeśli jednak -A Jest opcja
set („A” oznacza „asymetryczny”), a następnie po prostu nakłada się na miejsce, w którym odczyt a znajduje się w X, a odczyt b
w Y są zgłaszane, a jeśli X = Y, następnie zgłasza tylko te przypadki nakładania się, w których
indeks a-read jest mniejszy niż indeks b-read. W obu przypadkach, jeśli -I opcja jest ustawiona („I”
dla „tożsamości”), to gdy X = Y, różne części tego samego odczytu nakładają się na siebie
również zostać znalezione i zgłoszone.

Każde znalezione dopasowanie jest rejestrowane jako -- a[ab,ae] x bo[bb,be] -- gdzie aib to
indeksy (w przyciętym DB) odczytów, które nakładają się, o wskazuje, czy b-odczyt jest
z tej samej lub przeciwnej nici, a [ab,ae] i [bb,be] są odstępami a i bo,
odpowiednio, które się wyrównują. Program umieszcza te rekordy wyrównania w plikach o nazwie
ma postać XY[C|N]#.las, gdzie C wskazuje, że b-odczyty są uzupełnione, a N
wskazuje, że tak nie jest (wykonywane są oba porównania), a # to wątek, który wykrył
i spisał zbiór zestawień zawartych w pliku. To jest plik
XYO#.las zawiera wyrównania utworzone przez wątek #, dla którego odczyt a pochodzi z X i
b-odczyt pochodzi z Y i ma orientację O. Polecenie danger -A X Y tworzy 2*NTHREAD
pliki wątków XY?.las i danger X Y tworzy pliki 4*NTHREAD XY?.las i YX?.las
(chyba że X=Y w takim przypadku tworzone są tylko pliki NTHREAD, XX?.las).

Domyślnie danger porównuje wszystkie nałożenia się odczytów w bazie danych, które są większe
niż minimalna wartość odcięcia ustawiona przy dzieleniu bazy danych lub baz danych, zazwyczaj 1 lub 2 Kbp. Jednakże,
potok montażu HGAP chce korygować tylko duże odczyty, powiedzmy 8 Kbp lub więcej i tak dalej
potrzebuje tylko nakładek, w których odczyt a jest jednym z dużych odczytów. Ustawiając -H
parametr, aby powiedzieć N, zmienia się danger tak, że raportuje tylko nakładanie się tam, gdzie a-read
ma długość ponad N par zasad.

Chociaż domyślne ustawienia parametrów są dobre w przypadku surowych danych Pacbio, danger mogą być stosowane
do skutecznego znajdowania dopasowań w poprawionych odczytach lub innych mniej zaszumionych odczytach. Dla
na przykład do mapowania aplikacji na .dams uruchamiamy

danger -k20 -h60 -e.85

i po poprawionych odczytach zazwyczaj biegamy

danger -k25 -w5 -h60 -e.95 -s500

i przy tych ustawieniach jest bardzo szybki.

Korzystaj z daligner online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    Zabbix
    Zabbix
    Zabbix jest otwartą platformą klasy korporacyjnej
    rozwiązanie do monitorowania rozproszonego źródła
    przeznaczony do monitorowania i śledzenia
    wydajność i dostępność sieci
    serwery, urządzenia...
    Pobierz Zabbixa
  • 2
    KRóżn.3
    KRóżn.3
    To repozytorium nie jest już obsługiwane
    i jest przechowywany w celach archiwalnych. Widzieć
    https://invent.kde.org/sdk/kdiff3 for
    najnowszy kod i
    https://download.kde.o...
    Pobierz KDiff3
  • 3
    USBLoaderGX
    USBLoaderGX
    USBLoaderGX to GUI dla
    Ładowarka USB firmy Waninkoko, oparta na
    libwiigui. Umożliwia wyświetlanie i
    uruchamianie gier Wii, gier Gamecube i
    homebrew na Wii i WiiU...
    Pobierz USBLoaderGX
  • 4
    Firebird
    Firebird
    Firebird RDBMS oferuje funkcje ANSI SQL
    & działa w systemach Linux, Windows i
    kilka platform uniksowych. Cechy
    doskonała współbieżność i wydajność
    & moc...
    Pobierz Firebirda
  • 5
    KompoZer
    KompoZer
    KompoZer to edytor HTML wykorzystujący wysiwyg
    bazy kodu Mozilla Composer. Jak
    Rozwój Nvu został zatrzymany
    w 2005 roku KompoZer naprawia wiele błędów i
    dodaje k...
    Pobierz KompoZer
  • 6
    Darmowy program do pobierania plików Manga
    Darmowy program do pobierania plików Manga
    Darmowy Manga Downloader (FMD) to
    aplikacja open source napisana w
    Object-Pascal do zarządzania i
    pobieranie mangi z różnych stron internetowych.
    To jest lustro...
    Pobierz darmowy program do pobierania mangi
  • więcej »

Komendy systemu Linux

Ad