Jest to polecenie gmap, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu Mac OS
PROGRAM:
IMIĘ
gmap - Program mapowania i wyrównywania genomu
STRESZCZENIE
gmapa [OPCJE...] <SZYBKA pliki...>, or Kot | gmap [OPCJE...]
OPCJE
Wkład Opcje (musi zawierać -d or -g)
-D, --reż=katalog
Katalog genomu. Domyślny (określony przez --with-gmapdb do programu konfiguracyjnego)
is /var/cache/gmap
-d, --db.=STRING
Baza danych genomu. Jeśli argumentem jest „?” (z cudzysłowami), to polecenie wyświetla
dostępnych baz danych.
-k, -- kmer=INT
rozmiar kmer do użycia w bazie danych genomu (dozwolone wartości: 16 lub mniej). Jeśli nie
określony, program znajdzie najwyższy dostępny rozmiar kmer w genomie
baza danych
--próbowanie=INT
Próbkowanie do wykorzystania w bazie danych genomu. Jeśli nie zostanie określony, program znajdzie
najmniejsza dostępna wartość próbki w bazie danych genomu w ramach wybranej wielkości k-mer
-G, --genomfull
Użyj pełnego genomu (dozwolone są wszystkie znaki ASCII; budowane jawnie podczas konfiguracji), nie
wersja skompresowana
-g, --gseg=filename
Dostarczony przez użytkownika segment genomowy
-1, --samowyrównaj
Wyrównaj jedną sekwencję względem siebie w formacie FASTA przez standardowe wejście (przydatne do uzyskania
translacja białka sekwencji nukleotydowej)
-2, --Dopasuj do pary
Dopasuj dwie sekwencje w formacie FASTA przez standardowe wejście, z których pierwsza jest genomowa, a druga
jeden jest cDNA
--cmdlinia=STRING,STRUNOWY
Dopasuj te dwie sekwencje podane w wierszu poleceń, z których pierwsza jest genomowa i
drugi to cDNA
-q, --część=INT/INT
Przetwarzaj tylko i-ty z każdych n ciągów, np. 0/100 lub 99/100 (przydatne dla
dystrybucja zadań do farmy komputerowej).
--rozmiar-bufora-wejściowego=INT
Rozmiar bufora wejściowego (program odczytuje tyle sekwencji na raz, aby zwiększyć wydajność)
(domyślnie 1000)
Opcje obliczeń
-B, --seria=INT
Tryb wsadowy (domyślnie = 2)
Tryb Przesunięcia Pozycje Genom
0 patrz uwaga mmap mmap
1 patrz uwaga mmap i wstępne ładowanie mmap
(domyślnie) 2 patrz uwaga Mmap i ładowanie wstępne Mmap i ładowanie wstępne
3 patrz uwaga przydzielić Mmap i wstępne ładowanie
4 patrz uwaga przydzielić przydzielić
5 rozwiń przydziel przydziel
Uwaga: dla pojedynczej sekwencji wszystkie struktury danych używają mmap
Jeśli mmap nie jest dostępny, a alokacja nie jest wybrana, użyje fileio (bardzo wolno)
Uwaga na temat --seria i offsety: Rozbudowa offsetów może być kontrolowana
niezależnie przez --rozwiń-przesunięcia flaga. ten --seria=5 opcja jest równoważna
--seria=4 plus --rozwiń-przesunięcia=1
--rozwiń-przesunięcia=INT
Czy rozwinąć indeks przesunięcia genomowego Wartości: 0 (nie, domyślnie) lub 1 (tak).
Rozszerzenie zapewnia szybsze wyrównanie, ale wymaga więcej pamięci
--nosplicing
Wyłącza splicing (przydatne przy dopasowywaniu sekwencji genomowych do genomu)
--min-introndługość=INT
Minimalna długość jednego wewnętrznego intronu (domyślnie 9). Poniżej tego rozmiaru luka genomowa
będzie uważane za usunięcie, a nie intron.
-K, --introndługość=INT
Maksymalna długość dla jednego wewnętrznego intronu (domyślnie 200000)
-w, --lokalny splicedysta=INT
Maksymalna długość znanych miejsc łączenia na końcach sekwencji (domyślnie 2000000)
-L, --długość całkowita=INT
Maksymalna całkowita długość intronu (domyślnie 2400000)
-x, --chimera-marża=INT
Ilość niewyrównanej sekwencji, która uruchamia wyszukiwanie pozostałej sekwencji
(domyślnie 30). Umożliwia wyrównanie odczytów chimerycznych i może pomóc w niektórych
niechimeryczne odczyty. Aby wyłączyć, ustaw na zero.
--bez chimer
Wyłącza znajdowanie chimer. Ten sam efekt co --chimera-marża=0
-t, --nwątki=INT
Liczba wątków roboczych
-c, --chrssubset=ciąg
Ogranicz wyszukiwanie do danego chromosomu
-z, --kierunek=STRING
kierunek cDNA (sense_force, antisense_force, sense_filter, antisense_filter lub
auto (domyślnie))
-H, --trimendeksony=INT
Przytnij eksony końca z mniejszą liczbą dopasowań niż podana (w nt, domyślnie 9)
--tryb-kanoniczny=INT
Nagroda za kanoniczne i półkanoniczne introny 0=niska nagroda, 1=wysoka nagroda
(domyślnie), 2=niska nagroda za sekwencje o wysokiej tożsamości i wysoka nagroda w przeciwnym razie
--międzygatunkowe
Użyj bardziej czułego wyszukiwania splicingu kanonicznego, co jest szczególnie przydatne w przypadku
wyrównania międzygatunkowe i inne trudne przypadki
--allow-close-indels=INT
Zezwalaj na wstawianie i usuwanie blisko siebie (0=nie, 1=tak (domyślnie), 2=tylko
dla wyrównania wysokiej jakości)
--mikroekson-spliceprob=FLOAT
Zezwalaj na mikroeksony tylko wtedy, gdy jedno z prawdopodobieństw miejsca splicingu jest większe niż to
wartość (domyślnie 0.95)
--cmetdir=STRING
Katalog plików indeksu metylocytozyny (utworzony przy użyciu cmetindex) (domyślnie
lokalizacja plików indeksu genomu określona za pomocą -D, -V, -d)
--atoidir=STRING
Katalog do edycji plików indeksu A-to-I RNA (utworzonych za pomocą atoiindex) (domyślnie:
lokalizacja plików indeksu genomu określona za pomocą -D, -V, -d)
--tryb=STRING
Tryb wyrównania: standardowy (domyślny), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi bez nici, ttoc z nicią lub ttoc bez nici. Niestandardowe tryby wymagają
wcześniej uruchamiałeś programy cmetindex lub atoiindex (które również obejmują
tryby ttoc) na genomie
-p, --poziom śliwek
Poziom przycinania: 0=brak przycinania (domyślnie), 1=słabe sekwencje, 2=powtarzalne sekwencje, 3=słabe i
powtarzalne
Typy wyjść
-S, --streszczenie
Pokaż tylko podsumowanie linii trasowania
-A, --wyrównywać
Pokaż wyrównania
-3, --ciągły
Pokaż wyrównanie w trzech ciągłych liniach
-4, --ciągły-według-egzonu
Pokaż wyrównanie w trzech liniach na egzon
-Z, --Kompresja
Wydrukuj wydruk w formacie skompresowanym
-E, --egzony=STRING
Drukuj egzony („cdna” lub „genomiczne”)
-P, --białko_dna
Sekwencja białka druku (cDNA)
-Q, --białko_gen
Sekwencja białka druku (genomiczna)
-f, --format=INT
Inny format wyjścia (zwróć też uwagę na -A i -S opcje i inne wymienione opcje
w sekcji Typy wyjść):
psl (lub 1) = format PSL (BLAT),
gff3_gene (lub 2) = format genu GFF3,
gff3_match_cdna (lub 3) = format cDNA_match GFF3,
gff3_match_est (lub 4) = format GFF3 EST_match,
splicesites (lub 6) = wyjście splicesites (dla pliku splicingu GSNAP),
introns = wyjście intronów (dla pliku splicingu GSNAP),
map_exons (lub 7) = format mapy egzonowej IIT FASTA,
map_ranges (lub 8) = format mapy zasięgu IIT FASTA,
coords (lub 9) = coords w formacie tabeli,
sampe = format SAM (ustawienie bitu paired_read we fladze),
samse = format SAM (bez ustawienia bitu paired_read)
Opcje wyjściowe
-n, --nścieżki=INT
Maksymalna liczba ścieżek do wyświetlenia (domyślnie 5). Jeśli ustawiony na 1, GMAP nie będzie raportować
chimeryczne wyrównania, ponieważ implikują one dwie ścieżki. Jeśli chcesz jedno wyrównanie
plus wyrównania chimeryczne, a następnie ustaw to na 0.
--wynik-suboptymalny=INT
Raportuj tylko ścieżki, których wynik mieści się w tej wartości najlepszej ścieżki. Domyślnie,
jeśli ta opcja nie jest podana,
program drukuje wszystkie znalezione ścieżki.
-O, --zamówione
Wydrukuj dane wyjściowe w tej samej kolejności co dane wejściowe (istotne tylko wtedy, gdy jest więcej niż jeden pracownik)
wątek)
-5, --md5
Wydrukuj sumę kontrolną MD5 dla każdej sekwencji zapytania
-o, --chimera-nakłada się
Nakładaj, aby pokazać, jeśli w ogóle, w punkcie przerwania chimery
--tylko nieudane
Drukuj tylko nieudane wyrównania, te bez wyników
--nieudane
Wyklucz drukowanie nieudanych wyrównań
-V, --snpskatalog=STRING
Katalog dla plików indeksu SNP (utworzonych przy użyciu snpindex) (domyślna lokalizacja to
pliki indeksu genomu określone za pomocą -D i -d)
-v, --użyj-snps=STRING
Użyj bazy danych zawierającej znane SNP (w .iit, zbudowany wcześniej przy użyciu
snpindex) dla tolerancji na SNP
--podzielone wyjście=STRING
Nazwa bazowa dla wyjścia wieloplikowego, osobno dla nomapowania,
uniq, mult (i chimera, jeśli --chimera-marża jest zaznaczone)
--nieudane wejście=STRING
Wydrukuj całkowicie nieudane wyrównania jako dane wejściowe w formacie FASTA lub FASTQ do podanego
plik. Jeśli --podzielone wyjście podana jest również flaga, ten plik jest generowany dodatkowo
do danych wyjściowych w pliku .nomapping.
--dołącz-wyjście
Kiedy --podzielone wyjście or --nieudane wejście jest podana, ta flaga dołączy dane wyjściowe do
istniejące pliki. W przeciwnym razie domyślnie tworzone są nowe pliki.
--output-buffer size=INT
Rozmiar bufora w zapytaniach dla wątku wyjściowego (domyślnie 1000). Kiedy liczba
wyniki do wydrukowania przekraczają ten rozmiar, wątki robocze są zatrzymywane do czasu
zaległości są wyczyszczone
-F, --pełna długość
Przyjmij białko o pełnej długości, zaczynając od Met
-a, --cdstart=INT
Przetłumacz kodony z podanego nukleotydu (na podstawie 1)
-T, --ścięty
Skróć wyrównanie wokół białka pełnej długości, Met to Stop Implikuje -F flag.
-Y, --tolerancyjny
Tłumaczy cDNA z poprawkami na przesunięcia ramki
Opcje wyjścia GFF3
--gff3-dodaj-separatory=INT
Czy dodać separator ### po każdej sekwencji zapytania Wartości: 0 (nie), 1 (tak,
domyślna)
Opcje wyjścia SAM
--no-sam-nagłówki
Nie drukuj nagłówków zaczynających się od „@”
--sam-use-0M
Wstaw 0M w CIGAR między sąsiednimi wstawieniami i usunięciami Wymagane przez Picarda,
ale może powodować błędy w innych narzędziach
--force-xs-dir
W przypadku wyrównań RNA-Seq nie zezwala na XS:A:? kiedy kierunek zmysłu jest niejasny i
zastępuje tę wartość arbitralnie przez XS:A:+. Może się przydać w niektórych programach, np.
jako spinki do mankietów, które nie poradzą sobie z XS:A:?. Jeśli jednak użyjesz tej flagi,
raportowana wartość XS:A:+ w takich przypadkach nie będzie miała znaczenia.
--md-małe-snp
W ciągu MD, gdy znane SNP są podane przez -v flaga,
drukuje nukleotydy różnicowe jako małe litery, gdy one,
różnią się od odniesienia, ale pasują do znanego alternatywnego allelu
--akcja-jeśli-błąd-cygara
Działania, które należy podjąć w przypadku rozbieżności między długością CIGAR a długością sekwencji
Dozwolone wartości: ignorowanie, ostrzeżenie (domyślne), przerwanie
--identyfikator-grupy-odczytu=STRING
Wartość do umieszczenia w polu identyfikatora grupy odczytu (RG-ID)
--odczyt-nazwa-grupy=STRING
Wartość do umieszczenia w polu nazwy grupy odczytu (RG-SM)
--odczyt-biblioteka-grupy=STRING
Wartość do umieszczenia w polu biblioteki grupy do odczytu (RG-LB)
--platforma-odczytu-grupy=STRING
Wartość do umieszczenia w polu biblioteki grupy do odczytu (RG-PL)
Opcje oceny jakości
--protokół-jakości=STRING
Protokół dla wejściowych wyników jakości. Dozwolone wartości: iluminacja (ASCII 64-126)
(równoważny -J 64 -j -31) śpiewak (ASCII 33-126) (odpowiednik -J 33 -j 0)
Domyślnie jest to sanger (brak zmiany jakości druku)
Pliki wyjściowe SAM powinny mieć wyniki jakości w protokole sanger
Lub możesz określić przesunięcie drukowania za pomocą tej flagi:
-j, --jakość-przesunięcie-druku=INT
Przesuń wyniki jakości FASTQ o tę wartość na wyjściu (domyślnie 0 dla sangera)
protokół; aby zmienić wejście Illumina na wyjście Sanger, wybierz -31)
Opcje pliku mapy zewnętrznej
-M, --mapdir=katalog
Katalog map
-m, --mapa=plik iit
Plik mapy. Jeśli argumentem jest „?” (z cytatami),
zawiera listę dostępnych plików map.
-e, --mapeksony
Mapuj każdy egzon osobno
-b, --mapoba
Zgłoś trafienia z obu nici genomu
-u, --flankowanie=INT
Pokaż ciosy z flanki (domyślnie 0)
--drukuj-komentarz
Pokaż wiersz komentarza dla każdego trafienia
Opcje wyjścia wyrównania
-N, --niedługości
Brak długości intronów w wyrównaniu
-I, --odwróć tryb=INT
Tryb dopasowania do nici genomowej (-): 0=Nie odwracaj cDNA (domyślnie)
1=Odwróć cDNA i wydrukuj genomową (-) nić 2=Odwróć cDNA i wydrukuj genomową (+)
pasmo
-i, --introgap=INT
Nukleotydy do pokazania na każdym końcu intronu (domyślnie 3)
-l, --długość owinięcia=INT
Długość owijania do wyrównania (domyślnie 50)
Opcje filtrowania wyjścia
--min-przycięte-pokrycie=FLOAT
Nie drukuj wyrównań z przyciętym pokryciem pomniejszonym o tę wartość (domyślnie=0.0, co
oznacza brak filtrowania) Zauważ, że chimeryczne wyrównania będą wyświetlane niezależnie od tego
filtrować
--min-tożsamość=FLOAT
Nie drukuj wyrównań o tożsamości mniejszej niż ta wartość (domyślnie=0.0, co oznacza nie
filtrowanie) Zauważ, że chimeryczne wyrównania będą wyprowadzane niezależnie od tego filtra
Opcje pomocy
--sprawdzać
Sprawdź założenia kompilatora
--wersja
Pokaż wersję
--help Pokaż tę wiadomość pomocy
Inne narzędzia pakietu GMAP znajdują się w /usr/lib/gmap
Korzystaj z gmap online za pomocą usług onworks.net