Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

maq - Online w chmurze

Uruchom maq u dostawcy bezpłatnego hostingu OnWorks przez Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS

To jest polecenie maq, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS

PROGRAM:

IMIĘ


Maq - Mapowanie i montaż z jakościami

STRESZCZENIE


ale Q komenda [Opcje] argumenty

maq.pl komenda [Opcje] argumenty

OPIS


Maq to oprogramowanie, które buduje zestawy mapujące z krótkich odczytów generowanych przez następny
maszyny do sekwencjonowania generacji. Jest specjalnie zaprojektowany dla Illumina-Solexa 1G Genetic
Analizator i posiada wstępną funkcjonalność do obsługi danych AB SOLiD.

Dzięki Maq możesz:

· Szybkie dopasowanie odczytów Illumina/SOLiD do genomu referencyjnego. Przy domyślnych opcjach jeden
milion par odczytów można zmapować do ludzkiego genomu w około 10 godzin pracy procesora przy mniej
niż 1G pamięci.

· Dokładny pomiar prawdopodobieństwa błędu wyrównania każdego indywidualnego odczytu.

· Nazwij zgodne genotypy, w tym polimorfizmy homozygotyczne i heterozygotyczne, z
probabilistyczna jakość Phred przypisana do każdej bazy.

· Znajdź krótkie indeksy ze sparowanymi odczytami końca.

· Dokładne znajdowanie delecji i translokacji genomu na dużą skalę za pomocą odczytów sparowanych końców.

· Odkryj potencjalne CNV, sprawdzając głębokość odczytu.

· Oceń dokładność jakości surowych baz sekwenserów i pomóż sprawdzić
błędy systematyczne.

Jednak Maq może NIE:

· Robić de nowy montaż. (Maq może wywołać konsensus tylko poprzez mapowanie odczytów do znanej
referencja.)

· Spodenki na mapie czytają przeciwko sobie. (Maq może znaleźć tylko pełne nakładanie się odczytów.)

· Dopasuj odczyty kapilarne lub 454 odczyty do odniesienia. (Maq nie może wyrównać odczytów dłuższych niż
63pb.)

MAQ POLECENIA


Klawisz Polecenia

fasta2bfa ale Q fasta2bfa w.ref.fasta out.ref.bfa

Konwertuj sekwencje w formacie FASTA na format BFA (binarny FASTA) Maqa.

szybkoq2bfq ale Q szybkoq2bfq [-n nready] w.odczyt.szybki out.odczyt.bfqout.przedrostek

Konwertuj odczyty w formacie FASTQ na format BFQ (binarny FASTQ) Maq.

OPCJE:

-n INT liczba odczytów na plik [nie określono]

mapa ale Q mapa [-n nmis] [-a maksymy] [-c] [-1 Len1] [-2 Len2] [-d adaptacja3] [-m mutować]
[-u niezmapowane] [-tj maks] [-M c⎪g] [-N] [-H wszystkie hity] [-C maxy] out.aln.map
w.ref.bfa in.odczyt1.bfq [in.odczyt2.bfq] 2> out.mapa.log

Mapa odczytuje sekwencje referencyjne.

OPCJE:

-n INT Liczba maksymalnych niezgodności, które zawsze można znaleźć [2]

-a INT Maksymalna odległość zewnętrzna dla prawidłowej pary odczytu [250]

-A INT Maksymalna odległość zewnętrzna dwóch płatnych odczytów RF (0 oznacza wyłączenie) [0]

-c Mapy czytane w przestrzeni kolorów (tylko dla SOLiD)

-1 INT Długość odczytu dla pierwszego odczytu, 0 dla auto [0]

-2 INT Długość odczytu dla drugiego odczytu, 0 dla auto [0]

-m FLOAT Szybkość mutacji między sekwencjami referencyjnymi a odczytami [0.001]

-d FILE Określ plik zawierający pojedynczą linię sekwencji 3'-adaptera
[zero]

-u FILE Zrzuć niezmapowane odczyty i odczyty zawierające więcej niż nmis niedopasowania do
oddzielny plik [null]

-e INT Próg dla sumy niedopasowania jakości bazowych [70]

-H FILE Zrzuć wielokrotne/wszystkie niezgodności 01 do FILE [zero]

-C INT Maksymalna liczba trafień do wyjścia. Nieograniczony, jeśli jest większy niż 512. [250]

-M tryb wyrównania metylacji c⎪g. Wszystkie C (lub G) na przedniej nici będą
zmieniono na T (lub A). Ta opcja służy tylko do testowania.

-N zapisz niezgodną pozycję w pliku wyjściowym out.aln.map. Kiedy to
jest używana, maksymalna dozwolona długość odczytu to 55bp.

UWAGA:

* Sparowane odczyty końców powinny być przygotowane w dwóch plikach, po jednym dla każdego końca, z
odczyty są sortowane w tej samej kolejności. Oznacza to k-ty odczyt w pierwszym
plik jest powiązany z k-tym odczytanym plikiem w drugim pliku. Odpowiednie przeczytanie
nazwy muszą być identyczne, aż do zakończenia `/1' lub `/2'. Na przykład takie
dozwolona jest para odczytanych nazw: `EAS1_1_5_100_200/1' i
„EAS1_1_5_100_200/2”. Ogonowanie `/[12]' jest zwykle generowane przez
GAPipeline, aby odróżnić dwa końce w parze.

* Dane wyjściowe to skompresowany plik binarny. Ma na to wpływ endianowość.

* Najlepszym sposobem na uruchomienie tego polecenia jest dostarczenie około 1 do 3 milionów odczytów jako
Wejście. Więcej odczytów zajmuje więcej pamięci.

* Opcja -n kontroluje czułość wyrównania. Domyślnie hit z
zawsze można znaleźć do 2 niezgodności. Wyższy -n znajduje więcej hitów, a także
poprawia dokładność odwzorowania jakości. Odbywa się to jednak kosztem
prędkości.

* Wyrównania z wieloma niezgodnościami wysokiej jakości należy odrzucić jako fałszywe
wyrównania lub możliwe zanieczyszczenia. To zachowanie jest kontrolowane przez opcję
-e, -e próg jest obliczany tylko w przybliżeniu, ponieważ podstawowe cechy
są dzielone przez 10 na pewnym etapie wyrównywania. ten -Q opcja w
montować polecenie precyzyjnie ustaw próg.

* Mówi się, że para odczytów jest poprawnie sparowana wtedy i tylko wtedy, gdy
orientacja jest FR a zewnętrzna odległość pary nie jest większa niż
maksymy. Nie ma ograniczeń co do minimalnego rozmiaru płytki. To ustawienie jest
określone przez algorytm sparowanego wyrównania końca stosowany w Maq. Wymaganie
minimalny rozmiar płytki doprowadzi do niektórych nieprawidłowych wyrównań przy bardzo
przeszacowane właściwości mapowania.

* Obecnie odczytane pary z biblioteki długich wstawek Illumina/Solexa mają odczyt RF
orientacja. Maksymalny rozmiar płytki jest ustawiany przez opcję -A. Jednak długo-
biblioteka wstawek jest również mieszana z niewielką częścią odczytu krótkich wstawek
par. -a powinien być również prawidłowo ustawiony.

* Czasami można zsekwencjonować 5'-koniec lub nawet całą sekwencję adaptera 3'.
Zapewnienie -d renderuje Maq w celu wyeliminowania zanieczyszczeń adaptera.

* Biorąc pod uwagę 2 miliony odczytów jako dane wejściowe, ale Q zwykle zajmuje 800 MB pamięci.

scalanie map ale Q scalanie map out.aln.map w.aln1.mapa w.aln2.mapa [...]

Połącz ze sobą partię wyrównań odczytu.

UWAGA:

* Teoretycznie to polecenie może łączyć nieograniczoną liczbę wyrównań. Jednak jak
mapmerge będzie odczytywać wszystkie wejścia w tym samym czasie, może uderzyć w
limit maksymalnej liczby otwieranych plików ustawiony przez system operacyjny. Obecnie to
musi być rozwiązywany ręcznie przez użytkowników końcowych.

* Komenda scalanie map może być używany do łączenia plików wyrównania z różnymi odczytami
długości. Wszystkie kolejne analizy nie zakładają już stałej długości.

rmdup ale Q rmdup out.rmdup.map w.ori.mapa

Usuń pary o identycznych współrzędnych zewnętrznych. Zasadniczo pary z
identyczne współrzędne zewnętrzne powinny się zdarzać rzadko. Jednak ze względu na
amplifikacja w przygotowaniu próbki, występuje znacznie częściej niż przez
szansa. Z praktycznych analiz wynika, że ​​usuwanie duplikatów pomaga poprawić
ogólna dokładność wywołania SNP.

montować ale Q montować [-sp] [-m maksmis] [-Q maks] [-r hetrat] [-t współczynnik] [-q minQ] [-N
nHap] out.cns w.ref.bfa w.aln.map 2> out.cns.log

Wywołaj sekwencje konsensusu z mapowania odczytu.

OPCJE:

-t FLOAT Współczynnik zależności od błędu [0.93]

-r FLOAT Frakcja heterozygot wśród wszystkich ośrodków [0.001]

-s Potraktuj jakość odwzorowania pojedynczego końca jako ostateczną jakość odwzorowania;
w przeciwnym razie zostanie użyta sparowana jakość odwzorowania końcówek

-p Odrzuć sparowane odczyty końca, które nie są zmapowane w poprawnych parach

-m INT Maksymalna dozwolona liczba niezgodności dla odczytu, który ma być użyty w
powołanie do konsensusu [7]

-Q INT Maksymalna dozwolona suma wartości jakości niedopasowanych baz [60]

-q INT Minimalna jakość mapowania dozwolona dla odczytu, który ma być używany w konsensusie
dzwonię [0]

-N INT Liczba haplotypów w puli (>=2) [2]

UWAGA:

* Opcja -Q ustala limit maksymalnej sumy niedopasowanych cech podstawowych.
Odczyty zawierające wiele niezgodności wysokiej jakości należy odrzucić.

* Opcja -N ustawia liczbę haplotypów w puli. Jest przeznaczony do
ponowne sekwencjonowanie próbek przez połączenie wielu szczepów/osobników razem. Do
resekwencjonowanie genomu diploidalnego, ta opcja wynosi 2.

glfgen ale Q glfgen [-sp] [-m maksmis] [-Q maks] [-r hetrat] [-t współczynnik] [-q minQ] [-N
nHap] out.cns w.ref.bfa w.aln.map 2> out.cns.log

Oblicz prawdopodobieństwo logarytmiczne dla wszystkich genotypów i przechowuj wyniki w formacie GLF
(Format wiarygodności genotypowania). Proszę sprawdzić stronę MAQ, aby uzyskać szczegółowe informacje
opisy formatu pliku i powiązanych narzędzi.

indelpe ale Q indelpe w.ref.bfa w.aln.map > out.indelpe

Wywołaj spójne indeksy ze sparowanych odczytów końcowych. Dane wyjściowe są rozdzielane tabulatorami za pomocą
każda linia składająca się z chromosomu, pozycji początkowej, typu indelu, liczby
odczytów w poprzek indelu, wielkości indelu i wstawionych/usuniętych nukleotydów
(oddzielone dwukropkiem), liczba indelów na odwrotnej nici, liczba indelów
na przedniej nici, sekwencja 5' przed indelem, sekwencja 3' następująca
indel, liczba odczytów wyrównana bez indeksów i trzy dodatkowe kolumny
do filtrów.

W trzeciej kolumnie, typ indelu, gwiazdka wskazuje, że indel jest potwierdzony
przez odczyty z obu nici, plus oznacza, że ​​indeks został trafiony przez co najmniej dwa odczyty
ale z tej samej nici minus wskazuje, że indeks znajduje się tylko na jednym odczycie,
a kropka oznacza, że ​​indeks znajduje się zbyt blisko innego indeksu i jest odfiltrowywany.

Zaleca się, aby użytkownicy przechodzili przez `maq.pl indelpe' w celu poprawienia liczby
odczyty mapowane bez indeksów. Więcej szczegółów znajdziesz w `maq.pl indelpe'


indelsoa ale Q indelsoa w.ref.bfa w.aln.map > out.indelsoa

Nazwij potencjalne homozygotyczne indele i punkty załamania, wykrywając anormalne
wzór wyrównania wokół elementów wewnętrznych i punktów przerwania. Wyjście to również TAB
oddzielony każdą linią składającą się z chromosomu, przybliżona współrzędna,
długość nieprawidłowego obszaru, liczba odczytów zmapowanych w całej pozycji,
liczba odczytów po lewej stronie pozycji i liczba odczytów włączonych
po prawej stronie. Ostatnią kolumnę można zignorować.

Dane wyjściowe zawierają wiele fałszywych alarmów. Zalecanym filtrem może być:

awk '$5+6$-4$ >= 3 && 4$ <= 1' in.indelsoa

Zauważ, że to polecenie nie ma być dokładnym wykrywaczem indelu, ale
głównie pomaga uniknąć niektórych fałszywych trafień w wywołaniu podmiany. w
ponadto działa dobrze tylko przy dużej głębokości (na przykład ~40X); w przeciwnym razie
Wskaźnik wyników fałszywie ujemnych byłby bardzo wysoki.

utworzony Konwersja

sol2sanger ale Q sol2sanger w.sol.fastq nie.sanger.fastq

Konwertuj Solexa FASTQ na format standardowy/Sanger FASTQ.

bfq2fastq ale Q bfq2fastq in.odczyt.bfq out.read.fastq

Konwertuj format BFQ Maq na standardowy format FASTQ.

mapass2maq ale Q mapass2maq w.mapass2.map out.maq.map

Konwertuj przestarzały format mapy mapass2 na format mapy Maq. Stary format nie
nie zawierają przeczytanych nazw.

Informacja Ekstrahujący

widok mapy ale Q widok mapy [-bN] w.aln.map > out.aln.txt

Wyświetl wyrównanie odczytu w postaci zwykłego tekstu. Dla odczytów wyrównanych przed Smithem-
Wyrównanie Watermana, każda linia składa się z odczytanej nazwy, chromosomu, pozycji,
nić, rozmiar wstawki z zewnętrznych współrzędnych pary, sparowana flaga, mapowanie
jakość, jakość odwzorowania na jednym końcu, alternatywna jakość odwzorowania, liczba
niedopasowania najlepszego hitu, suma cech niedopasowanych baz najlepszych
trafienie, liczba trafień 0-mismatch z pierwszych 24 pb, liczba trafień 1-mismatch of
pierwsze 24 pz na referencji, długość odczytu, sekwencja odczytu i jej
jakość. Alternatywna jakość mapowania jest zawsze równa jakości mapowania, jeśli
odczyty nie są sparowane. Jeśli odczyty są sparowane, równa się mniejszemu mapowaniu
jakość obu końców. Ta alternatywna jakość odwzorowania jest w rzeczywistości
jakość odwzorowania nieprawidłowej pary.

Piąta kolumna, sparowana flaga, jest flagą bitową. Jego dolne 4 bity dają
orientacja: 1 oznacza FF, 2 to FR, 4 to RF, a 8 to RR, gdzie FR oznacza
że odczyt o mniejszej współrzędnej znajduje się na nitce przedniej, a jego partner to
na odwrotnej nitce. Tylko FR jest dozwolona dla prawidłowej pary. Wyższe bity
tej flagi podać dalsze informacje. Jeśli para spotyka sparowany koniec
wymagania, zostanie ustawionych 16. Jeśli dwa odczyty są zmapowane na różne
chromosomów, zostaną ustawione 32. Jeśli jeden z dwóch odczytów nie może być w ogóle zmapowany,
64 zostaną ustawione. Flaga prawidłowej pary zawsze wynosi 18.

W przypadku odczytów wyrównanych później przez wyrównanie Smitha-Watermana flagą jest
zawsze 130. Linia składa się z odczytanej nazwy, chromosomu, pozycji, nici, wstawki
rozmiar, flaga (zawsze 130), pozycja indeksu na odczycie (0 jeśli nie ma indeksu),
długość indeli (pozytywna dla insercji i negatywna dla delecji),
jakość odwzorowania swojego partnera, liczba niedopasowań najlepszego trafienia, suma
cechy niedopasowanych baz najlepszego trafienia, dwa zera, długość odczytu,
sekwencja odczytu i jego jakość. Mat z odczytem oznaczonym 130 flagami zawsze dostaje
flaga 18.

Flaga 192 wskazuje, że odczyt nie jest mapowany, ale jego wiązanie jest mapowane. Dla takich
para odczytu, jeden odczyt ma flagę 64, a drugi 192.

OPCJE:

-b nie wyświetlaj sekwencji odczytu i jakości

-N wyświetlić pozycje, w których występują niezgodności. Ta flaga działa tylko
z plikiem .map wygenerowanym przez `maq map -N'.

kontrola mapy ale Q kontrola mapy [-s] [-m maksmis] [-q minQ] w.ref.bfa w.aln.map > sprawdzanie mapy

Przeczytaj kontrolę jakości. Kontrola mapy najpierw zgłasza skład i głębokość
referencje. Po tym jest formularz. Pierwsza kolumna wskazuje
pozycja na odczyt. Kolejne cztery kolumny, które pokazują nukleotyd
skład, zostaną podane współczynniki substytucji między referencją a odczytami.
Te stawki i liczby w kolejnych kolumnach są skalowane do 999 i
zaokrąglona do najbliższej liczby całkowitej. Kolejna grupa kolumn przedstawia rozkład
podstawowe jakości wzdłuż odczytów w przedziale jakościowym 10. Spadek jakości
zwykle można zaobserwować, co oznacza, że ​​pod koniec odczytu zasad jest mniej
dokładny. Ostatnia grupa kolumn przedstawia ułamek podstawień dla
czytać zasady w odstępach jakościowych. Mierzy to dokładność podstawowej jakości
oszacowanie. Idealnie, spodziewamy się zobaczyć 1 na 3? kolumna, 10 w 2? kolumna
i 100 w 1? kolumna.

OPCJE:

-s Weź jakość mapowania pojedynczego końca jako ostateczną jakość mapowania

-m INT Maksymalna liczba niezgodności dozwolonych do zliczenia odczytu [4]

-q INT Minimalna jakość odwzorowania dozwolona do zliczenia odczytu [30]

spiętrzyć ale Q spiętrzyć [-spvP] [-m maksmis] [-Q maks] [-q minQ] [-l plik witryny] w.ref.bfa
w.aln.map > out.pileup

Wyświetla wyrównanie w formacie tekstowym pileup. Każda linia składa się z
chromosom, pozycja, podstawa odniesienia, głębokość i podstawy odczytów, które obejmują
ta pozycja. Gdyby -v jest dodawany w wierszu poleceń, podstawowe cechy i mapowanie
cechy zostaną przedstawione w kolejności w szóstej i siódmej kolumnie.

Piąta kolumna zawsze zaczyna się od `@'. W tej kolumnie odczytaj zasady identyczne
do odnośnika są pokazywane jako przecinek `,' lub kropka `.', a podstawy odczytu są różne
od referencji w listach. Przecinek lub duża litera oznacza, że ​​podstawa
pochodzi z odczytu wyrównanego na przedniej nitce, podczas gdy kropka lub mała litera włączona
odwrotna nić.

Ta komenda jest przeznaczona dla użytkowników, którzy chcą rozwijać własnych rozmówców SNP.

OPCJE:

-s Weź jakość mapowania pojedynczego końca jako ostateczną jakość mapowania

-p Odrzuć sparowane odczyty końca, które nie są zmapowane jako prawidłowe pary

-v Wyświetlaj szczegółowe informacje, w tym podstawowe cechy i mapowanie
cechy

-m INT Maksymalna dozwolona liczba niezgodności dla odczytu [7]

-Q INT Maksymalna dozwolona liczba wartości jakości niezgodności [60]

-q INT Minimalna jakość mapowania dozwolona dla odczytu [0]

-l FILE Plik zawierający strony, z których będzie drukowany pileup. W tym
file pierwsza kolumna zawiera nazwy referencji, a druga
współrzędne. Dodatkowe kolumny zostaną zignorowane. [zero]

-P wyprowadza również pozycję bazową na odczyt

cns2fq ale Q cns2fq [-Q minMapaQ] [-n minNeiQ] [-d minGłębokość] [-D maksymalna głębokość] w.cns >
out.cns.fastq

Wyodrębnij sekwencje konsensusowe w formacie FASTQ. W wierszach sekwencji zasady
małymi literami są zasadniczo powtórzeniami lub nie mają wystarczającego pokrycia; podstawy
w dużych literach wskaż regiony, w których można wiarygodnie nazwać SNP. w
linie jakości, ASCII znaku minus 33 daje jakość PHRED.

OPCJE:

-Q INT Minimalna jakość odwzorowania [40]

-d INT Minimalna głębokość odczytu [3]

-n INT Minimalna jakość sąsiednia [20]

-D INT Maksymalna głębokość odczytu. >=255 dla nieograniczonej liczby. [255]

cns2snp ale Q cns2snp w.cns > out.snp

Wyodrębnij miejsca SNP. Każda linia składa się z chromosomu, pozycji, bazy odniesienia,
podstawa konsensusu, jakość konsensusu podobna do Phred, głębokość odczytu, średnia liczba
trafienia odczytów obejmujące tę pozycję, najwyższa jakość odwzorowania odczytów
pokrycie pozycji, minimalna jakość konsensusu w flankowaniu 3 pb
regiony po obu stronach serwisu (łącznie 6 pb), drugie najlepsze połączenie, log
iloraz wiarygodności drugiego najlepszego i trzeciego najlepszego połączenia oraz trzeciego najlepszego
połączenie.

Piąta kolumna jest kluczowym kryterium przy ocenie wiarygodności SNP.
Ponieważ jednak ta jakość jest obliczana tylko przy założeniu niezależności witryny, ty
powinien również wziąć pod uwagę inne kolumny, aby uzyskać dokładniejsze wywołania SNP. Scenariusz
polecenie `maq.pl Filtr SNP' jest do tego przeznaczony (patrz poniżej).

Siódma kolumna wskazuje, czy witryna należy do powtarzalnego regionu. Jeśli nie
czytanie obejmujące witrynę może być mapowane z wysoką jakością mapowania, flankowanie
region jest prawdopodobnie powtarzalny lub brakuje dobrych lektur. SNP w takim miejscu
zwykle nie jest wiarygodny.

Ósma kolumna w przybliżeniu podaje numer kopii regionu flankującego w
genom referencyjny. W większości przypadków liczba ta zbliża się do 1.00, co oznacza
region jest wyjątkowy. Czasami możesz zobaczyć niezerową głębokość odczytu, ale 0.00 at
siódma kolumna. Oznacza to, że wszystkie odczyty obejmujące pozycję mają w
co najmniej dwie niezgodności. Maq liczy tylko liczbę niezgodności 0 i 1, aby
referencje. Wynika to ze złożonego problemu technicznego.

Dziewiąta kolumna podaje sąsiednią jakość. Filtrowanie w tej kolumnie jest również
wymagane do uzyskania wiarygodnych SNP. Pomysł ten jest inspirowany NQS, chociaż NQS jest
początkowo przeznaczony do pojedynczego odczytu zamiast konsensusu.

cns2view ale Q cns2view w.cns > widok.zewn

Pokaż szczegółowe informacje we wszystkich witrynach. Format wyjściowy jest identyczny z
cns2snp zgłosić.

cns2ref ale Q cns2ref w.cns > out.ref.fasta

Wyodrębnij sekwencję referencyjną.

cns2win ale Q cns2win [-w rozmiar win] [-c chr] [-b rozpocząć] [-e zakończenia] [-q minQ] w.cns >
wygrana

Uzyskaj informacje uśrednione w oknie uprawowym. Dane wyjściowe są rozdzielane tabulatorami,
który składa się z nazwy referencyjnej, współrzędnej podzielonej przez 1,000,000 XNUMX XNUMX, stawki SNP,
het rate, surowa głębokość odczytu, głębokość odczytu w mniej więcej unikalnych regionach,
średnia liczba trafień odczytów w oknie i procent GC.

OPCJE:

-w INT Rozmiar okna [1000]

-c STR Docelowa sekwencja referencyjna; w przeciwnym razie zostaną użyte wszystkie referencje
[zero]

-b INT Pozycja początkowa, 0 dla braku ograniczenia [0]

-e INT Pozycja końcowa, 0 dla braku ograniczenia [0]

-q INT Minimalna konsensusowa jakość witryn do wykorzystania [0]

Symulacja Związane z

fałszywa ale Q fałszywa [-r mutować] [-R indelfrak] w.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Wprowadzaj w sposób losowy podstawienia i indeksy do odwołania. Zastępstwa i
można dodać pojedyncze indeksy par zasad.

OPCJE:

-r FLOAT Wskaźnik mutacji [0.001]

-R FLOAT Frakcja mutacji, które mają być indelami [0.1]

symultaniczny ale Q symultaniczny out.simupars.dat w.odczyt.szybki

Oszacowanie/parametry pociągu do symulacji odczytu.

symulować ale Q symulować [-d W rozmiarze] [-s standardowe odw] [-N nOdczyty] [-1 przeczytajLen1] [-2 przeczytajLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq w.ref.fasta
w.simupars.dat

Symuluj sparowane odczyty końcowe. Plik w.simupars.dat określa odczytane długości i
jakość dystrybucji. Jest generowany z symultaniczny, lub można go pobrać z
Strona internetowa Maq. W odczytanych plikach wyjściowych nazwa odczytu składa się z referencji
nazwę sekwencji i zewnętrzne współrzędne pary symulowanych odczytów. Za pomocą
domyślna, symulować zakłada, że ​​odczyty pochodzą z generowanego ciągu diploidalnego
dodając dwa różne zestawy mutacji, w tym jeden indel pary zasad, aby
w.ref.fasta.

OPCJE:

-d INT średnia z odległości zewnętrznej wielkości płytek [170]

-s INT odchylenie standardowe rozmiarów płytek [20]

-N INT liczba par odczytów do wygenerowania [1000000]

-1 INT długość pierwszego odczytu [ustawiona przez w.simupars.dat]

-2 INT długość drugiego odczytu [ustawiona przez w.simupars.dat]

-r FLOAT wskaźnik mutacji [0.001]

-R FLOAT ułamek 1bp indel [0.1]

-h dodaj wszystkie mutacje do w.ref.fasta i generować odczyty z singla
zmutowana sekwencja (tryb haploidalny)

UWAGA:

* Odczyty generowane z tego polecenia są niezależne, co odbiega od
prawda. Podczas gdy ocena dostosowania ma mniejszy wpływ na to, ocena na:
Połączenia SNP należy wykonywać ostrożnie. Zależność błędu może być jedną z
główne przyczyny błędnych wywołań SNP.

symustat ale Q symustat w.simu-aln.map > out.simustat

Oceń jakość mapowania na podstawie symulowanych odczytów.

Solidny Związane z

fasta2csfa ale Q fasta2csfa in.nucl-ref.fasta > out.kolor-ref.fasta

Przekształć FASTA nukleotydową w kodowaną kolorami FASTA. Flaga -c należy następnie zastosować
do mapa Komenda. Na wyjściu litera „A” oznacza kolor 0, „C” oznacza 1, „G”
dla 2 i `T' dla 3. Każda sekwencja na wyjściu jest o 1bp krótsza niż na wejściu.

csmap2nt ale Q csmap2nt out.nt.map w.ref.nt.bfa w.cs.map

Konwertuj wyrównanie kolorów na wyrównanie nukleotydów. Wejście w.ref.nt.bfa jest
nukleotydowy binarny plik referencyjny FASTA. Musi odpowiadać oryginalnemu plikowi
z którego konwertowane jest odniesienie do koloru. Można nazwać konsensus nukleotydowy
z wynikowego wyrównania.

Różne/Zaawansowane Polecenia

podmapa ale Q podmapa [-q minMapaQ] [-Q błąd maksymalnej sumy] [-m maksMM] [-p] mapa.wyjścia w.mapa

Filtruj błędne wyrównania w w.mapa. Opcje wiersza poleceń są opisane w
`montować' Komenda.

eland2maq ale Q eland2maq [-q definitywnie] mapa.wyjścia na liście w.elandii

Konwertuj wyrównanie eland do formatu maq .map. Plik na liście sklada sie z
nazwy sekwencji, które pojawiają się w siódmej kolumnie pliku wyrównania eland
w.elandii i nazwę, którą spodziewasz się zobaczyć w wyrównaniu maq. Poniżej znajduje się
przykład:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Jeśli wyrównujesz odczyty w kilku partiach za pomocą eland, ważne jest, aby
użyj tego samego na liście do konwersji. Ponadto maq załaduje wszystkie
wyrównania i posortuj je w pamięci. Jeśli łączysz kilka eland
dane wyjściowe do jednego dużego pliku, należy go podzielić na mniejsze pliki, aby
zapobiec zjedzeniu całej pamięci maszyny przez maq.

To polecenie faktycznie ma na celu pokazanie wyrównania Eland w Maqview. Jak brak jakości
informacje są dostępne, wynikowy plik wyrównania maq nie powinien być używany
nazwać genotypami konsensusu.

eksport2maq ale Q eksport2maq [-1 przeczytaj1len] [-2 przeczytaj2len] [-a maxdist] [-n] mapa.wyjścia na liście
w eksporcie

Konwertuj format eksportu Illumina na format Maq .mapa format. Format eksportu jest nowy
format wyrównania od SolexaPipeline-0.3.0, który również oblicza mapowanie
cechy takie jak maq. Wynikowy plik może być użyty do wywołania genotypów konsensusu
ponieważ większość niezbędnych informacji jest dostępna dla maq, aby zrobić to dokładnie.

OPCJE:

-1 INT Długość pierwszego odczytu [0]

-2 INT Długość drugiego odczytu [0]

-a INT Maksymalna odległość zewnętrzna dla prawidłowej pary odczytu [250]

-n Zachowaj przefiltrowane odczyty

MAQ-PERL POLECENIA


próbny maq.pl próbny [-h] [-s] [-N nPary] [-d outDir] w.fasta w.simudat

Zademonstruj użycie ale Q i towarzyszące mu skrypty. To polecenie:
symulować odczyty z pliku FASTA w.fasta. Długość i jakość sekwencji
są określane przez w.simudat który jest generowany z ale Q symultaniczny lub może być
pobrane ze strony Maq. Symulowane odczyty zostaną następnie zmapowane za pomocą
maq.pl łatwy bieg. Dokładność wyrównania jest oceniana przez ale Q symustatThe
dokładność konsensusu o ale Q symulacje, a dokładność SNP o maq_eval.pl.

Domyślnie symulowane będą sparowane odczyty końca, a sekwencja diploidalna będzie
generowane z danych wejściowych przez dodanie mutacji do dowolnego typu haploidalnego. Wkładka
wielkość i szybkość mutacji są kontrolowane przez ale Q symulować.

OPCJE:

-h symulować sekwencję haploidów zamiast sekwencji diploidalnej

-s użyj trybu pojedynczego końca, aby wyrównać odczyty zamiast trybu sparowanego

-N INT liczba par odczytów do symulacji [1000000]

-d DIR katalog wyjściowy [maqdemo]

UWAGA:

* Pliki wyjściowe z maq_eval.pl nie zostały udokumentowane, ale możesz zrobić
dobre przypuszczenie niektórych z tych plików.

* To polecenie tylko demonstruje użycie pakietu maq. Dokładność w rzeczywistości
dane są prawie zawsze niższe niż to, co widać z czystej symulacji.

łatwy bieg maq.pl łatwy bieg [-1 przeczytaj1Len] [-d reż.zewn] [-n nOdczyty] [-A 3adapter] [-e MinDep]
[-q minCnsQ] [-p] [-2 przeczytaj2Len] [-a maxIns] [-S] [-N] w.ref.fasta w1.fastq
[w2.fastq]

Analizuje potok małych genomów. Polecenie Easyrun uruchomi większość analiz
zaimplementowany w ale Q. Domyślnie, łatwy bieg przyjmuje wszystkie wejściowe sekwencje odczytu
pliki są jednolite i niezależne; gdy -p jest określony, dwie sekwencje odczytu
wymagane są pliki, po jednym na każdy koniec.

Kilka plików zostanie wygenerowanych w reż.zewn, wśród których znajdują się następujące pliki
kluczowe wyjście:

cns.final.snp końcowe połączenia SNP z odfiltrowanymi połączeniami niskiej jakości

cns.fq sekwencje konsensusowe i jakości w formacie FASTQ

OPCJE:

-d DIR katalog wyjściowy [easyrun]

-n INT liczba odczytów/par w jednej partii wyrównania [2000000]

-S zastosuj analizę dzielonego odczytu krótkich indeksów (może bardzo wolno)

-N INT liczba haplotypów/szczepów w puli (>=2) [2]

-A FILE plik dla adaptera 3'. Plik powinien zawierać jedną linię sekwencji
[zero]

-1 INT długość pierwszego odczytu, 0 dla auto [0]

-e INT minimalna głębokość odczytu wymagana do wywołania SNP (dla SNPfilter) [3]

-q INT minimalna konsensusowa jakość dla SNP w cns.final.snp [30]

-p przełącz na tryb wyrównywania sparowanych końców

-2 INT długość drugiego odczytu, gdy -p jest stosowany [0]

-a INT maksymalny rozmiar płytki, gdy -p jest stosowany [250]

UWAGI:

* W przypadku wywoływania SNP na próbkach w puli, użytkownicy powinni ustawić poprawną `-N' jak również
`-E 0 '.

* Plik wejściowy może być w formacie binarnym maq. maq.pl automatycznie wykryje
format pliku.

Filtr SNP maq.pl Filtr SNP [-d MinDep] [-D maks. głębokość] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinRozmiar] [-n minNeiQ] [-F w.indelpe] [-f indelsoa] [-s minWynik] [-m
maxW poprzek] [-a] [-N maxWinSNP] [-W densWinSize] w.cns2snp.snp >
out.filtrowany.snp

Wyklucz SNP, które są objęte kilkoma odczytami (określonymi przez -d), o zbyt wiele
czyta (określone przez -D), w pobliżu (określone przez -w) do potencjalnego indelu, spadające
w możliwym powtarzalnym regionie (charakteryzującym się -Q) lub o niskiej jakości
sąsiednie bazy (określone przez -n). Jeśli maxWinSNP lub więcej SNP pojawia się w dowolnym
densWinSize okna, one również zostaną odfiltrowane razem.

OPCJE:

-d INT Minimalna głębokość odczytu wymagana do wywołania SNP [3]

-D INT Maksymalna głębokość odczytu wymagana do wywołania SNP (<255, w przeciwnym razie ignorowana)
[256]

-Q INT Wymagana maksymalna jakość odwzorowania odczytów obejmujących SNP [40]

-q INT Minimalna jakość konsensusu [20]

-n INT Minimalna sąsiadująca jakość konsensusu [20]

-w INT Rozmiar okna wokół potencjalnych indelów. SNP, które są blisko
do indeksów zostaną pominięte [3]

-F FILE Połączenia indelpe wyjście [null]

-f FILE Połączenia indelsoa wyjście [null]

-s INT Minimalny wynik dla soa-indel, który należy wziąć pod uwagę [3]

-m INT Maksymalna liczba odczytów, które można zmapować w soa-indel [1]

-a Alternatywny filtr do wyrównania na jednym końcu

indelpe maq.pl indelpe w.indelpe > out.indelpe

Popraw liczbę odczytów mapowanych bez indeksów dla traktów homopolimerowych. Ten
polecenie zmodyfikuj czwartą, dziesiątą i ostatnie trzy kolumny w.indelpe i
wypisz wynik w out.indelpe. Po korekcie następujące Awk
polecenie daje domniemane homozygotyczne indele:

awk '(3 USD=="*"⎪⎪3 USD=="+") && 6 USD+7 USD>=3 && (6 USD+7)/4 USD>=0.75'

a poniżej daje heterozygoty:

awk '(3 USD=="*"⎪⎪3 USD=="+") && 6 USD+7 USD>=3 && (6 USD+7)/4 USD<0.75'

Należy pamiętać, że indelpe polecenie implementuje tylko kilka reguł heurystycznych.
Nie koryguje dla nieczystych serii homopolimerów lub dinukleotydów/tryplet
powtarza. W związku z tym dwa polecenia awk dają tylko przybliżone hom/het
indele.

PRZYKŁADY


· Skrypt Easyrun:
maq.pl easyrun -d easyrun ref.fasta część1.fastq część2.fastq

· Kluczowe polecenia stojące za easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq część1.fastq część1.bfq;
maq fastq2bfq część2.fastq część2.bfq;
maq mapa part1.map ref.bfa part1.bfq;
maq mapa part2.map ref.bfa part2.bfq;
maq mapmerge aln.map część1.map część2.map;
maq asembler cns.cns ref.bfa aln.map;

Korzystaj z maq online za pomocą usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    Phaser
    Phaser
    Phaser to szybka, darmowa i zabawna gra otwarta
    źródłowa struktura gry HTML5, która oferuje
    Renderowanie WebGL i Canvas w poprzek
    przeglądarek internetowych na komputery i urządzenia mobilne. Gry
    może być współ...
    Pobierz Phaser
  • 2
    Silnik WASAL
    Silnik WASAL
    VASSAL to silnik gry do tworzenia
    elektroniczne wersje tradycyjnej tablicy
    i gry karciane. Zapewnia wsparcie dla
    renderowanie elementów gry i interakcja,
    i ...
    Pobierz silnik VASSAL
  • 3
    OpenPDF — rozwidlenie iText
    OpenPDF — rozwidlenie iText
    OpenPDF to biblioteka Java do tworzenia
    i edycji plików PDF z LGPL i
    Licencja open source MPL. OpenPDF to
    LGPL/MPL open source następca iText,
    w ...
    Pobierz OpenPDF — rozwidlenie iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - System do Automatyzacji
    Analizy geologiczne - to geografia
    Oprogramowanie systemu informacyjnego (GIS) z
    ogromne możliwości geodanych
    przetwarzanie i an...
    Pobierz SAGA GIS
  • 5
    Przybornik dla Java/JTOOpen
    Przybornik dla Java/JTOOpen
    IBM Toolbox for Java / JTOpen to
    biblioteka klas Java obsługująca
    klient/serwer i programowanie internetowe
    modeli do systemu z systemem OS/400,
    i5/OS, lub...
    Pobierz Zestaw narzędzi dla języka Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (lub D3 dla dokumentów opartych na danych)
    to biblioteka JavaScript, która pozwala
    do tworzenia dynamicznych, interaktywnych danych
    wizualizacje w przeglądarkach internetowych. Z D3
    ty...
    Pobierz plik D3.js
  • więcej »

Komendy systemu Linux

Ad