Jest to polecenie abyss-pe, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
abyss-pe - składa odczyty w kontigi
STRESZCZENIE
otchłań-pe [OPCJA]... [PARAMETR=WARTOŚĆ]... [MAKE_TARGET] ...
OPIS
Połącz odczyty plików wejściowych w kontigi. Odczyty mogą być w formacie FASTA, FASTQ,
qseq, eksport, SRA, SAM lub BAM i może być skompresowany za pomocą gz, bz2 lub xz i może być
smołowany.
abyss-pe jest skryptem Makefile. Dowolne opcje wykonania mogą być również użyte z abyss-pe.
parametry of otchłań-pe
Nazwa, NAZWA PRACY
Nazwa tego zgromadzenia. Powstałe rusztowania będą przechowywane w
${name}-scaffolds.fa.
in pliki wejściowe. Użyj tej zmiennej podczas składania danych z pojedynczej biblioteki.
lib cytowana lista nazw bibliotek o sparowanych końcach oddzielonych spacjami. Użyj tej zmiennej
podczas składania danych z wielu bibliotek ze sparowanymi końcami. Dla każdej nazwy biblioteki w
lib, użytkownik musi zdefiniować w wierszu poleceń zmienną o tej samej nazwie, która
wskazuje przeczytane pliki dla tej biblioteki. Widzieć PRZYKŁADY poniżej beton
przykład użycia.
pe lista bibliotek o sparowanych końcach, które będą używane tylko do łączenia jednostek
kontigów i nie będzie przyczyniać się do sekwencji konsensusowej.
mp lista bibliotek par wiązań, które zostaną użyte do tworzenia rusztowań. Biblioteki par partnerskich
nie wnoszą wkładu w sekwencję konsensusu.
długie lista bibliotek długich sekwencji, które zostaną użyte do ponownego rusztowania. długa sekwencja
biblioteki nie wnoszą wkładu w sekwencję konsensusową.
se pliki zawierające odczyty z jednego końca
a maksymalna liczba odgałęzień bańki [2]
b maksymalna długość bańki (bp) [10000]
c minimalne średnie pokrycie k-merowe jednostki [kwadrat(mediana)]
d błąd dopuszczalny oszacowania odległości (bp) [6]
e minimalne pokrycie erozji k-mer [kwadrat(mediana)]
E minimalne pokrycie erozji k-mer na pasmo [1]
j liczba wątków [2]
k rozmiar k-meru (kiedy K nie jest ustawione) lub rozpiętość pary k-merów (kiedy K jest ustawione)
K wielkość pojedynczego k-meru w parze k-merów (bp)
l minimalna długość wyrównania odczytu (bp) [k]
m minimalne nakładanie się dwóch jednostek (bp) [30]
n minimalna liczba par wymagana do zbudowania kontigów [10]
N minimalna liczba par wymagana do budowy rusztowań [n]
p minimalna identyczność sekwencji bańki [0.9]
q minimalna jakość bazowa podczas przycinania [3]
Przytnij podstawy z końców odczytów, których jakość jest mniejsza q.
Q minimalna jakość bazowa [0]
Maskuj wszystkie podstawy odczytów, których jakość jest mniejsza niż Q, jako „N”.
s minimalny rozmiar jednostki wymagany do budowy kontigów (bp) [200]
Długość nasion powinna być co najmniej dwukrotnie większa od wartości k. Jeśli jest więcej sekwencji
złożony niż oczekiwany rozmiar genomu, spróbuj zwiększyć s.
S minimalny rozmiar kontigu wymagany do budowy rusztowań (bp) [s]
SS SS=--SS do montażu w trybie specyficznym dla pasma
Wymaga, aby wszystkie biblioteki były bibliotekami RNA-Seq specyficznymi dla nici. Zakłada, że
pierwszy odczyt w parze odczytów jest odwracany WRT zsekwencjonowanych transkryptów.
t minimalny rozmiar końcówki (bp) [2k]
v v=-v, aby włączyć pełne rejestrowanie
np, NSLOTY
liczba procesów zespołu MPI
mpiruna droga do mpiruna
wyrównać
Program, którego należy użyć do wyrównania odczytów do kontigów [mapa].
Dozwolone wartości to: map, kaligner, bwa, bwasw, Bowtie, Bowtie2, Dida. Zobacz
DIDDA sekcję poniżej, aby uzyskać więcej informacji na temat opcji did.
cs po złożeniu przekształcają kontigi przestrzeni kolorów w kontigi nukleotydów
Opcje of robić
-n, --próba
Wydrukuj polecenia, które zostaną wykonane, ale ich nie wykonuj.
Spraw, żeby cele dla otchłań-pe
domyślnym
Odpowiednik „statystyki rusztowań rusztowań z kropkami”.
jednostki
Zmontuj jednostki.
unitig-dot
Wyprowadź wykres nakładania się jednostek.
pe-sam Mapuj odczyty sparowanych końców do jednostek i wysyłaj plik SAM. Tylko plik SAM
zawierają mapowanie odczytów na różne kontigi oraz identyfikator odczytu, sekwencję i jakość
ciągi znaków zostaną zastąpione znakami „*”.
pe-bam Mapuj odczyty sparowanych końców na jednostki i wysyłaj plik BAM. Tylko plik BAM
zawierają mapowanie odczytów na różne kontigi oraz identyfikator odczytu, sekwencję i jakość
ciągi znaków zostaną zastąpione znakami „*”.
indeks pe
Wygeneruj indeks jednostek używanych przez abyss-map.
kontigowie
Złóż kontigi.
kropka kontigów
Wyprowadź wykres nakładania się kontigów.
mp-sam Odwzoruj parę wiązań wczytującą do kontigów i wysyłającą plik SAM. Tylko plik SAM
zawierają mapowanie odczytów na różne kontigi oraz identyfikator odczytu, sekwencję i jakość
ciągi znaków zostaną zastąpione znakami „*”.
mp-bam Odwzoruj parę wiązań wczytującą do kontigów i wysyłającą plik BAM. Tylko plik BAM
zawierają mapowanie odczytów na różne kontigi oraz identyfikator odczytu, sekwencję i jakość
ciągi znaków zostaną zastąpione znakami „*”.
indeks mp
Wygeneruj indeks kontigów używanych przez Abyss-Map.
rusztowania
Zmontuj rusztowania.
rusztowania-kropka
Wyprowadź wykres nakładania się rusztowania.
rusztowania
Rozbij rusztowania i wygeneruj plik AGP.
długie rusztowania
Ponowne rusztowanie przy użyciu złożonych kontigów RNA-Seq.
długie rusztowanie-kropka
Wyprowadź wykres nakładania się rusztowania RNA.
statystyki Wyświetl statystyki przylegania zespołu.
kleń Usuń pliki pośrednie.
wersja
Wyświetl wersję abyss-pe.
Wersje
Wyświetl wersje wszystkich programów używanych przez abyss-pe.
pomoc Wyświetl pomocny komunikat.
DIDDA
ABySS obsługuje użycie DIDA (Distributed Indexing Dispatched Alignment), metody opartej na MPI
framework dopasowywania do obliczania dopasowań sekwencji na wielu maszynach. Używać
DIDA z ABySS, najpierw pobierz i zainstaluj DIDA z
http://www.bcgsc.ca/platform/bioinfo/software/dida, a następnie określ „dida” jako wartość
dotychczasowy wyrównać parametr otchłań-pe.
związane z DIDA otchłań-pe parametry
DIDA_MPIRUN
Komenda `mpirun` używana do uruchamiania zadań DIDA.
DIDA_RUN_OPTIONS
Opcje środowiska wykonawczego, takie jak liczba wątków na rangę MPI i wartości dla środowiska
zmienne (np. PATH, LD_LIBRARY_PATH). Uruchom `abyss-dida --help`, aby wyświetlić listę
dostępne opcje.
DIDA_OPTIONS
Opcje przekazywane bezpośrednio do pliku binarnego DIDA. Można to wykorzystać na przykład
do kontrolowania minimalnego progu długości linii trasowania. Uruchom `dida-wrapper --help` dla pliku
lista dostępnych opcji.
MPI ZGODNOŚĆ
Ze względu na użycie wielowątkowości, DIDA zna problemy z zakleszczeniem w OpenMPI. Za pomocą
biblioteka MPICH MPI jest zdecydowanie zalecana podczas uruchamiania złożeń za pomocą DIDA. Testowanie
zostało to zrobione za pomocą MPICH 3.1.3, skompilowanego z opcją --enable-threads=funneled.
PRZYKŁAD
Zalecana konfiguracja środowiska wykonawczego dla DIDA to 1 ranga MPI na maszynę i 1 wątek na
Rdzeń procesora. Na przykład, aby uruchomić zespół w 3 węzłach klastra po 12 rdzeni każdy, wykonaj:
abyss-pe k=64 name=ecoli in='reads1.fa reads2.fa' aimer=dida
DIDA_RUN_OPTIONS='-j12' DIDA_MPIRUN='mpirun -np 3 -ppn 1 -powiązanie z płytą'
W tym przykładzie użyto opcji wiersza poleceń MPICH dla `mpirun`. Tutaj wskazuje `-np 3`
liczba rang MPI, `-ppn 1` wskazuje liczbę rang MPI na „węzeł”, oraz
`-bind-to board` definiuje "węzeł" będący płytą główną (tj. pełną maszyną).
ŚRODOWISKO ZMIENNE
Dowolny parametr, który można określić w wierszu poleceń, można również określić w pliku
zmienna środowiskowa.
PATH musi zawierać katalog, w którym są zainstalowane pliki wykonywalne ABySS. Użyj `otchłani-
pe, aby sprawdzić, czy PATH jest poprawnie skonfigurowana.
TMPDIR określa katalog używany do przechowywania plików tymczasowych
Scheduler integracja
ABySS dobrze integruje się z harmonogramami zadań klastra, takimi jak:
* SGE (silnik sieci słonecznej)
* Przenośny system wsadowy (PBS)
* Funkcja współdzielenia obciążenia (LSF)
* IBM LoadLeveler
Zmienne środowiskowe SGE JOB_NAME, SGE_TASK_ID i NSLOTS mogą być użyte do określenia
parametry odpowiednio nazwa, k i np i podobnie dla innych programów planujących.
PRZYKŁADY
jeden sparowany koniec biblioteka
abyss-pe k=64 name=ecoli in='reads1.fa reads2.fa'
Wielokrotność sparowany koniec biblioteki
abyss-pe k=64 nazwa=ecoli lib='lib1 lib2' \
lib1='lib1_1.fa lib1_2.fa' lib2='lib2_1.fa lib2_2.fa' \
se='se1.fa se2.fa'
Sparowany koniec i para-partner biblioteki
abyss-pe k=64 name=ecoli lib='pe1 pe2' mp='mp1 mp2' \
pe1='pe1_1.fa pe1_2.fa' pe2='pe2_1.fa pe2_2.fa' \
mp1='mp1_1.fa mp1_2.fa' mp2='mp2_1.fa mp2_2.fa' \
se='se1.fa se2.fa'
Włącznie z sekwencja RNA Zespoły
otchłań-pe k=64 nazwa=ecoli lib=pe1 mp=mp1 long=long1 \
pe1='pe1_1.fa pe1_2.fa' mp1='mp1_1.fa mp1_2.fa' \
długi1=długi1.fa
MPI
abyss-pe np=8 k=64 name=ecoli in='reads1.fa reads2.fa'
SGE
qsub -N ecoli -t 64 -pe openmpi 8 \
otchłań-pe n=10 in='reads1.fa reads2.fa'
Korzystaj z Abyss-pe online, korzystając z usług onworks.net