Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

spidery - Online w chmurze

Uruchom Spidey u dostawcy bezpłatnego hostingu OnWorks przez Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS

Jest to program sterujący, który można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS

PROGRAM:

IMIĘ


spidey - dopasuj sekwencje mRNA do genomu

STRESZCZENIE


pająk [-] [-F N] [-G] [-L N] [-M filename] [-N filename] [-R filename] [-S po południu] [-T N]
[-X] [-a filename] [-c N] [-d] [-e X] [-f X] [-g X] -i filename [-j] [-k filename] [-l N]
-m filename [-n N] [-o str] [-p N] [-r c/d/m/p/v] [-s] [-t filename] [-u] [-w]

OPIS


pająk jest narzędziem do przyrównywania jednej lub większej liczby sekwencji mRNA do danej sekwencji genomowej.
pająk został napisany z myślą o dwóch głównych celach: znaleźć dobre wyrównanie niezależnie od intronu
rozmiar; i unikaj pomylenia przez pobliskie pseudogeny i paralogi. W kierunku pierwszego
cel, pająk używa BLAST i Dot View (inne lokalne narzędzie do wyrównywania), aby znaleźć swoje
linie trasowania; ponieważ są to oba narzędzia do lokalnego wyrównywania, pająk nie samoistnie
faworyzuje krótsze lub dłuższe introny i nie ma maksymalnego rozmiaru intronu. Aby przez pomyłkę uniknąć
w tym egzony z paralogów i pseudogenów, pająk najpierw definiuje okna w genomie
sekwencji, a następnie przeprowadza oddzielnie dopasowanie mRNA do genomu w każdym oknie.
Ze względu na konstrukcję okien sąsiednie paralogi lub pseudogeny powinny:
znajdować się w oddzielnych oknach i nie należy ich uwzględniać w ostatecznym dopasowaniu połączeń.

Początkowy linie trasowania i Budowa of genomowego okna
pająk przyjmuje jako dane wejściowe pojedynczą sekwencję genomową i zestaw przystąpień mRNA lub FASTA
sekwencje. Całe przetwarzanie odbywa się po jednej sekwencji mRNA na raz. Pierwszy krok dla każdego
Sekwencja mRNA to wysoce rygorystyczny BLAST w stosunku do sekwencji genomowej. Powstałe hity
są analizowane w celu znalezienia okien genomowych.

Dopasowania BLAST są sortowane według wyniku, a następnie przypisywane do okien przez rekurencyjne
funkcja, która pobiera pierwsze wyrównanie, a następnie przechodzi w dół listy wyrównań, aby znaleźć wszystkie
dopasowania, które są zgodne z pierwszym (ta sama nić mRNA, zarówno mRNA, jak i
współrzędne genomowe nie nakładają się i są liniowo spójne). Na kolejnych przejazdach,
pozostałe linie trasowania są sprawdzane i umieszczane we własnych, nienakładających się,
spójnych okien, dopóki nie zostaną żadne wyrównania. W zależności od liczby modeli genów
pożądane, górne n okna są wybierane, aby przejść do następnego kroku, a pozostałe są
usunięte.

Justowanie in każdy okno
Po skonstruowaniu okienek genomowych, początkowe dopasowania BLAST są uwalniane i
przeprowadza się kolejne wyszukiwanie BLAST, tym razem z całym mRNA w stosunku do genomu
region zdefiniowany przez okno i przy mniejszej rygorystyczności niż początkowe wyszukiwanie. pająk
następnie używa zachłannego algorytmu do wygenerowania wysoko punktowanego, nienakładającego się podzbioru
wyrównania z drugiego wyszukiwania BLAST. Ten spójny zestaw jest dokładnie analizowany, aby
upewnij się, że dopasowanie obejmuje całą sekwencję mRNA. Kiedy zostaną znalezione luki
między dopasowaniami odpowiedni region sekwencji genomowej jest przeszukiwany pod kątem
brakujące mRNA, najpierw przy użyciu BLAST o bardzo niskiej rygorystyczności, a jeśli BLAST nie znajdzie
hit, używając funkcji DotView do zlokalizowania wyrównania. Gdy na końcach znajdują się luki
wyrównania, wyszukiwania BLAST i DotView mogą w rzeczywistości wykraczać poza
granice okna. Jeśli koniec 3' mRNA nie jest całkowicie wyrównany, jest to
najpierw zbadano pod kątem obecności ogona poli(A). Nie podejmuje się żadnych prób wyrównania
część mRNA, która wydaje się być ogonem poli(A); czasami jest ogon poli(A)
który jest zgodny z sekwencją genomową, a te są odnotowane, ponieważ wskazują na
możliwość pseudogenu.

Teraz, gdy mRNA jest całkowicie pokryty zestawem dopasowań, granice
wyrównania (teraz powinno być jedno wyrównanie na egzon) są dostosowane tak, aby
linie przylegają do siebie dokładnie i tak, że przylegają do dobrego dawcy splotu
i akceptantów. Najczęściej, wyrównania dwóch sąsiadujących egzonów pokrywają się aż o
20 lub 30 par zasad w sekwencji mRNA. Prawdziwa granica egzonu może leżeć gdziekolwiek wewnątrz
to nakładanie się lub (jak widzieliśmy empirycznie) nawet kilka par zasad poza nakładaniem się.
Aby ustawić granice egzonów, nakładanie się plus kilka par zasad z każdej strony to
zbadane pod kątem miejsc dawców splicingu, przy użyciu funkcji, które mają różne macierze splicingowe
w zależności od wybranego organizmu. Kilka najpopularniejszych witryn dawców splicingu (według punktacji) to
oceniane pod kątem tego, jak bardzo wpływają na pierwotne granice linii trasowania. Witryna, która
najmniej wpływa na granice i jest oceniany pod kątem obecności
strona akceptanta. W razie potrzeby linie trasowania są skracane lub wydłużane, tak aby:
zakończyć w miejscu dawcy splotu i tak, aby się nie nakładały.

koniec dalsze
Okna są dokładnie sprawdzane, aby uzyskać procent identyczności na egzon, liczbę
przerwy na ekson, całkowity procent identyczności, procent pokrycia mRNA, obecność
wyrównujący lub nie wyrównujący ogon poli(A), liczba miejsc dawcy splicingu oraz obecność lub
brak miejsc donorowych i akceptorowych splicingu dla każdego eksonu oraz występowanie mRNA
który ma koniec 5' lub 3' (lub oba), który nie jest dopasowany do sekwencji genomowej. Jeśli
ogólny procent tożsamości i procent pokrycia długości są powyżej wartości granicznych zdefiniowanych przez użytkownika, a
raport podsumowujący jest drukowany i, na żądanie, wyrównanie tekstu pokazujące tożsamości i
drukowane są również niezgodności.

Międzygatunkowy linie trasowania
pająk jest zdolny do wykonywania wyrównań międzygatunkowych. Główna różnica w
dopasowanie międzygatunkowe polega na tym, że tożsamość genomowa mRNA nie będzie bliska 100%, ponieważ
znajduje się w wyrównaniu wewnątrzgatunkowym; również linie trasowania mają liczne i długie przerwy. Gdyby
pająk jest używany w swoim normalnym trybie do wyrównywania międzygatunkowego, wytwarza modele genów
z wieloma, wieloma krótkimi egzonami. Kiedy flaga międzygatunkowa jest ustawiona, pająk używa innego
Parametry BLAST, aby zachęcić do dłuższych i więcej przerw i nie karać tak mocno za
niedopasowania. W ten sposób wyrównania dla egzonów są znacznie dłuższe i bliższe
przybliżyć rzeczywistą strukturę genu.

Ekstrahujący CDS linie trasowania
Kiedy pająk jest uruchamiany w trybie sieciowym lub gdy pliki ASN.1 są używane do mRNA
rekordów, jest w stanie wyodrębnić wyrównanie CDS z wyrównania mRNA i drukowania
również informacje CDS. Ponieważ dopasowanie CDS jest tylko podzbiorem dopasowania mRNA,
stosunkowo proste jest skrócenie wyrównań egzonów w razie potrzeby i
wygenerować wyrównanie CDS. Co więcej, regiony nieprzetłumaczone są teraz zdefiniowane, więc
obliczono również procent identyczności dla nieulegających translacji regionów 5' i 3'.

OPCJE


Podsumowanie opcji znajduje się poniżej.

- Wydrukuj komunikat o użyciu.

-F N Pożądany początek przedziału genomowego (od; od 0).

-G Plik wejściowy to lista GI.

-L N Bardzo duży rozmiar intronu do użycia (domyślnie = 220000).

-M filename
Pilnik z matrycą łączenia dawcy.

-N filename
Pilnik z matrycą złączy akceptorowych.

-R filename
Plik (wraz ze ścieżką) do powtórzenia bazy danych wybuchu do filtrowania.

-S po południu Ogranicz do nici plus (p) lub minus (m) sekwencji genomowej.

-T N Pożądane zatrzymanie przedziału genomowego (do; w oparciu o 0).

-X Używaj bardzo dużych rozmiarów intronów (zwiększa limit intronów początkowych i końcowych)
od 100kb do 240kb i dla wszystkich innych od 35kb do 120kb); może spowodować
znacznie dłuższe czasy obliczeń.

-a filename
Plik wyjściowy dla linii trasowania po skierowaniu do oddzielnego pliku z -p 3 (domyślnie =
pajac.aln).

-c N Odcięcie tożsamości, w procentach, do celów kontroli jakości.

-d Spróbuj także dopasować sekwencje kodujące odpowiadające danym rekordom mRNA (może
wymagają dostępu do sieci).

-e X Wartość e pierwszego przejścia (domyślnie = 1.0e-10). Wyższe wartości zwiększają prędkość kosztem
wrażliwości.

-f X Wartość e drugiego przejścia (domyślnie = 0.001).

-g X Wartość elektroniczna trzeciego przejścia (domyślnie = 10).

-i filename
Plik wejściowy zawierający sekwencję genomową w formacie ASN.1 lub FASTA. Jeżeli twój
komputer działa w sieci, która może uzyskać dostęp do GenBank, możesz zastąpić
żądany numer dostępu dla nazwy pliku.

-j Wydrukować wyrównanie ASN.1?

-k filename
Plik dla wyjścia ASN.1 z -k (domyślnie = spidey.asn).

-l N Odcięcie pokrycia długości, w procentach.

-m filename
Plik wejściowy zawierający sekwencję (sekwencje) mRNA w formacie ASN.1 lub FASTA lub listę
ich przystąpień (z -G). Jeśli komputer działa w sieci, która może:
uzyskaj dostęp do GenBank, możesz zastąpić nazwę pliku pojedynczym numerem dostępu.

-n N Liczba modeli genów do zwrócenia na wejściowe mRNA (domyślnie = 1).

-o str Główny plik wyjściowy (domyślnie = stdout; zawartość kontrolowana przez -p).

-p N Wyrównanie wydruku?
0 podsumowanie i linie trasowania razem (domyślnie)
1 tylko podsumowanie
2 tylko wyrównania
3 podsumowanie i wyrównania w różnych plikach

-r c/d/m/p/v
Organizm sekwencji genomowej, stosowany do wyznaczania macierzy splicingowych.
c C. elegans
d Drosophila
m Dictyostelium discoideum
p roślina
v kręgowiec (domyślnie)

-s Dostrój do wyrównania międzygatunkowego.

-t filename
Plik z tabelą funkcji, w 4 kolumnach rozdzielonych tabulatorami:
nast (na przykład, NM_04377.1)
Nazwa (tylko powtarzalny_region jest obecnie obsługiwany)
początek (na podstawie 0)
Zatrzymaj się (na podstawie 0)

-u Wykonaj wielokrotne dopasowanie wszystkich wejściowych mRNA (które muszą nakładać się na genomowy)
sekwencja).

-w Rozważ małe litery w wejściowych sekwencjach FASTA jako maskowane.

Korzystaj z spidery online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    głęboko czyste
    głęboko czyste
    Skrypt Kotlin, który niszczy wszystkie kompilacje
    pamięci podręczne z projektów Gradle/Android.
    Przydatne, gdy pozwala na to Gradle lub IDE
    w dół. Skrypt został przetestowany na
    macOS, ale...
    Pobierz głębokie czyszczenie
  • 2
    Wtyczka Eclipse Checkstyle
    Wtyczka Eclipse Checkstyle
    Wtyczka Eclipse Checkstyle
    integruje kod Java Checkstyle
    audytora do Eclipse IDE. The
    wtyczka zapewnia informacje zwrotne w czasie rzeczywistym
    użytkownik o naruszeniu...
    Pobierz wtyczkę Eclipse Checkstyle
  • 3
    Gracz AstrOrz
    Gracz AstrOrz
    AstrOrz Player to darmowy odtwarzacz multimedialny
    oprogramowanie, częściowo oparte na WMP i VLC. The
    odtwarzacz jest w minimalistycznym stylu, z
    więcej niż dziesięć kolorów motywu, a także może
    b ...
    Pobierz AstrOrzPlayer
  • 4
    movistartv
    movistartv
    Kodi Movistar+ TV to dodatek do XBMC/
    Kodi que allowe disponer de un
    dekodowanie usług IPTV de
    Movistar integrado en uno de los
    mediacenter ma...
    Pobierz movistartv
  • 5
    Code :: Blocks
    Code :: Blocks
    Code::Blocks to darmowa, otwarta
    międzyplatformowe C, C++ i Fortran IDE
    zbudowany, aby sprostać najbardziej wymagającym potrzebom
    swoich użytkowników. Jest przeznaczony do bardzo
    rozciąga się...
    Pobierz Code::Blocks
  • 6
    Wśród
    Wśród
    Pośród zaawansowanego interfejsu Minecraft
    a śledzenie danych/struktur to narzędzie
    wyświetl przegląd gry Minecraft
    świat, nie tworząc go. To
    mogą ...
    Pobierz Wśród
  • więcej »

Komendy systemu Linux

Ad