Jest to polecenie formatdb, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
formatdb - formatuje bazy danych białek lub nukleotydów dla BLAST
STRESZCZENIE
sformatuj bazę danych [-] [-B filename] [-F filename] [-L filename] [-T filename] [-V] [-a] [-b] [-e]
[-i filename] [-l filename] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
OPIS
sformatuj bazę danych musi zostać użyte w celu wcześniejszego sformatowania baz danych źródeł białek lub nukleotydów
te bazy danych można przeszukiwać za pomocą blastall, blastpgp lub MegaBLAST. Baza źródłowa
może być w formacie FASTA lub ASN.1. Chociaż format FASTA jest najczęściej używany jako
wejście do sformatuj bazę danych, użycie ASN.1 jest korzystne dla tych, którzy używają ASN.1 jako
wspólne źródło dla innych formatów, takich jak raport GenBank. Raz źródłowy plik bazy danych
został sformatowany przez sformatuj bazę danych nie jest to potrzebne BLASTowi. Pamiętaj, że jeśli tak
zamierzam stosować okresowe aktualizacje baz danych BLAST przy użyciu połączyć(1), będziesz musiał
zachowaj źródłowy plik bazy danych.
OPCJE
Podsumowanie opcji znajduje się poniżej.
- Wydrukuj wiadomość o użyciu
-B filename
Binarny Gifile utworzony z Gifile określonego przez -F. Ta opcja określa
nazwa binarnego pliku listy GI. Opcji tej należy używać z -F opcja. A
tekstową listę GI można określić za pomocą -F opcja i -B opcja spowoduje
tę listę OG w formacie binarnym. Plik binarny jest mniejszy i BLAST nie potrzebuje
przekonwertować, aby można było go szybciej odczytać.
-F filename
Gifile (plik zawierający listę gi) do użytku z -B or -L
-L filename
Utwórz plik aliasów o nazwie filename, ograniczając przeszukiwane sekwencje do tych
określone przez -F.
-T filename
Ustaw identyfikatory taksonomii w definicjach ASN.1 zgodnie z tabelą w filename.
-V Pełny: sprawdź, czy w bazie danych nie występują unikalne identyfikatory ciągów
-a Plikiem wejściowym jest baza danych w formacie ASN.1 (w przeciwnym razie oczekiwana jest wersja FASTA)
-b Baza danych ASN.1 jest binarna (w przeciwieństwie do tekstu ASCII)
-e Dane wejściowe są wpisami sekwencyjnymi. Źródłowa baza danych ASN.1 (tekstowa lub binarna) może
zawierają zestaw Biseq lub tylko jeden Biseq. W tym drugim przypadku -e należy podać.
-i filename
Pliki wejściowe do formatowania
-l filename
Nazwa pliku dziennika (domyślnie = formatdb.log)
-n str Podstawowa nazwa plików BLAST (domyślnie jest to nazwa oryginalnego pliku FASTA)
-o Przeanalizuj SeqID i utwórz indeksy. Jeśli źródłowa baza danych jest w formacie FASTA, plik
identyfikatory bazy danych w linii definicji FASTA muszą być zgodne z konwencjami
format definiowania FASTA.
-p F Dane wejściowe to nukleotyd, a nie białko.
-s Indeksuj tylko według przystąpienia, a nie według miejsca. Jest to szczególnie przydatne w przypadku zestawów sekwencji
jak EST, gdzie nazwy dostępu i miejsca są identyczne. Formatdb działa
szybciej i tworzy mniejsze pliki tymczasowe, jeśli używana jest ta opcja. Jest mocno
zalecane dla EST, STS, GSS i HTGS.
-t str Tytuł pliku bazy danych [String]
-v N Podziel duże pliki FASTA na „woluminy” o rozmiarze N milionów liter (4000 by
domyślny). W ramach tworzenia woluminu, sformatuj bazę danych zapisuje nowy typ BLAST
plik bazy danych, zwany plikiem aliasowym, z rozszerzeniem „nal” lub „pal”.
Użyj formatdb online, korzystając z usług onworks.net