Aceasta este comanda formatdb care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
formatdb - formatarea bazelor de date de proteine sau nucleotide pentru BLAST
REZUMAT
formatdb [-] [-B nume de fișier] [-F nume de fișier] [-L nume de fișier] [-T nume de fișier] [-V] [-a] [-b] [-e]
[-i nume de fișier] [-l nume de fișier] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
DESCRIERE
formatdb trebuie utilizat pentru a formata bazele de date surse de proteine sau nucleotide înainte
aceste baze de date pot fi căutate prin blastall, blastpgp sau MegaBLAST. Baza de date sursă
poate fi în format FASTA sau ASN.1. Deși formatul FASTA este cel mai des folosit ca
intrare la formatdb, utilizarea ASN.1 este avantajoasă pentru cei care folosesc ASN.1 ca
sursă comună pentru alte formate, cum ar fi raportul GenBank. Odată un fișier de bază de date sursă
a fost formatat de formatdb nu este nevoie de BLAST. Vă rugăm să rețineți că, dacă sunteți
va aplica actualizări periodice bazelor de date BLAST folosind fmerge(1), va trebui
păstrați fișierul bazei de date sursă.
OPŢIUNI
Un rezumat al opțiunilor este inclus mai jos.
- Imprimați mesajul de utilizare
-B nume de fișier
Gifile binar produs din Gifile specificat de -F. Această opțiune specifică
numele unui fișier de listă GI binar. Această opțiune ar trebui utilizată împreună cu -F opțiune. A
Lista text GI poate fi specificată cu -F și opțiunea -B opțiunea va produce
acea listă GI în format binar. Fișierul binar este mai mic și BLAST nu are nevoie
pentru a-l converti, astfel încât să poată fi citit mai repede.
-F nume de fișier
Gifile (fișier care conține lista de gi) pentru utilizare cu -B or -L
-L nume de fișier
Creați un fișier alias numit nume de fișier, limitând secvențele căutate la cele
specificat de -F.
-T nume de fișier
Setați ID-urile taxonomiei în ASN.1 deflines conform tabelului din nume de fișier.
-V Verbos: verificați dacă există ID-uri de șir neunice în baza de date
-a Fișierul de intrare este o bază de date în format ASN.1 (în caz contrar este de așteptat FASTA)
-b Baza de date ASN.1 este binară (spre deosebire de textul ASCII)
-e Intrarea este o intrare Seq. O bază de date sursă ASN.1 (fie text ascii sau binară) poate
conțin un set Bioseq sau doar un Bioseq. In ultimul caz -e ar trebui furnizate.
-i nume de fișier
Fișier(e) de intrare pentru formatare
-l nume de fișier
Nume fișier jurnal (implicit = formatdb.log)
-n str Numele de bază pentru fișierele BLAST (implicit la numele fișierului FASTA original)
-o Analizați SeqID și creați indecși. Dacă baza de date sursă este în format FASTA,
identificatorii bazei de date din linia de definiție FASTA trebuie să respecte convențiile de
formatul FASTA Defline.
-p F Intrarea este o nucleotidă, nu o proteină.
-s Index numai prin aderare, nu după locus. Acest lucru este util în special pentru seturile de secvențe
precum EST-urile unde numele de accesare și locus sunt identice. Formatdb rulează
mai rapid și produce fișiere temporare mai mici dacă se folosește această opțiune. Este puternic
recomandat pentru EST, STS, GSS și HTGS.
-t str Titlu pentru fișierul bazei de date [String]
-v N Împărțiți fișierele FASTA mari în „volume” de dimensiune N milioane de litere (4000 de
Mod implicit). Ca parte a creării unui volum, formatdb scrie un nou tip de BLAST
fișier de bază de date, numit fișier alias, cu extensia „nal” sau „pal”.
Utilizați formatdb online folosind serviciile onworks.net