Ito ang command formatdb na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
formatdb - i-format ang mga database ng protina o nucleotide para sa BLAST
SINOPSIS
formatdb [-] [-B filename] [-F filename] [-L filename] [-T filename] [-V] [-a] [-b] [-e]
[-i filename] [-l filename] [-n STR] [-o] [-p F] [-s] [-t STR] [-v N]
DESCRIPTION
formatdb ay dapat gamitin upang ma-format ang mga database ng mapagkukunan ng protina o nucleotide bago
ang mga database na ito ay maaaring hanapin sa pamamagitan ng blastall, blastpgp o MegaBLAST. Ang database ng pinagmulan
maaaring nasa FASTA o ASN.1 na format. Kahit na ang FASTA na format ay kadalasang ginagamit bilang
input sa formatdb, ang paggamit ng ASN.1 ay kapaki-pakinabang para sa mga gumagamit ng ASN.1 bilang ang
karaniwang mapagkukunan para sa iba pang mga format tulad ng ulat ng GenBank. Sa sandaling isang source database file
ay na-format ni formatdb hindi ito kailangan ng BLAST. Mangyaring tandaan na kung ikaw ay
maglalapat ng mga pana-panahong pag-update sa iyong mga database ng BLAST na ginagamit fmerge(1), kakailanganin mo
panatilihin ang source database file.
Opsyon
Ang isang buod ng mga opsyon ay kasama sa ibaba.
- I-print ang mensahe ng paggamit
-B filename
Binary Gifile na ginawa mula sa Gifile na tinukoy ni -F. Tinutukoy ng opsyong ito ang
pangalan ng isang binary GI list file. Ang pagpipiliang ito ay dapat gamitin kasama ng -F opsyon. A
text GI list ay maaaring tukuyin kasama ang -F opsyon at ang -B bubuo ng pagpipilian
na listahan ng GI sa binary format. Ang binary file ay mas maliit at hindi kailangan ng BLAST
para ma-convert ito, para mas mabilis itong mabasa.
-F filename
Gifile (file na naglalaman ng listahan ng mga gi) para gamitin sa -B or -L
-L filename
Lumikha ng isang alias file na pinangalanan filename, nililimitahan ang mga sequence na hinanap sa mga iyon
tinukoy ng -F.
-T filename
Itakda ang mga taxonomy ID sa ASN.1 deflines ayon sa talahanayan sa filename.
-V Verbose: tingnan ang mga hindi natatanging string id sa database
-a Ang input file ay database sa format na ASN.1 (kung hindi man ay inaasahan ang FASTA)
-b Ang ASN.1 database ay binary (kumpara sa ASCII text)
-e Ang input ay isang Seq-entry. Ang isang source ASN.1 database (alinman sa text ascii o binary) ay maaaring
naglalaman ng Bioseq-set o isang Bioseq lang. Sa dating kaso -e dapat ibigay.
-i filename
Mag-input ng (mga) file para sa pag-format
-l filename
Pangalan ng log file (default = formatdb.log)
-n STR Base name para sa BLAST file (mga default sa pangalan ng orihinal na FASTA file)
-o I-parse ang SeqID at lumikha ng mga index. Kung ang source database ay nasa FASTA na format, ang
ang mga identifier ng database sa linya ng kahulugan ng FASTA ay dapat sumunod sa mga kumbensyon ng
ang FASTA Defline Format.
-p F Ang input ay isang nucleotide, hindi isang protina.
-s I-index lamang sa pamamagitan ng pag-akyat, hindi sa pamamagitan ng locus. Ito ay lalong kapaki-pakinabang para sa mga set ng pagkakasunud-sunod
tulad ng EST kung saan magkapareho ang mga pangalan ng accession at locus. Tumatakbo ang Formatdb
mas mabilis at gumagawa ng mas maliliit na pansamantalang file kung gagamitin ang opsyong ito. Ito ay malakas
inirerekomenda para sa EST's, STS's, GSS's, at HTGS's.
-t STR Pamagat para sa database file [String]
-v N Hatiin ang malalaking file ng FASTA sa `volume' na laki N milyong titik (4000 by
default). Bilang bahagi ng paglikha ng isang volume, formatdb nagsusulat ng bagong uri ng BLAST
database file, na tinatawag na alias file, na may extension na `nal' o `pal'.
Gumamit ng formatdb online gamit ang mga serbisyo ng onworks.net