Ini ialah arahan formatdb yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, Windows online emulator atau MAC OS online emulator.
JADUAL:
NAMA
formatdb - format pangkalan data protein atau nukleotida untuk BLAST
SINOPSIS
formatdb [-] [-B nama fail] [-F nama fail] [-L nama fail] [-T nama fail] [-V] [-a] [-b] [-e]
[-i nama fail] [-l nama fail] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
DESCRIPTION
formatdb mesti digunakan untuk memformat pangkalan data sumber protein atau nukleotida sebelum ini
pangkalan data ini boleh dicari dengan blastall, blastpgp atau MegaBLAST. Pangkalan data sumber
mungkin dalam format FASTA atau ASN.1. Walaupun format FASTA paling kerap digunakan sebagai
input kepada formatdb, penggunaan ASN.1 adalah berfaedah bagi mereka yang menggunakan ASN.1 sebagai
sumber biasa untuk format lain seperti laporan GenBank. Sekali fail pangkalan data sumber
telah diformatkan oleh formatdb ia tidak diperlukan oleh BLAST. Sila ambil perhatian bahawa jika anda
akan menggunakan kemas kini berkala pada pangkalan data BLAST anda menggunakan fmerge(1), anda perlu
simpan fail pangkalan data sumber.
PILIHAN
Ringkasan pilihan disertakan di bawah.
- Cetak mesej penggunaan
-B nama fail
Gifile binari yang dihasilkan daripada Gifile yang ditentukan oleh -F. Pilihan ini menentukan
nama fail senarai GI binari. Pilihan ini harus digunakan dengan -F pilihan. A
senarai GI teks boleh ditentukan dengan -F pilihan dan -B pilihan akan menghasilkan
senarai GI itu dalam format binari. Fail binari adalah lebih kecil dan BLAST tidak memerlukan
untuk menukarnya, supaya ia boleh dibaca dengan lebih cepat.
-F nama fail
Gifile (fail yang mengandungi senarai gi) untuk digunakan dengan -B or -L
-L nama fail
Buat fail alias bernama nama fail, mengehadkan urutan yang dicari kepada mereka
ditentukan oleh -F.
-T nama fail
Tetapkan ID taksonomi dalam ASN.1 mentakrifkan mengikut jadual dalam nama fail.
-V Verbose: semak id rentetan bukan unik dalam pangkalan data
-a Fail input ialah pangkalan data dalam format ASN.1 (jika tidak FASTA dijangka)
-b Pangkalan data ASN.1 adalah binari (berbanding dengan teks ASCII)
-e Input ialah kemasukan Seq. Pangkalan data ASN.1 sumber (sama ada teks ascii atau binari) boleh
mengandungi set Bioseq atau hanya satu Bioseq. Dalam kes kedua -e hendaklah disediakan.
-i nama fail
Masukkan fail untuk pemformatan
-l nama fail
Nama fail log (lalai = formatdb.log)
-n str Nama asas untuk fail BLAST (lalai kepada nama fail FASTA asal)
-o Parse SeqID dan buat indeks. Jika pangkalan data sumber dalam format FASTA, fail
pengecam pangkalan data dalam baris definisi FASTA mesti mengikut konvensyen
Format Defline FASTA.
-p F Input ialah nukleotida, bukan protein.
-s Indeks hanya dengan penyertaan, bukan dengan lokus. Ini amat berguna untuk set jujukan
seperti EST di mana nama kesertaan dan lokus adalah sama. Formatdb berjalan
lebih pantas dan menghasilkan fail sementara yang lebih kecil jika pilihan ini digunakan. Ia adalah kuat
disyorkan untuk EST, STS, GSS dan HTGS.
-t str Tajuk untuk fail pangkalan data [String]
-v N Pecahkan fail FASTA yang besar kepada saiz `volume' N juta surat (4000 oleh
lalai). Sebagai sebahagian daripada penciptaan volum, formatdb menulis jenis BLAST baharu
fail pangkalan data, dipanggil fail alias, dengan sambungan `nal' atau `pal'.
Gunakan formatdb dalam talian menggunakan perkhidmatan onworks.net