Đây là định dạng lệnh có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
formatdb - định dạng cơ sở dữ liệu protein hoặc nucleotide cho BLAST
SYNOPSIS
định dạngdb [-] [-B tên tập tin] [-F tên tập tin] [-L tên tập tin] [-T tên tập tin] [-V] [-a] [-b] [-e]
[-i tên tập tin] [-l tên tập tin] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
MÔ TẢ
định dạngdb phải được sử dụng để định dạng cơ sở dữ liệu nguồn protein hoặc nucleotide trước đây
những cơ sở dữ liệu này có thể được tìm kiếm bằng blastall, blastpgp hoặc MegaBLAST. Cơ sở dữ liệu nguồn
có thể ở định dạng FASTA hoặc ASN.1. Mặc dù định dạng FASTA thường được sử dụng nhất là
nhập vào định dạngdb, việc sử dụng ASN.1 có lợi cho những người đang sử dụng ASN.1 như
nguồn chung cho các định dạng khác như báo cáo GenBank. Từng là tệp cơ sở dữ liệu nguồn
đã được định dạng bởi định dạngdb nó không cần thiết bởi BLAST. Xin lưu ý rằng nếu bạn
sẽ áp dụng các bản cập nhật định kỳ cho cơ sở dữ liệu BLAST của bạn bằng cách sử dụng hợp nhất(1), bạn sẽ cần phải
giữ tệp cơ sở dữ liệu nguồn.
LỰA CHỌN
Dưới đây là một bản tóm tắt các tùy chọn.
- In tin nhắn sử dụng
-B tên tập tin
Gifile nhị phân được tạo ra từ Gifile được chỉ định bởi -F. Tùy chọn này chỉ định
tên của tệp danh sách GI nhị phân. Tùy chọn này nên được sử dụng với -F Lựa chọn. MỘT
văn bản GI danh sách có thể được chỉ định với -F tùy chọn và -B tùy chọn sẽ sản xuất
danh sách GI đó ở định dạng nhị phân. Tệp nhị phân nhỏ hơn và BLAST không cần
để chuyển đổi nó, vì vậy nó có thể được đọc nhanh hơn.
-F tên tập tin
Gifile (tệp chứa danh sách gi) để sử dụng với -B or -L
-L tên tập tin
Tạo một tệp bí danh có tên tên tập tin, giới hạn các trình tự được tìm kiếm cho những
theo quy định của -F.
-T tên tập tin
Đặt ID phân loại trong ASN.1 định nghĩa theo bảng trong tên tập tin.
-V Chi tiết: kiểm tra các id chuỗi không phải duy nhất trong cơ sở dữ liệu
-a Tệp đầu vào là cơ sở dữ liệu ở định dạng ASN.1 (nếu không thì cần FASTA)
-b Cơ sở dữ liệu ASN.1 là nhị phân (trái ngược với văn bản ASCII)
-e Đầu vào là một Seq-entry. Cơ sở dữ liệu ASN.1 nguồn (văn bản ascii hoặc nhị phân) có thể
chứa một Bioseq-set hoặc chỉ một Bioseq. Trong trường hợp sau -e cần được cung cấp.
-i tên tập tin
(Các) tệp đầu vào để định dạng
-l tên tập tin
Tên tệp nhật ký (mặc định = định dạngdb.log)
-n str Tên cơ sở cho tệp BLAST (mặc định là tên của tệp FASTA ban đầu)
-o Phân tích cú pháp SeqID và tạo chỉ mục. Nếu cơ sở dữ liệu nguồn ở định dạng FASTA,
định danh cơ sở dữ liệu trong dòng định nghĩa FASTA phải tuân theo các quy ước của
định dạng FASTA Defline.
-p F Đầu vào là nucleotide, không phải protein.
-s Chỉ mục theo quyền truy cập, không phải theo quỹ tích. Điều này đặc biệt hữu ích cho các tập hợp trình tự
như EST trong đó tên miền và quyền truy cập giống hệt nhau. Formatdb chạy
nhanh hơn và tạo ra các tệp tạm thời nhỏ hơn nếu tùy chọn này được sử dụng. Nó mạnh mẽ
được đề xuất cho EST, STS, GSS và HTGS.
-t str Tiêu đề cho tệp cơ sở dữ liệu [Chuỗi]
-v N Chia nhỏ các tệp FASTA lớn thành `` khối lượng '' có kích thước N triệu bức thư (4000 bởi
vỡ nợ). Là một phần của quá trình tạo tập, định dạngdb viết một loại BLAST mới
tệp cơ sở dữ liệu, được gọi là tệp bí danh, với phần mở rộng là `nal 'hoặc` pal'.
Sử dụng formatdb trực tuyến bằng các dịch vụ onworks.net