Đây là lệnh gt-extractseq có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
gt-extractseq - Trích xuất trình tự từ (các) tệp trình tự nhất định hoặc fastaindex.
SYNOPSIS
gt trích xuất [tùy chọn ...] [(các) tệp chuỗi] | fastaindex
MÔ TẢ
-từ [giá trị]
trích xuất chuỗi từ vị trí này đếm từ 1 trở đi (mặc định: 0)
-topos [giá trị]
trích xuất chuỗi lên đến vị trí này đếm từ 1 trở đi (mặc định: 0)
-trận đấu [chuỗi]
trích xuất tất cả các chuỗi có mô tả phù hợp với mẫu đã cho. Mẫu đã cho
phải là một biểu thức chính quy mở rộng hợp lệ. (mặc định: không xác định)
-key [tên tập tin]
trích xuất chuỗi con cho các khóa trong tệp được chỉ định (mặc định: không xác định)
-chiều rộng [giá trị]
đặt chiều rộng đầu ra cho in theo trình tự FASTA (0 tắt định dạng) (mặc định: 0)
-o [tên tập tin]
chuyển hướng đầu ra đến tệp được chỉ định (mặc định: không xác định)
-gzip [có | không]
ghi tệp đầu ra nén gzip (mặc định: không)
-bzip2 [có | không]
ghi tệp đầu ra nén bzip2 (mặc định: không)
-lực lượng [có | không]
buộc ghi vào tệp đầu ra (mặc định: không)
-Cứu giúp
hiển thị trợ giúp và thoát
-phiên bản
thông tin phiên bản màn hình và thoát
Tùy chọn -key cho phép người ta trích xuất chuỗi con hoặc chuỗi từ chuỗi đã cho
tệp hoặc từ một chỉ mục fasta. Các chuỗi con sẽ được trích xuất được chỉ định trong một tệp khóa
được đưa ra làm đối số cho tùy chọn này. Tệp khóa phải chứa các dòng của biểu mẫu
k
or
kij
trong đó k là một chuỗi (khóa) và i và j tùy chọn là các số nguyên dương sao cho
i⇐j. k là khóa và các số tùy chọn i và j chỉ định vị trí đầu tiên của
chuỗi con và vị trí cuối cùng của chuỗi con được trích xuất. Các vị trí là
được tính từ 1. Nếu k trùng với chuỗi giữa ký tự thứ nhất và thứ hai
sự xuất hiện của ký hiệu | trong tiêu đề fasta, sau đó là tiêu đề fasta và
trình tự là đầu ra. Ví dụ trong tiêu đề fasta
> tr | A0AQI4 | A0AQI4_9ARCH Amoniac monooxygenase giả định (Mảnh)
phím fasta là A0AQI4. Nếu cả i và j đều được chỉ định, thì chuỗi con tương ứng
được hiển thị ở định dạng fasta. Trong trường hợp thứ hai, tiêu đề của trình tự được định dạng fasta trong
đầu ra bắt đầu bằng
> kij
theo sau là tiêu đề fasta gốc ban đầu.
Nếu đầu vào trình tự là tệp fasta, thì các nội dung sau sẽ được lưu giữ:
· Các dòng trùng lặp trong tệp đầu vào dẫn đến chỉ một chuỗi trong đầu ra
· Các trình tự được xuất theo thứ tự trong các tệp trình tự ban đầu
· Định dạng của đầu ra có thể được kiểm soát bởi các tùy chọn -chiều rộng, -o, -gzipvà
-bzip2
Nếu đầu vào trình tự đến từ chỉ mục fasta (xem bên dưới), điều sau là:
· Lựa chọn -chiều rộng được yêu cầu
· Lựa chọn -o, -gzip và -bzip2 đừng làm việc
· Các trình tự được xuất theo thứ tự các khóa tương ứng xuất hiện trong tệp khóa
Nếu phần cuối của danh sách đối số chỉ chứa một tên tệp, chẳng hạn như fastaindex, thì đó là
đã kiểm tra xem có tệp fastaindex.kys không. Điều này tạo nên một phần của chỉ số fasta, là
được cấu trúc bằng cách gọi công cụ hậu tố như sau:
hậu tố gt -protein -ssp -tis -des -sds -kys -indexname fastaindex \
-db tệp đầu vào1 [tệp đầu vào2 ..]
Điều này đọc các tệp trình tự protein được cung cấp cho tùy chọn -db và tạo một số tệp:
· Một tệp fastaindex.esq đại diện cho trình tự.
· Một tệp fastaindex.ssp xác định các vị trí phân tách trình tự.
· Một tệp fastaindex.des hiển thị từng dòng tiêu đề fasta.
· Một tệp fastaindex.sds đưa ra các vị trí dấu phân cách tiêu đề trình tự.
· Một tệp fastaindex.kys chứa các khóa trong tệp fasta.
Để lệnh hậu tố hoạt động, các phím có dạng | key | trong tiêu đề fasta phải
thỏa mãn các ràng buộc sau:
· Tất cả chúng phải có cùng độ dài, không dài hơn 128 và không ngắn hơn 1
· Chúng phải xuất hiện theo thứ tự từ vựng
BÁO CÁO GIỎI
Báo cáo lỗi cho[email được bảo vệ]>.
Sử dụng gt-extractseq trực tuyến bằng các dịch vụ onworks.net