tigr-build-icm - Trực tuyến trên Đám mây

Đây là lệnh tigr-build-icm có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


tigr-glimmer - Đánh dấu và xuất ra mô hình Markov nội suy (IMM)

SYNOPSIS


tigr-build-icm

MÔ TẢ


Chương trình build-icm.c tạo và xuất ra mô hình Markov nội suy (IMM) như được mô tả
trong bài báo AL Delcher, D. Harmon, S. Kasif, O. White, và SL Salzberg. Cải tiến
Nhận dạng gen vi sinh vật với Glimmer. Nghiên cứu axit nucleic, 1999, trên báo chí.
Vui lòng tham khảo bài báo này nếu bạn sử dụng hệ thống như một phần của bất kỳ nghiên cứu đã xuất bản nào.

Đầu vào đến từ tệp có tên trên dòng lệnh. Định dạng phải là một chuỗi cho mỗi
hàng. Mỗi dòng có một chuỗi ID theo sau là khoảng trắng, theo sau là chính chuỗi.
Tập lệnh run-glimmer3 tạo tệp đầu vào ở định dạng chính xác bằng cách sử dụng 'giải nén'
chương trình.

IMM được xây dựng như sau: Đối với một ngữ cảnh nhất định, chẳng hạn như acgtta, chúng tôi muốn ước tính
phân phối xác suất của ký tự tiếp theo. Chúng tôi sẽ làm điều này như một tuyến tính
sự kết hợp của các phân phối xác suất quan sát được cho bối cảnh này và tất cả
các hậu tố, tức là, cgtta, gtta, tta, ta, a và rỗng. Theo các phân phối được quan sát, tôi có nghĩa là
đếm số lần xuất hiện của các chuỗi này trong tập huấn luyện. Tuyến tính
kết hợp được xác định bởi một tập hợp các xác suất, lambda, một xác suất cho mỗi chuỗi ngữ cảnh.
Đối với acgtta ngữ cảnh, các hệ số kết hợp tuyến tính là:

lambda (acgtta) (1 - lambda (acgtta)) x lambda (cgtta) (1 - lambda (acgtta)) x (1 - lambda
(cgtta)) x lambda (gtta) (1 - lambda (acgtta)) x (1 - lambda (cgtta)) x (1 - lambda
(gtta)) x lambda (tta) (1 - lambda (acgtta)) x (1 - lambda (cgtta)) x (1 - lambda (gtta))
x (1 - lambda (tta)) x (1 - lambda (ta)) x (1 - lambda (a))

Chúng tôi tính toán các giá trị lambda cho từng ngữ cảnh như sau: - Nếu số lượng quan sát
trong tập huấn luyện là> = hằng số SAMPLE_SIZE_BOUND, lambda cho ngữ cảnh đó là
1.0 - Nếu không, hãy thực hiện kiểm tra chi-bình phương trên các quan sát cho bối cảnh này so với
dự đoán phân phối cho ngữ cảnh hậu tố ngắn hơn một ký tự. Nếu chi-square
ý nghĩa <0.5, hãy đặt lambda cho ngữ cảnh này thành 0.0 Nếu không, hãy đặt lambda cho
ngữ cảnh này thành: (ý nghĩa chi bình phương) x (# quan sát) / SAMPLE_WEIGHT

Để chạy chương trình:

xây dựng train.model

Thao tác này sẽ sử dụng dữ liệu đào tạo trong train.seq để tạo tệp train.model, chứa
IMM của bạn.

Sử dụng tigr-build-icm trực tuyến bằng các dịch vụ onworks.net



Các chương trình trực tuyến Linux & Windows mới nhất