Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

hmmsim - Trực tuyến trên đám mây

Chạy hmmsim trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh hmmsim có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


hmmsim - thu thập phân phối điểm trên các chuỗi ngẫu nhiên

SYNOPSIS


hừm [tùy chọn]

MÔ TẢ


Sản phẩm hừm chương trình tạo ra các chuỗi ngẫu nhiên, cho điểm chúng với (các) mô hình trong ,
và xuất ra nhiều loại biểu đồ, biểu đồ và phân bố phù hợp cho kết quả
điểm số.

hừm không phải là một phần chính của gói HMMER. Hầu hết người dùng sẽ không có lý do gì để
sử dụng nó. Nó được sử dụng để phát triển và kiểm tra các phương pháp thống kê được sử dụng để xác định giá trị P
và giá trị E trong HMMER3. Ví dụ, nó được sử dụng để tạo ra hầu hết các kết quả trong năm 2008
bài báo về thống kê liên kết cục bộ của H3 (PLoS Comp Bio 4: e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Bởi vì nó là một thử nghiệm nghiên cứu, bạn không nên mong đợi nó sẽ mạnh mẽ như những
các chương trình trong gói. Ví dụ, các tùy chọn có thể tương tác theo những cách kỳ lạ; chúng tôi chưa
đã thử nghiệm cũng như không cố gắng dự đoán tất cả các kết hợp khác nhau có thể xảy ra.

Nhiệm vụ chính là điều chỉnh phân phối Gumbel có khả năng tối đa cho điểm Viterbi hoặc
khả năng tối đa theo cấp số nhân đến điểm Chuyển tiếp đạt điểm cao và để kiểm tra rằng những
các bản phân phối vừa vặn tuân theo phỏng đoán lambda ~ log_2 cho cả Viterbi Gumbel
và đuôi lũy thừa.

Đầu ra là một bảng số, một hàng cho mỗi kiểu máy. Bốn tham số phù hợp khác nhau
đối với dữ liệu điểm số được kiểm tra: (1) khả năng tối đa phù hợp với cả vị trí (mu / tau) và
thông số độ dốc (lambda); (2) giả sử lambda = log_2, khả năng tối đa phù hợp với
chỉ tham số vị trí; (3) giống nhau nhưng giả sử lambda được sửa cạnh, sử dụng dòng điện
các thủ tục trong H3 [Eddy, 2008]; và (4) sử dụng cả hai tham số được xác định bởi dòng điện của H3
các thủ tục. Thống kê đơn giản, nhanh chóng và tiêu chuẩn cho sự phù hợp là 'E @ 10',
Giá trị E được tính toán của lần truy cập hàng đầu được xếp hạng thứ 10, mà chúng tôi dự đoán là khoảng 10.

Cụ thể, các cột của đầu ra là:

tên Tên của mô hình.

nối đuôi nhau Một phần của điểm số cao nhất được sử dụng để phù hợp với phân phối. Đối với Viterbi, MSV và
Điểm kết hợp, giá trị này mặc định là 1.0 (bản phân phối Gumbel phù hợp với tất cả
dữ liệu). Đối với điểm số Chuyển tiếp, giá trị này mặc định là 0.02 (một đuôi hàm mũ được trang bị cho
2% điểm cao nhất).

mu / tau Tham số vị trí cho khả năng phù hợp tối đa với dữ liệu.

lambda Tham số độ dốc cho khả năng tối đa phù hợp với dữ liệu.

E @ 10 Giá trị E được tính cho điểm cao được xếp hạng thứ 10 ('E @ 10') bằng cách sử dụng ML mu / tau
và lambda. Theo định nghĩa, con số này dự kiến ​​là khoảng 10, nếu ước tính giá trị E là
chính xác

hỗn hợp Thông số vị trí, để có khả năng tối đa phù hợp với độ dốc (cố định) đã biết
tham số lambda của log_2 (0.693).

E @ 10fix
Giá trị E được tính cho điểm xếp hạng thứ 10 bằng cách sử dụng mufix và giá trị dự kiến
lambda = log_2 = 0.693.

mufix2 Thông số vị trí, để có khả năng phù hợp tối đa với hiệu ứng cạnh đã được hiệu chỉnh
lambda.

E @ 10fix2
Giá trị E được tính cho điểm xếp hạng thứ 10 bằng cách sử dụng mufix2 và hiệu ứng cạnh-
lambda đã sửa.

pmu Tham số vị trí được xác định bởi các thủ tục ước lượng của H3.

âm thanh
Tham số độ dốc được xác định bởi các thủ tục ước lượng của H3.

pE @ 10 Giá trị E được tính cho điểm xếp hạng thứ 10 bằng cách sử dụng pmu, plambda.

Ở cuối bảng này, một dòng nữa được in, bắt đầu bằng # và tóm tắt
tổng thời gian CPU được sử dụng bởi các mô phỏng.

Một số tệp đầu ra tùy chọn có định dạng xmgrace xy. xmgrace mạnh mẽ và tự do
phần mềm vẽ đồ thị có sẵn.

KHÁC LỰA CHỌN


-h Cứu giúp; in lời nhắc ngắn gọn về việc sử dụng dòng lệnh và tất cả các tùy chọn có sẵn.

-a Thu thập thống kê độ dài căn chỉnh Viterbi dự kiến ​​từ mỗi chuỗi được mô phỏng.
Điều này chỉ hoạt động với điểm số Viterbi (mặc định; xem --vit). Hai bổ sung
các trường được in trong bảng đầu ra cho mỗi kiểu máy: chiều dài trung bình của Viterbi
căn chỉnh và độ lệch chuẩn.

-v (Dài dòng). In cả điểm số, mỗi điểm một dòng.

-L Đặt độ dài của các trình tự được lấy mẫu ngẫu nhiên (không chứa mẫu) thành . Các
mặc định là 100.

-N Đặt số chuỗi được lấy mẫu ngẫu nhiên thành . Giá trị mặc định là 1000.

--mpi Chạy ở chế độ MPI song song, dưới mpirun. Nó được song song hóa ở cấp độ gửi
một hồ sơ tại một thời điểm cho một quy trình của nhân viên MPI, do đó, việc song song hóa chỉ hữu ích nếu
bạn có nhiều hơn một hồ sơ trong và bạn muốn có ít nhất là
nhiều hồ sơ do Bộ KHĐT xử lý. (Chỉ khả dụng nếu hỗ trợ MPI tùy chọn là
được kích hoạt tại thời điểm biên dịch.)

LỰA CHỌN KIỂM SOÁT OUTPUT


-o Lưu bảng đầu ra chính vào một tệp thay vì gửi nó đến stdout.

--một tập tin
Khi thu thập số liệu thống kê về căn chỉnh Viterbi ( -a tùy chọn), cho mỗi mẫu
trình tự, xuất hai trường trên mỗi dòng vào một tệp : chiều dài của tối ưu
sự liên kết và điểm số bit Viterbi. Yêu cầu rằng -a tùy chọn cũng được sử dụng.

--Tập tin điện tử
Xuất một thứ hạng so với biểu đồ giá trị E ở định dạng xy XMGRACE vào tệp . Trục x là
thứ hạng của chuỗi này, từ điểm cao nhất đến điểm thấp nhất; trục y là giá trị E
được tính toán cho chuỗi này. Giá trị điện tử được tính toán bằng các thủ tục mặc định của H3
(tức là các tham số pmu, plambda trong bảng đầu ra). Bạn mong đợi một trận đấu khó khăn
giữa thứ hạng và giá trị E nếu giá trị E được ước tính chính xác.

--fffile
Xuất tệp "sức mạnh bộ lọc" thành : cho mỗi mô hình, một dòng có ba trường:
tên kiểu máy, số chuỗi vượt qua ngưỡng giá trị P và phần
trình tự vượt qua ngưỡng giá trị P. Nhìn thấy --pthesh để thiết lập giá trị P
, mặc định là 0.02 (ngưỡng bộ lọc MSV mặc định trong H3). P-
các giá trị được xác định bởi các thủ tục mặc định của H3 (các tham số pmu, plambda trong
bảng đầu ra). Nếu tất cả đều ổn, bạn sẽ thấy công suất bộ lọc bằng
cài đặt giá trị P dự đoán của ngưỡng.

--pfile
Xuất các ô sống sót tích lũy (P (S> x)) vào tệp ở định dạng xy XMGRACE. Ở đó
là ba biểu đồ: (1) sự phân bố điểm số quan sát được; (2) khả năng tối đa
phân phối vừa vặn; (3) khả năng tối đa phù hợp với thông số vị trí
(mu / tau) trong khi
giả sử lambda = log_2.

--xfile
Xuất điểm số bit dưới dạng một mảng nhị phân gồm các số nổi có độ chính xác kép (8 byte cho mỗi
điểm) vào hồ sơ . Các chương trình như Easel's esl-histplot có thể đọc các tệp nhị phân như vậy.
Điều này rất hữu ích khi tạo kích thước mẫu cực lớn.

LỰA CHỌN KIỂM SOÁT MÔ HÌNH CẤU HÌNH (CHẾ ĐỘ)


H3 chỉ sử dụng liên kết cục bộ multihit ( --fs ), và đây là nơi chúng tôi tin rằng
phù hợp thống kê. Điểm căn chỉnh cục bộ Unihit (Smith / Waterman; --sw chế độ) cũng tuân theo
phỏng đoán thống kê. Thống kê liên kết toàn cầu (multihit hoặc unihit) là
vẫn chưa được hiểu đầy đủ cũng như không được trang bị đầy đủ.

--fs Thu thập nhiều điểm liên kết cục bộ. Đây là mặc định. căn chỉnh như
'chế độ tìm kiếm phân mảnh'.

--sw Thu thập điểm liên kết cục bộ unihit. Trạng thái H3 J bị vô hiệu hóa. căn chỉnh như
'Chế độ tìm kiếm Smith / Waterman'.

--ls Thu thập điểm số liên kết toàn cầu của multihit. Trong căn chỉnh toàn cầu (toàn cục / cục bộ),
toàn bộ mô hình phải phù hợp với một nhóm con của mục tiêu. Lối vào / lối ra cục bộ H3
xác suất chuyển đổi bị vô hiệu hóa. 'ls' đến từ lịch sử của HMMER2
thuật ngữ cho liên kết cục bộ multihit là 'chế độ tìm kiếm cục bộ'.

--NS Thu thập điểm liên kết toàn cầu unihit. Cả trạng thái H3 J và lối vào / lối ra cục bộ
xác suất chuyển đổi bị vô hiệu hóa. 's' đến từ lịch sử của HMMER2
thuật ngữ cho sự liên kết toàn cầu unihit.

LỰA CHỌN KIỂM SOÁT KIẾM TIẾNG VIỆT


--vit Thu thập điểm liên kết khả năng tối đa của Viterbi. Đây là mặc định.

--fwd Thu thập điểm số khả năng xảy ra trong nhật ký Chuyển tiếp, được tổng hợp trên nhóm liên kết.

--hyb Thu thập điểm 'Kết hợp', như được mô tả trong các bài báo của Yu và Hwa (ví dụ:
Tin sinh học 18: 864, 2002). Chúng liên quan đến việc tính toán ma trận Chuyển tiếp và lấy
giá trị ô lớn nhất. Bản thân con số này hơi không có động lực về mặt thống kê,
nhưng phân phối được mong đợi là phân phối giá trị cực đoan hoạt động tốt
(Gumbel).

--msv Thu thập điểm số MSV (nhiều Viterbi phân đoạn không được đánh dấu), sử dụng chính của H3
gia tốc heuristic.

--Nhanh Đối với bất kỳ tùy chọn nào ở trên, hãy sử dụng triển khai sản xuất được tối ưu hóa của H3 (sử dụng
Véc tơ hóa SIMD). Mặc định là sử dụng các triển khai hy sinh một
số lượng chính xác. Điều này có thể đưa tiếng ồn gây nhiễu vào
mô phỏng thống kê và phù hợp, vì vậy khi một người cực kỳ quan tâm đến chính xác
chi tiết, tốt hơn là có thể loại bỏ nguồn nhiễu đó.

LỰA CHỌN KIỂM SOÁT PHÙ HỢP ĐUÔI KHỐI LƯỢNG CHO PHÍA TRƯỚC


Trong một số thử nghiệm, sẽ rất hữu ích khi điều chỉnh điểm Chuyển tiếp với một loạt các đuôi khác nhau
khối lượng, thay vì chỉ một. Các tùy chọn này cung cấp một cơ chế để điều chỉnh một cách đồng đều-
khoảng cách giữa các khối đuôi khác nhau. Đối với mỗi khối lượng đuôi khác nhau, một dòng được tạo ra
trong đầu ra.

--tmin
Đặt giới hạn dưới cho phân bố khối lượng đuôi. (Mặc định là 0.02 cho
khối lượng đuôi đơn mặc định.)

--tmax
Đặt giới hạn trên cho phân bố khối lượng đuôi. (Mặc định là 0.02 cho
khối lượng đuôi đơn mặc định.)

--tđiểm
Đặt số lượng đuôi cần lấy mẫu, bắt đầu từ --tmin và kết thúc lúc --tmax.
(Giá trị mặc định là 1, đối với khối lượng đuôi đơn mặc định 0.02.)

--tline
Lấy mẫu một loạt các khối đuôi với khoảng cách tuyến tính đồng đều. Mặc định là sử dụng
khoảng cách logarit đều.

LỰA CHỌN KIỂM SOÁT H3 PARAMETER ƯỚC LƯỢNG PHƯƠNG PHÁP


H3 sử dụng ba mô phỏng trình tự ngẫu nhiên ngắn để ước tính các thông số vị trí cho
phân phối điểm dự kiến ​​cho điểm MSV, điểm Viterbi và điểm Chuyển tiếp. Này
các tùy chọn cho phép các mô phỏng này được sửa đổi.

--EmL
Đặt độ dài trình tự trong mô phỏng ước tính thông số vị trí mu cho
Giá trị E của MSV. Mặc định là 200.

--EmN
Đặt số chuỗi trong mô phỏng ước tính tham số vị trí mu
cho các giá trị E của MSV. Mặc định là 200.

--EvL
Đặt độ dài trình tự trong mô phỏng ước tính thông số vị trí mu cho
Giá trị điện tử Viterbi. Mặc định là 200.

--EvN
Đặt số chuỗi trong mô phỏng ước tính tham số vị trí mu
cho các giá trị E của Viterbi. Mặc định là 200.

--EfL
Đặt độ dài trình tự trong mô phỏng ước tính tham số vị trí tau
cho các giá trị E chuyển tiếp. Mặc định là 100.

--EfN
Đặt số chuỗi trong mô phỏng ước tính tham số vị trí
tau cho các giá trị E chuyển tiếp. Mặc định là 200.

--Eft
Đặt phần khối lượng đuôi để vừa với mô phỏng ước tính vị trí
tau tham số cho các đánh giá Chuyển tiếp. Mặc định là 0.04.

NỢ LỰA CHỌN


--ngăn cản
Để gỡ lỗi phiên bản chính / công nhân MPI: tạm dừng sau khi bắt đầu, để bật
nhà phát triển để đính kèm trình gỡ lỗi vào (các) quy trình chính và công nhân đang chạy. Gửi
Tín hiệu SIGCONT để giải phóng tạm dừng. (Theo gdb: (Gdb) tín hiệu NEXTCONT) (Chỉ một
khả dụng nếu hỗ trợ MPI tùy chọn được bật tại thời điểm biên dịch.)

--hạt giống
Đặt hạt giống số ngẫu nhiên thành . Giá trị mặc định là 0, làm cho số ngẫu nhiên
trình tạo sử dụng một hạt giống tùy ý, để các lần chạy khác nhau của hừm hầu như sẽ
chắc chắn tạo ra một mẫu thống kê khác. Để gỡ lỗi, nó rất hữu ích để
buộc các kết quả có thể tái tạo, bằng cách cố định một hạt số ngẫu nhiên.

THỰC NGHIỆM LỰA CHỌN


Các tùy chọn này đã được sử dụng trong một số ít các thí nghiệm khám phá khác nhau.

--bgflat
Đặt phân bố dư lượng nền thành phân bố đồng đều, cho cả
mục đích của mô hình rỗng được sử dụng để tính điểm và tạo ra
trình tự ngẫu nhiên. Mặc định là sử dụng tần số nền axit amin chuẩn
phân phối.

--bgcomp
Đặt phân bố dư lượng nền thành thành phần trung bình của hồ sơ.
Điều này đã được sử dụng để khám phá một số tác động của thành phần thiên vị.

--x-no-length model
Tắt mô hình độ dài trình tự mục tiêu H3. Đặt tự chuyển đổi cho N, C, J
và thay vào đó là mô hình null thành 350/351; điều này mô phỏng HMMER2. Không phải là một ý tưởng tốt trong
Tổng quan. Điều này được sử dụng để chứng minh một trong những điểm khác biệt chính của H2 so với H3.

--nu
Đặt tham số nu cho thuật toán MSV - số lượng cục bộ chưa được đánh dấu dự kiến
sự liên kết trên mỗi chuỗi mục tiêu. Giá trị mặc định là 2.0, tương ứng với E-> J
xác suất chuyển tiếp 0.5. Điều này được sử dụng để kiểm tra xem các nu khác nhau có
ảnh hưởng đáng kể đến kết quả (có vẻ như không, trong lý do). Chỉ tùy chọn này
hoạt động nếu --msv được chọn (nó chỉ ảnh hưởng đến MSV) và nó sẽ không hoạt động với --Nhanh
(bởi vì các triển khai được tối ưu hóa được làm cứng để giả sử nu = 2.0).

--pthesh
Đặt ngưỡng giá trị P của bộ lọc để sử dụng trong việc tạo các tệp công suất bộ lọc với
--fffile. Giá trị mặc định là 0.02 (sẽ thích hợp để kiểm tra điểm MSV,
vì đây là ngưỡng bộ lọc MSV mặc định trong đường ống tăng tốc của H3.)
Các lựa chọn thích hợp khác (các giá trị mặc định phù hợp trong quy trình tăng tốc) sẽ là
0.001 cho Viterbi và 1e-5 cho Chuyển tiếp.

Sử dụng hmmsim trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad