Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

cmcalibrate - Trực tuyến trên đám mây

Chạy cmcalibrate trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

Đây là lệnh cmcalibrate có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


cmcalibrate - phù hợp với đuôi hàm mũ để xác định giá trị E-mô hình hiệp phương sai

SYNOPSIS


hiệu chỉnh cm [tùy chọn] tập tin cmt

MÔ TẢ


hiệu chỉnh cm xác định các tham số đuôi hàm mũ để xác định giá trị E bằng cách tạo
trình tự ngẫu nhiên, tìm kiếm chúng bằng CM và thu thập điểm của kết quả
lượt truy cập. Biểu đồ về điểm số bit của các lần truy cập phù hợp với một đuôi cấp số nhân và
các thông số của đuôi vừa vặn được lưu vào tệp CM. Các thông số đuôi theo cấp số nhân
sau đó được sử dụng để ước tính ý nghĩa thống kê của các lần truy cập được tìm thấy trong cmsearch
cmscan.

Tệp CM phải được hiệu chỉnh với hiệu chỉnh cm trước khi nó có thể được sử dụng trong cmsearch or quét cms,
với một ngoại lệ duy nhất: không cần thiết phải hiệu chỉnh các tệp CM chỉ bao gồm
các mô hình không có bậc thang trước khi chạy cmsearch.

hiệu chỉnh cm Rất chậm. Phải mất vài giờ để hiệu chỉnh một kích thước trung bình duy nhất
CM trên một CPU duy nhất. hiệu chỉnh cm sẽ chạy song song trên tất cả các lõi có sẵn nếu Infernal
được xây dựng trên một hệ thống hỗ trợ phân luồng POSIX (xem phần Cài đặt của
hướng dẫn sử dụng để biết thêm thông tin). Sử dụng lõi sẽ dẫn đến khoảng Lần
tăng tốc so với một CPU duy nhất. MPI (Giao diện truyền thông báo) cũng có thể được sử dụng cho
song song với --mpi tùy chọn nếu Infernal được tạo với MPI được bật, nhưng sử dụng
hơn 161 bộ xử lý không được khuyến nghị vì tăng 161 bộ xử lý trong quá khứ sẽ không tăng tốc
hiệu chuẩn. Xem phần Cài đặt của hướng dẫn sử dụng để biết thêm thông tin.

Sản phẩm --dự báo tùy chọn có thể được sử dụng để ước tính thời gian chương trình sẽ chạy trong một
được tập tin cmt trên máy hiện tại. Để dự đoán thời gian chạy trên bộ xử lý với
MPI, bổ sung sử dụng --n dự báo tùy chọn.

Các trình tự ngẫu nhiên được tìm kiếm trong hiệu chỉnh cm được tạo ra bởi một HMM đã được đào tạo về
trình tự gen thực với các hàm lượng GC khác nhau. Mục tiêu là có các bản phân phối GC
trong trình tự ngẫu nhiên tương tự như trong trình tự gen thực tế.

Bốn lượt tìm kiếm và các lượt tìm kiếm phù hợp theo cấp số nhân tiếp theo được thực hiện, mỗi lượt tìm kiếm
bốn thuật toán CM khác nhau có thể được sử dụng trong cmsearchquét cmt: Glocal CYK,
glocal Inside, CYK cục bộ và Local Inside.

Các tham số giá trị E được xác định bởi hiệu chỉnh cm chỉ được sử dụng bởi cmsearchquét cmt
các chương trình. Nếu bạn không sử dụng các chương trình này thì đừng lãng phí thời gian hiệu chỉnh
mô hình của bạn.

LỰA CHỌN


-h Cứu giúp; in lời nhắc ngắn gọn về việc sử dụng dòng lệnh và các tùy chọn có sẵn.

-L Đặt tổng độ dài của chuỗi ngẫu nhiên để tìm kiếm thành megabases (Mb). Qua
vỡ nợ, is 1.6 Mb. Tăng sẽ làm cho đuôi theo cấp số nhân phù hợp hơn
chính xác và giá trị E chính xác hơn, nhưng sẽ mất nhiều thời gian hơn (nhân đôi đại khái sẽ
gấp đôi thời gian chạy). Đang giảm dần không được khuyến khích vì nó sẽ làm cho
phù hợp ít chính xác hơn và các giá trị E kém chính xác hơn.

LỰA CHỌN CHO DỰ KIẾN YÊU CẦU THỜI GIAN NHỚ


--dự báo
Dự đoán thời gian chạy hiệu chuẩn của tập tin cmt (với các tùy chọn được cung cấp) trên
máy hiện tại và thoát ra. Hiệu chuẩn không được thực hiện. Các dự đoán
nên được coi là ước tính thô. Nếu đa luồng được bật (xem
Phần cài đặt của hướng dẫn sử dụng), thời gian sẽ tính đến số
trong số các lõi có sẵn.

--n dự báo
Với --dự báo, xác định điều đó bộ xử lý sẽ được sử dụng để hiệu chuẩn.
Điều này có thể hữu ích để dự đoán thời gian chạy của MPI chạy với
bộ vi xử lý.

--memreq
Dự đoán dung lượng bộ nhớ cần thiết để hiệu chuẩn tập tin cmt (với cung cấp
tùy chọn) trên máy hiện tại và thoát. Hiệu chuẩn không được thực hiện.

LỰA CHỌN KIỂM SOÁT SỐ MŨ ĐUÔI FITS


--gtailn
phù hợp với đuôi mũ cho Glocal Inside và Glocal CYK cho điểm cao nhất
trong phần đuôi biểu đồ, nơi is nhân với số Mb đã tìm kiếm. Các
giá trị mặc định của là 250. Giá trị 250 được chọn vì nó hoạt động tốt
về mặt kinh nghiệm so với các giá trị khác.

--lđuôi
phù hợp với đuôi theo cấp số nhân cho CYK nội bộ và cục bộ cục bộ với điểm cao nhất
trong phần đuôi biểu đồ, nơi is nhân với số Mb đã tìm kiếm. Các
giá trị mặc định của là 750. Giá trị 750 được chọn vì nó hoạt động tốt
về mặt kinh nghiệm so với các giá trị khác.

--đuôi
Bỏ qua --gtailn--lđuôi các tùy chọn có tiền tố và phù hợp với phần đuôi của
biểu đồ thành đuôi hàm mũ, cho tất cả các chế độ tìm kiếm.

CHỌN OUTPUT CÁC TẬP TIN


--hfile
Lưu các biểu đồ phù hợp với tệp . Định dạng của tệp này là hai dấu cách
các cột được phân cách trên mỗi dòng. Cột đầu tiên là các giá trị trục x của điểm số bit của
mỗi thùng. Cột thứ hai là các giá trị trục y của số lần truy cập trên mỗi thùng. Mỗi
sê-ri được phân cách bằng một dòng với một ký tự "&". Tệp sẽ chứa
một chuỗi cho mỗi đuôi trong số bốn đuôi theo cấp số nhân phù hợp với thứ tự sau:
Glocal CYK, Glocal Inside, CYK cục bộ và Local Inside.

--sfile
Lưu thông tin cốt truyện sống sót vào hồ sơ . Định dạng của tệp này là hai dấu cách
các cột được phân cách trên mỗi dòng. Cột đầu tiên là các giá trị trục x của điểm số bit của
mỗi thùng. Cột thứ hai là các giá trị trục y của phần số lần truy cập đáp ứng hoặc
vượt quá số điểm cho mỗi thùng. Mỗi sê-ri được phân cách bằng một dòng với một
tính cách "&". Tệp sẽ chứa ba chuỗi dữ liệu cho mỗi trong bốn CM
chế độ tìm kiếm theo thứ tự sau: glocal CYK, glocal Inside, local CYK và
địa phương Bên trong. Loạt đầu tiên là cốt truyện sống sót theo kinh nghiệm từ biểu đồ
số lần truy cập vào chuỗi ngẫu nhiên. Chuỗi thứ hai là đuôi hàm mũ phù hợp với
phân phối theo kinh nghiệm. Chuỗi thứ ba là phần đuôi phù hợp theo cấp số nhân nếu lambda
đã được cố định và đặt làm nhật ký tự nhiên của 2 (0.691314718).

--qqfile
Lưu thông tin lô lượng tử-lượng tử vào tệp . Định dạng của tệp này là
hai cột được phân cách bằng dấu cách trên mỗi dòng. Cột đầu tiên là các giá trị trục x và
cột thứ hai là các giá trị trục y. Khoảng cách của các điểm từ
đường nhận dạng (y = x) là thước đo mức độ phù hợp của đuôi theo cấp số nhân,
Các điểm gần với đường nhận dạng càng tốt. Mỗi sê-ri là
được phân tách bằng một dòng với một ký tự "&". Tệp sẽ chứa một loạt
dữ liệu thực nghiệm cho mỗi phần trong số bốn phần đuôi theo cấp số nhân phù hợp với phần sau
thứ tự: glocal CYK, glocal Inside, local CYK và local Inside.

--fffile
Tiết kiệm các số liệu thống kê được phân tách bằng không gian của các đuôi theo cấp số nhân khác nhau phù hợp với tệp .
Tệp sẽ chứa các giá trị lambda và mu cho các đuôi theo cấp số nhân phù hợp với
biểu đồ đuôi có kích thước khác nhau. Các trường trong tệp được gắn nhãn
một cách thông tin.

--xfile
Lưu danh sách các điểm trong mỗi phần đuôi của biểu đồ phù hợp vào tệp . Mỗi dòng của
tệp này sẽ có một số điểm khác cho biết một lần truy cập tồn tại ở phần đuôi với
số điểm đó. Mỗi chuỗi được phân cách bằng một dòng với một ký tự duy nhất "&". Các
tệp sẽ chứa một chuỗi cho mỗi một trong bốn phần đuôi hàm mũ phù hợp với
thứ tự sau: glocal CYK, glocal Inside, local CYK và local Inside.

KHÁC LỰA CHỌN


--hạt giống
Giống như trình tạo số ngẫu nhiên với , một số nguyên> = 0. Nếu là nonzero,
mô phỏng ngẫu nhiên sẽ có thể tái tạo được; cùng một lệnh sẽ cung cấp cùng một
kết quả. Nếu như là 0, trình tạo số ngẫu nhiên được đưa vào tùy ý, và
mô phỏng ngẫu nhiên sẽ thay đổi tùy theo từng lần chạy của cùng một lệnh. Mặc định
hạt giống là 181.

--beta
Theo mặc định, dải phụ thuộc vào truy vấn (QDB) được sử dụng để tăng tốc tìm kiếm CM
các thuật toán có xác suất mất đuôi beta là 1E-15. Giá trị beta này có thể là
thay đổi để với --beta . Tham số beta là lượng xác suất
loại trừ khối lượng trong quá trình tính toán băng tần, các giá trị beta cao hơn cho tốc độ nhanh hơn
nhưng hy sinh độ chính xác nhiều hơn giá trị thấp hơn. Giá trị mặc định được sử dụng là 1E-15.
(Để biết thêm thông tin về QDB, hãy xem Nawrocki và Eddy, PLoS Computational Biology
3(3): e56.)

- không bị bó
Tắt QDB trong khi hiệu chuẩn giá trị E. Điều này sẽ làm chậm quá trình hiệu chuẩn.

--nonul3
Tắt mô hình null3 post hoc bổ sung null. Điều này không được khuyến khích trừ khi
bạn có kế hoạch sử dụng cùng một tùy chọn để cmsearch và / hoặc cmscan.

--ngẫu nhiên
Sử dụng mô hình rỗng nền của CM để tạo chuỗi ngẫu nhiên, thay vào đó
của HMM thực tế hơn. Trừ khi CM được xây dựng bằng cách sử dụng --vô giá trị tùy chọn để
cmbuild, mô hình rỗng nền sẽ là 25% cho mỗi A, C, G và U.

--gc
Tạo trình tự ngẫu nhiên bằng cách sử dụng sự phân bố nucleotide từ trình tự
hồ sơ .

--CPU
Chỉ định rằng nhân viên CPU song song được sử dụng. Nếu như được đặt là "0", sau đó
chương trình sẽ được chạy ở chế độ nối tiếp, không sử dụng luồng. Bạn cũng có thể kiểm soát
con số này bằng cách đặt một biến môi trường, INFERSAL_NCPU. Tùy chọn này sẽ
chỉ khả dụng nếu máy mà Infernal được chế tạo có khả năng sử dụng
Phân luồng POSIX (xem phần Cài đặt của hướng dẫn sử dụng để biết thêm
thông tin).

--mpi Chạy như một chương trình MPI song song. Tùy chọn này sẽ chỉ khả dụng nếu Infernal có
đã được định cấu hình và xây dựng bằng cờ "--enable-mpi" (xem Cài đặt
phần hướng dẫn sử dụng để biết thêm thông tin).

Sử dụng cmcalibrate trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad