Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

blasr - Trực tuyến trên đám mây

Chạy blasr trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh blasr có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


blasr - Ánh xạ chuỗi SMRT thành bộ gen tham chiếu.

SYNOPSIS


nói xấu read.bam bộ gen.fasta -bam -ngoài ra.bam

nói xấu read.fasta bộ gen.fasta

nói xấu read.fasta bộ gen.fasta -sa bộ gen.fasta.sa

nói xấu read.bax.h5 bộ gen.fasta [-sa bộ gen.fasta.sa]

nói xấu read.bax.h5 bộ gen.fasta -sa bộ gen.fasta.sa -Điểm tối đa -100 -minMatch 15 ...

nói xấu read.bax.h5 bộ gen.fasta -sa bộ gen.fasta.sa -nproc 24 -ngoài căn chỉnh.out hữu ích. Cảm ơn !

MÔ TẢ


nói xấu là một chương trình lập bản đồ đọc mà bản đồ đọc đến các vị trí trong bộ gen bằng cách phân cụm
đối sánh chính xác ngắn giữa số đọc và bộ gen, và các cụm tính điểm bằng cách sử dụng căn chỉnh.
Các kết quả phù hợp được tạo ra bằng cách tìm kiếm tất cả các hậu tố của một số đọc so với bộ gen bằng cách sử dụng
mảng hậu tố. Phương pháp chuỗi toàn cầu được sử dụng để tính điểm các cụm trận đấu.

Các đầu vào bắt buộc duy nhất để blasr là một tập tin đọc và một bộ gen tham chiếu. Nó là
cực kỳ hữu ích để đọc thông tin lọc và thời gian chạy ánh xạ có thể giảm
về cơ bản khi chỉ mục mảng hậu tố được tính toán trước trên chuỗi tham chiếu là
được chỉ định.

Mặc dù các lần đọc có thể được nhập ở định dạng FASTA, đầu vào được khuyến nghị là tệp PacBio BAM
bởi vì chúng chứa thông tin giá trị chất lượng được sử dụng trong việc căn chỉnh và tạo ra
phát hiện biến thể chất lượng cao hơn. Mặc dù căn chỉnh có thể được xuất ra ở nhiều định dạng khác nhau,
định dạng đầu ra được đề xuất là PacBio BAM. Hỗ trợ cho các tệp bax.h5 và plx.h5 sẽ được
KHÔNG DÙNG. Hỗ trợ các bảng vùng cho các tệp h5 sẽ được KHÔNG DÙNG.

Khi chỉ số mảng hậu tố của một bộ gen không được chỉ định, mảng hậu tố sẽ được tạo trước
sản xuất sự liên kết. Điều này có thể rất chậm khi bộ gen lớn (ví dụ: Con người).
Tốt nhất là tính toán trước mảng hậu tố của bộ gen bằng chương trình thợ cưa(1), và
sau đó chỉ định mảng hậu tố trên dòng lệnh bằng cách sử dụng -sa bộ gen.fa.sa.

Các tham số tùy chọn được chia đại khái thành ba loại: kiểm soát neo,
điểm căn chỉnh và đầu ra.

Các tham số neo mặc định là tối ưu cho các bộ gen nhỏ và các mẫu có tối đa 5%
phân kỳ khỏi hệ gen tham chiếu. Thông số chính điều chỉnh tốc độ và độ nhạy
-minMatch tham số. Đối với sự liên kết bộ gen của con người, giá trị từ 11 trở lên là
khuyến khích. Một số phương pháp có thể được sử dụng để tăng tốc độ căn chỉnh, với chi phí
có thể giảm độ nhạy.

Các vùng quá lặp lại có thể bị bỏ qua trong quá trình ánh xạ bằng cách giới hạn số lượng
định vị một bản đồ đã đọc với -maxAnchorsPerPosition lựa chọn. Giá trị từ 500 đến
1000 có hiệu quả trong bộ gen người.

Đối với các bộ gen nhỏ như bộ gen vi khuẩn hoặc BAC, các thông số mặc định là đủ
cho độ nhạy tối đa và tốc độ tốt.

LỰA CHỌN


Đầu vào Các tập tin

Đọc

read.bam
Một tệp PacBio BAM về số lần đọc. Đây là đầu vào ưu tiên cho nói xấu
vì giá trị chất lượng phong phú (chèn, xóa và thay thế
giá trị chất lượng) thông tin được duy trì. Chất lượng bổ sung
thông tin cải thiện tốc độ phát hiện và lập bản đồ biến thể.

read.fasta
Một tệp nhiều fasta đọc, mặc dù bất kỳ tệp fasta nào cũng là đầu vào hợp lệ

read.bax.h5|read.plx.h5
người già KHÔNG DÙNG định dạng đầu ra của các lần đọc SMRT.

đầu vào.fofn
Tệp tên tệp

-sa hậu tốArrayFile
Sử dụng mảng hậu tố 'sa' để phát hiện các kết quả phù hợp giữa các lần đọc và
tài liệu tham khảo. Mảng hậu tố đã được chuẩn bị bởi thợ cưa(1) chương trình.

-ctab chuyển hướng
Một bảng gồm nhiều bộ đếm được sử dụng để ước tính mức độ quan trọng của đối sánh. Đây là bởi
chương trình 'printTupleCountTable'. Mặc dù nó nhanh chóng tạo ra một cách nhanh chóng,
nếu có nhiều lời kêu gọi nói xấu, rất hữu ích khi tính toán trước ctab.

-khu vựcBảng bàn (KHÔNG DÙNG)
Đọc trong bảng vùng đọc ở định dạng HDF để che các phần của nội dung đọc.
Đây có thể là một bảng nếu chỉ có một tệp đầu vào hoặc một fofn. Khi nào
một bảng vùng được chỉ định, bất kỳ bảng vùng nào bên trong read.plx.h5 hoặc
Các tệp read.bax.h5 bị bỏ qua.
(KHÔNG DÙNG) Các lựa chọn cho sửa đổi đọc.

Có một thông tin đặc biệt về chuỗi con của các lần đọc được lưu trữ trong một
'bảng khu vực' cho mỗi tệp đã đọc. Vì HDF được sử dụng, bảng khu vực có thể
một phần của tệp .bax.h5 hoặc .plx.h5 hoặc một tệp riêng biệt. Đọc liên tục
chuỗi con từ mẫu là một luồng con và bất kỳ lần đọc nào cũng có thể chứa nhiều
các luồng phụ. Ranh giới của các luồng con có thể được suy ra từ bảng khu vực
trực tiếp hoặc theo định nghĩa của ranh giới bộ điều hợp. Điển hình là các bảng khu vực
cũng chứa thông tin về vị trí của các vùng chất lượng cao và thấp của
đọc. Các bài đọc được tạo ra bởi các bài đọc giả mạo từ các ZMW trống có chất lượng bắt đầu cao
điều phối ngang bằng với chất lượng cao cuối cùng, làm cho không có khả năng đọc.

-cài liệu
Căn chỉnh trình tự đồng thuận vòng tròn (ccs), sau đó báo cáo căn chỉnh của
ccs truyền tới cửa sổ mà ccs đã được ánh xạ tới. Chỉ căn chỉnh của
các luồng phụ được báo cáo.

-useccsall
Tương tự như -cài liệu, ngoại trừ tất cả các luồng con được căn chỉnh, thay vì chỉ
subreads được sử dụng để gọi ccs. Điều này sẽ bao gồm các bài đọc chỉ bao gồm phần
của mẫu.

-useccsdenovo
Căn chỉnh sự đồng thuận của vòng tròn và chỉ báo cáo sự liên kết của các ccs
sự nối tiếp.

-noSplitSubreads (sai)
Không chia nhỏ các luồng ở bộ điều hợp. Điều này thường chỉ hữu ích khi
bộ gen trong phiên bản chưa được cuộn của một mẫu đã biết và chứa mẫu-
trình tự adapter-reverse_template.

-bỏ quaKhu vực (sai)
Bỏ qua bất kỳ thông tin nào trong bảng khu vực.

-bỏ quaHQKhu vực (sai)
Bỏ qua bất kỳ vùng hq nào trong bảng vùng.
Căn chỉnh Đến Report

-tốt nhất n (10)
Báo cáo hàng đầu n sự liên kết.

-hitChính sách (tất cả)
Chỉ định một chính sách để xử lý nhiều lần truy cập từ [tất cả, tất cả, ngẫu nhiên,
randombest, ngoài cùng bên trái]

tất cả các báo cáo tất cả các căn chỉnh.

tất cả tốt nhất
báo cáo tất cả các liên kết cho điểm cao nhất như nhau.

ngẫu nhiên báo cáo một sự liên kết ngẫu nhiên.

ngẫu nhiên
báo cáo một sự liên kết ngẫu nhiên từ nhiều điểm số cao nhất bằng nhau
sự liên kết.

ngoài cùng bên trái
báo cáo một căn chỉnh có điểm căn chỉnh tốt nhất và có
tọa độ ánh xạ nhỏ nhất trong bất kỳ tham chiếu nào.

-placeRepeatRandomly (sai)
KHÔNG ĐƯỢC! Nếu đúng, tương đương với -hitChính sách ngẫu nhiên.

-hạt giống ngẫu nhiên (0)
Hạt giống cho bộ tạo số ngẫu nhiên. Theo mặc định (0), sử dụng thời gian hiện tại làm hạt giống.

-noSortRefinedAlignments (sai)
Sau khi các liên kết ứng viên được tạo và cho điểm thông qua động thưa thớt
lập trình, chúng được thay đổi vị trí bằng cách sử dụng căn chỉnh cục bộ chiếm
các cấu hình lỗi khác nhau. Việc phân loại dựa trên căn chỉnh cục bộ có thể thay đổi
thứ tự các lần truy cập được trả lại.

-allowIndels liền kề
Khi được chỉ định, cho phép chèn hoặc xóa liền kề. Nếu không thì,
chèn và xóa liền kề được hợp nhất thành một thao tác. Sử dụng
các giá trị chất lượng để hướng dẫn việc căn chỉnh theo cặp có thể quy định rằng giá trị càng cao
căn chỉnh xác suất chứa các chèn hoặc xóa liền kề. Hiện hành
các công cụ như GATK không cho phép điều này và do đó chúng không được báo cáo bởi
mặc định.
Đầu ra Định dạng Các tập tin

-ngoài ra (phần cuối)
Ghi đầu ra vào ra.

-sam Ghi đầu ra ở định dạng SAM.

-m t Nếu không in SAM, hãy sửa đổi đầu ra của căn chỉnh.

Thời Gian t là:

0 In ra giống như đầu ra với các nucleotide phù hợp kết nối của |.

1 Chỉ in một bản tóm tắt: điểm và vị trí.

2 In ở định dạng Compare.xml.

3 In ở định dạng thô tục (KHÔNG DÙNG).

4 In phiên bản căn chỉnh dạng bảng dài hơn.

5 In ở định dạng có thể phân tích cú pháp bằng máy được đọc bởi
so sánhSequences.py.

-cái đầu
In tiêu đề dưới dạng dòng đầu tiên của tệp đầu ra mô tả nội dung
của mỗi cột.

-titleBảng chuyển hướng (VÔ GIÁ TRỊ)
Xây dựng một bảng tiêu đề trình tự tham chiếu. Các trình tự tham chiếu là
được liệt kê theo hàng, 0,1, ... Chỉ mục tham chiếu được in thẳng hàng
kết quả thay vì tên tham chiếu đầy đủ. Điều này làm cho đầu ra ngắn gọn,
đặc biệt là khi các tiêu đề dài dòng tồn tại trong tên tham chiếu.

-được chỉ định hồ sơ
Các lần đọc đầu ra không được căn chỉnh để hồ sơ

-cửa hàng [không ai|cứng|đọc phụ|mềm mại] (không ai)

Không sử dụng / hard / subread / soft clipping, CHỈ cho đầu ra SAM / BAM.

-inSAMQV (sai)
In các giá trị chất lượng ra đầu ra SAM.

-xì gàSử dụngSeqMatch (sai)
Chuỗi CIGAR trong đầu ra SAM / BAM sử dụng '=' và 'X' để biểu thị khớp chuỗi
và không khớp thay vì 'M'.
Các lựa chọn cho neo đậu liên kết vùng.

Điều này sẽ có ảnh hưởng lớn nhất đến tốc độ và độ nhạy.

-minMatch m (12)
Chiều dài hạt tối thiểu. MinMatch cao hơn sẽ tăng tốc độ căn chỉnh, nhưng giảm
nhạy cảm.

-maxMatch l (thông tin)
Dừng ánh xạ số đọc vào bộ gen khi chiều dài lcp đạt đến l. Đây là
hữu ích khi truy vấn là một phần của tham chiếu, ví dụ: khi
xây dựng các căn chỉnh theo cặp cho lắp ráp de novo.

-maxLCPL Chiều dài l (thông tin)
Giống như -maxMatch.

-maxAnchorsPerPosition m (10000)
Không thêm neo từ một vị trí nếu nó khớp với nhiều hơn m địa điểm ở
mục tiêu.

-advanceExactMatch E (0)
Một thủ thuật khác để tăng tốc độ liên kết với đối sánh - Ít neo hơn.
Thay vì tìm kiếm các điểm neo giữa số đọc và bộ gen ở mọi
vị trí trong bài đọc, khi một mỏ neo được tìm thấy ở vị trí thứ i trong lần đọc
chiều dài L, vị trí tiếp theo trong bài đọc để tìm neo là i + LE. Sử dụng
điều này khi alignining các contigs đã được lắp ráp sẵn.

-nỨng cử viên n (10)
Theo kịp n ứng cử viên cho sự liên kết tốt nhất. Một giá trị lớn của n sẽ
ánh xạ chậm vì các bước lập trình động chậm hơn được áp dụng cho
nhiều cụm neo hơn có thể là một bước giới hạn tốc độ khi số lần đọc
rất dài.

-phù hợp (sai)
Ánh xạ tất cả các luồng phụ của một zmw (lỗ) đến nơi có luồng phụ dài nhất của
zmw được căn chỉnh thành. Điều này yêu cầu sử dụng bảng vùng và các vùng hq.
Tùy chọn này chỉ hoạt động khi các lần đọc ở định dạng h5 cơ bản hoặc xung.

-concordantTemplate (mediasubread)
Chọn một đường truyền con đầy đủ của một zmw làm mẫu cho ánh xạ phù hợp.
longestsubread - sử dụng mediansubread đầy đủ pass dài nhất - sử dụng
độ dài trung bình đầy đủ pass subread typicalsubread - sử dụng full dài thứ hai
vượt qua luồng con nếu độ dài của luồng con đầy đủ dài nhất là một giá trị ngoại lệ

-fastMaxInterval (sai)
Tìm kiếm nhanh khoảng thời gian tăng tối đa như các ứng cử viên liên kết. Tìm kiếm
không đầy đủ như mặc định, nhưng nhanh hơn nhiều.

-aggressiveIntervalCut (sai)
Đồng ý lọc ra các ứng cử viên liên kết không có triển vọng, nếu có
ít nhất một ứng cử viên triển vọng. Nếu tùy chọn này được bật, nói xấu is
có khả năng bỏ qua các liên kết ngắn của các phần tử ALU.

-fastSDP (sai)
Sử dụng thuật toán heuristic nhanh để tăng tốc độ lập trình động thưa thớt.
Các lựa chọn cho Tinh chế Số lượt truy cập

-sdpTupleSize K (11)
Sử dụng các trận đấu có độ dài K để tăng tốc độ liên kết lập trình động. Điều này
kiểm soát độ chính xác của việc chỉ định các khoảng trống trong các căn chỉnh theo cặp sau khi lập bản đồ
đã được tìm thấy, thay vì ánh xạ độ nhạy của chính nó.

-scoreMa trận Điểm số ma trận chuỗi
Chỉ định một ma trận điểm thay thế để chấm điểm các lần đọc fasta. Ma trận là
theo định dạng

ACGTN
A abcde
C fghij
G klmno
T pqrst
N uvwxy

Các giá trị a ... y phải được nhập dưới dạng chuỗi được phân tách bằng dấu cách: "abc
... y ". Điểm thấp hơn sẽ tốt hơn, vì vậy các trận đấu phải ít hơn điểm không khớp
ví dụ a, g, m, s = -5 (khớp), không khớp = 6.

-affineMở giá trị (10)
Đặt hình phạt cho việc mở một liên kết affine.

-affineMở rộng a (0)
Thay đổi hình phạt khoảng cách affine (mở rộng). Giá trị thấp hơn cho phép nhiều khoảng trống hơn.
Các lựa chọn cho chồng chéo / động lập trình sự liên kết có cặp trùng lặp cho de mới
hội,, tổ hợp.

-sử dụng (sai)
Sử dụng các giá trị chất lượng thay thế / chèn / xóa / hợp nhất để ghi khoảng cách và
các hình phạt không phù hợp theo từng cặp. Bởi vì việc chèn và
tỷ lệ xóa cao hơn nhiều so với thay thế, điều này sẽ làm cho nhiều
sự liên kết có lợi cho việc chèn / xóa hơn thay thế. nKhông có sự đồng thuận
các phương thức gọi sau đó sẽ thường bỏ lỡ các đa hình thay thế. Tùy chọn này
nên được sử dụng khi gọi sự đồng thuận bằng phương thức Quiver. Hơn nữa,
khi không sử dụng các giá trị chất lượng để cho điểm căn chỉnh, sẽ có
độ chính xác đồng thuận trong các vùng đồng nhất.

-affineAlign (sai)
Tinh chỉnh căn chỉnh bằng cách sử dụng căn chỉnh hướng dẫn affine.
Các lựa chọn cho lọc đọc sự liên kết

-minReadLength l (50)
Bỏ qua các bài đọc có độ dài đầy đủ nhỏ hơn l. Các bài đọc có thể ngắn hơn.

-minSubreadĐộ dài l (0)
Không căn chỉnh các trang con có độ dài nhỏ hơn l.

-minRawSubreadScore m (0)
Không căn chỉnh các trang con có điểm chất lượng trong bảng khu vực nhỏ hơn m
(điểm chất lượng phải nằm trong khoảng [0, 1000]).

-Điểm tối đa m (-200)
Điểm tối đa cho đầu ra (cao là xấu, âm tốt).

-minAlnChiều dài
(0) Chỉ báo cáo các căn chỉnh nếu độ dài của chúng lớn hơn minAlnLength.

-minPctTương tự (0) Chỉ báo cáo sự liên kết nếu tỷ lệ phần trăm tương tự của chúng là
lớn hơn minPctSimilarity.

-minPctĐộ chính xác
(0) Chỉ báo cáo các căn chỉnh nếu độ chính xác phần trăm của chúng lớn hơn
độ chính xác tối thiểu.
Các lựa chọn cho song song, tương đông liên kết

-nproc N (1)
Căn chỉnh bằng cách sử dụng N các quy trình. Tất cả các cấu trúc dữ liệu lớn như mảng hậu tố
và bảng đếm bộ được chia sẻ.

-Khởi đầu S (0)
Chỉ mục của lần đọc đầu tiên để bắt đầu căn chỉnh. Điều này hữu ích khi nhiều
các phiên bản đang chạy trên cùng một dữ liệu, chẳng hạn như khi trên nhiều giá đỡ
cụm.

-sải chân S (1)
Căn chỉnh mỗi lần đọc S đọc.
Các lựa chọn cho lấy mẫu con đọc.

-mẫu (0)
Tỷ lệ số lần đọc so với mẫu con ngẫu nhiên (được biểu thị dưới dạng số thập phân) và
căn chỉnh.

-số lỗ DANH SÁCH
Khi được chỉ định, chỉ căn chỉnh các lần đọc có số lỗ ZMW nằm trong DANH SÁCH. DANH SÁCH
là một chuỗi phạm vi được phân tách bằng dấu phẩy, chẳng hạn như '1,2,3,10-13'. Tùy chọn này
chỉ hoạt động khi các lần đọc ở định dạng bam, bax.h5 hoặc plx.h5.

-h In thông tin trợ giúp.

CITATION


Để trích dẫn BLASR, vui lòng sử dụng: Chaisson MJ và Tesler G., Lập bản đồ phân tử đơn lẻ
tuần tự các lần đọc sử dụng Căn chỉnh cục bộ cơ bản với sàng lọc kế tiếp (BLASR): Lý thuyết
và Ứng dụng, BMC Bioinformatics 2012, 13: 238.

Sử dụng blasr trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad