Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

maq - Trực tuyến trên đám mây

Chạy maq trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks qua Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là maq lệnh có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


Maq - Lập bản đồ và lắp ráp với các phẩm chất

SYNOPSIS


trang điểm lệnh [lựa chọn] đối số

maq.pl lệnh [lựa chọn] đối số

MÔ TẢ


Maq là một phần mềm xây dựng các tập hợp ánh xạ từ các lần đọc ngắn được tạo bởi phần tiếp theo-
máy giải trình tự thế hệ. Nó được thiết kế đặc biệt cho Illumina-Solexa 1G Genetic
Trình phân tích và có chức năng sơ bộ để xử lý dữ liệu AB SOLiD.

Với Maq, bạn có thể:

· Căn chỉnh nhanh Illumina / SOLiD đọc đến hệ gen tham chiếu. Với các tùy chọn mặc định, một
hàng triệu cặp lần đọc có thể được ánh xạ tới bộ gen người trong khoảng 10 giờ CPU với ít hơn
hơn bộ nhớ 1G.

· Đo lường chính xác xác suất lỗi của việc căn chỉnh của mỗi lần đọc riêng lẻ.

· Gọi các kiểu gen đồng thuận, bao gồm đa hình đồng hợp tử và dị hợp tử, với
chất lượng xác suất Phred được chỉ định cho mỗi cơ sở.

· Tìm các indels ngắn với các lần đọc cuối được ghép nối.

· Tìm chính xác sự mất đoạn và chuyển vị bộ gen quy mô lớn với các lần đọc kết thúc được ghép nối.

· Khám phá CNV tiềm năng bằng cách kiểm tra độ sâu đọc.

· Đánh giá độ chính xác của chất lượng cơ bản thô từ trình tự và giúp kiểm tra
sai số hệ thống.

Tuy nhiên, Maq có thể KHÔNG:

· Làm de mới cuộc họp. (Maq chỉ có thể gọi sự đồng thuận bằng cách ánh xạ các lần đọc tới một
tài liệu tham khảo.)

· Quần soóc bản đồ đọc ngược lại chính họ. (Maq chỉ có thể tìm thấy sự chồng chéo hoàn toàn giữa các lần đọc.)

· Căn chỉnh số đọc mao dẫn hoặc 454 lần đọc đối với tham chiếu. (Maq không thể căn chỉnh các lần đọc dài hơn
63bp.)

MAQ HÀNG


Key Lệnh

fasta2bfa trang điểm fasta2bfa trong.ref.fasta ra.ref.bfa

Chuyển đổi chuỗi ở định dạng FASTA sang định dạng BFA (FASTA nhị phân) của Maq.

nhanhq2bfq trang điểm nhanhq2bfq [-n đường chỉ] trong.read.fastq ra.read.bfqout.prefix

Chuyển đổi các lần đọc ở định dạng FASTQ sang định dạng BFQ (FASTQ nhị phân) của Maq.

TÙY CHỌN:

-n INT số lần đọc cho mỗi tệp [không được chỉ định]

bản đồ trang điểm bản đồ [-n nmis] [-a maxin] [-c] [-1 len1] [-2 len2] [-d thích ứng3] [-m đột biến]
[-u không có ánh xạ] [-e tối đa] [-M c⎪g] [-N] [-H tất cả] [-C maxhit] out.aln.map
trong.ref.bfa trong.read1.bfq [trong.read2.bfq] 2> out.map.log

Bản đồ đọc các trình tự tham chiếu.

TÙY CHỌN:

-n INT Số lượng không khớp tối đa luôn có thể được tìm thấy [2]

-a INT Khoảng cách bên ngoài tối đa cho một cặp đọc chính xác [250]

-A INT Khoảng cách bên ngoài tối đa của hai lần đọc RF được ghép nối (0 để tắt) [0]

-c Bản đồ đọc trong không gian màu (chỉ dành cho SOLiD)

-1 INT Độ dài đọc cho lần đọc đầu tiên, 0 cho lần đọc tự động [0]

-2 INT Độ dài đọc cho lần đọc thứ hai, 0 cho tự động [0]

-m PHAO NỔI Tỷ lệ đột biến giữa trình tự tham chiếu và số lần đọc [0.001]

-d FILE Chỉ định một tệp chứa một dòng duy nhất của trình tự bộ điều hợp 3'
[vô giá trị]

-u FILE Kết xuất các lần đọc chưa được ánh xạ và các lần đọc chứa nhiều hơn nmis không phù hợp với
một tệp riêng biệt [null]

-e INT Ngưỡng về tổng chất lượng cơ sở không khớp [70]

-H FILE Kết xuất nhiều / tất cả các lần truy cập 01 không khớp vào FILE [vô giá trị]

-C INT Số lần truy cập tối đa để xuất. Không giới hạn nếu lớn hơn 512. [250]

-M c⎪g chế độ liên kết metyl hóa. Tất cả C (hoặc G) trên sợi phía trước sẽ là
được đổi thành T (hoặc A). Tùy chọn này chỉ dành cho thử nghiệm.

-N lưu trữ vị trí không khớp trong tệp đầu ra out.aln.map. Khi này
đang sử dụng tùy chọn, độ dài đọc tối đa cho phép là 55bp.

LƯU Ý:

* Các lần đọc đầu cuối được ghép nối nên được chuẩn bị thành hai tệp, mỗi tệp cho mỗi đầu, với
các lần đọc được sắp xếp theo cùng một thứ tự. Điều này có nghĩa là thứ k được đọc trong
tệp được kết hợp với lần đọc thứ k trong tệp thứ hai. Bài đọc tương ứng
tên phải trùng với đuôi `/ 1 'hoặc` / 2'. Ví dụ, một
cho phép cặp tên đã đọc: `EAS1_1_5_100_200 / 1 'và
`EAS1_1_5_100_200 / 2 '. Phần đuôi `/ [12] 'thường được tạo bởi
GAPipeline để phân biệt hai đầu cặp.

* Đầu ra là một tệp nhị phân nén. Nó bị ảnh hưởng bởi độ bền.

* Cách tốt nhất để chạy lệnh này là cung cấp khoảng 1 đến 3 triệu lượt đọc như
đầu vào. Nhiều lần đọc hơn sẽ tiêu tốn nhiều bộ nhớ hơn.

* Lựa chọn -n kiểm soát độ nhạy của việc căn chỉnh. Theo mặc định, một lần truy cập với
có thể luôn tìm thấy tối đa 2 điểm không khớp. Cao hơn -n tìm thấy nhiều lượt truy cập hơn và cũng
cải thiện độ chính xác của chất lượng ánh xạ. Tuy nhiên, điều này được thực hiện với chi phí
tốc độ.

* Các căn chỉnh có nhiều điểm không phù hợp chất lượng cao nên bị loại bỏ là sai
sự liên kết hoặc có thể gây ô nhiễm. Hành vi này được kiểm soát bởi tùy chọn
-e. Các -e ngưỡng chỉ được tính toán gần đúng vì chất lượng cơ bản
được chia cho 10 ở một giai đoạn nhất định của việc căn chỉnh. Các -Q tùy chọn trong
lắp ráp lệnh đặt chính xác ngưỡng.

* Một cặp bài đọc được cho là được ghép nối chính xác nếu và chỉ khi
định hướng là FR và khoảng cách bên ngoài của cặp không lớn hơn
maxin. Không có giới hạn về kích thước chèn tối thiểu. Cài đặt này là
được xác định bởi thuật toán căn chỉnh đầu cuối được ghép nối được sử dụng trong Maq. Yêu cầu một
kích thước chèn tối thiểu sẽ dẫn đến một số căn chỉnh sai với
chất lượng lập bản đồ được đánh giá quá cao.

* Hiện tại, các cặp đầu đọc từ thư viện chèn dài Illumina / Solexa có chức năng đọc RF
sự định hướng. Kích thước chèn tối đa được đặt theo tùy chọn -A. Tuy nhiên, lâu-
thư viện insert cũng được trộn với một phần nhỏ của short-insert read
cặp. -a cũng nên được đặt chính xác.

* Đôi khi 5'-end hoặc thậm chí toàn bộ chuỗi 3'-adapter có thể được sắp xếp theo trình tự.
Cung cấp -d kết xuất Maq để loại bỏ nhiễm bẩn bộ điều hợp.

* Với 2 triệu lượt đọc dưới dạng đầu vào, trang điểm thường chiếm bộ nhớ 800MB.

lập bản đồ trang điểm lập bản đồ out.aln.map trong.aln1.map trong.aln2.map [...]

Hợp nhất một loạt các căn chỉnh đã đọc với nhau.

LƯU Ý:

* Về lý thuyết, lệnh này có thể hợp nhất số lượng căn chỉnh không giới hạn. Tuy nhiên, như
mapmerge sẽ đọc tất cả các đầu vào cùng một lúc, nó có thể nhấn vào
giới hạn số lượng tệp mở tối đa do HĐH đặt. Hiện tại, cái này
phải được giải quyết thủ công bởi người dùng cuối.

* Yêu cầu lập bản đồ có thể được sử dụng để hợp nhất các tệp căn chỉnh với các tệp đọc khác nhau
độ dài. Tất cả các phân tích tiếp theo không giả định độ dài cố định nữa.

rmdup trang điểm rmdup out.rmdup.map in.ori.map

Loại bỏ các cặp có tọa độ bên ngoài giống hệt nhau. Về nguyên tắc, các cặp với
tọa độ bên ngoài giống hệt nhau nên hiếm khi xảy ra. Tuy nhiên, do
khuếch đại trong quá trình chuẩn bị mẫu, điều này xảy ra thường xuyên hơn nhiều so với
cơ hội. Các phân tích thực tế cho thấy rằng việc loại bỏ các bản sao giúp cải thiện
độ chính xác tổng thể của cuộc gọi SNP.

lắp ráp trang điểm lắp ráp [-sp] [-m tối đa] [-Q tối đa] [-r hám lời] [-t đá ngầm] [-q tối thiểu] [-N
nHap] ra.cns trong.ref.bfa trong.aln.map 2> out.cns.log

Gọi các trình tự đồng thuận từ ánh xạ đọc.

TÙY CHỌN:

-t PHAO NỔI Hệ số phụ thuộc lỗi [0.93]

-r PHAO NỔI Phần dị hợp tử trong số tất cả các vị trí [0.001]

-s Lấy chất lượng ánh xạ một đầu làm chất lượng ánh xạ cuối cùng;
nếu không, chất lượng ánh xạ cuối được ghép nối sẽ được sử dụng

-p Loại bỏ các lần đọc kết thúc được ghép nối không được ánh xạ theo đúng cặp

-m INT Số lượng không khớp tối đa được phép sử dụng trong
kêu gọi sự đồng thuận [7]

-Q INT Tổng giá trị chất lượng tối đa được phép của các cơ sở không khớp [60]

-q INT Chất lượng ánh xạ tối thiểu được phép để đọc được sử dụng trong sự đồng thuận
đang gọi [0]

-N INT Số lượng haplotype trong nhóm (> = 2) [2]

LƯU Ý:

* Lựa chọn -Q đặt giới hạn về tổng số tối đa của chất lượng cơ sở không khớp.
Các bài đọc chứa nhiều nội dung không phù hợp chất lượng cao nên bị loại bỏ.

* Lựa chọn -N đặt số lượng haplotype trong một nhóm. Nó được thiết kế cho
sắp xếp lại các mẫu bằng cách gộp nhiều chủng / cá thể lại với nhau. Vì
Giải mã lại bộ gen lưỡng bội, phương án này bằng 2.

glfgen trang điểm glfgen [-sp] [-m tối đa] [-Q tối đa] [-r hám lời] [-t đá ngầm] [-q tối thiểu] [-N
nHap] ra.cns trong.ref.bfa trong.aln.map 2> out.cns.log

Tính toán khả năng log cho tất cả các kiểu gen và lưu trữ kết quả ở định dạng GLF
(Định dạng khả năng xảy ra kiểu gen). Vui lòng kiểm tra trang web MAQ để biết chi tiết
mô tả về định dạng tệp và các tiện ích liên quan.

indelpe trang điểm indelpe trong.ref.bfa trong.aln.map > ra.indelpe

Gọi các indels nhất quán từ các lần đọc cuối được ghép nối. Đầu ra là TAB được phân tách bằng
mỗi dòng bao gồm nhiễm sắc thể, vị trí bắt đầu, loại indel, số
số lần đọc trên indel, kích thước của indel và nucleotide được chèn / xóa
(phân cách bằng dấu hai chấm), số lượng indels trên sợi ngược, số lượng indels
trên sợi phía trước, chuỗi 5 'trước indel, 3' theo sau
indel, số lần đọc được căn chỉnh mà không có indels và ba cột bổ sung
cho các bộ lọc.

Tại cột thứ 3, nhập indel, một dấu sao cho biết indel được xác nhận
bằng cách đọc từ cả hai sợi, một dấu cộng có nghĩa là indel bị đánh bởi ít nhất hai lần đọc
nhưng từ cùng một sợi, một dấu trừ cho thấy chỉ xuất hiện trên một lần đọc,
và một dấu chấm có nghĩa là indel quá gần với indel khác và bị lọc ra.

Người dùng nên chạy qua `` maq.pl indelpe '' để sửa số
đọc được ánh xạ mà không có dấu ấn. Để biết thêm chi tiết, hãy xem `` maq.pl indelpe ''
phần.

indelsoa trang điểm indelsoa trong.ref.bfa trong.aln.map > ra ngoài.indelsoa

Gọi các indels đồng hợp tử tiềm ẩn và các điểm phá vỡ bằng cách phát hiện điểm bất thường
mô hình căn chỉnh xung quanh indels và điểm ngắt. Đầu ra cũng là TAB
được phân định bằng mỗi dòng bao gồm nhiễm sắc thể, tọa độ gần đúng,
độ dài của vùng bất thường, số lần đọc được ánh xạ trên vị trí,
số lần đọc ở phía bên trái của vị trí và số lần đọc trên
Phía tay phải. Cột cuối cùng có thể được bỏ qua.

Đầu ra chứa nhiều kết quả dương tính giả. Bộ lọc được đề xuất có thể là:

awk '$ 5 + $ 6- $ 4> = 3 && $ 4 <= 1' trong.indelsoa

Lưu ý rằng lệnh này không nhằm mục đích trở thành một bộ phát hiện indel chính xác, nhưng
chủ yếu giúp tránh một số dương tính giả trong việc gọi thay thế. Trong
ngoài ra, nó chỉ hoạt động tốt với độ sâu sâu (~ 40X chẳng hạn); nếu không
tỷ lệ âm tính giả sẽ rất cao.

Định dạng Chuyển đổi

sol2sanger trang điểm sol2sanger in.sol.fastq ra.sanger.fastq

Chuyển đổi Solexa FASTQ sang định dạng FASTQ tiêu chuẩn / Sanger.

bfq2fastq trang điểm bfq2fastq trong.read.bfq out.read.fastq

Chuyển đổi định dạng BFQ của Maq sang định dạng FASTQ tiêu chuẩn.

mapass2maq trang điểm mapass2maq trong.mapass2.map out.maq.map

Chuyển đổi định dạng bản đồ của mapass2 lỗi thời sang định dạng bản đồ của Maq. Định dạng cũ không
không chứa tên đã đọc.

Thông tin Trích xuất

chế độ xem bản đồ trang điểm chế độ xem bản đồ [-bN] trong.aln.map > out.aln.txt

Hiển thị căn chỉnh đã đọc ở dạng văn bản thuần túy. Đối với các lần đọc được căn chỉnh trước Smith-
Căn chỉnh người nước, mỗi dòng bao gồm tên đọc, nhiễm sắc thể, vị trí,
sợi, chèn kích thước từ các hạt bên ngoài của một cặp, cờ được ghép nối, ánh xạ
chất lượng, chất lượng ánh xạ một đầu, chất lượng ánh xạ thay thế, số lượng
sự không phù hợp của bản đánh tốt nhất, tổng hợp chất lượng của cơ sở không khớp của bản tốt nhất
lần truy cập, số lần truy cập không khớp 0 trong 24bp đầu tiên, số lần truy cập không khớp 1 lần là
24bp đầu tiên trên tham chiếu, độ dài của đọc, trình tự đọc và
phẩm chất. Chất lượng ánh xạ thay thế luôn bằng với chất lượng ánh xạ nếu
các lần đọc không được ghép nối. Nếu các lần đọc được ghép nối, nó tương đương với ánh xạ nhỏ hơn
chất lượng của hai đầu. Chất lượng ánh xạ thay thế này thực sự là
chất lượng ánh xạ của một cặp bất thường.

Cột thứ năm, cờ được ghép nối, là cờ theo chiều dọc. 4 bit thấp hơn của nó cung cấp cho
định hướng: 1 là viết tắt của FF, 2 cho FR, 4 cho RF và 8 cho RR, trong đó FR có nghĩa là
rằng giá trị đọc với tọa độ nhỏ hơn nằm trên sợi phía trước, và người bạn đời của nó là
trên sợi ngược lại. Chỉ FR được phép cho một cặp đúng. Các bit cao hơn
của cờ này cung cấp thêm thông tin. Nếu cặp gặp kết thúc được ghép nối
yêu cầu, 16 sẽ được thiết lập. Nếu hai lần đọc được ánh xạ đến
nhiễm sắc thể, 32 sẽ được thiết lập. Nếu một trong hai lần đọc hoàn toàn không thể được ánh xạ,
64 sẽ được thiết lập. Cờ cho một cặp đúng luôn bằng 18.

Đối với các lần đọc được căn chỉnh theo căn chỉnh Smith-Waterman sau đó, cờ là
luôn luôn là 130. Một dòng bao gồm tên đọc, nhiễm sắc thể, vị trí, sợi, đoạn chèn
kích thước, cờ (luôn là 130), vị trí của indel trên giá trị đọc (0 nếu không có indel),
độ dài của các indels (dương đối với chèn và âm đối với xóa),
chất lượng ánh xạ của người bạn đời của nó, số lần không khớp của lần truy cập tốt nhất, tổng
chất lượng của các cơ sở không khớp của cú đánh hay nhất, hai số không, độ dài của bài đọc,
trình tự đọc và chất lượng của nó. Người bạn đời của một bài đọc được gắn cờ 130 luôn nhận được một
cờ 18.

Cờ 192 chỉ ra rằng bài đọc không được ánh xạ nhưng người bạn đời của nó được ánh xạ. Cho như vậy
một cặp đọc, một đọc có cờ 64 và cặp kia có 192.

TÙY CHỌN:

-b không hiển thị trình tự đọc và chất lượng

-N hiển thị các vị trí xảy ra sự không khớp. Cờ này chỉ hoạt động
bằng tệp .map được tạo bởi `maq map -N '.

kiểm tra bản đồ trang điểm kiểm tra bản đồ [-s] [-m tối đa] [-q tối thiểu] trong.ref.bfa trong.aln.map > out.mapcheck

Đọc kiểm tra chất lượng. Kiểm tra bản đồ trước tiên báo cáo thành phần và độ sâu của
tài liệu tham khảo. Sau đó có một biểu mẫu. Cột đầu tiên cho biết
vị trí trên một bài đọc. Sau bốn cột hiển thị nucleotide
thành phần, tỷ lệ thay thế giữa tài liệu tham khảo và lượt đọc sẽ được đưa ra.
Các tỷ lệ này và các số trong các cột sau được chia tỷ lệ thành 999 và
làm tròn đến số nguyên gần nhất. Nhóm cột tiếp theo hiển thị sự phân bố của
chất lượng cơ bản dọc theo các lần đọc ở khoảng chất lượng là 10. Chất lượng giảm dần
thường có thể được quan sát, có nghĩa là các cơ sở ở cuối bài đọc ít hơn
chính xác. Nhóm cột cuối cùng trình bày phần thay thế cho
đọc các cơ sở ở một khoảng chất lượng. Điều này đo lường độ chính xác của chất lượng cơ sở
ước lượng. Lý tưởng, chúng tôi mong đợi để xem 1 trong 3? cột, 10 trong 2? cột
và 100 trong 1? cột.

TÙY CHỌN:

-s Lấy chất lượng ánh xạ một đầu làm chất lượng ánh xạ cuối cùng

-m INT Số sai lệch dữ liệu tối đa được phép đếm để đọc [4]

-q INT Chất lượng ánh xạ tối thiểu được phép để tính một lần đọc [30]

chồng chất trang điểm chồng chất [-spvP] [-m tối đa] [-Q tối đa] [-q tối thiểu] [-l tập tin trang web] trong.ref.bfa
trong.aln.map > out.pileup

Hiển thị căn chỉnh ở định dạng văn bản chồng chất. Mỗi dòng bao gồm
nhiễm sắc thể, vị trí, cơ sở tham chiếu, độ sâu và các cơ sở trên lần đọc trang bìa đó
vị trí này. Nếu như -v được thêm vào dòng lệnh, chất lượng cơ sở và ánh xạ
phẩm chất sẽ được trình bày ở cột thứ sáu và thứ bảy theo thứ tự.

Cột thứ năm luôn bắt đầu bằng `@ '. Trong cột này, hãy đọc các cơ sở giống hệt nhau
đối với tham chiếu được hiển thị bằng dấu phẩy `, 'hoặc dấu chấm'. ', và đọc các cơ sở khác nhau
từ tài liệu tham khảo trong các bức thư. Dấu phẩy hoặc chữ hoa cho biết rằng cơ sở
đến từ một số đọc được căn chỉnh trên sợi phía trước, trong khi một dấu chấm hoặc một chữ thường trên
sợi ngược.

Lệnh này dành cho những người dùng muốn phát triển trình gọi SNP của riêng họ.

TÙY CHỌN:

-s Lấy chất lượng ánh xạ một đầu làm chất lượng ánh xạ cuối cùng

-p Loại bỏ các lần đọc kết thúc được ghép nối không được ánh xạ thành các cặp chính xác

-v Đưa ra thông tin chi tiết bao gồm chất lượng cơ sở và ánh xạ
chất lượng

-m INT Số lượng không khớp tối đa được phép sử dụng để đọc [7]

-Q INT Số lượng giá trị chất lượng không khớp tối đa được phép [60]

-q INT Chất lượng ánh xạ tối thiểu được phép sử dụng để đọc [0]

-l FILE Tệp chứa các trang web sẽ được in ra. Trong này
tập tin cột đầu tiên cung cấp tên của tham chiếu và cột thứ hai
các tọa độ. Các cột bổ sung sẽ bị bỏ qua. [vô giá trị]

-P cũng xuất ra vị trí cơ sở trên giá trị đọc

cns2fq trang điểm cns2fq [-Q minMapQ] [-n minNeiQ] [-d độ sâu tối thiểu] [-D độ sâu tối đa] in.cns >
out.cns.fastq

Trích xuất các trình tự đồng thuận ở định dạng FASTQ. Trong các dòng trình tự, căn cứ
trong trường hợp thấp hơn về cơ bản là các lần lặp lại hoặc không có đủ phạm vi bảo hiểm; căn cứ
trong trường hợp viết hoa chỉ ra các khu vực nơi SNP có thể được gọi một cách đáng tin cậy. bên trong
dòng chất lượng, ASCII của một ký tự trừ đi 33 cho chất lượng PHRED.

TÙY CHỌN:

-Q INT Chất lượng ánh xạ tối thiểu [40]

-d INT Độ sâu đọc tối thiểu [3]

-n INT Chất lượng lân cận tối thiểu [20]

-D INT Tốc độ đọc tối đa. > = 255 không giới hạn. [255]

cns2snp trang điểm cns2snp in.cns > ra.snp

Trích xuất các trang web SNP. Mỗi dòng bao gồm nhiễm sắc thể, vị trí, cơ sở tham chiếu,
cơ sở đồng thuận, chất lượng đồng thuận giống Phred, độ sâu đọc, số lượng trung bình
lượt truy cập của lượt đọc bao gồm vị trí này, chất lượng ánh xạ cao nhất của lượt đọc
bao gồm vị trí, chất lượng đồng thuận tối thiểu trong sườn 3bp
các vùng ở mỗi bên của trang web (tổng cộng 6bp), cuộc gọi tốt thứ hai, nhật ký
tỷ lệ khả năng xảy ra của cuộc gọi tốt thứ hai và tốt thứ ba và tốt nhất thứ ba
gọi.

Cột thứ 5 là tiêu chí quan trọng khi bạn đánh giá độ tin cậy của SNP.
Tuy nhiên, vì chất lượng này chỉ được tính toán giả sử trang web độc lập, bạn
cũng nên xem xét các cột khác để nhận được các cuộc gọi SNP chính xác hơn. Script
lệnh 'maq.pl bộ lọc SNP'được thiết kế cho điều này (xem bên dưới).

Cột thứ 7 ngụ ý liệu trang web có nằm trong vùng lặp lại hay không. Nếu không
đọc bao gồm trang web có thể được lập bản đồ với chất lượng ánh xạ cao,
khu vực có thể lặp lại hoặc thiếu các bài đọc tốt. SNP tại trang web đó
thường không đáng tin cậy.

Cột thứ 8 đại khái cho biết số bản sao của vùng bên sườn trong
bộ gen tham chiếu. Trong hầu hết các trường hợp, con số này là 1.00, có nghĩa là
khu vực là duy nhất. Đôi khi bạn có thể thấy độ sâu đọc khác 0.00 nhưng XNUMX ở
cột thứ 7. Điều này chỉ ra rằng tất cả các lần đọc bao gồm vị trí có tại
ít nhất hai không phù hợp. Maq chỉ đếm số lần truy cập 0 và 1 lần truy cập không khớp với
tài liệu tham khảo. Điều này là do một vấn đề kỹ thuật phức tạp.

Cột thứ 9 cho chất lượng lân cận. Lọc trên cột này cũng là
bắt buộc để có được SNP đáng tin cậy. Ý tưởng này được lấy cảm hứng từ NQS, mặc dù NQS là
ban đầu được thiết kế cho một lần đọc thay vì một sự đồng thuận.

cns2view trang điểm cns2view in.cns > ra.view

Hiển thị thông tin chi tiết tại tất cả các trang web. Định dạng đầu ra giống hệt với
cns2snp báo cáo.

cns2ref trang điểm cns2ref in.cns > ra.ref.fasta

Trích xuất trình tự tham chiếu.

cns2win trang điểm cns2win [-w chiến thắng] [-c chr] [-b bắt đầu] [-e cuối] [-q tối thiểu] in.cns >
ra.win

Trích xuất thông tin được tính trung bình trong một cửa sổ kiểm tra. Đầu ra được phân tách bằng TAB,
bao gồm tên tham chiếu, tọa độ chia cho 1,000,000, tỷ lệ SNP,
tỷ lệ het, độ sâu đọc thô, độ sâu đọc ở các vùng duy nhất,
số lần đọc trung bình trong cửa sổ và phần trăm GC.

TÙY CHỌN:

-w INT Kích thước của một cửa sổ [1000]

-c STR Chuỗi tham chiếu đích; nếu không tất cả các tài liệu tham khảo sẽ được sử dụng
[vô giá trị]

-b INT Vị trí bắt đầu, 0 không có ràng buộc [0]

-e INT Vị trí kết thúc, 0 không có ràng buộc [0]

-q INT Chất lượng đồng thuận tối thiểu của các trang web sẽ được sử dụng [0]

Mô phỏng Sản phẩm liên quan

giả mạo trang điểm giả mạo [-r đột biến] [-R indelfrac] trong.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Giới thiệu ngẫu nhiên các thay thế và indels để tham chiếu. Thay thế và
Có thể thêm các indels cặp cơ sở sinlge.

TÙY CHỌN:

-r PHAO NỔI Tỷ lệ đột biến [0.001]

-R PHAO NỔI Phần đột biến là indels [0.1]

mô phỏng trang điểm mô phỏng ra.simupars.dat trong.read.fastq

Ước tính / huấn luyện các tham số để đọc mô phỏng.

mô phỏng trang điểm mô phỏng [-d kích thước] [-s stdev] [-N nĐọc] [-1 đọcLen1] [-2 đọcLen2] [-r
tỷ lệ đột biến] [-R indelFrac] [-h] ra.read1.fastq ra.read2.fastq trong.ref.fasta
trong.simupars.dat

Mô phỏng các lần đọc kết thúc được ghép nối. Tập tin trong.simupars.dat xác định độ dài đã đọc và
phân phối chất lượng. Nó được tạo ra từ mô phỏnghoặc có thể được tải xuống từ
Trang web Maq. Trong các tệp đọc đầu ra, tên đọc bao gồm tham chiếu
tên dãy và tọa độ ngoài của cặp giá trị đọc được mô phỏng. Qua
vỡ nợ, mô phỏng giả sử các lần đọc đến từ một trình tự lưỡng bội được tạo ra
bằng cách thêm hai tập hợp đột biến khác nhau, bao gồm một cặp indels cặp cơ sở, vào
trong.ref.fasta.

TÙY CHỌN:

-d INT trung bình của khoảng cách bên ngoài của các kích thước chèn [170]

-s INT độ lệch tiêu chuẩn của kích thước chèn [20]

-N INT số cặp lần đọc sẽ được tạo [1000000]

-1 INT độ dài của lần đọc đầu tiên [đặt bởi trong.simupars.dat]

-2 INT độ dài của lần đọc thứ hai [đặt bởi trong.simupars.dat]

-r PHAO NỔI tỷ lệ đột biến [0.001]

-R PHAO NỔI phần của 1bp indels [0.1]

-h thêm tất cả các đột biến vào trong.ref.fasta và tạo các lượt đọc từ đĩa đơn
trình tự đột biến (chế độ đơn bội)

LƯU Ý:

* Các lần đọc được tạo từ lệnh này là độc lập, khác với lệnh
sự thật. Trong khi đánh giá liên kết ít bị ảnh hưởng bởi điều này, đánh giá trên
Việc gọi SNP phải được thực hiện một cách thận trọng. Lỗi phụ thuộc có thể là một trong những
nguyên nhân chính của các cuộc gọi SNP sai.

mô phỏng trang điểm mô phỏng in.simu-aln.map > ra.simustat

Đánh giá chất lượng lập bản đồ từ các lần đọc mô phỏng.

Cứng Sản phẩm liên quan

fasta2csfa trang điểm fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

Chuyển đổi FASTA nucleotide thành FASTA mã màu. Lá cờ -c sau đó nên được áp dụng
đến bản đồ yêu cầu. Trong đầu ra, chữ cái `` A '' là viết tắt của màu 0, `` C '' cho 1, `` G ''
cho 2 và `T 'cho 3. Mỗi chuỗi ở đầu ra ngắn hơn đầu vào 1bp.

csmap2nt trang điểm csmap2nt out.nt.map trong.ref.nt.bfa trong.cs.map

Chuyển đổi sự liên kết màu sắc thành sự liên kết nucleotide. Đầu vào trong.ref.nt.bfa
tệp tham chiếu FASTA nhị phân nucleotide. Nó phải tương ứng với tệp gốc
từ đó tham chiếu màu được chuyển đổi. Sự đồng thuận nucleotide có thể được gọi là
từ sự liên kết kết quả.

Khác / Nâng cao Lệnh

sơ đồ con trang điểm sơ đồ con [-q minMapQ] [-Q maxSumErr] [-m tối đaMM] [-p] out.map trong.map

Lọc các căn chỉnh sai trong trong.map. Các tùy chọn dòng lệnh được mô tả trong
`lắp ráp' chỉ huy.

eland2maq trang điểm eland2maq [-q không bằng nhau] out.map trong.list trong.eland

Chuyển đổi căn chỉnh eland sang định dạng .map của maq. Tập tin trong.list bao gồm
tên trình tự xuất hiện ở cột thứ bảy của tệp căn chỉnh eland
trong.eland và tên bạn muốn thấy trong căn chỉnh maq. Sau đây là một
thí dụ:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Nếu bạn đang căn chỉnh số lần đọc trong nhiều đợt bằng eland, điều quan trọng là phải
sử dụng như nhau trong.list để chuyển đổi. Ngoài ra, maq sẽ tải tất cả
sắp xếp và sắp xếp chúng trong bộ nhớ. Nếu bạn đã nối nhiều eland
xuất thành một tệp lớn, bạn nên tách nó thành các tệp nhỏ hơn để
ngăn maq ăn hết bộ nhớ máy của bạn.

Lệnh này thực sự nhằm mục đích hiển thị căn chỉnh Eland trong Maqview. Như không có chất lượng
thông tin có sẵn, không nên sử dụng tệp căn chỉnh maq kết quả
để gọi các kiểu gen đồng thuận.

xuất2maq trang điểm xuất2maq [-1 đọc1len] [-2 đọc2len] [-a maxdist] [-n] out.map trong.list
in.export

Chuyển đổi định dạng Xuất của Illumina sang của Maq .bản đồ định dạng. Định dạng xuất khẩu là một định dạng mới
định dạng căn chỉnh kể từ SolexaPipeline-0.3.0 cũng tính toán ánh xạ
phẩm chất như maq. Tệp kết quả có thể được sử dụng để gọi các kiểu gen đồng thuận
vì hầu hết các thông tin cần thiết đều có sẵn để maq thực hiện việc này một cách chính xác.

TÙY CHỌN:

-1 INT Độ dài của lần đọc đầu tiên [0]

-2 INT Độ dài của lần đọc thứ hai [0]

-a INT Khoảng cách bên ngoài tối đa cho một cặp đọc chính xác [250]

-n Giữ lại các lần đọc đã lọc

MAQ-PERL HÀNG


bản demo maq.pl bản demo [-h] [-s] [-N nPairs] [-d outDir] in.fasta trong.simudat

Chứng minh việc sử dụng trang điểm và các tập lệnh đồng hành của nó. Lệnh này sẽ
mô phỏng các lần đọc từ tệp FASTA in.fasta. Độ dài và phẩm chất của trình tự
được xác định bởi trong.simudat được tạo ra từ trang điểm mô phỏng hoặc có thể là
được tải xuống từ trang web Maq. Các lần đọc mô phỏng sau đó sẽ được ánh xạ với
maq.pl dễ chạy. Độ chính xác căn chỉnh được đánh giá bằng trang điểm mô phỏng, Các
đồng thuận chính xác bởi trang điểm simucnvà độ chính xác SNP bằng maq_eval.pl.

Theo mặc định, các lần đọc kết thúc được ghép nối sẽ được mô phỏng và trình tự lưỡng bội sẽ là
được tạo ra từ đầu vào bằng cách thêm đột biến vào một trong hai loại đơn bội. Chèn
kích thước và tỷ lệ đột biến được kiểm soát bởi trang điểm mô phỏng.

TÙY CHỌN:

-h mô phỏng trình tự đơn bội thay vì trình tự lưỡng bội

-s sử dụng chế độ một đầu để căn chỉnh các lần đọc thay vì chế độ kết thúc ghép nối

-N INT số cặp đọc được mô phỏng [1000000]

-d DIR thư mục đầu ra [maqdemo]

LƯU Ý:

* Các tệp đầu ra từ maq_eval.pl chưa được ghi lại, nhưng bạn có thể làm
một dự đoán tốt về một số tệp này.

* Lệnh này chỉ trình bày việc sử dụng bộ maq. Độ chính xác trên thực tế
dữ liệu hầu như luôn thấp hơn những gì bạn thấy từ mô phỏng thuần túy.

dễ chạy maq.pl dễ chạy [-1 đọc1Len] [-d ra.dir] [-n nĐọc] [-A 3 bộ chuyển đổi] [-e minDep]
[-q phútCnsQ] [-p] [-2 đọc2Len] [-a maxIns] [-S] [-N] trong.ref.fasta in1.fastq
[in2.fastq]

Phân tích đường dẫn cho các bộ gen nhỏ. Lệnh Easyrun sẽ chạy hầu hết các phân tích
Thực hiện trong trang điểm. Theo mặc định, dễ chạy giả sử tất cả các chuỗi đọc đầu vào
các tệp là một đầu và độc lập; khi nào -p được chỉ định, hai chuỗi đọc
các tệp được yêu cầu, mỗi tệp cho mỗi đầu.

Một số tệp sẽ được tạo trong ra.dir, trong số đó các tệp sau đây là
đầu ra chính:

cns.cuối cùng.snp cuộc gọi SNP cuối cùng với những cuộc gọi chất lượng thấp được lọc ra

cns.fq trình tự và phẩm chất đồng thuận trong định dạng FASTQ

TÙY CHỌN:

-d DIR thư mục đầu ra [easyrun]

-n INT số lần đọc / cặp trong một đợt căn chỉnh [2000000]

-S áp dụng phân tích đọc tách của các indels ngắn (có thể rất chậm)

-N INT số lượng dạng đơn sắc / chủng trong nhóm (> = 2) [2]

-A FILE tệp cho bộ điều hợp 3'. Tệp phải chứa một dòng trình tự
[vô giá trị]

-1 INT độ dài của lần đọc đầu tiên, 0 cho tự động [0]

-e INT độ sâu đọc tối thiểu cần thiết để gọi SNP (đối với SNPfilter) [3]

-q INT chất lượng đồng thuận tối thiểu cho SNP trong cns.cuối cùng.snp [30]

-p chuyển sang chế độ căn chỉnh đầu cuối được ghép nối

-2 INT độ dài của lần đọc thứ hai khi -p được áp dụng [0]

-a INT kích thước chèn tối đa khi -p được áp dụng [250]

GHI CHÚ:

* Đối với cuộc gọi SNP trên các mẫu được gộp chung, người dùng nên đặt chính xác '-N' cũng như
`-E 0 '.

* Tệp đầu vào có thể là định dạng nhị phân của maq. maq.pl sẽ tự động phát hiện
định dạng tệp.

bộ lọc SNP maq.pl bộ lọc SNP [-d minDep] [-D maxDep] [-Q maxMapQ] [-q phútCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s điểm tối thiểu] [-m
maxAcross] [-a] [-N maxWinSNP] [-W mật độWinSize] trong.cns2snp.snp >
out.filtered.snp

Loại trừ SNP được bao phủ bởi một vài lần đọc (được chỉ định bởi -d), quá nhiều
đọc (được chỉ định bởi -D), gần (được chỉ định bởi -w) đến một indel tiềm năng, giảm
trong một vùng có thể lặp lại (được đặc trưng bởi -Q), hoặc có chất lượng thấp
các căn cứ lân cận (được chỉ định bởi -n). Nếu maxWinSNP hoặc nhiều SNP xuất hiện trong bất kỳ
mật độWinSize cửa sổ, chúng cũng sẽ được lọc ra cùng nhau.

TÙY CHỌN:

-d INT Độ sâu đọc tối thiểu cần thiết để gọi SNP [3]

-D INT Độ sâu đọc tối đa cần thiết để gọi SNP (<255, nếu không thì bỏ qua)
[256]

-Q INT Chất lượng ánh xạ tối đa bắt buộc của các lần đọc bao gồm SNP [40]

-q INT Chất lượng đồng thuận tối thiểu [20]

-n INT Chất lượng đồng thuận liền kề tối thiểu [20]

-w INT Kích thước của cửa sổ xung quanh các indels tiềm năng. SNP gần
sang indels sẽ bị chặn [3]

-F FILE Sản phẩm indelpe đầu ra [null]

-f FILE Sản phẩm indelsoa đầu ra [null]

-s INT Điểm tối thiểu cho một soa-indel được coi là [3]

-m INT Số lần đọc tối đa có thể được ánh xạ trên một soa-indel [1]

-a Bộ lọc thay thế cho căn chỉnh một đầu

indelpe maq.pl indelpe in.indelpe > ra.indelpe

Sửa số lần đọc được ánh xạ mà không có indels cho các vùng homopolymer. Điều này
lệnh sửa đổi cột thứ 4, thứ 10 và ba cột cuối cùng của in.indelpe
xuất kết quả trong ra.indelpe. Sau khi sửa, những điều sau ôi
lệnh đưa ra các indels đồng hợp tử giả định:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4> = 0.75'

và điều nào sau đây tạo ra các thể dị hợp tử:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4 <0.75'

Xin lưu ý rằng điều này indelpe lệnh chỉ thực hiện một số quy tắc heuristic.
Nó không đúng đối với chạy homopolymer không tinh khiết hoặc di-nucleotide / bộ ba
lặp lại. Do đó, hai lệnh awk chỉ cung cấp gần đúng hom / het
indel.

VÍ DỤ


· Tập lệnh Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Các lệnh chính đằng sau easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
bản đồ maq part1.map ref.bfa part1.bfq;
bản đồ maq part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq assembly cns.cns ref.bfa aln.map;

Sử dụng maq trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

  • 1
    Máy pha
    Máy pha
    Phaser là một công cụ mở nhanh, miễn phí và thú vị
    nguồn HTML5 trò chơi khung cung cấp
    Hiển thị WebGL và Canvas trên
    trình duyệt web trên máy tính để bàn và thiết bị di động. Trò chơi
    có thể được đồng ...
    Tải xuống Phaser
  • 2
    Động cơ VASSAL
    Động cơ VASSAL
    VASSAL là một công cụ trò chơi để tạo
    phiên bản điện tử của bảng truyền thống
    và các trò chơi bài. Nó cung cấp hỗ trợ cho
    kết xuất và tương tác mảnh trò chơi,
    và ...
    Tải xuống Công cụ VASSAL
  • 3
    OpenPDF - Ngã ba của iText
    OpenPDF - Ngã ba của iText
    OpenPDF là một thư viện Java để tạo
    và chỉnh sửa các tệp PDF bằng LGPL và
    Giấy phép nguồn mở MPL. OpenPDF là
    Mã nguồn mở LGPL/MPL kế thừa của iText,
    có ...
    Tải xuống OpenPDF - Một nhánh của iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - Hệ thống tự động
    Phân tích khoa học địa lý - là một địa lý
    Phần mềm Hệ thống Thông tin (GIS) với
    khả năng to lớn cho dữ liệu địa lý
    chế biến và ana ...
    Tải xuống SAGA GIS
  • 5
    Hộp công cụ cho Java / JTOpen
    Hộp công cụ cho Java / JTOpen
    Hộp công cụ IBM dành cho Java/JTOpen là một
    thư viện các lớp Java hỗ trợ
    lập trình client/server và internet
    các mô hình cho một hệ thống chạy OS/400,
    i5/OS, hoặc...
    Tải xuống Hộp công cụ cho Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (hoặc D3 cho Tài liệu hướng dữ liệu)
    là một thư viện JavaScript cho phép bạn
    để tạo dữ liệu động, tương tác
    trực quan hóa trong trình duyệt web. Với D3
    bạn...
    Tải xuống D3.js
  • Khác »

Lệnh Linux

Ad