Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

bcftools - Trực tuyến trên đám mây

Chạy bcftools trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

Đây là lệnh bcftools có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


samtools - Các tiện ích cho định dạng Bản đồ / Căn chỉnh trình tự (SAM)

bcftools - Tiện ích cho Định dạng cuộc gọi nhị phân (BCF) và VCF

SYNOPSIS


chế độ xem samtools -bt ref_list.txt -o aln.bam aln.sam.gz

samtools sắp xếp aln.bam aln.sorted

chỉ mục samtools aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools xem aln.sorted.bam chr2: 20,100,000-20,200,000

samtools hợp nhất out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools cọc -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3: 1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

chỉ mục bcftools trong.bcf

bcftools xem in.bcf chr2: 100-200> out.vcf

Chế độ xem bcftools -Nvm0.99 in.bcf> out.vcf 2> out.afs

MÔ TẢ


Samtools là một tập hợp các tiện ích điều khiển việc căn chỉnh ở định dạng BAM. Nó nhập khẩu
từ và xuất sang định dạng SAM (Căn chỉnh trình tự / Bản đồ), sắp xếp, hợp nhất và
lập chỉ mục và cho phép nhanh chóng truy xuất các lần đọc ở bất kỳ khu vực nào.

Samtools được thiết kế để hoạt động trên một luồng. Nó liên quan đến một tệp đầu vào `- 'là tiêu chuẩn
đầu vào (stdin) và một tệp đầu ra `- 'làm đầu ra tiêu chuẩn (stdout). Một số lệnh có thể
do đó được kết hợp với các ống Unix. Samtools luôn xuất cảnh báo và thông báo lỗi tới
đầu ra lỗi tiêu chuẩn (stderr).

Samtools cũng có thể mở tệp BAM (không phải SAM) trên máy chủ FTP hoặc HTTP từ xa nếu
Tên tệp BAM bắt đầu bằng `ftp: // 'hoặc` http: //'. Samtools kiểm tra hoạt động hiện tại
thư mục cho tệp chỉ mục và sẽ tải xuống chỉ mục khi vắng mặt. Samtools không
truy xuất toàn bộ tệp căn chỉnh trừ khi nó được yêu cầu làm như vậy.

CÔNG CỤ SAMTOOL HÀNG LỰA CHỌN


lượt xem chế độ xem samtools [-bchuHS] [-t in.refList] [-o output] [-f reqFlag] [-F Bỏ quaFlag]
[-q minMapQ] [-l library] [-r readGroup] [-R rgFile] | [khu vực1
[…]]

Trích xuất / in tất cả hoặc các căn chỉnh phụ ở định dạng SAM hoặc BAM. Nếu không có khu vực
được chỉ định, tất cả các căn chỉnh sẽ được in; nếu không thì chỉ căn chỉnh
chồng chéo các vùng được chỉ định sẽ được xuất. Một sự liên kết có thể được đưa ra
nhiều lần nếu nó chồng chéo nhiều vùng. Một khu vực có thể được trình bày,
ví dụ: ở định dạng sau: `chr2 '(toàn bộ chr2),` chr2: 1000000'
(vùng bắt đầu từ 1,000,000bp) hoặc `chr2: 1,000,000-2,000,000 '(vùng giữa
1,000,000 và 2,000,000bp bao gồm cả điểm cuối). Tọa độ dựa trên 1.

TÙY CHỌN:

-b Đầu ra ở định dạng BAM.

-f INT Chỉ đầu ra căn chỉnh với tất cả các bit trong INT có trong trường CỜ.
INT có thể ở dạng hex ở định dạng / ^ 0x [0-9A-F] + / [0]

-F INT Bỏ qua căn chỉnh với các bit có trong INT [0]

-h Bao gồm tiêu đề trong đầu ra.

-H Chỉ xuất tiêu đề.

-l STR Chỉ đọc đầu ra trong thư viện STR [null]

-o FILE Tệp đầu ra [stdout]

-q INT Bỏ qua căn chỉnh với MAPQ nhỏ hơn INT [0]

-r STR Chỉ đọc đầu ra trong nhóm đọc STR [null]

-R FILE Kết quả đọc trong các nhóm đọc được liệt kê trong FILE [vô giá trị]

-s PHAO NỔI Phân số của mẫu / cặp đối với mẫu phụ; phần nguyên được xử lý
làm hạt giống cho trình tạo số ngẫu nhiên [-1]

-S Đầu vào bằng SAM. Nếu các dòng tiêu đề @SQ không có, `-t ' Tùy chọn là
yêu cầu.

-c Thay vì in các căn chỉnh, chỉ đếm chúng và in
Tổng số. Tất cả các tùy chọn bộ lọc, chẳng hạn như `-f ', `-F '`-q ' , là
đã tính đến.

-t FILE Tệp này được phân cách bằng TAB. Mỗi dòng phải chứa tên tham chiếu
và độ dài của tham chiếu, một dòng cho mỗi tham chiếu riêng biệt;
các trường bổ sung bị bỏ qua. Tệp này cũng xác định thứ tự của
trình tự tham chiếu trong sắp xếp. Nếu bạn chạy `samtools faidx ',
tệp chỉ mục kết quả .fai có thể được sử dụng như thế này
tập tin.

-u Đầu ra BAM không nén. Tùy chọn này tiết kiệm thời gian dành cho
nén / giải nén và do đó được ưu tiên khi đầu ra là
được chuyển đến một lệnh samtools khác.

xem xem phim samtools [-p chr: pos] [-s STR] [-d trưng bày] [ref.fasta]

Trình xem căn chỉnh văn bản (dựa trên thư viện ncurses). Trong trình xem, nhấn `? '
để được trợ giúp và nhấn `g 'để kiểm tra việc căn chỉnh bắt đầu từ một vùng trong định dạng
như `chr10: 10,000,000 'hoặc` = 10,000,000' khi xem cùng một tham chiếu
sự nối tiếp.

Tùy chọn:

-d trưng bày Đầu ra dưới dạng (H) tml hoặc (C) urses hoặc (T) ext

-p chr: pos Đi thẳng đến vị trí này

-s STR Chỉ hiển thị các lần đọc từ mẫu này hoặc nhóm đọc

mpileup mpileup samtools [-EBugp] [-C nắpqcoef] [-r reg] [-f trong.fa] [-l ] [-M
mũBản đồQ] [-Q tối thiểuQ] [-q minMapQ] trong.bam [in2.bam [hữu ích. Cảm ơn !]]

Tạo BCF hoặc tích lũy cho một hoặc nhiều tệp BAM. Hồ sơ căn chỉnh là
được nhóm theo số nhận dạng mẫu trong dòng tiêu đề @RG. Nếu số nhận dạng mẫu là
vắng mặt, mỗi tệp đầu vào được coi là một mẫu.

Ở định dạng chồng chất (không có -uor-g), mỗi dòng đại diện cho một vị trí bộ gen,
bao gồm tên nhiễm sắc thể, tọa độ, cơ sở tham chiếu, cơ sở đọc, đọc
chất lượng và chất lượng ánh xạ liên kết. Thông tin về trận đấu, không khớp,
indel, strand, chất lượng ánh xạ và bắt đầu và kết thúc một bài đọc đều được mã hóa tại
cột cơ sở đọc. Tại cột này, một dấu chấm tượng trưng cho kết quả khớp với tham chiếu
căn cứ vào chuỗi thuận, dấu phẩy cho kết quả khớp với chuỗi ngược, dấu '>' hoặc
'<' để tham khảo bỏ qua, `ACGTN 'cho sự không khớp trên sợi phía trước và
`acgtn 'cho sự không khớp trên sợi ngược lại. Một mẫu `\ + [0-9] + [ACGTNacgtn] + '
cho biết có sự chèn giữa vị trí tham chiếu này và vị trí tiếp theo
vị trí tham chiếu. Chiều dài của phần chèn được cho bởi số nguyên trong
, theo sau là trình tự được chèn. Tương tự, một mẫu
`- [0-9] + [ACGTNacgtn] + 'đại diện cho việc xóa khỏi tham chiếu. Đã xóa
các base sẽ được trình bày dưới dạng dấu `* 'trong các dòng sau. Cũng tại cơ sở đọc
cột, ký hiệu `^ 'đánh dấu thời điểm bắt đầu đọc. ASCII của nhân vật
sau dấu `^ 'trừ 33 cho chất lượng ánh xạ. Một ký hiệu `$ 'đánh dấu sự kết thúc của
một phân đoạn đã đọc.

Đầu vào Tùy chọn:

-6 Giả sử chất lượng nằm trong bảng mã Illumina 1.3+. -A Đừng bỏ qua
các cặp đọc dị thường trong cách gọi biến thể.

-B Vô hiệu hóa việc sắp xếp lại theo xác suất để tính toán cơ số
chất lượng căn chỉnh (BAQ). BAQ là xác suất theo tỷ lệ của một lần đọc
đế bị lệch. Áp dụng tùy chọn này giúp giảm đáng kể
SNP sai do lệch trục.

-b FILE Danh sách các tệp BAM đầu vào, một tệp trên mỗi dòng [null]

-C INT Hệ số hạ cấp chất lượng ánh xạ cho các lần đọc chứa
không phù hợp quá mức. Đưa ra một lần đọc với xác suất theo tỷ lệ phred q
được tạo từ vị trí được ánh xạ, chất lượng ánh xạ mới
là về sqrt ((INT-q) / INT) * INT. Giá trị XNUMX vô hiệu hóa điều này
chức năng; nếu được bật, giá trị được đề xuất cho BWA là 50. [0]

-d INT Tại một vị trí, hãy đọc tối đa INT đọc mỗi đầu vào BAM. [250]

-E Tính toán BAQ mở rộng. Tùy chọn này giúp độ nhạy đặc biệt cho
MNPs, nhưng có thể ảnh hưởng đến tính đặc hiệu một chút.

-f FILE Sản phẩm faidx-tệp tham chiếu được lập chỉ mục ở định dạng FASTA. Tệp có thể là
được nén tùy chọn bởi tước đoạt. [vô giá trị]

-l FILE BED hoặc tệp danh sách vị trí có chứa danh sách các khu vực hoặc địa điểm nơi
đống hoặc BCF phải được tạo [null]

-q INT Chất lượng ánh xạ tối thiểu để sử dụng căn chỉnh [0]

-Q INT Chất lượng cơ bản tối thiểu cho một cơ sở được xem xét [13]

-r STR Chỉ tạo đống trong khu vực STR [tất cả các trang web]

Đầu ra Tùy chọn:

-D Độ sâu đọc đầu ra trên mỗi mẫu

-g Tính toán khả năng xảy ra kiểu gen và xuất chúng ở định dạng cuộc gọi nhị phân
(BCF).

-S Đầu ra cho mỗi mẫu Độ lệch sợi tỷ lệ theo Phred Giá trị P

-u Tương tự như -g ngoại trừ đầu ra là BCF không nén, là
ưu tiên cho đường ống.

Các lựa chọn cho Genotype Khả năng xảy ra Tính toán (Đối với -g or -u):

-e INT Xác suất lỗi giải trình tự phần mở rộng khoảng cách theo tỷ lệ phred. Giảm INT
dẫn đến các indels dài hơn. [20]

-h INT Hệ số mô hình hóa lỗi homopolymer. Đưa ra một l-Dài
chạy homopolymer, lỗi giải trình tự của một kích thước indel s được mô hình hóa
as INT*s/l. [100]

-I Không thực hiện cuộc gọi INDEL

-L INT Bỏ qua lệnh gọi INDEL nếu độ sâu trung bình trên mỗi mẫu là trên INT.
[250]

-o INT Xác suất lỗi giải trình tự mở khoảng trống theo tỷ lệ. Giảm INT dẫn
cho nhiều cuộc gọi indel hơn. [40]

-p Áp dụng ngưỡng -m và -F cho mỗi mẫu để tăng độ nhạy của
đang kêu gọi. Theo mặc định, cả hai tùy chọn đều được áp dụng cho các lần đọc được gộp chung từ tất cả
mẫu.

-P STR Danh sách nền tảng không giới hạn dấu phẩy (được xác định bởi @ RG-PL) từ đó
ứng cử viên indel được nhận. Khuyến khích thu thập indel
ứng cử viên từ các công nghệ giải trình tự có tỷ lệ lỗi indel thấp
chẳng hạn như PUBUMINA. [tất cả các]

người đứng đầu samtools reheader

Thay thế tiêu đề trong trong.bam với tiêu đề trong trong.header.sam. Lệnh này là
nhanh hơn nhiều so với việc thay thế tiêu đề bằng chuyển đổi BAM-> SAM-> BAM.

làm sao con mèo samtools [-h header.sam] [-o out.bam] [...]

Kết nối các BAM. Từ điển trình tự của mỗi BAM đầu vào phải giống hệt nhau,
mặc dù lệnh này không kiểm tra điều này. Lệnh này sử dụng một thủ thuật tương tự để
người đứng đầu cho phép ghép nối BAM nhanh chóng.

loại samtools sắp xếp [-nof] [-m maxMem]

Sắp xếp căn chỉnh theo tọa độ ngoài cùng bên trái. Tập tin .bam sẽ được tạo ra.
Lệnh này cũng có thể tạo các tệp tạm thời .% d.bam khi toàn bộ
căn chỉnh không thể được lắp vào bộ nhớ (được điều khiển bởi tùy chọn -m).

TÙY CHỌN:

-o Đầu ra căn chỉnh cuối cùng với đầu ra tiêu chuẩn.

-n Sắp xếp theo tên đọc thay vì theo tọa độ nhiễm sắc thể

-f Sử dụng dưới dạng đường dẫn đầu ra đầy đủ và không nối thêm .bam hậu tố.

-m INT Khoảng bộ nhớ tối đa cần thiết. [500000000]

hợp nhất hợp nhất samtools [-nur1f] [-h inh.sam] [-R reg]
[...]

Hợp nhất nhiều căn chỉnh đã được sắp xếp. Tham chiếu tiêu đề liệt kê tất cả các đầu vào
Tệp BAM và tiêu đề @SQ của inh.sam, nếu có, tất cả phải đề cập đến cùng một
tập hợp các trình tự tham chiếu. Danh sách tham chiếu tiêu đề và (trừ khi bị ghi đè bởi
-h) Tiêu đề `` @ 'của in1.bam sẽ được sao chép vào ra.bamvà các tiêu đề của
các tệp sẽ bị bỏ qua.

TÙY CHỌN:

-1 Sử dụng mức nén zlib 1 để kết nối đầu ra

-f Buộc ghi đè tệp đầu ra nếu có.

-h FILE Sử dụng các dòng của FILE dưới dạng tiêu đề `@ 'được sao chép vào ra.bam, thay thế
bất kỳ dòng tiêu đề nào sẽ được sao chép từ in1.bam. (FILE is
thực sự ở định dạng SAM, mặc dù bất kỳ bản ghi căn chỉnh nào nó có thể chứa
mặc kệ.)

-n Các liên kết đầu vào được sắp xếp theo tên đọc thay vì theo nhiễm sắc thể
tọa độ

-R STR Hợp nhất các tệp trong khu vực được chỉ định được chỉ định bởi STR [vô giá trị]

-r Đính kèm thẻ RG vào mỗi căn chỉnh. Giá trị thẻ được suy ra từ tệp
tên.

-u Đầu ra BAM không nén

chỉ số chỉ số samtools

Sắp xếp chỉ mục được sắp xếp để truy cập ngẫu nhiên nhanh chóng. Tệp chỉ mục .bai sẽ được
tạo ra.

idxstats samtools idxstats

Truy xuất và in số liệu thống kê trong tệp chỉ mục. Đầu ra là TAB được phân tách bằng
mỗi dòng bao gồm tên chuỗi tham chiếu, độ dài chuỗi, # lần đọc được ánh xạ
và # lần đọc chưa được ánh xạ.

faidx samtools faidx [khu vực1 [...]]

Trình tự tham chiếu chỉ mục ở định dạng FASTA hoặc trích xuất chuỗi con từ đã lập chỉ mục
trình tự tham chiếu. Nếu không có vùng nào được chỉ định, faidx sẽ lập chỉ mục tệp và
tạo .fai trên đĩa. Nếu các vùng được nói rõ, các chuỗi con
sẽ được truy xuất và in ra stdout ở định dạng FASTA. Tệp đầu vào có thể
được nén trong RAZF định dạng.

bạn cố định samtools fixmate

Điền vào tọa độ người bạn đời, ISIZE và các cờ liên quan đến người bạn đời từ một tên được sắp xếp
căn chỉnh.

rmdup samtools rmdup [-sS]

Loại bỏ các bản sao PCR tiềm ẩn: nếu nhiều cặp đọc có bên ngoài giống hệt nhau
tọa độ, chỉ giữ lại cặp có chất lượng ánh xạ cao nhất. Trong cặp-
chế độ kết thúc, lệnh này CHỈ hoạt động với định hướng FR và yêu cầu ISIZE là
được thiết lập chính xác. Nó không hoạt động đối với các lần đọc chưa được ghép nối (ví dụ: hai đầu được ánh xạ tới
nhiễm sắc thể khác nhau hoặc đọc mồ côi).

TÙY CHỌN:

-s Loại bỏ bản sao cho các lần đọc một đầu. Theo mặc định, lệnh hoạt động cho
chỉ đọc phần kết thúc được ghép nối.

-S Xử lý các lần đọc kết thúc được ghép nối và các lần đọc một đầu.

điềm tĩnh samtools normald [-EeubSr] [-C capQcoef]

Tạo thẻ MD. Nếu thẻ MD đã có, lệnh này sẽ cung cấp
cảnh báo nếu thẻ MD được tạo khác với thẻ hiện có. Đầu ra SAM
theo mặc định.

TÙY CHỌN:

-A Khi được sử dụng chung với -r tùy chọn này ghi đè lên cơ sở ban đầu
chất lượng.

-e Chuyển đổi cơ sở đọc thành = nếu nó giống với tham chiếu được căn chỉnh
cơ sở. Trình gọi Indel không hỗ trợ các căn cứ = vào lúc này.

-u Đầu ra không nén BAM

-b Đầu ra nén BAM

-S Đầu vào là SAM với các dòng tiêu đề

-C INT Hệ số giới hạn chất lượng ánh xạ của các lần đọc được ánh xạ kém. Xem
chồng chất lệnh để biết chi tiết. [0]

-r Tính toán thẻ BQ (không có -A) hoặc chất lượng cơ bản giới hạn bằng BAQ (với -A).

-E Tính toán BAQ mở rộng. Tùy chọn này giao dịch cụ thể cho
độ nhạy, mặc dù ảnh hưởng là nhỏ.

nhắm mục tiêu mục tiêu samtools [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
ref]

Lệnh này xác định các vùng mục tiêu bằng cách kiểm tra tính liên tục của việc đọc
độ sâu, tính toán trình tự đồng thuận đơn bội của các mục tiêu và đầu ra một SAM với
mỗi chuỗi tương ứng với một mục tiêu. Tùy chọn khi nào -f đang được sử dụng, BAQ sẽ
đã áp dụng. Lệnh này là có thể được thiết kế để cắt các dòng vô tính fosmid từ fosmid
trình tự hồ bơi [Tham khảo. Kitzman và cộng sự. (2010)].

giai đoạn pha samtools [-AF] [-k len] [-b prefix] [-q minLOD] [-Q minBaseQ]

Gọi và pha các SNP dị hợp tử. TÙY CHỌN:

-A Bỏ lần đọc với giai đoạn không rõ ràng.

-b STR Tiền tố của đầu ra BAM. Khi tùy chọn này được sử dụng, các lần đọc pha-0 sẽ
được lưu trong tệp STR.0.bam và phase-1 đọc trong STR.1.bam. Giai đoạn không xác định
các lần đọc sẽ được phân bổ ngẫu nhiên vào một trong hai tệp. Chimeric đọc
với lỗi chuyển đổi sẽ được lưu trong STR.chimeric.bam. [vô giá trị]

-F Đừng cố gắng sửa lỗi đọc chữ số.

-k INT Độ dài tối đa cho phân kỳ cục bộ. [13]

-q INT LOD tối thiểu theo tỷ lệ phred để gọi một dị hợp tử. [40]

-Q INT Chất lượng cơ bản tối thiểu được sử dụng trong lệnh gọi het. [13]

BCFTOOLS HÀNG LỰA CHỌN


lượt xem bcftools lượt xem [-abFGNQSucgv] [-D phần tiếp theoDict] [-l danh sáchLoci] [-s danh sáchSample] [-i
tỷ lệ gapSN] [-t tỷ lệ đột biến] [-p varThres] [-m varThres] [-P trước khi] [-1 nNhóm1]
[-d phútFrac] [-U nPerm] [-X permThres] [-T bộ baType] in.bcf [khu]

Chuyển đổi giữa BCF và VCF, gọi các ứng cử viên biến thể và ước tính alen
tần số.

Đầu ra đầu vào Tùy chọn:

-A Giữ lại tất cả các alen thay thế có thể có tại các trang web biến thể. Theo mặc định,
lệnh view loại bỏ các alen không chắc chắn.

-b Đầu ra ở định dạng BCF. Mặc định là VCF.

-D FILE Từ điển trình tự (danh sách tên nhiễm sắc thể) để chuyển đổi VCF-> BCF
[vô giá trị]

-F Cho biết PL được tạo bởi r921 hoặc trước đó (thứ tự là khác nhau).

-G Loại bỏ tất cả thông tin kiểu gen cá nhân.

-l FILE Danh sách các trang web mà tại đó thông tin được xuất ra [tất cả các trang web]

-N Bỏ qua các trang web có trường REF không phải là A / C / G / T

-Q Xuất định dạng khả năng QCALL

-s FILE Danh sách các mẫu để sử dụng. Cột đầu tiên trong đầu vào cung cấp mẫu
tên và tên thứ hai mang lại thể lưỡng bội, chỉ có thể là 1 hoặc 2. Khi
cột thứ 2 không có, mẫu đơn bội được giả định là 2. Trong
đầu ra, thứ tự của các mẫu sẽ giống với thứ tự trong FILE.
[vô giá trị]

-S Đầu vào là VCF thay vì BCF.

-u Đầu ra BCF không nén (lực -b).

Đồng thuận / Biến thể đang gọi Tùy chọn:

-c Gọi các biến thể bằng cách sử dụng suy luận Bayes. Tùy chọn này tự động
gọi ra tùy chọn -e.

-d PHAO NỔI Thời Gian -v đang được sử dụng, bỏ qua loci trong đó phần mẫu được bao phủ bởi
đọc là dưới FLOAT. [0]

-e Chỉ thực hiện suy luận khả năng xảy ra tối đa, bao gồm cả việc ước tính trang web
tần số alen, kiểm tra trạng thái cân bằng và kiểm tra Hardy-Weinberg
liên kết với LRT.

-g Gọi các kiểu gen trên mỗi mẫu tại các vị trí biến thể (lực -c)

-i PHAO NỔI Tỷ lệ đột biến INDEL-SNP [0.15]

-m PHAO NỔI Mô hình mới để cải tiến tính năng gọi đa âm và biến thể hiếm. Nữa
Alen ALT được chấp nhận nếu P (chi ^ 2) của LRT vượt quá ngưỡng FLOAT.
Tham số có vẻ mạnh mẽ và giá trị thực tế thường không
ảnh hưởng nhiều đến kết quả; một giá trị tốt để sử dụng là 0.99. Đây là
phương thức gọi được đề xuất. [0]

-p PHAO NỔI Một trang web được coi là một biến thể nếu P (ref | D)

-P STR Phổ tần số alen trước hoặc ban đầu. Nếu STR có thể Full, điều kiện2,
bằng phẳng hoặc tệp bao gồm đầu ra lỗi từ một biến thể trước đó
gọi chạy.

-t PHAO NỔI Tỷ lệ đột biến theo tỷ lệ cho việc gọi biến thể [0.001]

-T STR Bật tính năng gọi cặp / ba. Đối với cuộc gọi bộ ba, tùy chọn -s thường là
cần được áp dụng để định cấu hình các thành viên bộ ba và thứ tự của chúng.
Trong tệp được cung cấp cho tùy chọn -s, mẫu đầu tiên phải là
con, thứ hai là cha và thứ ba là mẹ. Hợp lệ
giá trị của STR là `` cặp '', `` bộ ba '', `` trioxd '' và `` triox '', trong đó
`` cặp '' gọi sự khác biệt giữa hai mẫu đầu vào và `` trioxd ''
(`` trioxs ') chỉ định rằng đầu vào là từ nhiễm sắc thể X không phải PAR
vùng và đứa trẻ là nữ (nam). [vô giá trị]

-v Chỉ các trang web biến thể đầu ra (force -c)

Tương phản đang gọi Hiệp hội Thử nghiệm Tùy chọn:

-1 INT Số lượng mẫu nhóm-1. Tùy chọn này được sử dụng để phân chia
mẫu thành hai nhóm để gọi SNP tương phản hoặc kiểm tra liên kết.
Khi tùy chọn này được sử dụng, THÔNG TIN VCF sau sẽ được xuất ra:
PC2, PCHI2 và QCHI2. [0]

-U INT Số hoán vị để kiểm tra liên kết (chỉ có hiệu lực với -1)
[0]

-X PHAO NỔI Chỉ thực hiện hoán vị cho P (chi ^ 2) -U)
[0.01]

chỉ số bcftools chỉ số in.bcf

Chỉ mục được sắp xếp BCF để truy cập ngẫu nhiên.

làm sao bcftools làm sao in1.bcf [in2.bcf [hữu ích. Cảm ơn !]]]

Nối các tệp BCF. Các tệp đầu vào được yêu cầu phải được sắp xếp và có
các mẫu giống hệt nhau xuất hiện theo cùng một thứ tự.

SAM FORMAT


Định dạng Căn chỉnh trình tự / Bản đồ (SAM) được phân tách bằng TAB. Ngoài các dòng tiêu đề,
được bắt đầu bằng ký hiệu `` @ ', mỗi dòng căn chỉnh bao gồm:

┌────┬────────┬────────────────────────────────────── ────────────────────────┐
cổ áoPhầnMô tả
├────┼────────┼────────────────────────────────────── ────────────────────────┤
│ 1 │ QNAME │ Mẫu / cặp truy vấn TÊN │
│ 2 │ CỜ │ CỜ theo chiều dọc │
│ 3 │ RNAME │ Chuỗi tham chiếu TÊN │
│ 4 │ POS │ Vị trí / tọa độ ngoài cùng bên trái dựa trên 1 của chuỗi bị cắt │
│ 5 │ MAPQ │ Chất lượng MAPping (theo tỷ lệ) │
│ 6 │ CIAGR │ chuỗi CIGAR mở rộng │
│ 7 │ MRNM │ Mate Chuỗi tham chiếu NaMe (`= 'nếu giống RNAME) │
│ 8 │ MPOS │ Mate POSistion dựa trên 1 │
│ 9 │ TLEN │ Mẫu suy ra LENgth (kích thước chèn) │
│10 │ SEQ │ truy vấn SEQuence trên cùng một sợi với tham chiếu │
│11 │ QUAL │ truy vấn QUALity (ASCII-33 cung cấp chất lượng cơ sở Phred) │
│12 + │ OPT │ biến Các trường tùy chọn ở định dạng TAG: VTYPE: VALUE │
└────┴────────┴────────────────────────────────────── ────────────────────────┘

Mỗi bit trong trường CỜ được định nghĩa là:

┌────────┬─────┬───────────────────────────────────── ────────────────┐
FlagBCMô tả
├────────┼─────┼───────────────────────────────────── ────────────────┤
│0x0001 │ p │ số đọc được ghép nối theo trình tự │
│0x0002 │ P │ số đọc được ánh xạ trong một cặp thích hợp │
│0x0004 │ u │ bản thân chuỗi truy vấn không được ánh xạ │
│0x0008 │ U │ bạn đời không có bản đồ │
│0x0010 │ r │ chuỗi của truy vấn (1 cho ngược lại) │
│0x0020 │ R │ sợi của người bạn đời │
│0x0040 │ 1 │ lần đọc đầu tiên trong một cặp │
│0x0080 │ 2 │ lần đọc là lần đọc thứ hai trong một cặp │
│0x0100 │ căn chỉnh không phải là chính │
│0x0200 │ f │ kiểm tra chất lượng nền tảng / nhà cung cấp không thành công
│0x0400 │ d │ số đọc là PCR hoặc bản sao quang học │
└────────┴─────┴───────────────────────────────────── ────────────────┘
trong đó cột thứ hai cung cấp biểu diễn chuỗi của trường CỜ.

VCF FORMAT


Định dạng Cuộc gọi Biến thể (VCF) là một định dạng được phân tách bằng TAB với mỗi dòng dữ liệu bao gồm
các trường sau:

┌────┬─────────┬───────────────────────────────────── ─────────────────────────────┐
cổ áoPhầnMô tả
├────┼─────────┼───────────────────────────────────── ─────────────────────────────┤
│ 1 │ CHROM │ CHRO Tên người │
│ 2 │ POS │ vị trí ngoài cùng bên trái của biến thể │
│ 3 │ ID │ định danh biến thể duy nhất │
│ 4 │ REF │ alen REFerence │
│ 5 │ ALT │ (các) alen ALTernate, được phân tách bằng dấu phẩy │
│ 6 │ QUAL │ biến thể / tham chiếu QUALity │
│ 7 │ LỌC │ Đã áp dụng các bộ lọc │
│ 8 │ INFO │ INFOrmation liên quan đến biến thể, được phân tách bằng dấu chấm phẩy │
│ 9 │ ĐỊNH DẠNG │ ĐỊNH DẠNG của các trường kiểu gen, được phân tách bằng dấu hai chấm (tùy chọn) │
│10 + │ MẪU │ Kiểu gen MẪU và thông tin về mỗi mẫu (tùy chọn) │
└────┴─────────┴───────────────────────────────────── ─────────────────────────────┘

Bảng sau đây cho Thông TIN các thẻ được samtools và bcftools sử dụng.

┌───────┬──────────── ... ──────────────────────┐
NhãnĐịnh dạngMô tả
├───────┼──────────── ... ──────────────────────┤
└───────┴──────────── ... ──────────────────────┘

VÍ DỤ


o Nhập SAM sang BAM khi @SQ các dòng hiện diện trong tiêu đề:

samtools view -bS aln.sam> aln.bam

If @SQ dòng vắng mặt:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam> aln.bam

Ở đâu ref.fa.fai được tạo tự động bởi faidx chỉ huy.

o Đính kèm RG trong khi hợp nhất các căn chỉnh được sắp xếp:

perl -e 'in
"@RG \ tID: ga \ tSM: hs \ tLB: ga \ tPL: Illumina \ n @ RG \ tID: 454 \ tSM: hs \ tLB: 454 \ tPL: 454 \ n" '> rg.txt
samtools merge -rh rg.txt merge.bam ga.bam 454.bam

Giá trị trong một RG được xác định bởi tên tệp mà đọc đến. Trong này
ví dụ, trong merge.bam, đọc từ ga.bam sẽ được đính kèm RG: Z: ga, trong khi đọc từ
454.bam sẽ được đính kèm RG: Z: 454.

o Gọi SNP và INDEL ngắn cho một cá thể lưỡng bội:

samtools mpileup -ugf ref.fa aln.bam | bcftools view -bvcg -> var.raw.bcf
bcftools xem var.raw.bcf | vcfutils.pl varFilter -D 100> var.flt.vcf

Sản phẩm -D tùy chọn của varFilter kiểm soát độ sâu đọc tối đa, độ sâu này sẽ được điều chỉnh thành
khoảng gấp đôi độ sâu đọc trung bình. Người ta có thể cân nhắc để thêm -C 50 đến mpileup nếu ánh xạ
chất lượng được đánh giá quá cao đối với các lần đọc có quá nhiều thông tin không khớp. Áp dụng tùy chọn này
thường giúp BWA-ngắn nhưng có thể không phải những người lập bản đồ khác.

o Tạo trình tự thuận cho một cá thể lưỡng bội:

samtools mpileup -uf ref.fa aln.bam | bcftools xem -cg - | vcfutils.pl vcf2fq>
cns.fq

o Gọi các đột biến xôma từ một cặp mẫu:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair -> var.bcf

Trong trường THÔNG TIN đầu ra, CLR đưa ra tỷ lệ Phred-log giữa khả năng bằng
xử lý hai mẫu một cách độc lập và khả năng xảy ra bằng cách yêu cầu kiểu gen
giống hệt nhau. Cái này CLR thực sự là một điểm số đo lường sự tự tin của soma
cuộc gọi. Càng cao càng tốt.

o Gọi de novo và đột biến xôma từ một bộ ba trong họ:

samtools mpileup -DSuf ref.fa aln.bam | bcftools xem -bvcgT cặp -s mẫu.txt ->
var.bcf

Tập tin sample.txt nên bao gồm ba dòng chỉ định thành viên và thứ tự của
mẫu (theo thứ tự con-cha-mẹ). Tương tự, CLR cung cấp cho Phred-log
tỷ lệ khả năng xảy ra có và không có ràng buộc bộ ba. CGU cho thấy nhiều khả năng nhất
cấu hình kiểu gen mà không có ràng buộc bộ ba, và CGT mang lại nhiều khả năng nhất
cấu hình kiểu gen thỏa mãn giới hạn bộ ba.

o Giai đoạn một cá nhân:

samtools normald -AEur aln.bam ref.fa | tiền tố pha -b của samtools -> phase.out

Sản phẩm điềm tĩnh lệnh được sử dụng để giảm dị hợp tử giả xung quanh INDEL.

o Gọi SNPs và indels ngắn cho các cá thể lưỡng bội:

samtools mpileup -P IllUMINA -ugf ref.fa * .bam | bcftools view -bcvg -> var.raw.bcf
bcftools xem var.raw.bcf | vcfutils.pl varFilter -D 2000> var.flt.vcf

Các cá nhân được xác định từ SM thẻ trong @R G các dòng tiêu đề. Cá nhân có thể được
được gộp chung trong một tệp căn chỉnh; một cá nhân cũng có thể được tách thành nhiều tệp.
Sản phẩm -P tùy chọn chỉ định rằng chỉ nên thu thập các ứng cử viên indel từ các nhóm đã đọc
với @ RG-PL thẻ được đặt thành MINH HOẠ. Thu thập các ứng cử viên từ các lần đọc được sắp xếp theo trình tự
bởi một công nghệ dễ bị lỗi indel có thể ảnh hưởng đến hiệu suất của cuộc gọi indel.

Lưu ý rằng có một mô hình gọi mới có thể được gọi bởi

bcftools xem -m0.99 ...

để khắc phục một số hạn chế nghiêm trọng của phương pháp mặc định.

Để lọc, kết quả tốt nhất dường như đạt được bằng cách áp dụng đầu tiên khe hở bộ lọc và
sau đó áp dụng một số phương pháp học máy

vcf-annotate -f SnpGap = n
bộ lọc vcf ...

Cả hai đều có thể được tìm thấy trong vcftoolshtslib gói (liên kết bên dưới).

o Tìm kiếm phổ tần số alen (AFS) trên danh sách các vị trí từ nhiều cá thể:

samtools mpileup -Nếu ref.fa * .bam> all.bcf
bcftools xem -bl sites.list all.bcf> sites.bcf
bcftools xem -cGP cond2 sites.bcf> / dev / null 2> sites.1.afs
bcftools xem -cGP trang web.1.afs trang web.bcf> / dev / null 2> trang web.2.afs
bcftools xem -cGP trang web.2.afs trang web.bcf> / dev / null 2> trang web.3.afs
......

Ở đâu site.list chứa danh sách các trang web với mỗi dòng bao gồm tham chiếu
tên trình tự và vị trí. Sau bcftools lệnh ước tính AFS bằng EM.

o Kết xuất BAQ áp dụng căn chỉnh cho những người gọi SNP khác:

samtools normald -bAr aln.bam> aln.baq.bam

Nó bổ sung và sửa lỗi NMMD cùng một lúc. Các điềm tĩnh lệnh cũng đến
với -C tùy chọn, giống như tùy chọn trong chồng chấtmpileup. Áp dụng nếu nó hữu ích.

GIỚI HẠN


o Các từ không dấu được sử dụng trong bam_import.c, bam_endian.h, bam.c và bam_aux.c.

o rmdup kết thúc ghép nối của Samtools không hoạt động đối với các lần đọc chưa được ghép nối (ví dụ: đọc hoặc kết thúc mồ côi
ánh xạ vào các nhiễm sắc thể khác nhau). Nếu đây là một mối quan tâm, vui lòng sử dụng Picard's
MarkDuplicate xử lý chính xác các trường hợp này, mặc dù chậm hơn một chút.

Sử dụng bcftools trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

  • 1
    Chim lửa
    Chim lửa
    Firebird RDBMS cung cấp các tính năng ANSI SQL
    & chạy trên Linux, Windows &
    một số nền tảng Unix. Đặc trưng
    đồng thời và hiệu suất tuyệt vời
    & sức mạnh...
    Tải xuống Firebird
  • 2
    KompoZer
    KompoZer
    KompoZer là một trình soạn thảo HTML wysiwyg sử dụng
    cơ sở mã của Mozilla Composer. Như
    Sự phát triển của Nvu đã bị dừng lại
    vào năm 2005, KompoZer sửa nhiều lỗi và
    thêm một f ...
    Tải xuống KompoZer
  • 3
    Tải xuống Manga miễn phí
    Tải xuống Manga miễn phí
    Trình tải xuống Manga miễn phí (FMD) là một
    ứng dụng mã nguồn mở được viết bằng
    Object-Pascal để quản lý và
    tải manga từ các trang web khác nhau.
    Đây là một tấm gương ...
    Tải xuống Trình tải xuống Manga miễn phí
  • 4
    Aetbootin
    Aetbootin
    UNetbootin cho phép bạn tạo khả năng khởi động
    Ổ đĩa USB trực tiếp cho Ubuntu, Fedora và
    các bản phân phối Linux khác mà không có
    ghi đĩa CD. Nó chạy trên Windows, Linux,
    và ...
    Tải xuống UNetbootin
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM dễ sử dụng
    Gói phần mềm mã nguồn mở ERP và CRM
    (chạy với máy chủ web php hoặc
    phần mềm độc lập) dành cho doanh nghiệp,
    nền tảng ...
    Tải xuống Dolibarr ERP - CRM
  • 6
    Máy khách SQL SQuirreL
    Máy khách SQL SQuirreL
    SQuirreL SQL Client là một SQL đồ họa
    ứng dụng khách được viết bằng Java sẽ cho phép
    bạn có thể xem cấu trúc của một JDBC
    cơ sở dữ liệu tuân thủ, duyệt dữ liệu trong
    những cái bàn...
    Tải xuống ứng dụng khách SQuirreL SQL
  • Khác »

Lệnh Linux

Ad