Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

ipdSummary - Trực tuyến trên đám mây

Chạy ipdSummary trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh ipdSummary có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


ipdSummary - Phát hiện các sửa đổi gốc DNA từ các dấu hiệu động học.

MÔ TẢ


kineticsTool tải các IPD được quan sát tại mỗi vị trí trong bộ gen và so sánh các IPD đó
để đánh giá giá trị mong đợi cho DNA chưa sửa đổi và xuất ra kết quả của thử nghiệm thống kê này.
Giá trị IPD dự kiến ​​cho DNA chưa sửa đổi có thể đến từ một trong-silico điều khiển hoặc một
khuếch đại điều khiển. Điều khiển trong silico được PacBio đào tạo và vận chuyển cùng với
Bưu kiện. Nó dự đoán dự đoán IPD bằng cách sử dụng bối cảnh trình tự cục bộ xung quanh hiện tại
Chức vụ. Tập dữ liệu điều khiển khuếch đại được tạo ra bằng cách giải trình tự DNA chưa sửa đổi với
trình tự giống như mẫu thử nghiệm. Một mẫu điều khiển khuếch đại thường được tạo ra bởi
khuếch đại toàn bộ bộ gen của mẫu ban đầu.

Sửa đổi Phát hiện
Chế độ cơ bản của kineticsTools thực hiện so sánh độc lập các IPD tại mỗi vị trí trên
bộ gen, cho mỗi sợi và phát ra các số liệu thống kê khác nhau cho CSV và GFF (sau khi áp dụng
bộ lọc ý nghĩa).

Sửa đổi Xác định
động họcCông cụ Ngoài ra a Sửa đổi Xác định chế độ việc này có thể giải mã nhiều địa điểm IPD
'dấu vân tay' trong a giảm định of cuộc gọi of riêng các sửa đổi. T tính năng các
tiếp theo lợi ích:

· Các sửa đổi khác nhau xảy ra trên cùng một cơ sở có thể được phân biệt (đối với
ví dụ m5C và m4C)

· Tín hiệu từ một lần sửa đổi được kết hợp thành một thống kê, cải thiện
độ nhạy, loại bỏ các đỉnh thừa và căn giữa cuộc gọi một cách chính xác

LỰA CHỌN


Vui lòng gọi chương trình này với --Cứu giúp để xem các tùy chọn có sẵn.

TIẾNG VIỆT


Tổng hợp Kiểm soát
Các nghiên cứu về mối quan hệ giữa IPD và bối cảnh trình tự cho thấy rằng hầu hết các
sự thay đổi về IPD trung bình trên một bộ gen có thể được dự đoán từ bối cảnh trình tự 12 cơ sở
bao quanh vị trí hoạt động của DNA polymerase. Các giới hạn của bối cảnh có liên quan
cửa sổ tương ứng với cửa sổ DNA tiếp xúc với polymerase, như đã thấy trong
Cấu trúc tinh thể DNA / polymerase. Để đơn giản hóa quá trình tìm kiếm các sửa đổi DNA
với dữ liệu PacBio, công cụ này bao gồm bảng tra cứu được đào tạo trước lập bản đồ DNA 12-mer
trình tự các IPD trung bình được quan sát thấy trong hóa học C2.

Lọc Cắt
kineticsTools sử dụng Mapping QV được tạo bởi BLASR và được lưu trữ trong tệp cmp.h5 để
bỏ qua các lần đọc không được ánh xạ một cách chắc chắn. Yêu cầu QV ánh xạ tối thiểu mặc định là
10, ngụ ý rằng BLASR có 90 \% tin tưởng rằng bài đọc được ánh xạ chính xác. Bởi vì
phạm vi cường độ đọc vốn có trong dữ liệu PacBio Điều này có thể được thay đổi khi sử dụng
--mapQvThreshold đối số dòng lệnh hoặc thông qua hộp thoại cấu hình SMRTPortal cho
Phát hiện sửa đổi.

Có một số tính năng của dữ liệu PacBio cần được chú ý đặc biệt để đạt được hiệu quả
hiệu suất phát hiện sửa đổi tốt. kineticsTools kiểm tra sự liên kết giữa
các cơ sở quan sát và trình tự tham chiếu - để thực hiện phép đo IPD
được đưa vào phân tích, chuỗi đọc PacBio phải khớp với chuỗi tham chiếu cho k
xung quanh đế cognate. Trong mô-đun hiện tại k = 1 Phân phối IPD tại một số điểm được
được coi là hỗn hợp giữa quy trình kết hợp 'bình thường' IPD, quy trình này nhạy cảm
đối với bối cảnh trình tự cục bộ và sửa đổi DNA và quá trình 'tạm dừng' gây ô nhiễm
IPD có thời lượng dài hơn nhiều (trung bình dài hơn 10 lần so với bình thường), nhưng hiếm khi xảy ra
(~ 1% IPD). Lưu ý: Hiểu biết hiện tại của chúng tôi là tạm dừng không hữu ích
thông tin về trạng thái metyl hóa của DNA, tuy nhiên, một phân tích cẩn thận hơn có thể
được bảo hành. Cũng lưu ý rằng các sửa đổi làm tăng mạnh Khoảng 1% của
IPD quan sát được tạo ra bởi các sự kiện tạm dừng. Giới hạn IPD được quan sát ở vị trí thứ 99 toàn cầu
phần trăm được thúc đẩy bởi lý thuyết từ việc kiểm tra giả thuyết mạnh mẽ. Một số bối cảnh trình tự
có thể có IPD dài hơn một cách tự nhiên, để tránh giới hạn quá nhiều dữ liệu trong những bối cảnh đó, giới hạn
ngưỡng được điều chỉnh theo ngữ cảnh như sau: capThreshold = max (global99,
5 * modelPrediction, percentile (ipdObservations, 75))

Thống kê Kiểm tra
Chúng tôi kiểm tra giả thuyết rằng các IPD được quan sát tại một vị trí cụ thể trong mẫu có
dài hơn có nghĩa là IPD được quan sát tại cùng một vị trí trong DNA chưa sửa đổi. Nếu chúng tôi đã tạo
tập dữ liệu được Khuếch đại toàn bộ bộ gen, loại bỏ các sửa đổi DNA, chúng tôi sử dụng kiểm soát trường hợp,
thử nghiệm t hai mẫu. Công cụ này cũng cung cấp mô hình 'điều khiển tổng hợp' được hiệu chỉnh trước
dự đoán IPD không sửa đổi, dựa trên ngữ cảnh 12 trình tự cơ sở. Trong tổng hợp
trường hợp kiểm soát, chúng tôi sử dụng thử nghiệm t một mẫu, với điều chỉnh để giải thích lỗi trong
mô hình điều khiển tổng hợp.

ĐẦU VÀO


align_reads.cmp.h5
Tệp cmp.h5 tiêu chuẩn chứa các căn chỉnh và thông tin IPD cung cấp dữ liệu động học
được sử dụng để thực hiện phát hiện sửa đổi. Tệp cmp.h5 tiêu chuẩn của một công việc SMRTportal là
data / align_read.cmp.h5.

Tài liệu tham khảo Trình tự
Công cụ yêu cầu trình tự tham chiếu được sử dụng để thực hiện căn chỉnh. Hiện tại điều này phải
được cung cấp thông qua đường dẫn đến mục nhập kho lưu trữ tham chiếu SMRTportal.

KẾT QUẢ


Công cụ phát hiện sửa đổi cung cấp kết quả ở nhiều định dạng phù hợp với
phân tích thống kê chuyên sâu, tham khảo nhanh và tiêu thụ bằng các công cụ trực quan
chẳng hạn như PacBio SMRTView. Kết quả thường được lập chỉ mục theo vị trí tham chiếu và
sợi tham chiếu. Trong mọi trường hợp, giá trị sợi liên quan đến sợi mang
sửa đổi trong mẫu DNA. Hãy nhớ rằng hiệu ứng động học của việc sửa đổi là
được quan sát trong các trình tự đọc sắp xếp với sợi đối diện. Vì vậy, các lần đọc liên kết với
sợi dương mang thông tin về sự sửa đổi trên sợi tiêu cực và ngược lại
ngược lại, nhưng trong bộ công cụ này, chúng tôi luôn báo cáo chuỗi chứa giả định
sửa đổi.

sửa đổi.csv
Tệp modification.csv chứa một hàng cho mỗi cặp (vị trí tham chiếu, sợi)
xuất hiện trong tập dữ liệu với phạm vi ít nhất là x. x mặc định là 3, nhưng là
có thể định cấu hình bằng cờ '--minCoverage' thành ipdSummary.py. Chỉ số vị trí tham chiếu là
1-based để tương thích với môi trường R tệp gff.

Đầu ra cột
trong-silico điều khiển chế độ

┌────────────────── ──┐
│Column │ Mô tả │
├────────────────── ──┤
│refId │ ID trình tự tham chiếu của │ này
│ │ quan sát │
├────────────────── ──┤
│tpl │ vị trí mẫu dựa trên 1 │
├────────────────── ──┤
│strand │ sợi mẫu gốc ở đâu │
│ │ động học được tạo ra. '0' là │
│ │ sợi của bản gốc │
│ │ FASTA, '1' là sợi đối diện │
│ │ từ FASTA │
├────────────────── ──┤
│base │ base cognate ở đây │
│ │ vị trí trong tham chiếu │
├────────────────── ──┤
│score │ Giá trị được biến đổi theo phred mà một │
│ │ độ lệch động học tồn tại ở đây │
│ │ vị trí │
└────────────────── ──┘

Trung bình giới hạn │tMean của IPD được chuẩn hóa │
│ │ đã quan sát tại vị trí này │
├────────────────── ──┤
│tErr │ lỗi tiêu chuẩn giới hạn của │
│ │ IPD chuẩn hóa được quan sát tại đây │
│ │ vị trí (độ lệch chuẩn / │
│ │ sqrt (phạm vi bảo hiểm) │
├────────────────── ──┤
│modelPrediction │ IPD trung bình chuẩn hóa được dự đoán bởi │
│ │ mô hình điều khiển tổng hợp cho │
│ │ bối cảnh trình tự này │
├────────────────── ──┤
│ipdRatio │ tMean/modelPrediction │
├────────────────── ──┤
│ mức độ phù hợp │ số lượng IPD hợp lệ tại đây │
│ │ vị trí (xem phần Lọc │
│ │ để biết chi tiết) │
├────────────────── ──┤
│frac │ ước lượng phân số của │
│ │ phân tử mang │
│ │ sửa đổi │
├────────────────── ──┤
Giới hạn tin cậy │fracLow │ 2.5% của frac │
│ │ ước tính │
├────────────────── ──┤
Giới hạn tin cậy │fracUpp │ 97.5% của frac │
│ │ ước tính │
└────────────────── ──┘

kiểm soát trường hợp chế độ

┌────────────────── ──┐
│Column │ Mô tả │
├────────────────── ──┤
│refId │ ID trình tự tham chiếu của │ này
│ │ quan sát │
├────────────────── ──┤
│tpl │ vị trí mẫu dựa trên 1 │
├────────────────── ──┤
│strand │ sợi mẫu gốc ở đâu │
│ │ động học được tạo ra. '0' là │
│ │ sợi của bản gốc │
│ │ FASTA, '1' là sợi đối diện │
│ │ từ FASTA │
├────────────────── ──┤
│base │ base cognate ở đây │
│ │ vị trí trong tham chiếu │
├────────────────── ──┤
│score │ Giá trị được biến đổi theo phred mà một │
│ │ độ lệch động học tồn tại ở đây │
│ │ vị trí │
├────────────────── ──┤
│caseMean │ trung bình của IPD trường hợp chuẩn hóa │
│ │ đã quan sát tại vị trí này │
├────────────────── ──┤
│controlMean │ trung bình của các IPD điều khiển chuẩn hóa │
│ │ đã quan sát tại vị trí này │
├────────────────── ──┤
│caseStd │ độ lệch chuẩn của trường hợp IPDs │
│ │ đã quan sát tại vị trí này │
├────────────────── ──┤
│controlStd │ độ lệch chuẩn của điều khiển │
│ │ IPD được quan sát tại vị trí này │
└────────────────── ──┘

│ipdRatio │ tMean/modelPrediction │
├────────────────── ──┤
│testStatistic │ thống kê t-test │
├────────────────── ──┤
│ mức độ bao phủ │ nghĩa của trường hợp và kiểm soát │
│ │ phạm vi bảo hiểm │
├────────────────── ──┤
│controlCoverage │ số lượng IPD kiểm soát hợp lệ tại │
│ │ vị trí này (xem phần Lọc │
│ phần để biết chi tiết) │
├────────────────── ──┤
│caseCoverage │ số lượng IPD trường hợp hợp lệ tại đây │
│ │ vị trí (xem phần Lọc │
│ │ để biết chi tiết) │
└────────────────── ──┘

sửa đổi. gff
Các sửa đổi. Gff tuân thủ đặc điểm kỹ thuật GFF Phiên bản 3 (-
http://www.sequenceontology.org/gff3.shtml). Mỗi vị trí mẫu / cặp sợi có
p-value vượt quá ngưỡng pvalue xuất hiện dưới dạng một hàng. Vị trí mẫu dựa trên 1,
theo thông số GFF. Cột sợi đề cập đến sợi mang
sửa đổi, là nhánh đối lập với những thứ được sử dụng để phát hiện sửa đổi. Các
Cột tin cậy GFF là giá trị phát hiện được chuyển đổi theo Phred.

Chú thích on gen trình duyệt khả năng tương thích

Tệp modification.gff sẽ không hoạt động trực tiếp với hầu hết các trình duyệt bộ gen. Bạn sẽ
có thể cần tạo một bản sao của tệp GFF và chuyển đổi các cột _seqid_ từ
các tên chung chung 'ref0000x' do PacBio tạo, cho các tiêu đề FASTA có trong bản gốc
tham chiếu tệp FASTA. Bảng ánh xạ được viết trong tiêu đề của các sửa đổi. Gff
tập tin trong # tiêu đề trình tự các thẻ. Vấn đề này sẽ được giải quyết trong phiên bản 1.4 của
động họcCông cụ.

Cột dữ liệu phụ của tệp GFF chứa các thống kê khác có thể hữu ích
phân tích hoặc lọc hạ nguồn. Cụ thể là mức độ bao phủ của các bài đọc được sử dụng để
thực hiện cuộc gọi và bối cảnh trình tự +/- 20bp xung quanh trang web.

┌────────────┬───────────────────────────────────
│Column │ Mô tả │
├────────────┼───────────────────────────────────
│seqid │ Tên contig Fasta │
├────────────┼───────────────────────────────────
│ nguồn │ Tên công cụ - 'kinModCall' │
├────────────┼───────────────────────────────────
│type │ Loại sửa đổi - trong │
│ │ chế độ nhận dạng đây sẽ là │
│ │ m6A, m4C hoặc m5C cho │ đã được xác định
│ │ cơ sở, hoặc thẻ chung │
│ │ 'mod_base' nếu một động học │
Sự kiện │ │ đã được phát hiện không │
│ │ khớp với một sửa đổi đã biết │
│ │ chữ ký │
├────────────┼───────────────────────────────────
│start │ Vị trí sửa đổi trên contig │
├────────────┼───────────────────────────────────
│end │ Vị trí sửa đổi trên contig │
├────────────┼───────────────────────────────────
│score │ Giá trị p được chuyển đổi phred của │
│ │ phát hiện - đây là │
│ │ giá trị p phát hiện một trang web │
├────────────┼───────────────────────────────────
│strand │ Sợi mẫu chứa │
│ │ sửa đổi │
└────────────┴───────────────────────────────────

│phase │ Không áp dụng │
├────────────┼───────────────────────────────────
│ thuộc tính │ Các trường bổ sung liên quan đến cơ sở │
│ │ mod. IPDRatio là truyền thống │
│ │ IPDRatio, ngữ cảnh là │
│ │ trình tự tham chiếu -20bp đến │
│ │ + 20bp xung quanh sửa đổi, │
│ │ và mức độ phủ sóng là số │
│ │ quan sát IPD được sử dụng sau │
│ │ Lập bản đồ lọc QV và │
│ │ lọc độ chính xác. Nếu hàng │
│ │ kết quả từ một │ đã xác định
Sửa đổi │ │ chúng tôi cũng bao gồm một │
Thẻ │ │ IDQv với thẻ │
│ │ từ sửa đổi │
│ │ thủ tục nhận dạng. │
│ │ nhận dạngQv là │
│ │ xác suất biến đổi phred của │
│ │ một nhận dạng không chính xác, cho │
│ │ cơ sở được xác định là │
│ │ có một │ cụ thể
│ │ sửa đổi. frac, fracLow, │
│ │ fracUp là ước tính │
│ │ phần phân tử mang │
│ │ sửa đổi, và 5% │
│ │ khoảng tin cậy của │
│ │ ước tính. Metyl hóa │
│ │ ước lượng phân số là một │
│ │ tính năng cấp beta và nên │
│ │ chỉ được sử dụng để khám phá │
│ │ mục đích. │
└────────────┴───────────────────────────────────

motif
Nếu công cụ Motif Finder được chạy, nó sẽ tạo ra motif.gff, đây là phiên bản được xử lý lại
của các sửa đổi. gff với các thay đổi sau. Nếu một sửa đổi được phát hiện xảy ra trên
mô-típ được phát hiện bởi công cụ tìm mô-típ, sửa đổi được chú thích bằng dữ liệu mô-típ. Một
thuộc tính 'motif' được thêm vào có chứa chuỗi motif và một thuộc tính 'id' được thêm vào
chứa id họa tiết, là chuỗi họa tiết cho các họa tiết chưa ghép nối hoặc
'motifString1 / motifString2' cho các họa tiết được ghép nối. Nếu một trường hợp mô típ tồn tại trong bộ gen,
nhưng không được phát hiện trong các sửa đổi.gff, một mục nhập được thêm vào motif.gff, cho biết
sự hiện diện của mô típ đó và động học quan sát được tại vị trí đó.

mô típ_tóm tắt.csv
Nếu công cụ Motif Finder được chạy, motif_summary.csv được tạo, tóm tắt
họa tiết do công cụ khám phá. CSV chứa một hàng cho mỗi mô-típ được phát hiện, với
các cột sau

┌───────────────────── ─────┐
│Column │ Mô tả │
├───────────────────── ─────┤
│motifString │ Chuỗi mô típ được phát hiện │
├───────────────────── ─────┤
│centerPos │ Vị trí trong mô típ của │
│ │ sửa đổi (dựa trên 0) │
├───────────────────── ─────┤
│fraction │ Một số trường hợp của điều này │
│ │ motif với sửa đổi QV ở trên │
│ │ ngưỡng QV │
├───────────────────── ─────┤
│nDetected │ Số lượng trường hợp này │
│ │ mô típ trên ngưỡng │
└───────────────────── ─────┘

│nGenome │ Số lượng trường hợp này │
│ │ motif trong chuỗi tham chiếu │
├───────────────────── ─────┤
│groupTag │ Một chuỗi lý tưởng cho mô-típ │
│ │ phân nhóm. Đối với các họa tiết được ghép nối này │
│ │ là │
│ │ " / ", │
│ │ Đối với các họa tiết chưa ghép đôi, giá trị này bằng │
│ │ motif Chuỗi │
├───────────────────── ─────┤
│partnerMotifString │ motif Chuỗi motif được ghép nối │
│ │ (họa tiết với │
│ │ đảo ngược-bổ sung │
│ │ mô típChuỗi) │
├───────────────────── ─────┤
│meanScore │ Qv sửa đổi trung bình của được phát hiện │
│ │ trường hợp │
├───────────────────── ─────┤
│meanIpdRatio │ Tỷ lệ IPD trung bình của phát hiện │
│ │ trường hợp │
├───────────────────── ─────┤
│meanCoverage │ Mức độ phù hợp trung bình của những thứ đã phát hiện được │
│ │ trường hợp │
├───────────────────── ─────┤
│objectiveScore │ Điểm khách quan của mô típ này trong │
│ │ thuật toán tìm mô típ │
└───────────────────── ─────┘

Sử dụng ipdSummary trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad