Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

daligner - Trực tuyến trên đám mây

Chạy daligner trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh phân bổ có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


daligner - căn chỉnh đọc dài

SYNOPSIS


người daligner [-vbAI][-kint(14)] [-wint(6)] [-hint(35)] [-tint] [-Mint] [-egấp đôi (.70)]
[-lint(1000)] [-sint(100)] [-Hint] [-mtheo dõi]+ chủ đề:db|dam mục tiêu:db|dam hữu ích. Cảm ơn !

MÔ TẢ


So sánh trình tự trong phần đã cắt Tiêu đề chặn những người trong danh sách mục tiêu khối
tìm kiếm sự sắp xếp cục bộ liên quan đến ít nhất -l cặp cơ sở (mặc định 1000) trở lên,
có tỷ lệ tương quan trung bình là -e (mặc định 70%). Sự sắp xếp cục bộ được tìm thấy
sẽ được xuất ra ở dạng mã hóa thưa thớt trong đó một điểm theo dõi trên căn chỉnh được ghi lại mỗi lần
-s cặp cơ sở của a-đọc (100bp mặc định). Các lần đọc được so sánh theo cả hai hướng và
sắp xếp cục bộ đáp ứng các tiêu chí sẽ được xuất ra một trong một số tệp được tạo được mô tả
phía dưới. Các -v tùy chọn bật chế độ báo cáo chi tiết cung cấp số liệu thống kê về từng
bước chính của tính toán.

Các tùy chọn -k, -h-w kiểm soát việc tìm kiếm lọc ban đầu cho các kết quả phù hợp có thể
giữa các lần đọc. Cụ thể, mã tìm kiếm của chúng tôi tìm kiếm một cặp dải chéo có chiều rộng
2^w (mặc định 2^6 = 64) chứa tập hợp các k-mer khớp chính xác (mặc định 14)
giữa hai lần đọc, sao cho tổng số cơ sở được bao phủ bởi các lần truy cập k-mer là h
(mặc định 35). k không thể lớn hơn 32 trong quá trình triển khai hiện tại. Nếu -b tùy chọn
được thiết lập, sau đó người daligner giả định dữ liệu có độ lệch thành phần mạnh (ví dụ: >65% AT
giàu) và tốn thêm một chút thời gian, tự động điều chỉnh kích thước k-mer tùy thuộc vào
độ lệch thành phần, sao cho các hợp chất được sử dụng có độ đặc hiệu hiệu dụng là 4^k.

Nếu có một hoặc nhiều rãnh quãng được chỉ định bằng -m tùy chọn, sau đó đọc
DB hoặc DB được áp dụng mặt nạ được che mềm bằng sự kết hợp của các khoảng
trong số tất cả các rãnh quãng được áp dụng, đó là bất kỳ k-mer nào chứa bất kỳ cơ sở nào trong bất kỳ
các khoảng bị che được bỏ qua nhằm mục đích tạo hạt giống cho trận đấu. Một bài hát ngắt quãng
là một rãnh, chẳng hạn như rãnh "bụi" được tạo bởi DBdust, mã hóa một tập hợp các khoảng thời gian
trên DB chưa được cắt xén hoặc đã được cắt xén.

Luôn luôn có một số k-mer được thể hiện quá mức đáng kể (ví dụ: chạy homopolyme).
Những k-mer này tạo ra quá nhiều cặp k-mer phù hợp và nếu không được xử lý sẽ
khiến Daligner tràn bộ nhớ vật lý hiện có. Một cách để giải quyết vấn đề này là
thiết lập rõ ràng -t tham số ngăn chặn việc sử dụng bất kỳ k-mer nào xảy ra nhiều hơn
hơn t lần trong chủ đề hoặc khối mục tiêu. Tuy nhiên, cách tốt hơn để xử lý
tình huống là để chương trình tự động chọn một giá trị t đáp ứng một điều kiện nhất định
giới hạn sử dụng bộ nhớ được chỉ định (tính bằng Gb) bởi -M tham số. Theo mặc định người daligner sẽ sử dụng
dung lượng bộ nhớ vật lý là sự lựa chọn cho -M. Nếu bạn muốn sử dụng ít hơn, chỉ nói 8Gb
trên nút cụm HPC 24Gb vì bạn muốn chạy 3 người daligner công việc trên nút, sau đó
chỉ định -M8. Xác định -M0 về cơ bản chỉ ra rằng bạn không muốn người daligner để tự
điều chỉnh việc loại bỏ k-mer để vừa với một lượng bộ nhớ nhất định.

Đối với mỗi chủ đề, cặp khối mục tiêu, chẳng hạn như X và Y, chương trình sẽ báo cáo sự sắp xếp trong đó
a-read nằm trong X và b-read nằm trong Y và ngược lại. Tuy nhiên, nếu -A Tùy chọn là
được đặt ("A" cho "không đối xứng") sau đó chỉ trùng lặp trong đó phần đọc a nằm trong X và phần đọc b là
trong Y được báo cáo và nếu X = Y thì nó chỉ báo cáo thêm những phần trùng lặp trong đó
chỉ số a-read nhỏ hơn chỉ số b-read. Trong cả hai trường hợp, nếu -I tùy chọn được đặt ("Tôi"
đối với "danh tính") thì khi X = Y, sự chồng chéo giữa các phần khác nhau của cùng một lần đọc sẽ
cũng được tìm thấy và báo cáo.

Mỗi căn chỉnh tìm được sẽ được ghi lại dưới dạng -- a[ab,ae] x bo[bb,be] -- trong đó a và b là
các chỉ mục (trong DB được cắt bớt) của các lần đọc trùng lặp, o cho biết liệu b-read có phải là
từ cùng một chuỗi hoặc đối diện, và [ab,ae] và [bb,be] là các khoảng của a và bo,
tương ứng, căn chỉnh đó. Chương trình đặt các bản ghi căn chỉnh này vào các tệp có tên
có dạng XY[C|N]#.las trong đó C chỉ ra rằng các b-đọc được bù và N
cho biết chúng không phải như vậy (cả hai phép so sánh đều được thực hiện) và # là luồng được phát hiện
và viết ra bộ sưu tập sắp xếp có trong tệp. Đó là tập tin
XYO#.las chứa các sắp xếp được tạo bởi luồng # mà a-đọc là từ X và
b-đọc là từ Y và theo hướng O. Lệnh người daligner -A X Y tạo ra 2*NTHREAD
tập tin luồng XY?.las và người daligner X Y tạo ra các tệp 4*NTHREAD XY?.las và YX?.las
(trừ khi X=Y trong trường hợp đó chỉ có các tệp NTHREAD, XX?.las, được tạo ra).

Theo mặc định, người daligner so sánh tất cả sự trùng lặp giữa các lần đọc trong cơ sở dữ liệu lớn hơn
hơn mức cắt tối thiểu được đặt khi DB hoặc DB được phân chia, thường là 1 hoặc 2 Kbp. Tuy nhiên,
đường dẫn lắp ráp HGAP chỉ muốn sửa các lần đọc lớn, chẳng hạn như 8Kbp trở lên, v.v.
chỉ cần các phần trùng lặp trong đó phần đọc a là một trong những phần đọc lớn. Bằng cách thiết lập -H
tham số để nói N, một thay đổi người daligner để nó chỉ báo cáo trùng lặp ở nơi đọc
dài hơn N cặp bazơ.

Mặc dù cài đặt tham số mặc định phù hợp với dữ liệu Pacbio thô, người daligner có thể được sử dụng
để tìm kiếm sự sắp xếp một cách hiệu quả trong các lần đọc đã sửa hoặc các lần đọc khác ít nhiễu hơn. Vì
ví dụ: để ánh xạ các ứng dụng với .dams, chúng tôi chạy

người daligner -k20 -h60 -e. 85

và trên các lần đọc đã sửa, chúng tôi thường chạy

người daligner -k25 -w5 -h60 -e. 95 -s500

và ở những cài đặt này, nó rất nhanh.

Sử dụng daligner trực tuyến bằng dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

  • 1
    Zabbix
    Zabbix
    Zabbix là một công ty mở cấp doanh nghiệp
    nguồn giải pháp giám sát phân tán
    được thiết kế để giám sát và theo dõi
    hiệu suất và tính khả dụng của mạng
    máy chủ, thiết bị ...
    Tải xuống Zabbix
  • 2
    KĐ3
    KĐ3
    Kho lưu trữ này không còn được duy trì
    và được giữ cho mục đích lưu trữ. Nhìn thấy
    https://invent.kde.org/sdk/kdiff3 for
    mã mới nhất và
    https://download.kde.o...
    Tải xuống KDiff3
  • 3
    USBLoaderGX
    USBLoaderGX
    USBLoaderGX là một GUI cho
    Bộ nạp USB của Waninkoko, dựa trên
    libwiigui. Nó cho phép liệt kê và
    khởi chạy trò chơi Wii, trò chơi Gamecube và
    homebrew trên Wii và WiiU ...
    Tải xuống USBLoaderGX
  • 4
    Chim lửa
    Chim lửa
    Firebird RDBMS cung cấp các tính năng ANSI SQL
    & chạy trên Linux, Windows &
    một số nền tảng Unix. Đặc trưng
    đồng thời và hiệu suất tuyệt vời
    & sức mạnh...
    Tải xuống Firebird
  • 5
    KompoZer
    KompoZer
    KompoZer là một trình soạn thảo HTML wysiwyg sử dụng
    cơ sở mã của Mozilla Composer. Như
    Sự phát triển của Nvu đã bị dừng lại
    vào năm 2005, KompoZer sửa nhiều lỗi và
    thêm một f ...
    Tải xuống KompoZer
  • 6
    Tải xuống Manga miễn phí
    Tải xuống Manga miễn phí
    Trình tải xuống Manga miễn phí (FMD) là một
    ứng dụng mã nguồn mở được viết bằng
    Object-Pascal để quản lý và
    tải manga từ các trang web khác nhau.
    Đây là một tấm gương ...
    Tải xuống Trình tải xuống Manga miễn phí
  • Khác »

Lệnh Linux

Ad