Ini ialah perintah daligner yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
daligner - penyelaras bacaan panjang
SINOPSIS
daligner [-vbAI][-kint(14)] [-wint(6)] [-hint(35)] [-tint] [-Mint] [-edua kali ganda(.70)]
[-lint(1000)] [-sint(100)] [-Hint] [-mmenjejaki]+ subjek:db|em sasaran:db|empangan ...
DESCRIPTION
Bandingkan urutan dalam dipangkas tertakluk sekat terhadap mereka dalam senarai sasaran blok
mencari penjajaran tempatan yang melibatkan sekurang-kurangnya -l pasangan asas (lalai 1000) atau lebih,
yang mempunyai kadar korelasi purata sebanyak -e (lalai 70%). Jajaran tempatan ditemui
akan dikeluarkan dalam pengekodan jarang di mana titik surih pada penjajaran direkodkan setiap
-s pasangan asas bacaan-a (lalai 100bp). Bacaan dibandingkan dalam kedua-dua orientasi dan
penjajaran tempatan yang memenuhi kriteria adalah output kepada salah satu daripada beberapa fail yang dicipta yang diterangkan
di bawah. The -v pilihan menghidupkan mod pelaporan verbose yang memberikan statistik pada setiap satu
langkah utama pengiraan.
Pilihannya -k, -h, dan -w mengawal carian penapisan awal untuk kemungkinan padanan
antara bacaan. Khususnya, kod carian kami mencari sepasang jalur pepenjuru lebar
2^w (lalai 2^6 = 64) yang mengandungi koleksi k-mers padanan tepat (lalai 14)
antara kedua-dua bacaan, supaya jumlah bilangan pangkalan yang diliputi oleh hits k-mer ialah h
(lalai 35). k tidak boleh lebih besar daripada 32 dalam pelaksanaan semasa. Sekiranya -b pilihan
ditetapkan, maka daligner menganggap data mempunyai bias komposisi yang kuat (cth. >65% AT
kaya), dan dengan kos lebih sedikit masa, melaraskan saiz k-mer secara dinamik bergantung pada
bias komposisi, supaya mers yang digunakan mempunyai kekhususan berkesan 4^k.
Jika terdapat satu atau lebih trek selang yang ditentukan dengan -m pilihan, kemudian bacaan daripada
DB atau DB yang digunakan topeng adalah bertopeng lembut dengan gabungan selang
daripada semua trek selang yang digunakan, iaitu mana-mana k-mers yang mengandungi sebarang asas dalam mana-mana
selang bertopeng diabaikan untuk tujuan pembenihan perlawanan. Trek selang waktu
ialah trek, seperti trek "debu" yang dicipta oleh DBdust, yang mengekodkan set selang
atas sama ada DB yang tidak dipangkas atau dipangkas.
Selalunya, sesetengah k-mer diwakili dengan ketara (contohnya larian homopolimer).
K-mers ini mencipta bilangan pasangan k-mer padanan yang berlebihan dan dibiarkan tanpa ditangani
menyebabkan daligner melimpahi memori fizikal yang ada. Satu cara untuk menangani perkara ini adalah dengan
secara eksplisit menetapkan -t parameter yang menyekat penggunaan mana-mana k-mer yang berlaku lebih banyak
daripada t kali sama ada dalam subjek atau blok sasaran. Walau bagaimanapun, cara yang lebih baik untuk mengendalikan
situasi adalah untuk membiarkan program secara automatik memilih nilai t yang memenuhi yang diberikan
had penggunaan memori yang ditentukan (dalam Gb) oleh -M parameter. Secara lalai daligner akan guna
jumlah memori fizikal sebagai pilihan untuk -M. Jika anda ingin menggunakan lebih sedikit, katakan hanya 8Gb
pada nod kluster HPC 24Gb kerana anda ingin menjalankan 3 daligner kerja pada nod, kemudian
nyatakan -M8. Menentukan -M0 pada dasarnya menunjukkan bahawa anda tidak mahu daligner kepada diri sendiri
laraskan penindasan k-mer agar muat dalam jumlah memori tertentu.
Untuk setiap subjek, sasarkan pasangan blok, katakan X dan Y, program melaporkan penjajaran di mana
a-baca dalam X dan b-baca dalam Y, dan begitu juga sebaliknya. Walau bagaimanapun, jika -A pilihan adalah
set ("A" untuk "asymmetric") kemudian hanya bertindih di mana a-read berada dalam X dan b-read ialah
dalam Y dilaporkan, dan jika X = Y, maka ia hanya melaporkan pertindihan yang
indeks a-baca adalah kurang daripada indeks b-baca. Dalam kedua-dua kes, jika -I pilihan ditetapkan ("I"
untuk "identiti") maka apabila X = Y, bertindih antara bahagian berlainan bacaan yang sama akan
juga ditemui dan dilaporkan.
Setiap penjajaran yang ditemui direkodkan sebagai -- a[ab,ae] x bo[bb,be] -- dengan a dan b ialah
indeks (dalam DB yang dipangkas) bagi bacaan yang bertindih, o menunjukkan sama ada bacaan b adalah
daripada untaian yang sama atau bertentangan, dan [ab,ae] dan [bb,be] ialah selang a dan bo,
masing-masing, yang sejajar. Program ini meletakkan rekod penjajaran ini dalam fail yang namanya
adalah dalam bentuk X.Y.[C|N]#.las di mana C menunjukkan bahawa bacaan-b dilengkapkan dan N
menunjukkan ia tidak (kedua-dua perbandingan dilakukan) dan # ialah urutan yang dikesan
dan menulis koleksi penjajaran yang terkandung dalam fail. Itulah failnya
X.Y.O#.las mengandungi penjajaran yang dihasilkan oleh benang # yang mana a-read adalah daripada X dan
b-baca adalah dari Y dan dalam orientasi O. Perintah daligner -A X Y menghasilkan 2*NTHREAD
fail benang X.Y.?.las dan daligner X Y menghasilkan 4*NTHREAD fail X.Y.?.las dan Y.X.?.las
(melainkan X=Y dalam kes ini hanya fail NTHREAD, X.X.?.las, dihasilkan).
Secara lalai, daligner membandingkan semua pertindihan antara bacaan dalam pangkalan data yang lebih besar
daripada set pemotongan minimum apabila DB atau DB dipecahkan, biasanya 1 atau 2 Kbp. Walau bagaimanapun,
saluran paip pemasangan HGAP hanya mahu membetulkan bacaan besar, katakan 8Kbp atau lebih, dan sebagainya
hanya memerlukan pertindihan di mana bacaan-a adalah salah satu bacaan yang besar. Dengan menetapkan -H
parameter untuk mengatakan N, satu berubah daligner supaya ia hanya melaporkan bertindih di mana a-baca
melebihi N pasangan asas panjang.
Walaupun tetapan parameter lalai bagus untuk data Pacbio mentah, daligner boleh digunakan
untuk mencari penjajaran dengan cekap dalam bacaan yang diperbetulkan atau bacaan lain yang kurang bising. Untuk
contoh, untuk aplikasi pemetaan terhadap .dams, kami jalankan
daligner -k20 -h60 -e. 85
dan pada bacaan yang diperbetulkan, kami biasanya menjalankan
daligner -k25 -w5 -h60 -e. 95 -s500
dan pada tetapan ini ia sangat pantas.
Gunakan daligner dalam talian menggunakan perkhidmatan onworks.net