GoGPT Best VPN GoSearch

favorit OnWorks

vsearch-gz - Online di Cloud

Jalankan vsearch-gz di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah vsearch-gz yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


vsearch — deteksi chimera, clustering, dereplication, masking, pairwise alignment,
mencari, mengacak, dan menyortir amplikon dari proyek metagenomik.

RINGKASAN


Deteksi chimera:
vsearch --uchime_denovo fastafile (--chimera | --nonchimera | --uchimealns |
--uchimeout) berkas keluaran [Pilihan]

vsearch --uchime_ref fastafile (--chimera | --nonchimera | --uchimealns |
--uchimeout) berkas keluaran --db fastafile [Pilihan]

Pengelompokan:
vsearch (--cluster_fast | --cluster_size | --cluster_smallmem) fastafile (--hampir
| --blast6out | --centroid | --cluster | --msaout | --samout | --uc | --pengguna keluar)
berkas keluaran --Indo nyata [Pilihan]

Dereplikasi:
vsearch --derep_panjang penuh fastafile (--keluaran | --uc) berkas keluaran [Pilihan]

Penyembunyian:
vsearch --maskfasta fastafile --keluaran berkas keluaran [Pilihan]

Penjajaran berpasangan:
vsearch --allpairs_global fastafile (--alnout | --blast6out | --cocok |
--tidak cocok | --samout | --uc | --pengguna keluar) berkas keluaran (--terima semua | --id nyata)
[Pilihan]

Mencari:
vsearch --usearch_global fastafile --db fastafile (--alnout | --blast6out |
--samout | --uc | --pengguna keluar) berkas keluaran --Indo nyata [Pilihan]

Mengacak:
vsearch --mengacak fastafile --keluaran berkas keluaran [Pilihan]

Penyortiran:
vsearch (--urutkan berdasarkan panjang | --urutkan berdasarkan ukuran) fastafile --keluaran berkas keluaran [Pilihan]

DESKRIPSI


Studi keragaman molekuler lingkungan atau klinis menghasilkan volume besar amplikon
(misalnya urutan SSU-rRNA) yang perlu diperiksa untuk chimeras, dereplicated, masked,
diurutkan, dicari, dikelompokkan atau dibandingkan dengan urutan referensi. Tujuan dari vsearch adalah untuk
menawarkan alat open source all-in-one untuk melakukan tugas-tugas ini, menggunakan algoritma yang dioptimalkan
implementasi dan pemanenan potensi penuh dari komputer modern, sehingga menyediakan cepat
dan pengolahan data yang akurat.

Membandingkan urutan nukleotida adalah inti dari vsearch. Untuk mempercepat perbandingan, vsearch
mengimplementasikan implementasi yang sangat cepat dari algoritma Needleman-Wunsch, memanfaatkan
dari Streaming SIMD Extensions (SSE2) dari CPU x86-64 modern. Jika instruksi SSE2 adalah
tidak tersedia, vsearch keluar dengan pesan kesalahan. Untuk perbandingan yang melibatkan barisan
lebih dari 5,000 nukleotida, vsearch menggunakan metode penyelarasan yang lebih lambat dengan memori yang lebih kecil
persyaratan.

Memasukkan
vsearch input adalah file fasta yang berisi satu atau beberapa urutan nukleotida. Untuk setiap
urutan, pengidentifikasi urutan didefinisikan sebagai string yang terdiri antara ">"
simbol dan spasi pertama, atau akhir baris, mana saja yang lebih dulu. Selain itu,
jika baris dimulai dengan ">[;]size=bilangan bulat;label", berisi ">label;size=bilangan bulat;label" atau
diakhiri dengan ">label;size=bilangan bulat[;]", vsearch akan menghapus pola [;]size=bilangan bulat[;]
dari tajuk dan tafsirkan bilangan bulat sebagai jumlah kemunculan (atau kelimpahan) dari
urutan dalam studi. Informasi kelimpahan itu digunakan atau dibuat selama chimera
deteksi, pengelompokan, dereplikasi, pengurutan, dan pencarian.

Urutan nukleotida didefinisikan sebagai string simbol IUPAC (ACGTURYSWKMDBHVN),
dimulai setelah akhir baris pengenal dan berakhir sebelum baris pengenal berikutnya,
atau akhir file. vsearch diam-diam mengabaikan karakter ascii 9 hingga 13, dan keluar dengan
pesan kesalahan jika karakter ascii 0 hingga 8, 14 hingga 31, "." atau "-" hadir. Semua lainnya
karakter ascii atau non-ascii dilucuti dan dikeluhkan dalam peringatan non-pemblokiran
pesan.

vsearch operasi tidak peka huruf besar/kecil, kecuali jika soft masking diaktifkan. Ketika menggunakan
clustering, masking atau searching perintah, kasus ini penting jika soft masking digunakan.
Soft masking ditentukan dengan opsi "--dbmask soft" (untuk pencarian) atau "--qmask
soft" (untuk pencarian, pengelompokan dan masking). Saat menggunakan soft masking, huruf kecil
menunjukkan simbol bertopeng, sedangkan huruf besar menunjukkan simbol biasa. Simbol bertopeng
tidak pernah termasuk dalam keunikan k-mers digunakan dalam pencarian. Saat soft masking tidak
diaktifkan, semua huruf diubah menjadi huruf besar secara internal dan digunakan dalam file hasil.

Saat membandingkan urutan selama deteksi chimera, dereplikasi, pencarian dan
pengelompokan, T dan U dianggap identik, terlepas dari kasusnya. Jika dua simbol adalah
tidak identik, penyelarasannya akan menghasilkan skor ketidakcocokan negatif (default -4),
kecuali jika salah satu atau kedua simbolnya ambigu (RYSWKMDBHVN) dalam hal ini skornya
adalah nol. Penjajaran dua simbol ambigu yang identik (misalnya R vs R) juga menerima skor
dari nol.

vsearch dapat dikompilasi ke file fasta terkompresi yang diterima sebagai input (gz dan bzip2
format). Di sisi lain, file khusus seperti pipa, pipa bernama, atau soket tidak dapat
digunakan sebagai masukan. Untuk menyajikan indikator kemajuan, vsearch perlu mencari sampai akhir
nama file untuk mencari panjangnya. Akibatnya, nama file harus berupa file biasa, bukan aliran.

Opsi
vsearch mengenali sejumlah besar opsi baris perintah. Untuk navigasi yang lebih mudah, opsi
dikelompokkan di bawah ini berdasarkan tema (deteksi chimera, pengelompokan, dereplikasi, penyembunyian,
mengacak, menyortir, dan mencari). Kami mulai dengan opsi umum yang berlaku untuk semua
tema.

Pilihan umum:

--fasta_width positif bilangan bulat
File Fasta diproduksi oleh vsearch dibungkus (urutan ditulis pada
garis bilangan bulat nukleotida, 80 secara default). Tetapkan nilai itu ke 0 ke
menghilangkan pembungkus.

--membantu Tampilkan bantuan singkat dan keluar.

--catatan nama file
Tulis pesan ke file log yang ditentukan. Informasi tertulis meliputi:
versi program, jumlah memori yang tersedia, jumlah inti dan perintah
pilihan baris. Waktu mulai dan selesai juga dicatat serta
waktu berlalu. Jumlah maksimum memori yang dikonsumsi disertakan. NS
perintah yang berbeda biasanya juga akan menulis beberapa informasi tentang
hasil. Baik fatal, peringatan dan pesan informasi ditulis.

--maxseqlength positif bilangan bulat
Semua vsearch operasi akan membuang urutan dengan panjang yang sama atau lebih besar
dari bilangan bulat (50,000 nukleotida secara default).

--minseqpanjang positif bilangan bulat
Semua vsearch operasi akan membuang urutan panjang lebih kecil dari
bilangan bulat (1 nukleotida secara default untuk menyortir atau mengacak, 32 nukleotida
untuk pengelompokan, dereplikasi atau pencarian).

--notrunclabels
Jangan memotong label urutan di spasi pertama, gunakan header lengkap di
file keluaran.

--diam Tekan semua output ke stdout dan stdout kecuali untuk peringatan dan fatal
pesan kesalahan.

--Versi: kapan
Keluarkan informasi versi dan keluar.

Opsi deteksi chimera:

Deteksi chimera didasarkan pada fungsi penilaian yang dikendalikan oleh lima opsi (--dn,
--mindiff, --mindiv, --minh, --xn). Urutan pertama diurutkan berdasarkan penurunan
kelimpahan (jika tersedia), dan dibandingkan dengan plus untai saja (kasus
tidak peka).

In de baru mode, masukan file fasta harus menyajikan anotasi kelimpahan (pola
[;]ukuran=bilangan bulat[;] di header fasta). Urutan input memengaruhi chimera
deteksi, jadi kami menyarankan untuk mengurutkan urutan dengan mengurangi kelimpahan (default dari
--derep_fulllength perintah). Jika rangkaian urutan Anda perlu diurutkan, silakan lihat
perintah --sortbysize di bagian pengurutan.

--abskew nyata
Saat menggunakan --uchime_denovo, kemiringan kelimpahan digunakan untuk membedakan dalam a
Penjajaran 3 arah yang urutannya adalah chimera dan mana yang menjadi parent.
Asumsinya adalah bahwa chimera muncul kemudian dalam amplifikasi PCR
proses dan karena itu kurang melimpah dari orang tua mereka. Standarnya
nilainya adalah 2.0, yang berarti bahwa orang tua harus setidaknya 2 kali lebih banyak
berlimpah dari chimera mereka. Nilai positif apa pun yang lebih besar dari 1.0 dapat menjadi
bekas.

--sejajarkan lebar positif bilangan bulat
Lebar keberpihakan 3 arah dalam keluaran --uchimealns. Nilai defaultnya adalah
80. Atur ke 0 untuk menghilangkan pembungkus.

--chimera nama file
Keluarkan urutan chimeric ke nama file, dalam format cepat. Pesanan keluaran mungkin
bervariasi saat menggunakan banyak utas.

--db nama file
Saat menggunakan --uchime_ref, deteksi chimera menggunakan format cepat
urutan referensi yang terkandung dalam nama file. Urutan referensi diasumsikan
menjadi bebas chimera. Chimera tidak akan terdeteksi jika orang tuanya (atau
kerabat yang cukup dekat) tidak ada dalam database.

--dn nyata
Tidak ada penghitungan suara semu (parameter n dalam fungsi penilaian chimera)
(nilai default adalah 1.4).

--mindiff positif bilangan bulat
Jumlah minimum perbedaan per segmen (nilai default adalah 3).

--pikiran nyata
Divergensi minimum dari induk terdekat (nilai default adalah 0.8).

--minh nyata
Skor minimal (h). Meningkatkan nilai ini cenderung mengurangi jumlah
positif palsu dan untuk mengurangi sensitivitas. Nilai defaultnya adalah 0.28, dan
nilai mulai dari 0.0 hingga 1.0 termasuk diterima.

--nonchimera nama file
Keluarkan urutan non-chimeric ke nama file, dalam format cepat. Urutan keluaran
mungkin berbeda saat menggunakan beberapa utas.

--diri sendiri Saat menggunakan --uchime_ref, abaikan urutan referensi saat labelnya
cocok dengan label urutan kueri (berguna untuk memperkirakan positif palsu
tingkat dalam urutan referensi).

--selfie Saat menggunakan --uchime_ref, abaikan urutan referensi saat nukleotidanya
urutan benar-benar identik dengan urutan kueri.

--utas positif bilangan bulat
Jumlah utas komputasi yang akan digunakan (1 hingga 256) dengan --uchime_ref. NS
jumlah utas harus lebih kecil atau sama dengan jumlah CPU yang tersedia
inti. Standarnya adalah menggunakan semua sumber daya yang tersedia dan meluncurkannya
utas per inti logis.

--uchime_denovo nama file
Deteksi chimera yang ada dalam format fasta nama file, tanpa eksternal
referensi (yaitu de baru). Secara otomatis mengurutkan urutan dalam nama file by
penurunan kelimpahan sebelumnya (lihat bagian penyortiran untuk detailnya).
Multithreading tidak didukung.

--uchime_ref nama file
Deteksi chimera yang ada dalam format fasta nama file dengan membandingkannya
dengan urutan referensi (opsi --db). Multithreading didukung.

--uchimealns nama file
Tulis keberpihakan global 3 arah (parentA, parentB, chimera) ke nama file
menggunakan format yang dapat dibaca manusia. Gunakan --alignwidth untuk mengubah perataan
panjang. Urutan keluaran dapat bervariasi saat menggunakan beberapa utas.

--uchimeout nama file
Tulis hasil deteksi chimera ke nama file menggunakan tab-dipisahkan uchime
format 18 bidang (lihat daftar di bawah). Gunakan --uchimeout5 untuk menggunakan format
kompatibel dengan userarch v5 dan versi sebelumnya. Urutan keluaran baris mungkin
bervariasi saat menggunakan banyak utas.

1. skor: skor yang lebih tinggi berarti keselarasan chimeric yang lebih mungkin.

2. T: label urutan kueri.

3. A: induk Sebuah label urutan.

4. B: label urutan B induk.

5. T: label urutan induk teratas (yaitu induk yang paling mirip dengan
pertanyaan). Bidang itu dihapus saat menggunakan --uchimeout5.

6. idQM: persentase kesamaan query (Q) dan model (M)
dibangun sebagai bagian dari induk A dan bagian dari induk B.

7. idQA : persentase kemiripan query (Q) dan parent A.

8. idQB : persentase kemiripan query (Q) dan parent B.

9. idAB : persentase kemiripan induk A dan induk B.

10. idQT : persentase kemiripan query (Q) dan top parent (T).

11. LY: ya suara di bagian kiri model.

12. LN: tidak ada suara di bagian kiri model.

13. LA: suara abstain di bagian kiri model.

14. RY: ya suara di bagian kanan model.

15. RN: tidak ada suara di bagian kanan model.

16. RA: suara abstain di bagian kanan model.

17. div: divergensi, didefinisikan sebagai (idQM - idQT).

18. YN: kueri adalah chimeric (Y), atau tidak (N), atau merupakan kasus batas
(?).

--uchimeout5
Saat menggunakan --uchimeout, tulis hasil deteksi chimera menggunakan tab-
format terpisah dari 17 bidang (lepaskan bidang ke-5 dari --uchimeout),
kompatibel dengan userarch versi 5 dan versi sebelumnya.

--xn nyata
Tidak ada bobot suara (parameter beta dalam fungsi penilaian) (nilai defaultnya adalah
8.0).

Opsi pengelompokan:

vsearch mengimplementasikan algoritma pengelompokan bintang serakah single-pass, mirip dengan
algoritma diimplementasikan di userarch, DNAclust dan sumaclust misalnya. Penting
parameternya adalah ambang pengelompokan global (--id) dan identitas berpasangan
definisi (--iddef).

--centroid nama file
Keluarkan urutan centroid cluster ke nama file, dalam format cepat. NS
centroid adalah urutan yang menyemai cluster (yaitu urutan pertama
dari klaster).

--cluster_fast nama file
Kelompokkan urutan fasta di nama file, secara otomatis melakukan a
menyortir dengan mengurangi panjang urutan sebelumnya.

--ukuran kelompok nama file
Kelompokkan urutan fasta di nama file, secara otomatis melakukan a
penyortiran dengan mengurangi kelimpahan urutan terlebih dahulu.

--cluster_smallmem nama file
Kelompokkan urutan fasta di nama file tanpa memodifikasi secara otomatis
pesanan mereka sebelumnya. Urutan diharapkan diurutkan berdasarkan penurunan
panjang urutan, kecuali --usersort digunakan.

--cluster string
Keluarkan setiap cluster ke file fasta terpisah menggunakan awalan string dan
ticker (0, 1, 2, dll.) untuk membangun jalur dan nama file.

--konsumen nama file
Keluarkan urutan konsensus cluster ke nama file. Untuk setiap cluster,
beberapa keselarasan dihitung, dan urutan konsensus dibangun oleh
mengambil simbol mayoritas (nukleotida atau celah) dari setiap kolom
penyelarasan. Kolom yang berisi sebagian besar celah dilewati, kecuali untuk
celah terminal.

--Indo nyata
Jangan menambahkan target ke cluster jika identitas berpasangan dengan
pusatnya lebih rendah dari nyata (nilai mulai dari 0.0 hingga 1.0 disertakan). NS
identitas berpasangan didefinisikan sebagai jumlah (kolom yang cocok) /
(panjang keselarasan - celah terminal). Definisi tersebut dapat dimodifikasi dengan
--iddef.

--iddef 0|1|2|3|4
Ubah definisi identitas berpasangan yang digunakan di --id. Nilai yang diterima adalah:

0. Definisi CD-HIT: (kolom yang cocok) / (urutan terpendek
panjangnya).

1. edit jarak: (kolom yang cocok) / (panjang perataan).

2. edit jarak tidak termasuk celah terminal (sama seperti --id).

3. Definisi Lab Biologi Kelautan menghitung setiap celah yang diperpanjang
(internal atau terminal) sebagai satu perbedaan: 1.0 -
[(ketidakcocokan + celah)/(panjang urutan terpanjang)]

4. Definisi BLAST, setara dengan --iddef 2 dalam konteks
keselarasan berpasangan global.

--msa keluar nama file
Keluarkan penyelarasan beberapa urutan dan urutan konsensus untuk masing-masing
mengelompok ke nama file, dalam format cepat. Urutan konsensus adalah
dibangun dengan mengambil simbol mayoritas (nukleotida atau celah) dari masing-masing
kolom pelurusan. Kolom yang mengandung sebagian besar celah adalah
dilewati, kecuali untuk celah terminal.

--qmask tidak ada|debu|lembut
Tutupi pengulangan sederhana dan daerah dengan kompleksitas rendah secara berurutan menggunakan debu
atau itu lembut algoritma, atau tidak menutupi (tak satupun). Peringatan, saat menggunakan lembut
masking, clustering menjadi case sensitive. Standarnya adalah untuk menutupi menggunakan
debu.

--ukuran Mempertimbangkan anotasi kelimpahan yang ada di fasta input
file (cari pola "[>;]size=bilangan bulat[;]" di header urutan).

--ukuran keluar
Tambahkan anotasi kelimpahan ke file fasta keluaran (tambahkan polanya
";ukuran=bilangan bulat;" untuk mengurutkan header). Jika --sizein ditentukan, kelimpahan
anotasi dilaporkan ke file keluaran, dan setiap cluster centroid
menerima nilai kelimpahan baru yang sesuai dengan total kelimpahan
amplikon termasuk dalam cluster (--centroids option). Jika --sizein tidak
ditentukan, kelimpahan input diatur ke 1 untuk amplikon, dan ke nomor
amplikon per cluster untuk centroid.

--untai ditambah|keduanya
Saat membandingkan urutan dengan benih cluster, periksa plus untai saja
(default) atau centang kedua untaian.

--utas positif bilangan bulat
Jumlah utas komputasi yang akan digunakan (1 hingga 256). Jumlah benang
harus lebih kecil atau sama dengan jumlah core CPU yang tersedia. NS
defaultnya adalah menggunakan semua sumber daya yang tersedia dan meluncurkan satu utas per
inti logis.

--uc nama file
Pengelompokan keluaran menghasilkan nama file menggunakan format seperti uclust. Untuk sebuah
deskripsi format, lihat
<http://www.drive5.com/usearch/manual/ucout.html>.

--urutan pengguna
Saat menggunakan --cluster_smallmem, izinkan urutan input urutan apa pun, bukan hanya a
pengurangan panjang pemesanan.

Sebagian besar opsi pencarian juga berlaku untuk pengelompokan:
--alnout, --blast6out, --fastapars, --matched, --notmatched, --maxaccept,
--maxreject, --samout, --userout, --userfields, pemfilteran skor, celah
hukuman, penyamaran. (lihat bagian Pencarian).

Opsi dereplikasi:

--derep_panjang penuh nama file
Gabungkan urutan yang sangat identik yang terkandung dalam nama file. Identik
barisan didefinisikan memiliki panjang yang sama dan string yang sama dari
nukleotida (tidak peka huruf besar/kecil, T dan U dianggap sama).

--ukuran maksimal positif bilangan bulat
Buang urutan dengan nilai kelimpahan lebih besar dari bilangan bulat.

--ukuran kecil positif bilangan bulat
Buang urutan dengan nilai kelimpahan lebih kecil dari bilangan bulat.

--keluaran nama file
Tulis urutan yang tidak direplikasi menjadi nama file, dalam format fasta dan diurutkan
dengan mengurangi kelimpahan. Urutan yang identik menerima header dari
urutan pertama kelompok mereka. Jika --sizeout digunakan, jumlah
kejadian (yaitu kelimpahan) dari setiap urutan ditunjukkan pada akhir
header fasta mereka menggunakan pola ";size=bilangan bulat;".

--ukuran Mempertimbangkan anotasi kelimpahan yang ada di fasta input
file (cari pola "[>;]size=bilangan bulat[;]" di header urutan).

--ukuran keluar
Tambahkan anotasi kelimpahan ke file fasta keluaran (tambahkan polanya
";ukuran=bilangan bulat;" untuk mengurutkan header). Jika --sizein ditentukan, masing-masing
urutan unik menerima nilai kelimpahan baru yang sesuai dengan totalnya
kelimpahan (jumlah kelimpahan kejadiannya). Jika --sizein tidak
ditentukan, kelimpahan input diatur ke 1, dan setiap urutan unik
menerima nilai kelimpahan baru yang sesuai dengan jumlah kemunculannya
dalam berkas masukan.

--untai ditambah|keduanya
Saat mencari urutan yang benar-benar identik, periksa plus untai
hanya (default) atau centang kedua untaian.

--topn positif bilangan bulat
Keluarkan hanya bagian atas bilangan bulat urutan (yaitu yang paling melimpah).

--uc nama file
Dereplikasi keluaran menghasilkan nama file menggunakan format seperti uclust. Untuk sebuah
deskripsi format, lihat
<http://www.drive5.com/usearch/manual/ucout.html>. Dalam konteks
dereplikasi, opsi --uc_allhits tidak berpengaruh pada keluaran --uc.

Opsi penyamaran:

Urutan input dapat terdiri dari nukleotida huruf kecil atau besar. Huruf kecil
nukleotida diam-diam diatur ke huruf besar sebelum menutupi, kecuali --qmask soft
opsi digunakan. Berikut adalah hasil dari opsi masking gabungan --qmask (atau
--dbmask untuk urutan database) dan --hardmask, dengan asumsi setiap urutan input
mengandung nukleotida huruf kecil dan huruf besar:

aksi topeng keras qmask
────────────────────────────────────────────────── ─────────────────
tidak ada off no masking, semua simbol huruf besar
none on no masking, semua simbol huruf besar
bersihkan simbol bertopeng dengan huruf kecil, yang lain huruf besar
debu pada simbol bertopeng diubah menjadi Ns, yang lain huruf besar
simbol huruf kecil yang lembut disamarkan, tidak ada perubahan huruf besar
lembut pada simbol huruf kecil disamarkan dan diubah menjadi Ns

--topeng keras
Tutupi wilayah dengan kompleksitas rendah dengan menggantinya dengan Ns alih-alih pengaturan
mereka untuk huruf kecil.

--maskfasta nama file
Topeng pengulangan sederhana dan daerah dengan kompleksitas rendah dalam urutan yang terkandung dalam
nama file. Standarnya adalah untuk menutupi menggunakan debu (gunakan --qmask untuk mengubahnya
perilaku).

--keluaran nama file
Tulis urutan bertopeng ke nama file, dalam format cepat.

--qmask tidak ada|debu|lembut
Tutupi pengulangan sederhana dan daerah dengan kompleksitas rendah secara berurutan menggunakan debu
atau itu lembut algoritma, atau tidak menutupi (tak satupun). Standarnya adalah untuk menutupi
menggunakan debu.

--utas positif bilangan bulat
Jumlah utas komputasi yang akan digunakan (1 hingga 256). Jumlah benang
harus lebih kecil atau sama dengan jumlah core CPU yang tersedia. NS
defaultnya adalah menggunakan semua sumber daya yang tersedia dan meluncurkan satu utas per
inti logis.

Opsi perataan berpasangan:

Hasil dari n * (n - 1) / 2 perataan berpasangan ditulis ke hasil
file yang ditentukan dengan --alnout, --blast6out, --fastapairs --matched, --notmatched,
--samout, --uc atau --userout (lihat bagian Pencarian di bawah). Tentukan baik
--acceptall opsi untuk menampilkan semua keberpihakan berpasangan, atau menentukan tingkat identitas
dengan --id untuk membuang keberpihakan yang lemah. Sebagian besar opsi terima/tolak lainnya (lihat
Opsi pencarian di bawah) juga dapat digunakan. Urutan disejajarkan pada mereka plus
untai saja.

--Terima semua
Tulis hasil semua keberpihakan ke file output. Opsi ini menimpa
semua opsi terima/tolak lainnya (termasuk --id).

--allpairs_global nama file
Lakukan penyelarasan berpasangan global yang optimal dari semua vs. semua urutan fasta
terkandung dalam nama file. Perintah ini multi-utas.

--Indo nyata
Tolak kecocokan urutan jika identitas berpasangan lebih rendah dari nyata
(nilai mulai dari 0.0 hingga 1.0 disertakan).

--utas positif bilangan bulat
Jumlah utas komputasi yang akan digunakan (1 hingga 256). Jumlah benang
harus lebih kecil atau sama dengan jumlah core CPU yang tersedia. NS
defaultnya adalah menggunakan semua sumber daya yang tersedia dan meluncurkan satu utas per
inti logis.

Opsi pencarian:

--alnout nama file
Tulis perataan global berpasangan ke nama file menggunakan yang dapat dibaca manusia
format. Gunakan --rowlen untuk mengubah panjang pelurusan. Urutan keluaran dapat bervariasi
saat menggunakan banyak utas.

--ledakan6keluar nama file
Tulis hasil pencarian ke nama file menggunakan format yang dipisahkan tab seperti ledakan
dari dua belas bidang (tercantum di bawah), dengan satu baris per pencocokan target kueri
(atau kurang cocok jika --output_no_hits digunakan). Urutan keluaran dapat bervariasi
saat menggunakan banyak utas. Output serupa dapat diperoleh dengan --userout
nama file dan --userfields
kueri+target+id+alnlen+mism+buka+qlo+qhi+tlo+thi+enilai+bit. Lengkap
daftar dan deskripsi tersedia di bagian "Userfields" ini
Buku Pegangan.

1. pertanyaan: label kueri.

2. target: label target (urutan basis data). Bidang diatur ke
"*" jika tidak ada keselarasan.

3. id: persentase identitas (nilai riil mulai dari 0.0 hingga
100.0). Identitas persentase didefinisikan sebagai 100 * (cocok
kolom) / (panjang penjajaran - celah terminal). Lihat kolom id0
ke id4 untuk definisi lain.

4. allnlen: panjang penyelarasan target kueri (jumlah
kolom). Bidang diatur ke 0 jika tidak ada perataan.

5. sama: jumlah ketidaksesuaian dalam penyelarasan (nol atau positif
nilai bilangan bulat).

6. membuka: jumlah kolom yang berisi bukaan celah (nol atau
nilai bilangan bulat positif).

7. qlo: nukleotida pertama dari kueri yang selaras dengan target.
Selalu sama dengan 1 jika ada keselarasan, 0 jika tidak.

8. qi: nukleotida terakhir dari kueri yang selaras dengan target.
Selalu sama dengan panjang penjajaran berpasangan. Lapangan
diatur ke 0 jika tidak ada keselarasan.

9. tanah: nukleotida pertama dari target yang disejajarkan dengan kueri.
Selalu sama dengan 1 jika ada keselarasan, 0 jika tidak.

10. ini: nukleotida terakhir dari target yang disejajarkan dengan kueri.
Selalu sama dengan panjang penjajaran berpasangan. Lapangan
diatur ke 0 jika tidak ada keselarasan.

11. menilai: nilai harapan (tidak dihitung untuk nukleotida
keselarasan). Selalu setel ke -1.

12. bit: skor bit (tidak dihitung untuk penyelarasan nukleotida).
Selalu disetel ke 0.

--db nama file
Bandingkan urutan kueri (ditentukan dengan --usearch_global) dengan fasta-
urutan target yang diformat yang terkandung dalam nama file, menggunakan global berpasangan
penjajaran.

--dbmask tidak ada|debu|lembut
Tutupi pengulangan sederhana dan wilayah dengan kompleksitas rendah di basis data target
urutan menggunakan debu atau itu lembut algoritma, atau tidak menutupi (tak satupun).
Peringatan, saat menggunakan lembut menyembunyikan perintah pencarian menjadi peka huruf besar/kecil.
Standarnya adalah untuk menutupi menggunakan debu.

--dbcocok nama file
Tulis urutan target basis data yang cocok dengan setidaknya satu urutan kueri ke
nama file, dalam format cepat. Jika opsi --sizeout digunakan, jumlah
kueri yang cocok dengan setiap urutan target ditunjukkan menggunakan pola
";ukuran=bilangan bulat;".

--dbtidakcocok nama file
Tulis urutan target basis data yang tidak cocok dengan urutan kueri ke nama file,
dalam format cepat.

--fastapars nama file
Tulis perataan berpasangan dari urutan kueri dan target ke nama filedi
format cepat.

--penuhdp Opsi dummy untuk kompatibilitas dengan userarch. Untuk memaksimalkan pencarian
kepekaan, vsearch menggunakan 8-way 16-bit SIMD vectorized full dynamic
algoritma pemrograman (Needleman-Wunsch), apakah --fulldp adalah
ditentukan.

--gapext string
Tetapkan hukuman untuk perpanjangan celah. Lihat --gapopen untuk lengkapnya
deskripsi sistem deklarasi penalti. Standarnya adalah untuk
inisialisasi enam celah yang memperpanjang penalti menggunakan penalti 2 untuk
memperpanjang celah internal dan penalti 1 untuk memperpanjang celah terminal, dalam
baik query dan urutan target (yaitu 2I/1E).

--celah terbuka string
Tetapkan penalti untuk celah yang terbuka. Pembukaan celah dapat terjadi dalam enam perbedaan
konteks: dalam kueri (Q) atau dalam urutan target (T), di sebelah kiri (L)
atau ekstremitas kanan (R) dari barisan, atau di dalam barisan (I).
Simbol urutan (Q dan T) dapat digabungkan dengan simbol lokasi (L, I,
dan R), dan nilai numerik untuk menyatakan penalti untuk semua kemungkinan
konteks: aQL/bQI/cQR/dTL/eTI/fTR, di mana abcdef adalah nol atau positif
bilangan bulat, dan "/" digunakan sebagai pemisah.
Untuk menyederhanakan deklarasi, simbol lokasi (L, I, dan R) dapat menjadi
digabungkan, simbol (E) dapat digunakan untuk mengobati kedua ekstremitas (L dan R)
sama, dan simbol Q dan T dapat dihilangkan untuk memperlakukan kueri dan target
urutan secara merata. Misalnya, defaultnya adalah mendeklarasikan penalti 20
untuk membuka celah internal dan penalti 2 untuk membuka celah terminal
(kiri atau kanan), dalam urutan kueri dan target (yaitu 20I/2E). Jika hanya
nilai numerik diberikan, tanpa urutan atau simbol lokasi, maka
penalti berlaku untuk semua bukaan celah. Untuk melarang pembukaan celah, dan
nilai pinalti tak hingga dapat dideklarasikan dengan simbol “*”. Menggunakan vsearch
sebagai pelurus semi-global, penalti nol dapat diterapkan ke kiri (L) atau
celah kanan (R).
vsearch selalu menginisialisasi enam penalti pembukaan celah menggunakan default
parameter (20I/2E). Pengguna kemudian bebas untuk mendeklarasikan nilai saja
dia ingin memodifikasi. NS string dipindai dari kiri ke kanan, diterima
simbolnya adalah (0123456789/LIREQT*), dan nilai yang lebih baru menggantikan nilai sebelumnya
nilai-nilai.
Harap dicatat bahwa vsearch, berbeda dengan userarch, hanya mengizinkan celah bilangan bulat
hukuman. Karena penalti celah terendah adalah 0.5 secara default di userarch,
semua skor default dan penalti celah di vsearch telah digandakan menjadi
mempertahankan hukuman yang setara dan untuk menghasilkan keberpihakan yang identik.

--topeng keras
Tutupi wilayah dengan kompleksitas rendah dengan menggantinya dengan Ns alih-alih pengaturan
mereka untuk huruf kecil. Untuk informasi lebih lanjut, silakan lihat bagian Masking.

--Indo nyata
Tolak kecocokan urutan jika identitas berpasangan lebih rendah dari nyata
(nilai mulai dari 0.0 hingga 1.0 disertakan). Proses pencarian mengurutkan target
barisan dengan mengurangi jumlah k-mers mereka memiliki kesamaan dengan
urutan kueri, menggunakan informasi itu sebagai proxy untuk kesamaan urutan.
Pra-pemfilteran yang efisien juga akan mencegah penyelarasan berpasangan dengan
target yang cocok dengan lemah, karena harus ada setidaknya 6 yang dibagikan k-mer ke
mulai penyelarasan berpasangan, dan setidaknya satu dari setiap 16 k-mers dari
kueri harus sesuai dengan target. Akibatnya, menggunakan nilai lebih rendah dari
--id 0.5 kemungkinan tidak akan menangkap target yang cocok dengan lebih lemah. NS
identitas berpasangan secara default didefinisikan sebagai jumlah (cocok)
kolom) / (panjang penjajaran - celah terminal). Definisi tersebut dapat
dimodifikasi oleh --iddef.

--iddef 0|1|2|3|4
Ubah definisi identitas berpasangan yang digunakan di --id. Nilai yang diterima adalah:

0. Definisi CD-HIT: (kolom yang cocok) / (urutan terpendek
panjangnya).

1. edit jarak: (kolom yang cocok) / (panjang perataan).

2. edit jarak tidak termasuk celah terminal (sama seperti --id).

3. Definisi Lab Biologi Kelautan menghitung setiap celah yang diperpanjang
(internal atau terminal) sebagai satu perbedaan: 1.0 -
[(ketidakcocokan + celah)/(panjang urutan terpanjang)]

4. Definisi BLAST, setara dengan --iddef 2 dalam konteks
keselarasan berpasangan global.

Opsi --userfields menerima bidang id0 hingga id4, selain
id bidang, untuk melaporkan nilai identitas berpasangan yang sesuai dengan
definisi yang berbeda.

--awalanid positif bilangan bulat
Tolak urutannya cocok jika yang pertama bilangan bulat nukleotida target
tidak cocok dengan kueri.

--iduffix positif bilangan bulat
Tolak urutannya cocok jika yang terakhir bilangan bulat nukleotida target do
tidak cocok dengan kueri.

--kiri saja
Tolak kecocokan urutan jika penyelarasan berpasangan dimulai dengan celah.

--cocok bilangan bulat
Skor yang ditetapkan untuk kecocokan (yaitu nukleotida identik) secara berpasangan
penyelarasan. Nilai defaultnya adalah 2.

--cocok nama file
Tulis urutan kueri yang cocok dengan urutan target basis data ke nama filedi
format cepat.

--maxaccept positif bilangan bulat
Jumlah maksimum klik yang harus diterima sebelum menghentikan pencarian. Standarnya
nilainya adalah 1. Opsi ini bekerja berpasangan dengan --maxrejects. Pencarian
proses mengurutkan urutan target dengan mengurangi jumlah k-mers yang mereka miliki di
umum dengan urutan kueri, menggunakan informasi itu sebagai proxy untuk
kesamaan urutan. Setelah penyelarasan berpasangan, jika target pertama
urutan melewati kriteria penerimaan, itu diterima sebagai hit terbaik dan
proses pencarian berhenti untuk kueri itu. Jika --maxaccepts disetel ke a
nilai yang lebih tinggi, lebih banyak hit yang diterima. Jika --maxaccepts dan --maxrejects adalah
keduanya diatur ke 0, database lengkap dicari.

--maxdiff positif bilangan bulat
Tolak kecocokan urutan jika penyelarasan mengandung setidaknya bilangan bulat
penggantian, penyisipan, atau penghapusan.

--kesenjangan maksimal positif bilangan bulat
Tolak kecocokan urutan jika penyelarasan mengandung setidaknya bilangan bulat
penyisipan atau penghapusan.

--maksimal positif bilangan bulat
Jumlah maksimum klik untuk ditampilkan setelah pencarian dihentikan (klik adalah
diurutkan berdasarkan penurunan identitas). Tidak terbatas secara default. Opsi itu berlaku
ke --alnout, --blast6out, --fastapairs, --samout, --uc, atau --userout
file keluaran.

--maksimal nyata
Tolak urutannya cocok jika persentase identitas di antara keduanya
barisan lebih besar dari nyata.

--ukuran maksimal positif bilangan bulat
Tolak urutan kueri dengan kelimpahan lebih besar dari bilangan bulat.

--maksqt nyata
Tolak jika rasio panjang urutan kueri/target lebih besar dari nyata.

--maxrejects positif bilangan bulat
Jumlah maksimum urutan target yang tidak cocok untuk dipertimbangkan sebelumnya
menghentikan pencarian. Nilai defaultnya adalah 32. Opsi ini bekerja berpasangan
dengan --maxaccepts. Proses pencarian mengurutkan urutan target dengan mengurangi
jumlah k-mers mereka memiliki kesamaan dengan urutan kueri, menggunakan itu
informasi sebagai proxy untuk kesamaan urutan. Setelah penyelarasan berpasangan,
jika tidak satu pun dari 32 urutan target yang diperiksa pertama yang lulus penerimaan
kriteria, proses pencarian berhenti untuk kueri itu (tidak ada hit). Jika
--maxrejects diatur ke nilai yang lebih tinggi, lebih banyak urutan target
dipertimbangkan. Jika --maxaccepts dan --maxrejects keduanya diset ke 0, the
database lengkap dicari.

--rasio maksimal nyata
Tolak jika rasio kelimpahan kueri/target lebih besar dari nyata.

--makssl nyata
Tolak jika rasio panjang urutan yang lebih pendek/lebih panjang lebih besar dari nyata.

--maxsubs positif bilangan bulat
Tolak kecocokan urutan jika penjajaran berpasangan berisi lebih dari
bilangan bulat substitusi.

--pertengahan nyata
Tolak kecocokan urutan jika persentase identitas lebih rendah dari nyata
(mengabaikan semua celah, internal dan terminal).

--mincol positif bilangan bulat
Tolak kecocokan urutan jika panjang pelurusan lebih pendek dari bilangan bulat.

--minqt nyata
Tolak jika rasio panjang urutan kueri/target lebih rendah dari nyata.

--ukuran kecil nyata
Tolak jika rasio kelimpahan kueri/target lebih rendah dari nyata.

--minsl nyata
Tolak jika rasio panjang urutan yang lebih pendek/lebih panjang lebih rendah dari nyata.

--ukuran mint positif bilangan bulat
Tolak urutan target dengan kelimpahan lebih rendah dari bilangan bulat.

--tidak cocok bilangan bulat
Skor ditetapkan untuk ketidakcocokan (yaitu nukleotida yang berbeda) secara berpasangan
penyelarasan. Nilai defaultnya adalah -4.

--tidak cocok nama file
Tulis urutan kueri yang tidak cocok dengan urutan target basis data ke nama file,
dalam format cepat.

--output_no_hits
Tulis kueri yang cocok dan tidak cocok ke --alnout, --blast6out,
--samout atau --userout file output (--uc dan --uc_allhits output file
selalu menampilkan kueri yang tidak cocok). Kueri yang tidak cocok diberi label
"Tidak ada hit" di file --alnout.

--qmask tidak ada|debu|lembut
Tutupi pengulangan sederhana dan wilayah dengan kompleksitas rendah dalam urutan kueri menggunakan
itu debu atau itu lembut algoritma, atau tidak menutupi (tak satupun). Peringatan, kapan
menggunakan lembut menyembunyikan perintah pencarian menjadi peka huruf besar/kecil. Standarnya adalah
untuk menutupi menggunakan debu.

--query_cov nyata
Tolak jika fraksi kueri selaras dengan urutan target adalah
lebih rendah dari nyata. Cakupan kueri dihitung sebagai (cocok + tidak cocok)
/ panjang urutan kueri. Kesenjangan internal atau terminal tidak diperhitungkan
rekening.

--benar saja
Tolak kecocokan urutan jika penjajaran berpasangan berakhir dengan celah.

--rowlen positif bilangan bulat
Lebar garis pelurusan di --alnout output. Nilai defaultnya adalah 64. Atur
ke 0 untuk menghilangkan pembungkus.

--sama nama file
Tulis hasil penyelarasan ke nama file dalam format SAM. Untuk deskripsi
formatnya, lihat . Urutan keluaran
mungkin berbeda saat menggunakan beberapa utas.

--diri sendiri Tolak kecocokan urutan jika kueri dan label target identik.

--selfie Tolak kecocokan urutan jika kueri dan urutan target benar-benar
identik.

--ukuran keluar
Tambahkan anotasi kelimpahan ke output opsi --dbmatched (menggunakan
pola ";ukuran=bilangan bulat;"), untuk melaporkan jumlah kueri yang
cocok dengan masing-masing target.

--untai ditambah|keduanya
Saat mencari urutan serupa, periksa plus untai saja (default)
atau periksa kedua untaian.

--target_cov nyata
Tolak kecocokan urutan jika fraksi dari urutan target selaras
ke urutan kueri lebih rendah dari nyata. Cakupan target dihitung
as (cocok + tidak cocok) / panjang urutan target. Internal atau terminal
kesenjangan tidak diperhitungkan.

--utas positif bilangan bulat
Jumlah utas komputasi yang akan digunakan (1 hingga 256). Jumlah benang
harus lebih kecil atau sama dengan jumlah core CPU yang tersedia. NS
defaultnya adalah menggunakan semua sumber daya yang tersedia dan meluncurkan satu utas per
inti logis.

--top_hits_only
Keluarkan hanya hit dengan persentase identitas tertinggi dengan
pertanyaan.

--uc nama file
Keluarkan hasil pencarian di nama file menggunakan format seperti uclust. Untuk sebuah
deskripsi format, lihat
<http://www.drive5.com/usearch/manual/ucout.html>. Urutan keluaran dapat bervariasi
saat menggunakan banyak utas.

--uc_allhits
Saat menggunakan opsi --uc, tampilkan semua hit, bukan hanya hit teratas untuk masing-masing
pertanyaan.

--usearch_global nama file
Bandingkan urutan target (--db) dengan urutan kueri yang diformat cepat
terkandung dalam nama file, menggunakan perataan berpasangan global.

--bidang pengguna string
Saat menggunakan --userout, pilih dan urutkan bidang yang ditulis ke output
mengajukan. Bidang dipisahkan oleh "+" (misalnya kueri+target+id). Lihat
Bagian "Userfields" untuk daftar lengkap bidang.

--penggunakeluar nama file
Tulis output yang dipisahkan oleh tab yang ditentukan pengguna ke nama file. Pilih bidang
dengan opsi --userfields. Urutan keluaran dapat bervariasi saat menggunakan beberapa
benang. Jika --userfields kosong atau tidak ada, nama file kosong.

--lemah_id nyata
Tampilkan hits dengan persentase identitas minimal nyata, tanpa
mengakhiri pencarian. Pencarian normal berhenti segera setelah cukup banyak hit
ditemukan (seperti yang didefinisikan oleh --maxaccepts, --maxrejects, dan --id). Sebagai --weak_id
melaporkan hit lemah yang tidak disimpulkan dari --maxaccepts, nilai --id tinggi
dapat digunakan, sehingga menjaga kecepatan dan sensitivitas. Logikanya, nyata
harus lebih kecil dari nilai yang ditunjukkan oleh --id.

--panjang kata positif bilangan bulat
Panjang kata (mis k-mers) untuk pengindeksan basis data. Kisaran kemungkinan
nilai berubah dari 3 menjadi 15, tetapi nilai mendekati 8 umumnya direkomendasikan.
Kata-kata yang lebih panjang dapat mengurangi kepekaan untuk kesamaan yang lemah, tetapi dapat
meningkatkan akurasi. Di sisi lain, kata-kata yang lebih pendek dapat meningkat
sensitivitas, tetapi dapat mengurangi akurasi. Waktu komputasi umumnya akan
bertambah dengan kata-kata yang lebih pendek dan berkurang dengan kata-kata yang lebih panjang. Penyimpanan
persyaratan untuk bagian dari kenaikan indeks dengan faktor 4 setiap kali
panjang kata bertambah satu nukleotida, dan ini umumnya menjadi
signifikan untuk kata-kata yang panjang (12 atau lebih). Nilai defaultnya adalah 8.

Opsi pengocokan:

--keluaran nama file
Tulis urutan yang diacak ke nama file, dalam format cepat.

--benih positif bilangan bulat
Saat mengacak urutan urutan, gunakan bilangan bulat sebagai benih. Benih yang diberikan akan
selalu menghasilkan urutan keluaran yang sama (berguna untuk replikasi). Setel ke 0
untuk menggunakan benih pseudo-acak (perilaku default).

--mengacak nama file
Pseudo-acak acak urutan urutan yang terkandung dalam nama file.

--topn positif bilangan bulat
Keluarkan hanya bagian atas bilangan bulat urutan

Opsi pengurutan:
Entri Fasta diurutkan berdasarkan penurunan kelimpahan (--sortbysize) atau panjang urutan
(--sortbylength). Untuk mendapatkan urutan penyortiran yang stabil, ikatan diurutkan berdasarkan penurunan
kelimpahan dan label meningkatkan urutan alfanumerik (--sortbylength), atau hanya dengan
label meningkatkan urutan alfa-numerik (--sortbysize). Penyortiran label mengasumsikan bahwa
semua urutan memiliki label unik. Hal yang sama berlaku untuk penyortiran otomatis
dilakukan selama pemeriksaan chimera (--uchime_denovo), dereplikasi
(--derep_fulllength), dan pengelompokan (--cluster_fast dan --cluster_size).

--ukuran maksimal positif bilangan bulat
Saat menggunakan --sortbysize, buang urutan dengan nilai kelimpahan lebih besar
dari bilangan bulat.

--ukuran kecil positif bilangan bulat
Saat menggunakan --sortbysize, buang urutan dengan nilai kelimpahan yang lebih kecil
dari bilangan bulat.

--keluaran nama file
Tulis urutan yang diurutkan ke nama file, dalam format cepat.

--label ulang string
Beri label ulang urutan menggunakan awalan string dan ticker (1, 2, 3, dll.) untuk
membangun header baru. Gunakan --sizeout untuk menghemat kelimpahan
penjelasan.

--ukuran keluar
Saat menggunakan --relabel, laporkan anotasi kelimpahan ke output fasta
file (menggunakan pola ";size=bilangan bulat;").

--urutkan menurut panjangnya nama file
Urutkan dengan mengurangi panjang urutan yang terkandung dalam nama file. Lihat
opsi umum --minseqlength dan --maxseqlength untuk menghilangkan short dan
urutan panjang.

--urutkan berdasarkan ukuran nama file
Urutkan dengan mengurangi kelimpahan urutan yang terkandung dalam nama file (The
pola "[>;]ukuran=bilangan bulat[;]" harus ada). Lihat opsi
--minsize dan --maxsize untuk menghilangkan sekuens langka dan dominan.

--topn positif bilangan bulat
Keluarkan hanya bagian atas bilangan bulat urutan (yaitu yang terpanjang atau paling banyak
melimpah).

Bidang pengguna (bidang yang diterima oleh opsi --userfields):

aln Cetak string M (cocok), D (hapus, yaitu celah dalam kueri) dan I
(masukkan, yaitu celah di target) yang mewakili keselarasan berpasangan.
Bidang kosong jika tidak ada perataan.

allnlen Cetak panjang perataan target kueri (jumlah kolom). NS
bidang diatur ke 0 jika tidak ada keselarasan.

bit Skor bit (tidak dihitung untuk penyelarasan nukleotida). Selalu disetel ke 0.

tenang Representasi ringkas dari penyelarasan berpasangan menggunakan format CIGAR
(Laporan Penyelarasan Gapped Idiosyncratic Ringkas): M (cocok), D (penghapusan)
dan saya (penyisipan). Bidang kosong jika tidak ada perataan.

menilai Nilai-E (tidak dihitung untuk penyelarasan nukleotida). Selalu setel ke -1.

ext Jumlah kolom yang berisi ekstensi celah (nol atau bilangan bulat positif
nilai).

kesenjangan Jumlah kolom yang berisi celah (nilai nol atau bilangan bulat positif).

id Persentase identitas (nilai riil berkisar antara 0.0 hingga 100.0). NS
identitas persentase didefinisikan sebagai 100 * (kolom yang cocok) / (perataan
panjang - celah terminal).

id0 Definisi CD-HIT dari persentase identitas (nilai riil mulai dari
0.0 hingga 100.0) menggunakan panjang barisan terpendek secara berpasangan
penyelarasan sebagai penyebut: 100 * (kolom yang cocok) / (urutan terpendek
panjangnya).

id1 Persentase identitas (nilai riil berkisar antara 0.0 hingga 100.0) adalah
didefinisikan sebagai jarak edit: 100 * (kolom yang cocok) / (perataan
panjangnya).

id2 Persentase identitas (nilai riil berkisar antara 0.0 hingga 100.0) adalah
didefinisikan sebagai jarak edit, tidak termasuk celah terminal. Bidang id2 adalah
alias untuk id bidang.

id3 Lab Biologi Laut definisi persentase identitas (nilai riil
mulai dari 0.0 hingga 100.0), menghitung setiap celah yang diperpanjang (internal atau
terminal) sebagai perbedaan tunggal dan menggunakan panjang terpanjang
urutan dalam perataan berpasangan sebagai penyebut: 100 * (1.0 -
[(ketidakcocokan + celah) / (panjang urutan terpanjang)]).

id4 Definisi BLAST dari persentase identitas (nilai riil mulai dari
0.0 hingga 100.0), setara dengan --iddef 2 dalam konteks berpasangan global
penjajaran.

id Jumlah kecocokan dalam perataan (nilai nol atau bilangan bulat positif).

sama Jumlah ketidakcocokan dalam perataan (nilai nol atau bilangan bulat positif).

membuka Jumlah kolom yang berisi bukaan celah (nol atau bilangan bulat positif
nilai).

pasang Jumlah kolom yang hanya berisi nukleotida. Nilai itu sesuai dengan
panjang alinyemen dikurangi kolom yang mengandung celah (nol atau
nilai bilangan bulat positif).

celah persen Jumlah kolom yang berisi celah yang dinyatakan sebagai persentase dari
panjang keselarasan (nilai nyata mulai dari 0.0 hingga 100.0).

pctpv Persentase kolom positif. Ketika bekerja dengan urutan nukleotida,
ini setara dengan persentase kecocokan (nilai sebenarnya mulai dari
0.0 ke 100.0).

pv Jumlah kolom positif. Saat bekerja dengan urutan nukleotida, ini
setara dengan jumlah kecocokan (nilai nol atau bilangan bulat positif).

qcov Bagian dari urutan kueri yang selaras dengan urutan target
(nilai nyata mulai dari 0.0 hingga 100.0). Cakupan kueri dihitung sebagai
100.0 * (cocok + tidak cocok) / panjang urutan kueri. internal atau
celah terminal tidak diperhitungkan. Bidang diatur ke 0.0 jika ada
tidak ada keselarasan.

bingkai q Bingkai kueri (-3 hingga +3). Bidang itu hanya menyangkut urutan pengkodean dan adalah
tidak dihitung dengan vsearch. Selalu atur ke +0.

qi Nukleotida terakhir dari kueri selaras dengan target. Selalu sama dengan
panjang dari keselarasan berpasangan. Bidang diatur ke 0 jika tidak ada
penjajaran.

qihi Nukleotida terakhir dari kueri yang disejajarkan dengan target (mengabaikan terminal
celah). Penomoran nukleotida dimulai dari 1. Bidang diatur ke 0 jika ada
tidak ada keselarasan.

qilo Nukleotida pertama dari kueri yang disejajarkan dengan target (mengabaikan inisial
celah). Penomoran nukleotida dimulai dari 1. Bidang diatur ke 0 jika ada
tidak ada keselarasan.

ql Panjang urutan kueri (nilai bilangan bulat positif). Bidang diatur ke 0 jika
tidak ada keselarasan.

qlo Nukleotida pertama kueri selaras dengan target. Selalu sama dengan 1
jika ada keselarasan, 0 sebaliknya.

baris Cetak urutan segmen kueri seperti yang terlihat pada perataan berpasangan
(yaitu dengan penyisipan celah jika perlu). Kolom kosong jika tidak ada
penjajaran.

qs Panjang segmen kueri. Selalu sama dengan panjang urutan kueri.

qstrand Orientasi untai kueri (+ atau - untuk urutan nukleotida). Bidang kosong jika
tidak ada keselarasan.

pertanyaan Label kueri.

mentah Skor keselarasan mentah (nilai integer negatif, nol atau positif). Nilai
adalah jumlah hadiah pertandingan dikurangi penalti ketidakcocokan, celah, dan celah
ekstensi. Bidang diatur ke 0 jika tidak ada perataan.

target Label sasaran. Bidang diatur ke "*" jika tidak ada perataan.

tcov Fraksi dari urutan target yang selaras dengan urutan kueri
(nilai nyata mulai dari 0.0 hingga 100.0). Cakupan target dihitung sebagai
100.0 * (cocok + tidak cocok) / panjang urutan target. internal atau
celah terminal tidak diperhitungkan. Bidang diatur ke 0.0 jika
tidak ada keselarasan.

bingkai Bingkai target (-3 hingga +3). Bidang itu hanya menyangkut urutan pengkodean dan adalah
tidak dihitung dengan vsearch. Selalu atur ke +0.

ini Nukleotida terakhir dari target selaras dengan kueri. Selalu sama dengan
panjang dari keselarasan berpasangan. Bidang diatur ke 0 jika tidak ada
penjajaran.

tihi Nukleotida terakhir dari target yang disejajarkan dengan kueri (mengabaikan terminal
celah). Penomoran nukleotida dimulai dari 1. Bidang diatur ke 0 jika ada
tidak ada keselarasan.

Linden Nukleotida pertama dari target yang disejajarkan dengan kueri (mengabaikan inisial
celah). Penomoran nukleotida dimulai dari 1. Bidang diatur ke 0 jika ada
tidak ada keselarasan.

tl Target panjang urutan (nilai bilangan bulat positif). Bidang diatur ke 0 jika
tidak ada keselarasan.

tanah Nukleotida pertama dari target yang disejajarkan dengan kueri. Selalu sama dengan 1
jika ada keselarasan, 0 sebaliknya.

percaya pd Cetak urutan segmen target seperti yang terlihat pada perataan berpasangan
(yaitu dengan penyisipan celah jika perlu). Kolom kosong jika tidak ada
penjajaran.

ts Panjang segmen sasaran. Selalu sama dengan panjang urutan target. Lapangan
diatur ke 0 jika tidak ada keselarasan.

untai Orientasi untai target (+ atau - untuk urutan nukleotida). Selalu atur ke
"+", jadi kecocokan untai terbalik memiliki tstrand "+" dan qstrand "-". Kosong
bidang jika tidak ada keselarasan.

DISENGAJA PERUBAHAN


Jika Anda adalah pengguna userarch, tujuan kami adalah membuat Anda merasa seperti di rumah sendiri. Itu sebabnya vsearch
dirancang untuk berperilaku seperti userarch, sampai batas tertentu. Seperti perangkat lunak kompleks lainnya, userarch adalah
tidak bebas dari keanehan dan inkonsistensi. Kami memutuskan untuk tidak mereproduksi beberapa dari mereka, dan
untuk transparansi penuh, untuk mendokumentasikan di sini perubahan yang disengaja yang kami buat.

Selama pencarian dengan userarch, saat menggunakan opsi --blast6out dan --output_no_hits, untuk
kueri tanpa kecocokan jumlah bidang yang dilaporkan adalah 13, di mana seharusnya 12. Ini adalah
dikoreksi dalam vsearch.

Bidang mentah dari opsi --userfields tidak informatif di userarch. Ini dikoreksi
in vsearch.

Bidang qlo, qhi, tlo, thi sekarang memiliki pelaporan rekanan (qilo, qihi, tilo, tihi)
koordinat keselarasan mengabaikan celah terminal.

Di userarch, saat menggunakan opsi --output_no_hits, kueri yang tidak menerima kecocokan adalah
dilaporkan dalam file blast6out, tetapi tidak dalam file output penyelarasan. Ini dikoreksi dalam
vsearch.

vsearch memperkenalkan perintah --cluster_size baru yang mengurutkan urutan dengan mengurangi
kelimpahan sebelum pengelompokan.

vsearch memperkenalkan kembali --iddef alternatif definisi identitas berpasangan yang telah dihapus
dari userarch.

vsearch memperluas opsi --topn ke perintah pengurutan.

vsearch memperluas opsi --sizein ke dereplikasi (--derep_fulllength) dan pengelompokan
(--cluster_fast).

vsearch memperlakukan T dan U sebagai nukleotida identik selama dereplikasi.

vsearch penyortiran distabilkan dengan menggunakan kelimpahan urutan atau label urutan sebagai
kunci sekunder atau tersier.

hal baru


vsearch memperkenalkan opsi baru yang tidak ada di userarch 7. Mereka dijelaskan dalam
bagian "Opsi" dari manual ini. Berikut adalah daftar singkatnya:

- alignwidth (pemeriksaan chimera)

- cluster_size (pengelompokan)

- fasta_width (opsi umum)

- iddef (pengelompokan, perataan berpasangan, pencarian)

- maxuniquesize (dereplikasi)

- mengocok (mengocok)

CONTOH


Sejajarkan semua urutan dalam database satu sama lain dan keluarkan semua perataan berpasangan:

vsearch --allpairs_global database.fas --alnout result.aln --Terima semua

Periksa keberadaan chimera (de baru); orang tua harus setidaknya 1.5 kali lebih banyak
melimpah daripada chimera. Output urutan non-chimeric dalam format fasta (tanpa pembungkus):

vsearch --uchime_denovo query.fas --nonchimera result.fas --fasta_width 0
--Abskew 1.5

Cluster dengan ambang kesamaan 97%, kumpulkan centroid cluster, dan tulis cluster
deskripsi menggunakan format seperti uclust:

vsearch --cluster_fast query.fas --id 0.97 --centroids centroids.fas --uc
cluster.uc

Dereplikasi urutan yang terkandung dalam query.fas, perhitungkan kelimpahannya
informasi sudah ada, tulis urutan yang tidak terbungkus ke output dengan kelimpahan baru
informasi, buang semua urutan dengan kelimpahan 1:

vsearch --derep_panjang penuh query.fas --keluaran query_masked.fas --ukuran
--ukuran keluar --fasta_width 0 --ukuran unik 2

Topeng pengulangan sederhana dan daerah dengan kompleksitas rendah dalam file fasta input (daerah bertopeng adalah
huruf kecil), dan tulis hasilnya ke file output:

vsearch --maskfasta query.fas --keluaran query_masked.fas --qmask debu

Cari kueri dalam database referensi, dengan ambang kesamaan 80%, ambil terminal
kesenjangan yang diperhitungkan saat menghitung kesamaan berpasangan:

vsearch --usearch_global query.fas --db referensi.fas --alnout result.aln --Indo
0.8 --iddef 1

Cari dataset urutan terhadap dirinya sendiri (abaikan self hit), dapatkan semua kecocokan dengan setidaknya
60% identitas, dan kumpulkan hasil dalam format yang dipisahkan tab seperti ledakan:

vsearch --usearch_global query.fas --db query.fas --id 0.6 --self --blast6out
result.blast6 --maxaccepts 0 --maxrejects 0

Acak file fasta input (ubah urutan urutan) dengan cara yang dapat diulang
(benih tetap), dan tulis urutan fasta yang belum dibuka ke file output:

vsearch --mengacak query.fas --keluaran query_shuffled.fas --benih 13 --fasta_width
0

Urutkan dengan mengurangi kelimpahan urutan yang terkandung dalam query.fas (menggunakan
"ukuran =bilangan bulat" informasi), beri label ulang urutan sambil menjaga kelimpahan
informasi (dengan --sizeout), pertahankan hanya urutan dengan kelimpahan yang sama atau lebih besar
dari 2:

vsearch --urutkan berdasarkan ukuran query.fas --keluaran query_sorted.fas --label ulang sampelA_
--ukuran keluar --ukuran kecil 2

PENULIS


Implementasi oleh Torbjørn Rognes dan Tomás Flouri, dokumentasi oleh Frédéric Mahé.

PELAPORAN BUG


Kirim saran dan laporan bug di , Kirim
tarik permintaan aktif , atau buat or yang ramah
e-mail kasar ke Torbjørn Rognes[email dilindungi]>.

KETERSEDIAAN


Kode sumber dan binari tersedia di .

HAK CIPTA


Hak Cipta (C) 2014, 2015 Torbjørn Rognes, Frédéric Mahé dan Tomás Flouri.

Program ini adalah perangkat lunak gratis: Anda dapat mendistribusikan ulang dan/atau memodifikasinya di bawah ketentuan
Lisensi Publik Umum GNU Affero yang diterbitkan oleh Free Software Foundation, baik
versi 3 dari Lisensi, atau versi yang lebih baru.

Program ini disebarluaskan dengan harapan dapat bermanfaat, namun TANPA JAMINAN APAPUN;
bahkan tanpa jaminan tersirat tentang KELAYAKAN DIPERDAGANGKAN atau KESESUAIAN UNTUK TUJUAN TERTENTU.
Lihat Lisensi Publik Umum GNU Affero untuk lebih jelasnya.

Anda seharusnya telah menerima salinan dari GNU Affero General Public License bersama dengan ini
program. Jika tidak, lihathttp://www.gnu.org/licenses/>.

vsearch termasuk kode dari proyek CityHash Google oleh Geoff Pike dan Jyrki Alakuijala,
menyediakan beberapa fungsi hash yang sangat baik yang tersedia di bawah lisensi MIT.

vsearch termasuk kode yang berasal dari program DUST Tatusov dan Lipman yang ada di publik
domain.

vsearch binari dapat menyertakan kode dari perpustakaan zlib, hak cipta Jean-Loup Gailly dan
Tandai Adler.

vsearch binari dapat menyertakan kode dari perpustakaan bzip2, hak cipta Julian R. Seward.

Gunakan vsearch-gz online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

Perintah Linux

Ad




×
iklan
❤️Berbelanja, pesan, atau beli di sini — tanpa biaya, membantu menjaga layanan tetap gratis.