Ini adalah perintah cdhit-est yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
cdhit-est - menjalankan algoritma CD-HIT pada urutan RNA/DNA
RINGKASAN
cdhit-est [Opsi]
DESKRIPSI
====== CD-HIT versi 4.6 (dibuat pada 23 Januari 2016) ======
Opsi
-i masukkan nama file dalam format fasta, diperlukan
-o nama file keluaran, diperlukan
-c ambang identitas urutan, default 0.9 ini adalah "global" cd-hit default
identitas urutan" dihitung sebagai: jumlah asam amino identik dalam keselarasan
dibagi dengan panjang penuh dari urutan yang lebih pendek
-G gunakan identitas urutan global, default 1 jika disetel ke 0, lalu gunakan urutan lokal
identitas, dihitung sebagai : jumlah asam amino identik dalam kesejajaran dibagi dengan
panjang pelurusan CATATAN!!! jangan gunakan -G 0 kecuali Anda menggunakan perataan
kontrol cakupan lihat opsi -Al, -AL, -sebagai, -SEBAGAI
-b band_width penyelarasan, default 20
-M batas memori (dalam MB) untuk program, default 800; 0 untuk tidak terbatas;
-T jumlah utas, default 1; dengan 0, semua CPU akan digunakan
-n word_length, default 10, lihat panduan pengguna untuk memilihnya
-l panjang throw_away_sequences, default 10
-d panjang deskripsi dalam file .clstr, default 20 jika disetel ke 0, dibutuhkan fasta
defline dan berhenti di ruang pertama
-s cutoff perbedaan panjang, default 0.0 jika diatur ke 0.9, urutan yang lebih pendek perlu
setidaknya 90% panjang dari perwakilan cluster
-S perbedaan panjang cutoff dalam asam amino, default 999999 jika diatur ke 60, panjangnya
perbedaan antara urutan yang lebih pendek dan perwakilan dari cluster dapat
tidak lebih besar dari 60
-Al cakupan keselarasan untuk urutan yang lebih panjang, default 0.0 jika diatur ke 0.9, the
keselarasan harus mencakup 90% dari urutan
-AL kontrol cakupan penyelarasan untuk urutan yang lebih panjang, default 99999999 jika diatur ke 60,
dan panjang barisannya adalah 400, maka penjajarannya harus >= 340 (400-60)
residu
-sebagai cakupan keselarasan untuk urutan yang lebih pendek, default 0.0 jika diatur ke 0.9, the
keselarasan harus mencakup 90% dari urutan
-SEBAGAI kontrol cakupan penyelarasan untuk urutan yang lebih pendek, default 99999999 jika diatur ke 60,
dan panjang barisannya adalah 400, maka penjajarannya harus >= 340 (400-60)
residu
-A kontrol cakupan penyelarasan minimal untuk kedua urutan, penyelarasan default 0 harus
cover >= nilai ini untuk kedua urutan
-uL persentase tak tertandingi maksimum untuk urutan yang lebih panjang, default 1.0 jika diatur ke 0.1,
wilayah yang tidak ada bandingannya (tidak termasuk celah leading dan tailing) tidak boleh lebih dari 10%
dari urutan
-kita persentase tak tertandingi maksimum untuk urutan yang lebih pendek, default 1.0 jika diatur ke 0.1,
wilayah yang tidak ada bandingannya (tidak termasuk celah leading dan tailing) tidak boleh lebih dari 10%
dari urutan
-U panjang maksimum yang tak tertandingi, default 99999999 jika diatur ke 10, wilayah yang tak tertandingi
(tidak termasuk celah terkemuka dan tailing) tidak boleh lebih dari 10 pangkalan
-B 1 atau 0, default 0, secara default, urutan disimpan dalam RAM jika diatur ke 1, urutan
disimpan di hard drive disarankan untuk digunakan -B 1 untuk database besar
-p 1 atau 0, default 0 jika disetel ke 1, perataan cetak tumpang tindih dalam file .clstr
-g 1 atau 0, default 0 oleh algoritme default cd-hit, urutan dikelompokkan ke
cluster pertama yang memenuhi ambang batas (fast cluster). Jika disetel ke 1, program akan
mengelompokkannya ke dalam cluster yang paling mirip yang memenuhi ambang batas (akurat tapi lambat
mode) tetapi 1 atau 0 tidak akan mengubah perwakilan kluster akhir
-r 1 atau 0, default 1, secara default lakukan perataan +/+ & +/- jika disetel ke 0, hanya +/+
keselarasan untai
-topeng huruf penutup (mis -topeng NX, untuk menutupi 'N' dan 'X')
-pertandingan skor yang cocok, default 2 (1 untuk TU dan NN)
-ketidakcocokan
skor tidak cocok, default -2
-celah skor pembukaan celah, default -6
-celah-ext
skor ekstensi kesenjangan, default -1
-bak tulis file cluster cadangan (1 atau 0, default 0)
-h cetak bantuan ini
Pertanyaan, bug, hubungi Limin Fu di [email dilindungi], atau Weizhong Li at [email dilindungi]
Untuk versi dan informasi terbaru, silakan kunjungi: http://cd-hit.org
server web cd-hit juga tersedia dari http://cd-hit.org
Jika Anda merasa cd-hit bermanfaat, silakan kutip:
"Pengelompokan urutan yang sangat homolog untuk mengurangi ukuran protein besar
database", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatika, (2001)
17:282-283 "Cd-hit: program cepat untuk mengelompokkan dan membandingkan kumpulan besar
urutan protein atau nukleotida", Weizhong Li & Adam Godzik. Bioinformatika, (2006)
22: 1658-1659
Gunakan cdhit-est online menggunakan layanan onworks.net