นี่คือคำสั่ง cdhit-454 ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้หนึ่งในเวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
cd-hit-454 - จัดกลุ่มลำดับอย่างรวดเร็ว ปรับให้เหมาะสมสำหรับข้อมูล 454
เรื่องย่อ
cdhit-454 [ Options]
DESCRIPTION
====== CD-HIT เวอร์ชั่น 4.6 (สร้างเมื่อ 23 มกราคม 2016) ======
Options
-i ใส่ชื่อไฟล์ในรูปแบบ fasta, จำเป็น
-o ชื่อไฟล์เอาต์พุต จำเป็น
-c เกณฑ์เอกลักษณ์ของลำดับ ค่าเริ่มต้น 0.98 นี่คือ "เอกลักษณ์ของลำดับสากล"
คำนวณเป็น : จำนวนกรดอะมิโนที่เหมือนกันในแนวเดียวกันหารด้วยจำนวนเต็ม
ความยาวของลำดับที่สั้นกว่า + ช่องว่าง
-b band_width ของการจัดตำแหน่ง ค่าเริ่มต้น 10
-M ขีด จำกัด หน่วยความจำ (เป็น MB) สำหรับโปรแกรม ค่าเริ่มต้น 800; 0 สำหรับไม่จำกัด;
-T จำนวนเธรด ค่าเริ่มต้น 1; ด้วย 0 ซีพียูทั้งหมดจะถูกใช้
-n word_length ค่าเริ่มต้น 10 ดูคู่มือผู้ใช้สำหรับการเลือก
-aL ความครอบคลุมการจัดตำแหน่งสำหรับลำดับที่ยาวขึ้น ค่าเริ่มต้น 0.0 หากตั้งค่าเป็น 0.9 ค่า
การจัดตำแหน่งต้องครอบคลุม 90% ของลำดับ
-อัล การควบคุมความครอบคลุมการจัดตำแหน่งสำหรับลำดับที่ยาวขึ้น ค่าเริ่มต้น 99999999 หากตั้งค่าเป็น 60
และความยาวของลำดับคือ 400 ดังนั้นการจัดตำแหน่งจะต้อง >= 340 (400-60)
สารตกค้าง
-เช่น ความครอบคลุมการจัดตำแหน่งสำหรับลำดับที่สั้นกว่า ค่าเริ่มต้น 0.0 หากตั้งค่าเป็น 0.9, the
การจัดตำแหน่งต้องครอบคลุม 90% ของลำดับ
-เช่น การควบคุมความครอบคลุมการจัดตำแหน่งสำหรับลำดับที่สั้นกว่า ค่าเริ่มต้น 99999999 หากตั้งค่าเป็น 60
และความยาวของลำดับคือ 400 ดังนั้นการจัดตำแหน่งจะต้อง >= 340 (400-60)
สารตกค้าง
-B 1 หรือ 0, ค่าเริ่มต้น 0 โดยค่าเริ่มต้น ลำดับจะถูกเก็บไว้ใน RAM หากตั้งค่าเป็น 1, ลำดับ
ถูกเก็บไว้ในฮาร์ดไดรฟ์ ขอแนะนำให้ใช้ -B 1 สำหรับฐานข้อมูลขนาดใหญ่
-g 1 หรือ 0 ค่าเริ่มต้น 0 โดยอัลกอริทึมเริ่มต้นของ cd-hit ลำดับจะจัดกลุ่มเป็น
คลัสเตอร์แรกที่ตรงตามเกณฑ์ (คลัสเตอร์ด่วน) หากตั้งค่าเป็น 1 โปรแกรมจะ
จัดกลุ่มเป็นคลัสเตอร์ที่คล้ายกันมากที่สุดซึ่งตรงตามเกณฑ์ (แม่นยำแต่ช้า
โหมด) แต่ 1 หรือ 0 จะไม่เปลี่ยนตัวแทนของกลุ่มสุดท้าย
-D ขนาดสูงสุดต่ออินเดล ค่าเริ่มต้น 1
-การจับคู่ คะแนนที่ตรงกัน ค่าเริ่มต้น2
-ไม่ตรงกัน
คะแนนไม่ตรงกัน ค่าเริ่มต้น -1
-ช่องว่าง คะแนนการเปิดช่องว่าง, ค่าเริ่มต้น -3
-gap-ต่อ
คะแนนการขยายช่องว่าง, ค่าเริ่มต้น -1
- บัก เขียนไฟล์คลัสเตอร์สำรอง (1 หรือ 0, ค่าเริ่มต้น 0)
-h พิมพ์ความช่วยเหลือนี้
คำถาม ข้อบกพร่อง ติดต่อ Weizhong Li ได้ที่ [ป้องกันอีเมล]
หากคุณพบว่า cd-hit มีประโยชน์ โปรดอ้างอิง:
"การจัดกลุ่มของลำดับที่คล้ายคลึงกันสูงเพื่อลดขนาดของโปรตีนขนาดใหญ่
ฐานข้อมูล", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatics, (2001)
17:282-283 "Cd-hit: โปรแกรมที่รวดเร็วสำหรับการจัดกลุ่มและเปรียบเทียบชุดใหญ่
ลำดับโปรตีนหรือนิวคลีโอไทด์", Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22:1658-1659 "Beifang Niu, Limin Fu, Shulei Sun และ Weizhong Li ประดิษฐ์และ
การอ่านซ้ำตามธรรมชาติของข้อมูลเมตาเจโนมิก BMC ชีวสารสนเทศ
(2010) 11:187 น.
ใช้ cdhit-454 ออนไลน์โดยใช้บริการ onworks.net