Amazon Best VPN GoSearch

ไอคอน Fav ของ OnWorks

spidey - ออนไลน์ในคลาวด์

เรียกใช้ spidey ในผู้ให้บริการโฮสต์ฟรีของ OnWorks ผ่าน Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

นี่คือคำสั่ง spidey ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


spidey - จัดลำดับ mRNA ให้สอดคล้องกับจีโนม

เรื่องย่อ


Spidey [-] [-F N] [-G] [-L N] [-M ชื่อไฟล์] [-N ชื่อไฟล์] [-R ชื่อไฟล์] [-S ] [-T N]
[-X] [-a ชื่อไฟล์] [-c N] [-d] [-e X] [-f X] [-g X] -i ชื่อไฟล์ [-j] [-k ชื่อไฟล์] [-l N]
-m ชื่อไฟล์ [-n N] [-o Str] [-p N] [-r ค/d/m/p/v] [-s] [-t ชื่อไฟล์] [-u] [-w]

DESCRIPTION


Spidey เป็นเครื่องมือสำหรับจัดแนวลำดับ mRNA ตั้งแต่หนึ่งลำดับขึ้นไปกับลำดับจีโนมที่กำหนด
Spidey ถูกเขียนขึ้นโดยมีเป้าหมายหลัก XNUMX ประการคือ ค้นหาการจัดตำแหน่งที่ดีโดยไม่คำนึงถึงอินตรอน
ขนาด; และหลีกเลี่ยงการสับสนโดย pseudogenes และ paralogs ที่อยู่ใกล้เคียง มุ่งสู่ที่แรก
เป้าหมาย, Spidey ใช้ BLAST และ Dot View (เครื่องมือการจัดตำแหน่งในพื้นที่อื่น) เพื่อค้นหา
การจัดตำแหน่ง; เนื่องจากสิ่งเหล่านี้เป็นทั้งเครื่องมือการจัดตำแหน่งในพื้นที่ Spidey ไม่ได้อยู่ภายใน
ชอบอินตรอนที่สั้นกว่าหรือยาวกว่า และไม่มีขนาดอินตรอนสูงสุด เพื่อหลีกเลี่ยงความผิดพลาด
รวมทั้ง exons จาก paralogs และ pseudogenes Spidey ก่อนกำหนด windows บนจีโนม
ลำดับ จากนั้นดำเนินการจัดตำแหน่ง mRNA-to-genomic แยกกันภายในแต่ละหน้าต่าง
เนื่องจากวิธีการสร้างหน้าต่าง พาราล็อกหรือเทียมข้างเคียงจึงควร
อยู่ในหน้าต่างแยกต่างหากและไม่ควรรวมอยู่ในการจัดตำแหน่งประกบขั้นสุดท้าย

แรกเริ่ม การจัดตำแหน่ง และ การก่อสร้าง of จีโนม หน้าต่าง
Spidey ใช้เป็นอินพุตลำดับจีโนมเดียวและชุดของการเข้าถึง mRNA หรือ FASTA
ลำดับ การประมวลผลทั้งหมดจะทำได้ครั้งละหนึ่งลำดับ mRNA ก้าวแรกของแต่ละคน
ลำดับ mRNA เป็น BLAST ที่มีความเข้มงวดสูงเมื่อเทียบกับลำดับจีโนม ฮิตผลลัพธ์
วิเคราะห์เพื่อหาหน้าต่างจีโนม

การจัดตำแหน่ง BLAST จะถูกจัดเรียงตามคะแนนแล้วกำหนดลงในหน้าต่างโดยเรียกซ้ำ
ฟังก์ชันที่ใช้การจัดตำแหน่งแรกแล้วเลื่อนลงรายการการจัดตำแหน่งเพื่อค้นหาทั้งหมด
การจัดตำแหน่งที่สอดคล้องกับเส้นแรก (เส้นเดียวกันของ mRNA ทั้ง mRNA และ
พิกัดจีโนมจะไม่ทับซ้อนกันและสอดคล้องกันเป็นเส้นตรง) ในการผ่านครั้งต่อไป
การจัดตำแหน่งที่เหลือจะถูกตรวจสอบและใส่ลงในแบบไม่ทับซ้อนกัน
หน้าต่างที่สอดคล้องกัน จนกว่าจะไม่มีการจัดตำแหน่งเหลือ ขึ้นอยู่กับจำนวนรุ่นของยีน
ที่ต้องการด้านบน n หน้าต่างถูกเลือกเพื่อไปยังขั้นตอนต่อไปและส่วนอื่นๆ จะเป็น
ที่ถูกลบ

สอดคล้อง in แต่ละ หน้าต่าง
เมื่อสร้างหน้าต่างจีโนมแล้ว การจัดตำแหน่ง BLAST เริ่มต้นจะเป็นอิสระและ
มีการค้นหา BLAST อีกครั้ง คราวนี้กับ mRNA ทั้งหมดเทียบกับจีโนม
ขอบเขตที่กำหนดโดยหน้าต่าง และมีความเข้มงวดน้อยกว่าการค้นหาเริ่มต้น Spidey
จากนั้นใช้อัลกอริธึมที่โลภเพื่อสร้างชุดย่อยที่ให้คะแนนสูงและไม่ทับซ้อนกันของ
การจัดตำแหน่งจากการค้นหา BLAST ครั้งที่สอง ชุดที่สอดคล้องกันนี้ได้รับการวิเคราะห์อย่างรอบคอบเพื่อ
ตรวจสอบให้แน่ใจว่าลำดับ mRNA ทั้งหมดครอบคลุมโดยการจัดตำแหน่ง เมื่อพบช่องว่าง
ระหว่างการจัดตำแหน่ง พื้นที่ที่เหมาะสมของลำดับจีโนมจะถูกค้นหาเทียบกับ
mRNA ที่หายไป ขั้นแรกให้ใช้ BLAST ที่มีความเข้มงวดต่ำมาก และหาก BLAST ไม่พบ
hit โดยใช้ฟังก์ชัน DotView เพื่อค้นหาตำแหน่ง เมื่อพบช่องว่างที่ปลายของ
การจัดตำแหน่ง การค้นหา BLAST และ DotView นั้นอนุญาตให้ขยายเกิน
ขอบเขตของหน้าต่าง ถ้าปลาย mRNA ที่ 3' ไม่เรียงตัวกันอย่างสมบูรณ์ แสดงว่าเป็น
ขั้นแรกตรวจสอบการมีหางโพลี (A) ไม่มีความพยายามในการจัดตำแหน่ง
ส่วนของ mRNA ที่ดูเหมือนว่าจะเป็นหางโพลี (A) บางครั้งก็มีหางโพลี(A)
ที่ไม่สอดคล้องกับลำดับจีโนม และสิ่งเหล่านี้ถูกบันทึกไว้เนื่องจากบ่งชี้ว่า
ความเป็นไปได้ของยาหลอก

ตอนนี้ mRNA ถูกครอบคลุมโดยชุดของการจัดตำแหน่ง ขอบเขตของ
การจัดตำแหน่ง (ควรมีหนึ่งการจัดตำแหน่งต่อ exon ตอนนี้) ถูกปรับเพื่อให้
เรียงชิดกันอย่างแม่นยำและแนบชิดกับผู้ให้ประกบที่ดี
และไซต์ตัวรับ โดยทั่วไป การจัดตำแหน่ง exons ที่ติดกันสองตัวซ้อนทับกันมากเท่ากับ
20 หรือ 30 คู่เบสในลำดับ mRNA ขอบเขต exon ที่แท้จริงอาจอยู่ที่ใดก็ได้ภายใน
การทับซ้อนกันนี้ หรือ (ดังที่เราได้เห็นในเชิงประจักษ์) แม้แต่คู่ฐานสองสามคู่ที่อยู่นอกการทับซ้อนกัน
ในการวางตำแหน่งขอบเขต exon การทับซ้อนบวกคู่ฐานสองสามคู่ในแต่ละด้านคือ
ตรวจสอบไซต์ผู้บริจาคประกบ โดยใช้ฟังก์ชันที่มีเมทริกซ์การประกบต่างกัน
ขึ้นอยู่กับสิ่งมีชีวิตที่เลือก ไซต์ผู้บริจาคประกบสองสามอันดับแรก (ตามคะแนน) คือ
ประเมินว่ามีผลกระทบต่อขอบเขตการจัดตำแหน่งเดิมมากน้อยเพียงใด เว็บไซต์ที่
ส่งผลกระทบต่อขอบเขตที่น้อยที่สุดที่ถูกเลือก และประเมินว่ามีอยู่ของ an
เว็บไซต์ตัวรับ การจัดตำแหน่งจะถูกตัดทอนหรือขยายตามความจำเป็นเพื่อให้
สิ้นสุดที่ไซต์ผู้บริจาคประกบและเพื่อไม่ให้ทับซ้อนกัน

สุดท้าย ผล
หน้าต่างได้รับการตรวจสอบอย่างรอบคอบเพื่อให้ได้เปอร์เซ็นต์เอกลักษณ์ต่อ exon จำนวน
ช่องว่างต่อ exon, เปอร์เซ็นต์เอกลักษณ์, เปอร์เซ็นต์ความครอบคลุมของ mRNA, การปรากฏตัวของ
หางโพลี (A) ที่จัดตำแหน่งหรือไม่จัดแนว จำนวนไซต์ผู้บริจาคประกบและการมีอยู่หรือ
ไม่มีไซต์ผู้บริจาคและตัวรับประกบกันสำหรับแต่ละ exon และการเกิด mRNA
ที่มีปลาย 5' หรือ 3' (หรือทั้งสองอย่าง) ที่ไม่สอดคล้องกับลำดับจีโนม ถ้า
เปอร์เซ็นต์ข้อมูลประจำตัวโดยรวมและความครอบคลุมของความยาวเป็นเปอร์เซ็นต์อยู่เหนือจุดตัดที่ผู้ใช้กำหนด a
มีการพิมพ์รายงานสรุป และหากได้รับการร้องขอ การจัดตำแหน่งข้อความแสดงตัวตนและ
ยังพิมพ์ไม่ตรงกัน

interspecies การจัดตำแหน่ง
Spidey มีความสามารถในการจัดตำแหน่ง interspecies ความแตกต่างที่สำคัญใน
การจัดตำแหน่ง interspecies คือเอกลักษณ์ของ mRNA-genomic จะไม่ใกล้เคียงกับ 100% เหมือนเดิม
อยู่ในการจัดตำแหน่ง intraspecies; นอกจากนี้ การจัดตำแหน่งยังมีช่องว่างมากมายและยาว ถ้า
Spidey ใช้ในโหมดปกติเพื่อจัดตำแหน่ง interspecies จะสร้างแบบจำลองยีน
ที่มีเอ็กซอนสั้นจำนวนมาก เมื่อตั้งค่าสถานะ interspecies Spidey ใช้ต่างกัน
พารามิเตอร์ BLAST เพื่อกระตุ้นให้เกิดช่องว่างที่ยาวขึ้นและมากขึ้น และไม่ลงโทษอย่างหนักสำหรับ
ไม่ตรงกัน ด้วยวิธีนี้ การเรียงตัวของ exons จะยาวขึ้นและใกล้เคียงกันมากขึ้น
ประมาณโครงสร้างยีนจริง

สกัด CDS การจัดตำแหน่ง
เมื่อ Spidey ทำงานในโหมดเครือข่ายรับรู้หรือเมื่อใช้ไฟล์ ASN.1 สำหรับ mRNA
บันทึก มันสามารถแยกการจัดตำแหน่ง CDS จากการจัดตำแหน่ง mRNA และการพิมพ์
ข้อมูล CDS ด้วย เนื่องจากการจัดตำแหน่ง CDS เป็นเพียงส่วนย่อยของการจัดตำแหน่ง mRNA
มันค่อนข้างตรงไปตรงมาในการตัดทอนการจัดตำแหน่ง exon ตามความจำเป็นและเพื่อ
สร้างการจัดตำแหน่ง CDS นอกจากนี้ ขอบเขตที่ไม่ได้แปลถูกกำหนดไว้แล้ว ดังนั้น
เปอร์เซ็นต์เอกลักษณ์สำหรับภูมิภาคที่ไม่ได้แปล 5' และ 3' จะถูกคำนวณด้วย

OPTIONS


สรุปตัวเลือกอยู่ด้านล่าง

- พิมพ์ข้อความการใช้งาน

-F N เริ่มต้นช่วงจีโนมที่ต้องการ (จาก; อิงจาก 0)

-G ไฟล์อินพุตเป็นรายการ GI

-L N ขนาดอินตรอนขนาดใหญ่พิเศษที่จะใช้ (ค่าเริ่มต้น = 220000)

-M ชื่อไฟล์
ไฟล์ที่มีเมทริกซ์ประกบผู้บริจาค

-N ชื่อไฟล์
ไฟล์ที่มีเมทริกซ์ประกบตัวรับ

-R ชื่อไฟล์
ไฟล์ (รวมถึงเส้นทาง) เพื่อทำซ้ำฐานข้อมูล blast สำหรับการกรอง

-S จำกัดเฉพาะสายบวก (p) หรือลบ (ม.) ของลำดับจีโนม

-T N หยุดช่วงจีโนมที่ต้องการ (เป็น; 0-based)

-X ใช้ขนาดอินตรอนขนาดใหญ่พิเศษ (เพิ่มขีดจำกัดสำหรับอินตรอนเริ่มต้นและเทอร์มินัล
จาก 100kb ถึง 240kb และสำหรับอื่น ๆ ทั้งหมดตั้งแต่ 35kb ถึง 120kb); อาจส่งผลให้
เวลาประมวลผลนานขึ้นอย่างมาก

-a ชื่อไฟล์
ไฟล์เอาต์พุตสำหรับการจัดตำแหน่งเมื่อนำไปยังไฟล์แยกต่างหากด้วย -p 3 (ค่าเริ่มต้น =
สไปดี้.aln).

-c N การตัดทอนข้อมูลประจำตัวเป็นเปอร์เซ็นต์ เพื่อวัตถุประสงค์ในการควบคุมคุณภาพ

-d พยายามจัดแนวลำดับการเข้ารหัสที่สอดคล้องกับบันทึก mRNA ที่กำหนด (อาจ
ต้องการการเข้าถึงเครือข่าย)

-e X ค่าอิเล็กทรอนิกส์ผ่านครั้งแรก (ค่าเริ่มต้น = 1.0e-10) ค่าที่สูงขึ้นเพิ่มความเร็วที่ราคา
ของความไว

-f X ค่า e-value ครั้งที่ 0.001 (ค่าเริ่มต้น = XNUMX)

-g X ค่า e-value ครั้งที่สาม (ค่าเริ่มต้น = 10)

-i ชื่อไฟล์
ไฟล์อินพุตที่มีลำดับจีโนมในรูปแบบ ASN.1 หรือ FASTA ถ้าคุณ
คอมพิวเตอร์ทำงานบนเครือข่ายที่สามารถเข้าถึง GenBank ได้ คุณสามารถแทนที่
หมายเลขภาคยานุวัติที่ต้องการสำหรับชื่อไฟล์

-j พิมพ์การจัดตำแหน่ง ASN.1?

-k ชื่อไฟล์
ไฟล์สำหรับเอาต์พุต ASN.1 ด้วย -k (ค่าเริ่มต้น = spidey.asn)

-l N ค่าตัดความครอบคลุมความยาวเป็นเปอร์เซ็นต์

-m ชื่อไฟล์
ไฟล์อินพุตที่มีลำดับ mRNA ในรูปแบบ ASN.1 หรือ FASTA หรือรายการของ
ภาคยานุวัติของพวกเขา (ด้วย -G). หากคอมพิวเตอร์ของคุณทำงานบนเครือข่ายที่สามารถ
เข้าถึง GenBank คุณสามารถเปลี่ยนหมายเลขภาคยานุวัติเดียวสำหรับชื่อไฟล์ได้

-n N จำนวนรุ่นของยีนที่จะส่งคืนต่ออินพุต mRNA (ค่าเริ่มต้น = 1)

-o Str ไฟล์เอาต์พุตหลัก (ค่าเริ่มต้น = stdout; เนื้อหาควบคุมโดย -p).

-p N การจัดตำแหน่งการพิมพ์?
0 สรุปและการจัดแนวร่วมกัน (ค่าเริ่มต้น)
1 แค่เรื่องย่อ
2 เพียงแค่การจัดตำแหน่ง
3 สรุปและการจัดตำแหน่งในไฟล์ต่างๆ

-r ค/d/m/p/v
สิ่งมีชีวิตของลำดับจีโนม ใช้เพื่อกำหนดเมทริกซ์ประกบ
c C. elegans
d แมลงหวี่
m Dictyostelium ดิสคอยเดียม
p พืช
v สัตว์มีกระดูกสันหลัง (ค่าเริ่มต้น)

-s ปรับแต่งสำหรับการจัดตำแหน่ง interspecies

-t ชื่อไฟล์
ไฟล์ที่มีตารางคุณลักษณะใน 4 คอลัมน์ที่คั่นด้วยแท็บ:
ลำดับที่สอง (เช่น, NM_04377.1)
ชื่อ (เท่านั้น ซ้ำ_ภูมิภาค ได้รับการสนับสนุนในขณะนี้)
เริ่มต้น (ตาม 0)
หยุด (ตาม 0)

-u จัดตำแหน่ง mRNA อินพุตทั้งหมดหลายตำแหน่ง (ซึ่งต้องทับซ้อนกับจีโนม
ลำดับ).

-w พิจารณาตัวพิมพ์เล็กในลำดับอินพุต FASTA ที่จะปิดบัง

ใช้ spidey ออนไลน์โดยใช้บริการ onworks.net


เซิร์ฟเวอร์และเวิร์กสเตชันฟรี

ดาวน์โหลดแอพ Windows & Linux

คำสั่ง Linux

Ad




×
โฆษณา
❤️ช้อป จอง หรือซื้อที่นี่โดยไม่เสียค่าใช้จ่าย ช่วยให้บริการต่างๆ ฟรี