Amazon Best VPN GoSearch

ไอคอน Fav ของ OnWorks

htseq-count - ออนไลน์ใน Cloud

เรียกใช้ htseq-count ในผู้ให้บริการโฮสต์ฟรีของ OnWorks ผ่าน Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

นี่คือคำสั่ง htseq-count ที่สามารถเรียกใช้ในผู้ให้บริการโฮสติ้งฟรีของ OnWorks โดยใช้หนึ่งในเวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


htseq-count - นับจำนวนการอ่านในไฟล์การจัดตำแหน่ง SAM ที่แมปกับฟีเจอร์ GFF

ให้ไฟล์ที่มีการจัดลำดับการอ่านและรายการคุณลักษณะจีโนมซึ่งเป็นงานทั่วไป
คือการนับจำนวนการอ่านแผนที่ในแต่ละจุด

จุดสนใจอยู่ที่นี่เป็นระยะ (เช่น ช่วงของตำแหน่ง) บนโครโมโซมหรือการรวมกันของ
ช่วงเวลาดังกล่าว

ในกรณีของ RNA-Seq ลักษณะเด่นมักจะเป็นยีน โดยจะพิจารณาแต่ละยีน
ที่นี่เป็นการรวมตัวของ exons ทั้งหมด เราอาจพิจารณา exon แต่ละอันเป็นคุณลักษณะ เช่น ใน
เพื่อตรวจสอบการประกบแบบอื่น สำหรับ ChIP-Seq เปรียบเทียบ คุณสมบัติอาจเป็น
ขอบเขตที่มีผลผูกพันจากรายการที่กำหนดไว้ล่วงหน้า

ต้องใช้ความระมัดระวังเป็นพิเศษในการตัดสินใจว่าจะจัดการกับการอ่านที่ทับซ้อนกันได้อย่างไร
ลักษณะเฉพาะ. NS htseq-นับ สคริปต์อนุญาตให้เลือกระหว่างสามโหมด แน่นอน ถ้าไม่มี
ซึ่งตรงกับความต้องการของคุณ คุณสามารถเขียนสคริปต์ของคุณเองด้วย HTSeq ดูบท การท่องเที่ยว
สำหรับคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีการทำเช่นนั้น

สามโหมดความละเอียดที่ทับซ้อนกันของ htseq-นับ ทำงานดังนี้. สำหรับแต่ละตำแหน่ง i in
การอ่านชุด ส(ผม) ถูกกำหนดให้เป็นชุดของคุณสมบัติทั้งหมดที่ทับซ้อนกันตำแหน่ง i. จากนั้น
พิจารณาชุด Sซึ่งก็คือ (กับ i วิ่งผ่านทุกตำแหน่งภายในการอ่าน)

· การรวมตัวของชุดทั้งหมด ส(ผม) สำหรับโหมด สหภาพ.

· จุดตัดของเซตทั้งหมด ส(ผม) สำหรับโหมด ทางแยกเข้มงวด.

· จุดตัดของเซตไม่ว่างทั้งหมด ส(ผม) สำหรับโหมด สี่แยก nonempty.

If S มีหนึ่งคุณสมบัติอย่างแม่นยำ การอ่านจะถูกนับสำหรับคุณสมบัตินี้ หากมี
มากกว่าหนึ่งคุณสมบัติ การอ่านจะถูกนับเป็น คลุมเครือ (และไม่นับใดๆ
คุณสมบัติ) และ if S ว่างเปล่า การอ่านจะนับเป็น no_feature.

รูปภาพต่อไปนี้แสดงเอฟเฟกต์ของโหมดทั้งสามนี้: [ภาพ]

การใช้


หลังจากที่คุณติดตั้ง HTSeq แล้ว (ดู ติดตั้ง) คุณสามารถเรียกใช้ htseq-นับ จากคำสั่ง
สาย:

htseq-นับ [ตัวเลือก]

ถ้าไฟล์ htseq-qa ไม่อยู่ในเส้นทางของคุณ คุณสามารถเรียกสคริปต์ด้วย

python -m HTSeq.scripts.count [ตัวเลือก]

NS มีการอ่านที่จัดแนวในรูปแบบ SAM (โปรดทราบว่า SAMtools
มีสคริปต์ Perl เพื่อแปลงรูปแบบการจัดตำแหน่งส่วนใหญ่เป็น SAM) ตรวจสอบให้แน่ใจว่าใช้a
เครื่องจัดฟันแบบ splicing-aware เช่น TopHat HTSeq-count ใช้ข้อมูลอย่างเต็มที่ใน
สนามซิการ์

หากต้องการอ่านจากอินพุตมาตรฐาน ให้ใช้ - as .

หากคุณมีข้อมูลปลายคู่ คุณต้องจัดเรียงไฟล์ SAM ตามชื่อที่อ่านก่อน (ถ้าคุณ
sorting tool จัดการไฟล์ขนาดใหญ่ไม่ได้ เช่น Ruan Jue's , หาได้จาก สบู่
เว็บไซต์)

NS มีคุณสมบัติในการ GFF รูป.

สคริปต์แสดงตารางที่มีการนับสำหรับแต่ละคุณลักษณะ ตามด้วยตัวนับพิเศษ
ซึ่งนับการอ่านที่ไม่นับคุณสมบัติใด ๆ ด้วยเหตุผลหลายประการ ได้แก่ :

· no_feature: อ่านที่ไม่สามารถกำหนดให้กับคุณสมบัติใด ๆ (set S ตามที่อธิบายไว้ข้างต้น
ว่างเปล่า)

· คลุมเครือ: การอ่านที่สามารถกำหนดให้กับคุณสมบัติได้มากกว่าหนึ่งคุณสมบัติและด้วยเหตุนี้จึงเป็น
ไม่นับสิ่งเหล่านี้ (set S มีมากกว่าหนึ่งองค์ประกอบ)

· too_low_aQual: การอ่านที่ไม่นับเนื่องจาก -a ตัวเลือกดูด้านล่าง

· ไม่_จัดแนว: อ่านในไฟล์ SAM โดยไม่มีการจัดตำแหน่ง

· การจัดตำแหน่ง_not_unique: อ่านด้วยการจัดตำแหน่งที่รายงานมากกว่าหนึ่งรายการ การอ่านเหล่านี้คือ
ได้รับการยอมรับจาก NH แท็กฟิลด์ SAM ที่เป็นตัวเลือก (หากตัวจัดตำแหน่งไม่ได้ตั้งค่าฟิลด์นี้
การอ่านเรียงตัวคูณจะถูกนับหลายครั้ง)

สำคัญ: ค่าดีฟอลต์สำหรับการควั่นคือ ใช่. หากยังไม่ได้สร้างข้อมูล RNA-Seq ของคุณ
ด้วยโปรโตคอลเฉพาะกลุ่ม ซึ่งทำให้การอ่านข้อมูลครึ่งหนึ่งหายไป ดังนั้นให้
แน่ใจว่าตั้งค่าตัวเลือก --stranded=ไม่ เว้นแต่ว่าคุณมีข้อมูลเฉพาะสาระ!

Options
-m , --mode=
โหมดสำหรับจัดการการอ่านที่ทับซ้อนกันมากกว่าหนึ่งคุณสมบัติ ค่าที่เป็นไปได้สำหรับ
เป็น สหภาพ, ทางแยกเข้มงวด และ สี่แยก nonempty (ค่าเริ่มต้น: สหภาพ)

-s <ใช่ ไม่ or ย้อนกลับ>, --ควั่น= ไม่มี or ย้อนกลับ>
ข้อมูลมาจากการทดสอบเฉพาะสาระหรือไม่ (ค่าเริ่มต้น: ใช่)

สำหรับ stranded=no การอ่านจะถือว่าทับซ้อนกับคุณลักษณะโดยไม่คำนึงถึง
ไม่ว่าจะจับคู่กับสายเดียวกันหรือสายตรงข้ามเป็นคุณลักษณะ สำหรับ
stranded=yes และ single-end reads การอ่านจะต้องถูกแมปกับ strand เดียวกันเช่น
คุณลักษณะ สำหรับการอ่านแบบคู่ขนาน การอ่านครั้งแรกจะต้องอยู่ในสายเดียวกันและ
การอ่านครั้งที่สองในแนวตรงข้าม สำหรับ stranded=reverse กฎเหล่านี้คือ
ย้อนกลับ

-a , --a=
ข้ามการอ่านทั้งหมดที่มีคุณภาพการจัดตำแหน่งต่ำกว่าค่าต่ำสุดที่กำหนด (ค่าเริ่มต้น:
0)

-t <คุณสมบัติ ประเภท>, --type= พิมพ์>
ประเภทคุณลักษณะ (คอลัมน์ที่ 3 ในไฟล์ GFF) ที่จะใช้ คุณลักษณะทั้งหมดของประเภทอื่นคือ
ละเว้น (ค่าเริ่มต้น เหมาะสำหรับ RNA-Seq และ วงดนตรี จีทีเอฟ ไฟล์: เอ็กซอน)

-i <รหัสประจำตัว คุณลักษณะ>, --idatr= คุณลักษณะ>
แอตทริบิวต์ GFF ที่จะใช้เป็นรหัสคุณลักษณะ GFF หลายบรรทัดที่มี ID ฟีเจอร์เดียวกัน
จะถือว่าเป็นส่วนหนึ่งของคุณสมบัติเดียวกัน รหัสคุณสมบัติใช้เพื่อระบุตัวตน
การนับในตารางผลลัพธ์ ค่าเริ่มต้น เหมาะสำหรับ RNA-SEq และ Ensembl GTF
ไฟล์คือ ยีน_id.

-o , --samout=
เขียนบันทึกการจัดตำแหน่ง SAM ทั้งหมดลงในไฟล์ SAM เอาต์พุตที่เรียกว่า ,
การใส่คำอธิบายประกอบแต่ละบรรทัดด้วยการกำหนดคุณลักษณะหรือตัวนับพิเศษ (เช่น an
ฟิลด์ตัวเลือกที่มีแท็ก 'XF')

-NS, --เงียบ
ระงับรายงานความคืบหน้าและคำเตือน

-ชม, --ช่วยด้วย
แสดงสรุปการใช้งานและการออก

ใช้ htseq-count ออนไลน์โดยใช้บริการ onworks.net


เซิร์ฟเวอร์และเวิร์กสเตชันฟรี

ดาวน์โหลดแอพ Windows & Linux

คำสั่ง Linux

Ad




×
โฆษณา
❤️ช้อป จอง หรือซื้อที่นี่โดยไม่เสียค่าใช้จ่าย ช่วยให้บริการต่างๆ ฟรี