นี่คือคำสั่ง gsnap ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
gsnap - โปรแกรมการจัดตำแหน่งนิวคลีโอไทด์แบบอ่านสั้นของจีโนม
เรื่องย่อ
จีสแน็ป [OPTIONS... ] <ฟาสต้า ไฟล์>, or แมว | gmap [ตัวเลือก...]
OPTIONS
อินพุต ตัวเลือก (ต้อง ประกอบด้วย -d)
-D, --ผบ=ไดเรกทอรี
ไดเรกทอรีจีโนม ค่าเริ่มต้น (ตามที่ระบุโดย --ด้วย-gmapdb ไปที่โปรแกรมกำหนดค่า)
is /var/cache/gmap
-d, --ฐานข้อมูล=STRING
ฐานข้อมูลจีโนม
--use-sarray=INT
ไม่ว่าจะใช้อาร์เรย์ต่อท้ายซึ่งจะให้ความเร็วเพิ่มขึ้น ค่าที่อนุญาต: 0
(ไม่ใช่) 1 (ใช่ บวกกับอัลกอริทึม GSNAP/GMAP ค่าเริ่มต้น) หรือ 2 (ใช่ และใช้เฉพาะส่วนต่อท้ายเท่านั้น
อัลกอริธึมอาร์เรย์) โปรดทราบว่าอาร์เรย์ต่อท้ายจะมีอคติกับอัลลีล SNP ใน
การจัดตำแหน่งที่ทนต่อ SNP
-k, --กม=INT
ขนาด kmer ที่จะใช้ในฐานข้อมูลจีโนม (ค่าที่อนุญาต: 16 หรือน้อยกว่า) หากไม่ระบุ
โปรแกรมจะค้นหาขนาดสูงสุดของ kmer ที่มีอยู่ในฐานข้อมูลจีโนม
--สุ่มตัวอย่าง=INT
การสุ่มตัวอย่างเพื่อใช้ในฐานข้อมูลจีโนม หากไม่ระบุ โปรแกรมจะค้นหา
ค่าสุ่มตัวอย่างที่เล็กที่สุดในฐานข้อมูลจีโนมภายในขนาด k-mer ที่เลือก
-q, --ส่วนหนึ่ง=INT/INT
ประมวลผลเฉพาะ i-th ของทุก ๆ n ลำดับเช่น 0/100 หรือ 99/100 (มีประโยชน์สำหรับ
กระจายงานไปยังฟาร์มคอมพิวเตอร์)
--อินพุต-บัฟเฟอร์-ขนาด=INT
ขนาดของบัฟเฟอร์อินพุต (โปรแกรมอ่านหลาย ๆ ลำดับพร้อมกันเพื่อประสิทธิภาพ)
(ค่าเริ่มต้น 1000)
--บาร์โค้ด-ความยาว=INT
จำนวนบาร์โค้ดที่จะลบตั้งแต่เริ่มอ่าน (ค่าเริ่มต้น 0)
--ปฐมนิเทศ=STRING
การวางแนวของการอ่านแบบปลายคู่ ค่าที่อนุญาต: FR (fwd-rev หรือ Illumina ทั่วไป;
ค่าเริ่มต้น), RF (rev-fwd สำหรับเม็ดมีดแบบวงกลม) หรือ FF (fwd-fwd, เกลียวเดียวกัน)
--fastq-id-เริ่มต้น=INT
ตำแหน่งเริ่มต้นของตัวระบุในส่วนหัว FASTQ คั่นด้วยช่องว่าง (>= 1)
--fastq-id-end=INT
ตำแหน่งสิ้นสุดของตัวระบุในส่วนหัว FASTQ คั่นด้วยช่องว่าง (>= 1)
ตัวอย่าง:
@HWUSI-EAS100R:6:73:941:1973#0/1
start=1, end=1 (ค่าเริ่มต้น) => ตัวระบุคือ HWUSI-EAS100R:6:73:941:1973#0
@SRR001666.1 071112_SLXA-EAS1_s_7:5:1:817:345 length=36
start=1, end=1 => ตัวระบุคือ SRR001666.1 start=2, end=2 => ตัวระบุคือ
071112_SLXA-EAS1_s_7:5:1:817:345 start=1, end=2 => ตัวระบุคือ SRR001666.1
071112_SLXA-EAS1_s_7:5:1:817:345
--แรงเดียวจบ
เมื่อมีการระบุไฟล์ FASTQ หลายไฟล์ในบรรทัดคำสั่ง GSNAP จะถือว่าไฟล์เหล่านั้นเป็น
จับคู่ไฟล์ปลายคู่ที่ตรงกัน แฟล็กนี้ถือว่าแต่ละไฟล์เป็นแบบ single-end
--กรอง-พรหมจรรย์=STRING
ข้ามการอ่านที่ทำเครื่องหมายโดยโปรแกรมพรหมจรรย์ของ Illumina คาดหวังสตริงหลังจาก
ภาคยานุวัติที่มี 'Y' หลังเครื่องหมายทวิภาคแรกเช่นนี้
@การเข้าถึง 1:Y:0:CTTGTA
โดยที่ 'Y' หมายถึงการกรองตามพรหมจรรย์ ค่า: ปิด (ค่าเริ่มต้น) อย่างใดอย่างหนึ่ง
ทั้งสอง. สำหรับ "อย่างใดอย่างหนึ่ง" ตัว "Y" ที่ปลายด้านใดด้านหนึ่งของการอ่านแบบคู่จะถูกกรอง
สำหรับ 'ทั้งสอง' ต้องใช้ 'Y' ที่ปลายทั้งสองด้านของการอ่านแบบคู่ (หรือด้านเดียว
ของการอ่านแบบปลายเดียว)
--อนุญาตชื่อ-นามสกุลไม่ตรงกัน
อนุญาตให้ชื่อภาคยานุวัติของการอ่านไม่ตรงกันในไฟล์ที่จับคู่แล้ว
--gunzip
คลายการบีบอัดไฟล์อินพุต gzipped
--bunzip2
คลายการบีบอัดไฟล์อินพุตที่บีบอัด bzip2
ตัวเลือกการคำนวณ
หมายเหตุ: GSNAP มีอัลกอริธึมที่เร็วมากสำหรับการคำนวณที่ไม่ตรงกันถึงและ
รวมทั้ง
((readlength+2)/kmer - 2) ("ไม่ตรงกันเร็วมาก") โปรแกรมจะทำงานเร็วที่สุด if
max-mismatches (บวกกับ suboptimal-levels) อยู่ในค่านั้น นอกจากนี้ indels โดยเฉพาะอย่างยิ่ง
end indels ใช้เวลาในการคำนวณนานขึ้น แม้ว่าอัลกอริธึมจะยังออกแบบมาให้ทำงานได้อย่างรวดเร็ว
-B, --แบทช์=INT
โหมดแบทช์ (ค่าเริ่มต้น = 2)
โหมด ออฟเซ็ต ตำแหน่ง จีโนม คำต่อท้าย อาร์เรย์
0 ดูหมายเหตุ mmap mmap mmap
1 ดูหมายเหตุ mmap & โหลดล่วงหน้า mmap mmap
2 ดูหมายเหตุ mmap & โหลด mmap ล่วงหน้า & โหลด mmap ล่วงหน้า & โหลดล่วงหน้า
3 ดูหมายเหตุ จัดสรร mmap & โหลดล่วงหน้า mmap & โหลดล่วงหน้า
(ค่าเริ่มต้น) 4 ดูหมายเหตุจัดสรรจัดสรร mmap & โหลดล่วงหน้า
5 ดูหมายเหตุ จัดสรร จัดสรร จัดสรร
หมายเหตุ: สำหรับลำดับเดียว โครงสร้างข้อมูลทั้งหมดใช้ mmap
หากไม่มี mmap และไม่ได้จัดสรรไว้ จะใช้ fileio (ช้ามาก)
หมายเหตุเกี่ยวกับออฟเซ็ต: สามารถควบคุมการขยายออฟเซ็ตได้
อย่างอิสระโดย --ขยายออฟเซ็ต ธง. อย่างไรก็ตามมีการเข้าถึงออฟเซ็ต
ค่อนข้างเร็วใน GSNAP เวอร์ชันนี้
--use-shared-หน่วยความจำ=INT
หากเป็น 1 (ค่าเริ่มต้น) หน่วยความจำที่จัดสรรจะถูกแบ่งใช้ระหว่างกระบวนการทั้งหมดบนโหนดนี้
ถ้า 0 แสดงว่าแต่ละกระบวนการมีหน่วยความจำที่จัดสรรส่วนตัว
--ขยายออฟเซ็ต=INT
จะขยายดัชนีออฟเซ็ตของจีโนมหรือไม่ ค่า: 0 (ไม่ใช่ ค่าเริ่มต้น) หรือ 1 (ใช่)
การขยายช่วยให้การจัดตำแหน่งเร็วขึ้น แต่ต้องใช้หน่วยความจำมากขึ้น
-m, --max-ไม่ตรงกัน=ลอย
จำนวนการไม่ตรงกันสูงสุดที่อนุญาต (หากไม่ได้ระบุ ค่าเริ่มต้นจะเป็น
ระดับเร็วมากของ ((readlength+index_interval-1)/kmer - 2)) (โดยค่าเริ่มต้น the
ช่วงดัชนีจีโนมคือ 3 แต่สิ่งนี้สามารถเปลี่ยนแปลงได้โดยการระบุค่าที่ต่างกัน
for -q เพื่อ gmap_build เมื่อประมวลผลจีโนม)
หากระบุไว้ระหว่าง 0.0 ถึง 1.0 ให้ถือว่าเป็นเศษส่วน
ของความยาวอ่านแต่ละครั้ง มิฉะนั้น จะถือว่าเป็นจำนวนเต็มของจำนวนที่ไม่ตรงกัน
(รวมถึงบทลงโทษอินเดลและประกบ) สำหรับ RNA-Seq คุณอาจต้องเพิ่มค่านี้
ค่าเล็กน้อยเพื่อจัดแนวการอ่านที่ขยายผ่านปลาย exon
--min-ครอบคลุม=ลอย
ความครอบคลุมขั้นต่ำที่จำเป็นสำหรับการจัดตำแหน่ง หากระบุไว้ระหว่าง 0.0 ถึง 1.0 ดังนั้น
ถือเป็นเศษส่วนของความยาวในการอ่านแต่ละครั้ง มิฉะนั้นจะถือว่าเป็นอินทิกรัล
จำนวนคู่ฐาน ค่าเริ่มต้นคือ 0.0
--query-unk-ไม่ตรงกัน=INT
จะนับอักขระที่ไม่รู้จัก (N) ในแบบสอบถามว่าไม่ตรงกันหรือไม่ (0=no (ค่าเริ่มต้น)
1=ใช่)
--genome-unk-ไม่ตรงกัน=INT
จะนับอักขระที่ไม่รู้จัก (N) ในจีโนมว่าไม่ตรงกันหรือไม่ (0=no, 1=yes .)
(ค่าเริ่มต้น))
--การค้นหาสูงสุด=INT
จำนวนการจัดตำแหน่งสูงสุดที่จะค้นหา (ค่าเริ่มต้น 1000) ต้องใหญ่กว่า --npaths,
ซึ่งเป็นหมายเลขที่จะรายงาน การรักษาตัวเลขนี้ให้มากจะทำให้สุ่มได้
การเลือกระหว่างหลายการจัดตำแหน่ง การลดจำนวนนี้สามารถเร่งความเร็ว
โครงการ
-i, --อินเดล-จุดโทษ=INT
บทลงโทษสำหรับอินเดล (ค่าเริ่มต้น 2) อนุญาตให้นับไม่ตรงกัน การค้นหา
indels ให้โทษ indel น้อยกว่าหรือเท่ากับ max-mismatches ค่า < 2 can
นำไปสู่ผลบวกลวงเมื่ออ่านจบ
--indel-endlength=INT
ความยาวต่ำสุดที่ปลายที่จำเป็นสำหรับการจัดตำแหน่งอินเดล (ค่าเริ่มต้น 4)
-y, --แทรกกลางสูงสุด=INT
จำนวนการแทรกตรงกลางสูงสุดที่อนุญาต (ค่าเริ่มต้น 9)
-z, --max-middle-การลบ=INT จำนวนสูงสุดของการลบกลางที่อนุญาต (ค่าเริ่มต้น 30)
-Y, --max-end-แทรก=INT
จำนวนสูงสุดของการแทรกสิ้นสุดที่อนุญาต (ค่าเริ่มต้น 3)
-Z, --max-end-การลบ=INT
จำนวนสูงสุดของการลบสิ้นสุดที่อนุญาต (ค่าเริ่มต้น 6)
-M, --suboptimal-ระดับ=INT
รายงานการโจมตีที่ต่ำกว่ามาตรฐานที่มากกว่าการโจมตีที่ดีที่สุด (ค่าเริ่มต้น 0) การเข้าชมทั้งหมดที่มีคะแนนดีที่สุดบวก
มีการรายงานระดับล่างสุด
-a, --adapter-แถบ=STRING
วิธีการถอดอะแดปเตอร์ออกจากการอ่าน ค่าที่อนุญาตในปัจจุบัน: ปิด, จับคู่
ค่าเริ่มต้นคือ "ปิด" หากต้องการเปิด ให้ระบุ "จับคู่" ซึ่งจะลบอะแดปเตอร์ออกจาก
paired-end จะอ่านถ้าปรากฏอยู่
--trim-mismatch-คะแนน=INT
คะแนนที่จะใช้สำหรับการไม่ตรงกันเมื่อตัดแต่งปลาย (ค่าเริ่มต้นคือ -3; ที่จะปิด
ตัดแต่ง ระบุ 0). คำเตือน: การปิดการตัดแต่งจะให้ผลบวกที่ผิดพลาด
ไม่ตรงกันในตอนท้ายของการอ่าน
--trim-indel คะแนน=INT
คะแนนที่จะใช้สำหรับอินเดลเมื่อตัดแต่งปลาย (ค่าเริ่มต้นคือ -2; เพื่อปิดการตัดแต่ง
ระบุ 0). คำเตือน: การปิดการตัดแต่งจะทำให้ indels บวกปลอมที่
อ่านจบ
-V, --snpsdir=STRING
ไดเรกทอรีสำหรับไฟล์ดัชนี SNP (สร้างโดยใช้ snpindex) (ค่าเริ่มต้นคือตำแหน่งของ
ไฟล์ดัชนีจีโนมที่ระบุโดยใช้ -D และ -d)
-v, --use-snps=STRING
ใช้ฐานข้อมูลที่มี SNP ที่รู้จัก (in .iit สร้างขึ้นก่อนหน้านี้โดยใช้
snpindex) สำหรับความทนทานต่อ SNPs
--ซม=STRING
ไดเร็กทอรีสำหรับไฟล์ดัชนี methylcytosine (สร้างโดยใช้ cmetindex) (ค่าเริ่มต้นคือ
ตำแหน่งของไฟล์ดัชนีจีโนมที่ระบุโดยใช้ -D, -Vและ -d)
--atoidir=STRING
ไดเร็กทอรีสำหรับไฟล์ดัชนีการแก้ไข A-to-I RNA (สร้างโดยใช้ atoiindex) (ค่าเริ่มต้นคือ
ตำแหน่งของไฟล์ดัชนีจีโนมที่ระบุโดยใช้ -D, -Vและ -d)
--โหมด=STRING
โหมดการจัดตำแหน่ง: มาตรฐาน (ค่าเริ่มต้น), cmet-stranded, cmet-nonstranded, atoi-stranded,
แบบอะโทอิ แบบไม่มีเกลียว แบบเกลียวแบบเกลียว หรือแบบเกลียวแบบเกลียวแบบเกลียว ต้องใช้โหมดที่ไม่ได้มาตรฐาน
คุณต้องเคยรันโปรแกรม cmetindex หรือ atoiindex (ซึ่งครอบคลุมด้วย
โหมด ttoc) บนจีโนม
-t, --nกระทู้=INT
จำนวนเธรดผู้ปฏิบัติงาน
ตัวเลือกสำหรับการจัดตำแหน่ง GMAP ภายใน GSNAP
--gmap-โหมด=STRING
กรณีที่ใช้ GMAP สำหรับการจัดตำแหน่งที่ซับซ้อนซึ่งมีการประกบหรืออินเดลหลายตัว
ค่าที่อนุญาต: ไม่มี, ทั้งหมด, ค้นหาคู่, indel_knownsplice, เทอร์มินัล, ปรับปรุง
(หรือหลายค่า คั่นด้วยเครื่องหมายจุลภาค)
ค่าเริ่มต้น: all, ie, pairsearch,indel_knownsplice,terminal,improve
--trigger-คะแนนสำหรับ gmap=INT
ลองใช้การค้นหาคู่ของ GMAP ในบริเวณจีโนมใกล้เคียงหากได้คะแนนดีที่สุด (ผลรวมของปลายทั้งสองข้าง
ถ้า paired-end) เกินค่านี้ (ค่าเริ่มต้น 5)
--gmap-min-match-length=INT
ให้ GMAP โดนต่อเมื่อมีแมตช์ติดต่อกันหลายแมตช์นี้ (ค่าเริ่มต้น 20)
--gmap-เผื่อ=INT
คะแนนที่ไม่ตรงกัน/อินเดลเพิ่มเติมที่อนุญาตสำหรับการจัดตำแหน่ง GMAP (ค่าเริ่มต้น 3)
--max-gmap-pairsearch=INT
ทำการค้นหาคู่ของ GMAP ในบริเวณจีโนมที่อยู่ใกล้เคียงจนถึงผู้สมัครจำนวนมาก
สิ้นสุด (ค่าเริ่มต้น 50) ต้องการการค้นหาคู่ใน --gmap-โหมด
--max-gmap-เทอร์มินัล=INT
ดำเนินการเทอร์มินัล GMAP ในบริเวณจีโนมที่อยู่ใกล้เคียงจนถึงตัวเลือกจำนวนมากนี้
(ค่าเริ่มต้น 50) ต้องใช้เทอร์มินัลใน --gmap-โหมด
--max-gmap-การปรับปรุง=INT
ดำเนินการปรับปรุง GMAP ในพื้นที่จีโนมที่อยู่ใกล้เคียงจนถึงสิ้นผู้สมัครหลายคน
(ค่าเริ่มต้น 5) ต้องปรับปรุงใน --gmap-โหมด
--microexon-spliceprob=ลอย
อนุญาต microexons เฉพาะในกรณีที่ความน่าจะเป็นของไซต์ประกบตัวใดตัวหนึ่งมากกว่านี้
ค่า (ค่าเริ่มต้น 0.95)
ตัวเลือกการประกบสำหรับ DNA-Seq
--find-dna-chimeras=INT
ค้นหาการประกบกันระยะไกลในข้อมูล DNA-Seq (0=ไม่ใช่ (ค่าเริ่มต้น), 1=ใช่) โดยอัตโนมัติ
ปิดใช้งานสำหรับข้อมูล RNA-Seq if -N or -s ระบุไว้)
ตัวเลือก Splicing สำหรับ RNA-Seq
-N, --การแต่งนิยาย=INT
มองหาการประกบแบบใหม่ (0=ไม่ใช่ (ค่าเริ่มต้น), 1=ใช่)
--splicingdir=STRING
ไดเร็กทอรีสำหรับการประกบที่เกี่ยวข้องกับไซต์ที่รู้จักหรืออินตรอนที่รู้จัก ตามที่ระบุโดย
-s or --ใช้-ประกบ แฟล็ก (ค่าเริ่มต้นคือไดเร็กทอรีที่คำนวณจาก -D และ -d ธง)
หมายเหตุ: สามารถระบุชื่อพาธแบบเต็มให้กับ .ได้ -s ธงแทน
-s, --ใช้-ประกบ=STRING
มองหาการประกบที่เกี่ยวข้องกับไซต์ที่รู้จักหรืออินตรอนที่รู้จัก (in .iit) ที่
ระยะทางสั้นหรือยาว ดูคำแนะนำ README สำหรับความแตกต่างระหว่างที่รู้จัก
ไซต์และอินตรอนที่รู้จัก
--ambig-ประกบ-noclip
สำหรับการต่อรอยที่ไม่ชัดเจนที่ส่วนท้ายของการอ่าน ห้ามหนีบที่จุดต่อประกบ
แต่ขยายเข้าไปในอินตรอนแทน แฟล็กนี้เหมาะสมก็ต่อเมื่อคุณระบุ
--ใช้-ประกบ ธงและคุณกำลังพยายามกำจัดการตัดแบบอ่อนทั้งหมดด้วย
--trim-mismatch-คะแนน=0
-w, --localsplicedist=INT
คำจำกัดความของเหตุการณ์การประกบนวนิยายในพื้นที่ (ค่าเริ่มต้น 200000)
--ผู้ประกบนวนิยายเรื่องใหม่=INT
ระยะห่างเพื่อค้นหารอยต่อที่ปลายการอ่าน (ค่าเริ่มต้น 50000)
-e, --ท้องถิ่น-ประกบ-บทลงโทษ=INT
บทลงโทษสำหรับการเชื่อมต่อในพื้นที่ (ค่าเริ่มต้น 0) อนุญาตให้นับไม่ตรงกัน
-E, --distant-ประกบ-บทลงโทษ=INT
บทลงโทษสำหรับการประกบกันที่อยู่ห่างไกล (ค่าเริ่มต้น 1) รอยต่อที่อยู่ห่างไกลเป็นที่ที่อินตรอน
ความยาวเกินค่าของ -w,หรือ --localsplicedistหรือเป็นการผกผัน การแย่งชิง
หรือการโยกย้ายระหว่างสองโครโมโซมที่ต่างกัน นับไม่ตรงกัน
อนุญาตให้
-K, --distant-ประกบ-endlength=INT
ความยาวต่ำสุดที่ปลายที่จำเป็นสำหรับการจัดตำแหน่งประกบห่าง (ค่าเริ่มต้น 20, min
อนุญาตคือค่าของ -kหรือขนาดกิโลเมตร)
-l, --สั้น-ประกบ-endlength=INT
ความยาวต่ำสุดที่ปลายที่จำเป็นสำหรับการจัดตำแหน่งประกบด้านสั้น (ค่าเริ่มต้น 2 แต่
เว้นแต่ไซต์ประกบที่รู้จักจะมี -s ธง GSNAP อาจยังคงต้องการ
ความยาวปลายจะเป็นค่าของ -kหรือขนาด kmer เพื่อค้นหา splice ที่กำหนด
--distant-ประกบ-identity=ลอย
ข้อมูลประจำตัวขั้นต่ำที่ปลายที่จำเป็นสำหรับการจัดตำแหน่งประกบกันที่อยู่ห่างไกล (ค่าเริ่มต้น 0.95)
--ต่อต้านจุดโทษ=INT
(ไม่ได้ดำเนินการในขณะนี้ เนื่องจากจะนำไปสู่ผลลัพธ์ที่ไม่ดี) บทลงโทษสำหรับ
การต่อประกบกันต้านเมื่อใช้โปรโตคอล RNA-Seq ที่ควั่น ค่าบวก
เช่น 1 คาดหวัง antisense ในการอ่านครั้งแรกและความรู้สึกในการอ่านครั้งที่สอง
ค่าเริ่มต้นคือ 0 ซึ่งปฏิบัติต่อความรู้สึกและความรู้สึกผิดอย่างเท่าเทียมกัน
--ผสาน-ไกล-samechr
รายงานรอยต่อที่อยู่ห่างไกลบนโครโมโซมเดียวกันเป็นรอยต่อเดียว ถ้าเป็นไปได้
จะสร้างสาย SAM เดียวแทนที่จะเป็นสองสาย SAM ซึ่งทำเพื่อ
การโยกย้าย การผกผัน และเหตุการณ์ช่วงชิง
ตัวเลือกสำหรับการอ่านปลายคู่
--pairmax-ดีเอ็นเอ=INT
ความยาวสูงสุดของจีโนมทั้งหมดสำหรับการอ่านที่จับคู่ DNA-Seq หรือการอ่านอื่น ๆ โดยไม่ต้องประกบ
(ค่าเริ่มต้น 1000) ใช้ if -N or -s ไม่ได้ระบุ
--pairmax-rna=INT
ความยาวสูงสุดของจีโนมทั้งหมดสำหรับการอ่านที่จับคู่ RNA-Seq หรือการอ่านอื่น ๆ ที่อาจมีa
ประกบกัน (ค่าเริ่มต้น 200000) ใช้ if -N or -s ระบุไว้ น่าจะตรงกับ
คุ้มค่าสำหรับ -w, --localsplicedist.
--คู่คาดหวัง=INT
ความยาวปลายคู่ที่คาดไว้ ใช้สำหรับเรียกตัวต่อในส่วนตรงกลางของปลายคู่
อ่าน (ค่าเริ่มต้น 200) ถูกปิดในเวอร์ชันก่อนหน้า แต่คืนสถานะ
--pairdev=INT
ค่าเบี่ยงเบนที่อนุญาตจากความยาวปลายคู่ที่คาดไว้ ใช้สำหรับเรียกตัวต่อใน
ส่วนตรงกลางของการอ่านปลายคู่ (ค่าเริ่มต้น 100) ถูกปิดในก่อนหน้านี้
เวอร์ชันต่างๆ แต่คืนสถานะ
ตัวเลือกสำหรับคะแนนคุณภาพ
--คุณภาพ-โปรโตคอล=STRING
โปรโตคอลสำหรับคะแนนคุณภาพอินพุต ค่าที่อนุญาต: illumina (ASCII 64-126)
(เทียบเท่ากับ -J 64 -j -31) แซงเกอร์ (ASCII 33-126) (เทียบเท่ากับ -J 33 -j 0)
ค่าเริ่มต้นคือ sanger (ไม่มีกะงานพิมพ์คุณภาพ)
ไฟล์เอาต์พุต SAM ควรมีคะแนนคุณภาพในโปรโตคอล sanger
หรือคุณสามารถปรับแต่งการทำงานนี้ด้วยแฟล็กเหล่านี้:
-J, --คุณภาพ-ศูนย์-คะแนน=INT
คะแนนคุณภาพ FASTQ เป็นศูนย์ที่ค่า ASCII นี้ (ค่าเริ่มต้นคือ 33 สำหรับ sanger
มาตรการ; สำหรับ Illumina เลือก 64)
-j, --คุณภาพ-พิมพ์-shift=INT
เปลี่ยนคะแนนคุณภาพ FASTQ ด้วยจำนวนนี้ในเอาต์พุต (ค่าเริ่มต้นคือ 0 สำหรับ sanger
มาตรการ; ในการเปลี่ยนอินพุต Illumina เป็นเอาต์พุต Sanger ให้เลือก -31)
ตัวเลือกการส่งออก
-n, --npaths=INT
จำนวนเส้นทางการพิมพ์สูงสุด (ค่าเริ่มต้น 100)
-Q, --เงียบ-ถ้า-มากเกินไป
หากพบเส้นทางเกินจำนวนสูงสุด จะไม่มีการพิมพ์ใดๆ
-O, --สั่ง
พิมพ์ผลลัพธ์ในลำดับเดียวกันกับอินพุต (เกี่ยวข้องเฉพาะเมื่อมีผู้ปฏิบัติงานมากกว่าหนึ่งคน
เกลียว)
--แสดง-refdiff
สำหรับเอาต์พุต GSNAP ในการจัดตำแหน่งที่ทนต่อ SNP จะแสดงความแตกต่างทั้งหมดที่สัมพันธ์กับ
จีโนมอ้างอิงเป็นตัวพิมพ์เล็ก (ไม่เช่นนั้น จะแสดงความแตกต่างทั้งหมดที่สัมพันธ์กับ
ทั้งการอ้างอิงและจีโนมสำรอง)
--คลิปทับซ้อนกัน
สำหรับการอ่านปลายคู่ที่มีการจัดแนวทับซ้อนกัน ให้ตัดส่วนที่ทับซ้อนกัน
--ผสาน-ทับซ้อนกัน
สำหรับการอ่านแบบคู่ที่มีการจัดแนวทับซ้อนกัน ให้รวมปลายทั้งสองเป็นปลายด้านเดียว
(การใช้งานเบต้า)
--พิมพ์-snps
พิมพ์ข้อมูลโดยละเอียดเกี่ยวกับ SNP ในการอ่าน (ใช้ได้ก็ต่อเมื่อ -v เลือกด้วย)
(ยังดำเนินการไม่เต็มที่)
--ล้มเหลวเท่านั้น
พิมพ์เฉพาะการจัดตำแหน่งที่ล้มเหลว ไม่มีผลลัพธ์
--ไม่มีความล้มเหลว
ไม่รวมการพิมพ์การจัดตำแหน่งที่ล้มเหลว
-A, --รูปแบบ=STRING
รูปแบบอื่นนอกเหนือจากค่าเริ่มต้น ใช้งานในปัจจุบัน: sam, m8 (BLAST
รูปแบบตาราง)
--สปลิต-เอาท์พุต=STRING
ชื่อฐานสำหรับเอาต์พุตหลายไฟล์ แยกกันสำหรับการตั้งชื่อ, halfmapping_uniq,
halfmapping_mult, unpaired_uniq, unpaired_mult, paired_uniq, paired_mult,
concordant_uniq และ concordant_mult ผล
-o, --output-ไฟล์=STRING
ชื่อไฟล์สำหรับผลลัพธ์เอาต์พุตสตรีมเดียว
--failed-อินพุต=STRING
พิมพ์การจัดตำแหน่งที่ล้มเหลวอย่างสมบูรณ์ในรูปแบบอินพุต FASTA หรือ FASTQ ไปยังที่กำหนด
ไฟล์ ต่อท้าย .1 หรือ .2 สำหรับข้อมูลปลายคู่ ถ้า --สปลิต-เอาท์พุต ธงยังเป็น
กำหนด ไฟล์นี้ถูกสร้างขึ้นนอกเหนือจากผลลัพธ์ในไฟล์ .nomapping
--ผนวก-เอาท์พุต
เมื่อ --สปลิต-เอาท์พุต or --failed-อินพุต จะได้รับ แฟล็กนี้จะผนวกเอาท์พุตต่อท้าย
ไฟล์ที่มีอยู่ มิฉะนั้น ค่าเริ่มต้นคือการสร้างไฟล์ใหม่
--order-ในหมู่-ดีที่สุด=STRING
ในบรรดาการจัดตำแหน่งที่มีคะแนนดีที่สุด ให้เรียงลำดับการจัดตำแหน่งตามลำดับนี้
ค่าที่อนุญาต: จีโนม สุ่ม (ค่าเริ่มต้น)
--output-บัฟเฟอร์-ขนาด=INT
ขนาดบัฟเฟอร์ ในการสืบค้น สำหรับเธรดเอาต์พุต (ค่าเริ่มต้น 1000) เมื่อจำนวน
ผลลัพธ์ที่จะพิมพ์เกินขนาดนี้เธรดของผู้ปฏิบัติงานจะหยุดจนกว่า
เคลียร์งานค้าง
ตัวเลือกสำหรับเอาต์พุต SAM
--no-sam-ส่วนหัว
อย่าพิมพ์ส่วนหัวที่ขึ้นต้นด้วย '@'
--add-paired-nomappers
เพิ่มบรรทัด nomapper ตามความจำเป็นเพื่อให้ผลลัพธ์ที่จับคู่ทั้งหมดสลับกันระหว่าง first
ปลายและปลายที่สอง
--คู่-ธง-หมายถึง-สอดคล้อง=INT
บิตที่จับคู่ในแฟล็ก SAM หมายถึงสอดคล้องกันเท่านั้น (1) หรือบวกบวก
สอดคล้อง (0, ค่าเริ่มต้น)
--sam-ส่วนหัว-ชุด=INT
พิมพ์ส่วนหัวสำหรับชุดนี้เท่านั้น ตามที่ระบุโดย -q
--sam-use-0M
แทรก 0M ใน CIGAR ระหว่างการแทรกและการลบที่อยู่ติดกันที่ Picard ต้องการ
แต่อาจทำให้เกิดข้อผิดพลาดในเครื่องมืออื่นๆ ได้
--sam-หลายหลัก
อนุญาตให้ทำเครื่องหมายหลายตำแหน่งเป็นตำแหน่งหลักหากมีการดีเท่ากัน
คะแนนการทำแผนที่
--บังคับ-xs-dir
สำหรับการจัดตำแหน่ง RNA-Seq ไม่อนุญาต XS:A:? เมื่อทิศทางความรู้สึกไม่ชัดเจนและ
แทนที่ค่านี้โดยพลการด้วย XS:A:+ อาจมีประโยชน์สำหรับบางโปรแกรม เช่น
เป็น Cufflinks ที่ไม่สามารถจัดการ XS:A:? อย่างไรก็ตาม หากคุณใช้แฟล็กนี้ ค่า
ค่าที่รายงานของ XS:A:+ ในกรณีเหล่านี้จะไม่มีความหมาย
--md-ตัวพิมพ์เล็ก-snp
ในสตริง MD เมื่อ SNP ที่รู้จักถูกกำหนดโดย -v ธงพิมพ์ความแตกต่าง
นิวคลีโอไทด์เป็นตัวพิมพ์เล็กเมื่อแตกต่างจากการอ้างอิง แต่ตรงกับที่รู้จัก
อัลลีลสำรอง
--extend-ซอฟท์คลิป
ขยายการจัดตำแหน่งผ่านบริเวณที่มีการตัดแบบอ่อน
--action-if-cigar-ข้อผิดพลาด
การดำเนินการที่จะดำเนินการหากมีข้อขัดแย้งระหว่างความยาวของ CIGAR และความยาวของลำดับ
ค่าที่อนุญาต: ละเว้น, คำเตือน, noprint (ค่าเริ่มต้น), abort
--read-group-id=STRING
ค่าที่จะใส่ลงในช่อง read-group id (RG-ID)
--อ่านชื่อกลุ่ม=STRING
ค่าที่จะใส่ลงในฟิลด์ชื่อกลุ่มการอ่าน (RG-SM)
--read-กลุ่มห้องสมุด=STRING
ค่าที่จะใส่ลงในช่อง read-group library (RG-LB)
--read-group-แพลตฟอร์ม=STRING
ค่าที่จะใส่ลงในช่อง read-group library (RG-PL)
ตัวเลือกความช่วยเหลือ
--ตรวจสอบ
ตรวจสอบสมมติฐานของคอมไพเลอร์
--รุ่น
แสดงเวอร์ชัน
--ช่วยด้วย แสดงข้อความช่วยเหลือนี้
เครื่องมืออื่นๆ ของชุด GMAP จะอยู่ใน /usr/lib/gmap
ใช้ gsnap ออนไลน์โดยใช้บริการ onworks.net