นี่คือคำสั่ง gmap ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
gmap - การทำแผนที่จีโนมและโปรแกรมการจัดตำแหน่ง
เรื่องย่อ
จีแมป [OPTIONS... ] <ฟาสต้า ไฟล์...>, or แมว | gmap [ตัวเลือก...]
OPTIONS
อินพุต ตัวเลือก (ต้อง ประกอบด้วย -d or -g)
-D, --ผบ=ไดเรกทอรี
ไดเรกทอรีจีโนม ค่าเริ่มต้น (ตามที่ระบุโดย --ด้วย-gmapdb ไปที่โปรแกรมกำหนดค่า)
is /var/cache/gmap
-d, --ฐานข้อมูล=STRING
ฐานข้อมูลจีโนม ถ้าอาร์กิวเมนต์คือ '?' (พร้อมเครื่องหมายคำพูด) คำสั่งนี้แสดงรายการ
ฐานข้อมูลที่มีอยู่
-k, --กม=INT
ขนาด kmer ที่จะใช้ในฐานข้อมูลจีโนม (ค่าที่อนุญาต: 16 หรือน้อยกว่า) ถ้าไม่
ระบุโปรแกรมจะค้นหาขนาดสูงสุดของ kmer ที่มีอยู่ในจีโนม
ฐานข้อมูล
--สุ่มตัวอย่าง=INT
การสุ่มตัวอย่างเพื่อใช้ในฐานข้อมูลจีโนม หากไม่ระบุ โปรแกรมจะค้นหา
ค่าสุ่มตัวอย่างที่เล็กที่สุดในฐานข้อมูลจีโนมภายในขนาด k-mer ที่เลือก
-G, --จีโนมฟูล
ใช้จีโนมแบบเต็ม (อนุญาตให้ใช้อักขระ ASCII ทั้งหมด สร้างขึ้นอย่างชัดเจนระหว่างการตั้งค่า) ไม่ใช่
เวอร์ชันบีบอัด
-g, --gseg=ชื่อไฟล์
กลุ่มจีโนมที่ผู้ใช้จัดหา
-1, --จัดฟันเอง
จัดแนวหนึ่งลำดับเทียบกับตัวเองในรูปแบบ FASTA ผ่าน stdin (มีประโยชน์สำหรับการรับ
การแปลโปรตีนของลำดับนิวคลีโอไทด์)
-2, --จัดฟันคู่
จัดแนวสองลำดับในรูปแบบ FASTA ผ่าน stdin ลำดับแรกเป็นจีโนมและวินาที
หนึ่งคือ cDNA
--cmdline=STRING,STRING
จัดแนวสองลำดับที่ให้มาบนบรรทัดคำสั่ง ลำดับแรกเป็นจีโนมและ
คนที่สองคือ cDNA
-q, --ส่วนหนึ่ง=INT/INT
ประมวลผลเฉพาะ i-th ของทุก ๆ n ลำดับเช่น 0/100 หรือ 99/100 (มีประโยชน์สำหรับ
กระจายงานไปยังฟาร์มคอมพิวเตอร์)
--อินพุต-บัฟเฟอร์-ขนาด=INT
ขนาดของบัฟเฟอร์อินพุต (โปรแกรมอ่านหลาย ๆ ลำดับพร้อมกันเพื่อประสิทธิภาพ)
(ค่าเริ่มต้น 1000)
ตัวเลือกการคำนวณ
-B, --แบทช์=INT
โหมดแบทช์ (ค่าเริ่มต้น = 2)
โหมด ออฟเซ็ต ตำแหน่ง จีโนม
0 ดูหมายเหตุ mmap mmap
1 ดูบันทึกย่อ mmap & โหลดล่วงหน้า mmap
(ค่าเริ่มต้น) 2 ดูหมายเหตุ mmap & โหลดล่วงหน้า mmap & โหลดล่วงหน้า
3 ดูโน้ตจัดสรร mmap & โหลดล่วงหน้า
4 ดูหมายเหตุ จัดสรร จัดสรร
5 ขยาย จัดสรร จัดสรร
หมายเหตุ: สำหรับลำดับเดียว โครงสร้างข้อมูลทั้งหมดใช้ mmap
หากไม่มี mmap และไม่ได้จัดสรรไว้ จะใช้ fileio (ช้ามาก)
หมายเหตุเกี่ยวกับ --แบทช์ และออฟเซ็ต: สามารถควบคุมการขยายออฟเซ็ตได้
อย่างอิสระโดย --ขยายออฟเซ็ต ธง. NS --แบทช์=5 ตัวเลือกเทียบเท่ากับ
--แบทช์=4 บวก --ขยายออฟเซ็ต=1
--ขยายออฟเซ็ต=INT
จะขยายดัชนีออฟเซ็ตของจีโนมหรือไม่ ค่า: 0 (ไม่ใช่ ค่าเริ่มต้น) หรือ 1 (ใช่)
การขยายช่วยให้การจัดตำแหน่งเร็วขึ้น แต่ต้องใช้หน่วยความจำมากขึ้น
--การประกบจมูก
ปิดการประกบ (มีประโยชน์สำหรับการจัดลำดับจีโนมบนจีโนม)
--นาที-อินตรอนความยาว=INT
ความยาวต่ำสุดสำหรับอินตรอนภายในหนึ่งอัน (ค่าเริ่มต้น 9) ด้านล่างขนาดนี้ ช่องว่างจีโนม
จะถือว่าเป็นการลบมากกว่าอินตรอน
-K, --ความยาวอินตรอน=INT
ความยาวสูงสุดสำหรับอินตรอนภายในหนึ่งอัน (ค่าเริ่มต้น 200000)
-w, --localsplicedist=INT
ความยาวสูงสุดสำหรับไซต์ต่อที่ทราบเมื่อสิ้นสุดลำดับ (ค่าเริ่มต้น 2000000)
-L, --ความยาวทั้งหมด=INT
ความยาวอินตรอนรวมสูงสุด (ค่าเริ่มต้น 2400000)
-x, --chimera-ขอบ=INT
จำนวนลำดับที่ไม่สอดคล้องกันซึ่งทำให้เกิดการค้นหาลำดับที่เหลือ
(ค่าเริ่มต้น 30) เปิดใช้งานการจัดตำแหน่งการอ่านแบบ chimeric และอาจช่วยได้บ้าง
อ่านไม่เพ้อฝัน หากต้องการปิด ให้ตั้งค่าเป็นศูนย์
--ไม่มีไคเมรา
ปิดการค้นหา chimeras ผลเช่นเดียวกับ --chimera-ขอบ=0
-t, --nกระทู้=INT
จำนวนเธรดผู้ปฏิบัติงาน
-c, --chrsubset=เชือก
จำกัดการค้นหาให้อยู่ในโครโมโซมที่กำหนด
-z, --ทิศทาง=STRING
ทิศทาง cDNA (sense_force, antisense_force, sense_filter, antisense_filter หรือ
อัตโนมัติ (ค่าเริ่มต้น))
-H, --trimendexons=INT
ตัดแต่ง exons ท้ายด้วยจำนวนการแข่งขันน้อยกว่าที่กำหนด (ใน nt ค่าเริ่มต้น 9)
--canonical-โหมด=INT
รางวัลสำหรับอินตรอนตามบัญญัติและกึ่งบัญญัติ 0=รางวัลต่ำ 1=รางวัลสูง
(ค่าเริ่มต้น), 2=รางวัลต่ำสำหรับลำดับที่มีตัวตนสูงและรางวัลสูงเป็นอย่างอื่น
--ข้ามสายพันธุ์
ใช้การค้นหาที่ละเอียดอ่อนกว่าสำหรับการประกบแบบบัญญัติ ซึ่งช่วยได้โดยเฉพาะอย่างยิ่งสำหรับ
การจัดตำแหน่งข้ามสายพันธุ์และกรณีที่ยากลำบากอื่น ๆ
--อนุญาต-ปิด indels=INT
อนุญาตให้แทรกและลบใกล้กัน (0=ไม่ใช่, 1=ใช่ (ค่าเริ่มต้น), 2=เท่านั้น
เพื่อการจัดตำแหน่งคุณภาพสูง)
--microexon-spliceprob=ลอย
อนุญาต microexons เฉพาะในกรณีที่ความน่าจะเป็นของไซต์ประกบตัวใดตัวหนึ่งมากกว่านี้
ค่า (ค่าเริ่มต้น 0.95)
--ซม=STRING
ไดเร็กทอรีสำหรับไฟล์ดัชนี methylcytosine (สร้างโดยใช้ cmetindex) (ค่าเริ่มต้นคือ
ตำแหน่งของไฟล์ดัชนีจีโนมที่ระบุโดยใช้ -D, -Vและ -d)
--atoidir=STRING
ไดเร็กทอรีสำหรับไฟล์ดัชนีการแก้ไข A-to-I RNA (สร้างโดยใช้ atoiindex) (ค่าเริ่มต้นคือ
ตำแหน่งของไฟล์ดัชนีจีโนมที่ระบุโดยใช้ -D, -Vและ -d)
--โหมด=STRING
โหมดการจัดตำแหน่ง: มาตรฐาน (ค่าเริ่มต้น), cmet-stranded, cmet-nonstranded, atoi-stranded,
แบบอะโทอิ แบบไม่มีเกลียว แบบเกลียวแบบเกลียว หรือแบบเกลียวแบบเกลียวแบบเกลียว ต้องใช้โหมดที่ไม่ได้มาตรฐาน
คุณต้องเคยรันโปรแกรม cmetindex หรือ atoiindex (ซึ่งครอบคลุมด้วย
โหมด ttoc) บนจีโนม
-p, --พรุนระดับ
ระดับการตัดแต่งกิ่ง: 0=ไม่มีการตัดแต่งกิ่ง (ค่าเริ่มต้น), 1=ลำดับที่แย่, 2=ลำดับการทำซ้ำ, 3=แย่ และ
ซ้ำ
ประเภทเอาต์พุต
-S, --สรุป
แสดงสรุปการจัดตำแหน่งเท่านั้น
-A, --จัดตำแหน่ง
แสดงการจัดตำแหน่ง
-3, --ต่อเนื่อง
แสดงการจัดตำแหน่งในสามบรรทัดต่อเนื่องกัน
-4, --ต่อเนื่องโดยexon
แสดงการจัดตำแหน่งในสามบรรทัดต่อ exon
-Z, --บีบอัด
พิมพ์ออกมาในรูปแบบบีบอัด
-E, --เอ็กซอน=STRING
พิมพ์ exons ("cdna" หรือ "genomic")
-P, --protein_dna
พิมพ์ลำดับโปรตีน (cDNA)
-Q, --โปรตีน_เจน
พิมพ์ลำดับโปรตีน (จีโนม)
-f, --รูปแบบ=INT
รูปแบบอื่นสำหรับเอาต์พุต (โปรดทราบว่า -A และ -S ตัวเลือกและตัวเลือกอื่น ๆ ที่ระบุไว้
ภายใต้ประเภทเอาต์พุต):
psl (หรือ 1) = รูปแบบ PSL (BLAT)
gff3_gene (หรือ 2) = รูปแบบยีน GFF3
gff3_match_cdna (หรือ 3) = รูปแบบ GFF3 cDNA_match
gff3_match_est (หรือ 4) = รูปแบบ GFF3 EST_match
splicesites (หรือ 6) = เอาต์พุต splicesites (สำหรับไฟล์ splicing GSNAP)
introns = เอาต์พุต introns (สำหรับไฟล์ splicing GSNAP)
map_exons (หรือ 7) = รูปแบบแผนที่ IIT FASTA exon
map_ranges (หรือ 8) = รูปแบบแผนที่ช่วง IIT FASTA
coords (หรือ 9) = coords ในรูปแบบตาราง
sampe = รูปแบบ SAM (การตั้งค่า paired_read bit ในแฟล็ก)
samse = รูปแบบ SAM (ไม่มีการตั้งค่า paired_read bit)
ตัวเลือกการส่งออก
-n, --npaths=INT
จำนวนเส้นทางสูงสุดที่จะแสดง (ค่าเริ่มต้น 5) หากตั้งค่าเป็น 1 GMAP จะไม่รายงาน
แนวคิเมริก เพราะนั่นหมายถึงสองเส้นทาง หากคุณต้องการการจัดตำแหน่งเดียว
บวกการจัดแนวคิเมริก แล้วตั้งค่านี้เป็น 0
--suboptimal-คะแนน=INT
รายงานเฉพาะเส้นทางที่มีคะแนนอยู่ในค่านี้ของเส้นทางที่ดีที่สุด โดยค่าเริ่มต้น,
หากไม่มีตัวเลือกนี้
โปรแกรมพิมพ์เส้นทางทั้งหมดที่พบ
-O, --สั่ง
พิมพ์ผลลัพธ์ในลำดับเดียวกันกับอินพุต (เกี่ยวข้องเฉพาะเมื่อมีผู้ปฏิบัติงานมากกว่าหนึ่งคน
เกลียว)
-5, --md5
พิมพ์เช็คซัม MD5 สำหรับแต่ละลำดับการสืบค้น
-o, --chimera-คาบเกี่ยว
ทับซ้อนกันเพื่อแสดง หากมี ที่จุดพัก chimera
--ล้มเหลวเท่านั้น
พิมพ์เฉพาะการจัดตำแหน่งที่ล้มเหลว ไม่มีผลลัพธ์
--ไม่มีความล้มเหลว
ไม่รวมการพิมพ์การจัดตำแหน่งที่ล้มเหลว
-V, --snpsdir=STRING
ไดเรกทอรีสำหรับไฟล์ดัชนี SNP (สร้างโดยใช้ snpindex) (ค่าเริ่มต้นคือตำแหน่งของ
ไฟล์ดัชนีจีโนมที่ระบุโดยใช้ -D และ -d)
-v, --use-snps=STRING
ใช้ฐานข้อมูลที่มี SNP ที่รู้จัก (in .iit สร้างขึ้นก่อนหน้านี้โดยใช้
snpindex) สำหรับความทนทานต่อ SNPs
--สปลิต-เอาท์พุต=STRING
ชื่อฐานสำหรับเอาต์พุตหลายไฟล์ แยกกันสำหรับการตั้งชื่อ
uniq, mult, (และคิเมร่า if --chimera-ขอบ ถูกเลือก)
--failed-อินพุต=STRING
พิมพ์การจัดตำแหน่งที่ล้มเหลวอย่างสมบูรณ์ในรูปแบบอินพุต FASTA หรือ FASTQ ไปยังที่กำหนด
ไฟล์. ถ้า --สปลิต-เอาท์พุต นอกจากนี้ยังได้รับแฟล็กไฟล์นี้ถูกสร้างขึ้นเพิ่มเติม
ไปยังเอาต์พุตในไฟล์ .nomapping
--ผนวก-เอาท์พุต
เมื่อ --สปลิต-เอาท์พุต or --ล้มเหลวในการป้อนข้อมูล จะได้รับ แฟล็กนี้จะผนวกเอาท์พุตต่อท้าย
ไฟล์ที่มีอยู่ มิฉะนั้น ค่าเริ่มต้นคือการสร้างไฟล์ใหม่
--output-บัฟเฟอร์-ขนาด=INT
ขนาดบัฟเฟอร์ ในการสืบค้น สำหรับเธรดเอาต์พุต (ค่าเริ่มต้น 1000) เมื่อจำนวน
ผลลัพธ์ที่จะพิมพ์เกินขนาดนี้เธรดของผู้ปฏิบัติงานจะหยุดจนกว่า
เคลียร์งานค้าง
-F, --เต็มความยาว
สมมติว่ามีโปรตีนเต็มความยาว เริ่มด้วย Met
-a, --cdsstart=INT
แปล codon จากนิวคลีโอไทด์ที่ให้มา (1-based)
-T, --ตัด
ตัดการจัดตำแหน่งรอบโปรตีนเต็มความยาว พบเพื่อหยุดโดยนัย -F ธง.
-Y, --ใจกว้าง
แปล cDNA พร้อมการแก้ไขสำหรับ frameshifts
ตัวเลือกสำหรับเอาต์พุต GFF3
--gff3-เพิ่มคั่น=INT
จะเพิ่มตัวคั่น ### หลังจากแต่ละลำดับการสืบค้นหรือไม่ ค่า: 0 (ไม่ใช่), 1 (ใช่,
ค่าเริ่มต้น)
ตัวเลือกสำหรับเอาต์พุต SAM
--no-sam-ส่วนหัว
อย่าพิมพ์ส่วนหัวที่ขึ้นต้นด้วย '@'
--sam-use-0M
แทรก 0M ใน CIGAR ระหว่างการแทรกและการลบที่อยู่ติดกันที่ Picard ต้องการ
แต่อาจทำให้เกิดข้อผิดพลาดในเครื่องมืออื่นๆ ได้
--บังคับ-xs-dir
สำหรับการจัดตำแหน่ง RNA-Seq ไม่อนุญาต XS:A:? เมื่อทิศทางความรู้สึกไม่ชัดเจนและ
แทนที่ค่านี้โดยพลการด้วย XS:A:+ อาจมีประโยชน์สำหรับบางโปรแกรม เช่น
เป็น Cufflinks ที่ไม่สามารถจัดการ XS:A:? อย่างไรก็ตาม หากคุณใช้แฟล็กนี้ ค่า
ค่าที่รายงานของ XS:A:+ ในกรณีเหล่านี้จะไม่มีความหมาย
--md-ตัวพิมพ์เล็ก-snp
ในสตริง MD เมื่อ SNP ที่รู้จักถูกกำหนดโดย -v ธง,
พิมพ์ความแตกต่างของนิวคลีโอไทด์เป็นตัวพิมพ์เล็กเมื่อพวกมัน
แตกต่างจากการอ้างอิง แต่ตรงกับอัลลีลสำรองที่รู้จัก
--action-if-cigar-ข้อผิดพลาด
การดำเนินการที่จะดำเนินการหากมีข้อขัดแย้งระหว่างความยาวของ CIGAR และความยาวของลำดับ
ค่าที่อนุญาต: ละเว้น, คำเตือน (ค่าเริ่มต้น), abort
--read-group-id=STRING
ค่าที่จะใส่ลงในช่อง read-group id (RG-ID)
--อ่านชื่อกลุ่ม=STRING
ค่าที่จะใส่ลงในฟิลด์ชื่อกลุ่มการอ่าน (RG-SM)
--read-กลุ่มห้องสมุด=STRING
ค่าที่จะใส่ลงในช่อง read-group library (RG-LB)
--read-group-แพลตฟอร์ม=STRING
ค่าที่จะใส่ลงในช่อง read-group library (RG-PL)
ตัวเลือกสำหรับคะแนนคุณภาพ
--คุณภาพ-โปรโตคอล=STRING
โปรโตคอลสำหรับคะแนนคุณภาพอินพุต ค่าที่อนุญาต: illumina (ASCII 64-126)
(เทียบเท่ากับ -J 64 -j -31) แซงเกอร์ (ASCII 33-126) (เทียบเท่ากับ -J 33 -j 0)
ค่าเริ่มต้นคือ sanger (ไม่มีกะงานพิมพ์คุณภาพ)
ไฟล์เอาต์พุต SAM ควรมีคะแนนคุณภาพในโปรโตคอล sanger
หรือคุณสามารถระบุกะการพิมพ์ด้วยแฟล็กนี้:
-j, --คุณภาพ-พิมพ์-shift=INT
เปลี่ยนคะแนนคุณภาพ FASTQ ด้วยจำนวนนี้ในเอาต์พุต (ค่าเริ่มต้นคือ 0 สำหรับ sanger
มาตรการ; ในการเปลี่ยนอินพุต Illumina เป็นเอาต์พุต Sanger ให้เลือก -31)
ตัวเลือกไฟล์แผนที่ภายนอก
-M, --แผนที่=ไดเรกทอรี
ไดเรกทอรีแผนที่
-m, --แผนที่=iitfile
ไฟล์แผนที่. ถ้าอาร์กิวเมนต์คือ '?' (ด้วยคำพูด)
รายการนี้แสดงรายการไฟล์แผนที่ที่มีอยู่
-e, --แมปซอน
แมปแต่ละ exon แยกกัน
-b, --แผนที่ทั้งสอง
รายงานการเข้าชมจากทั้งสองสายของจีโนม
-u, --ขนาบข้าง=INT
แสดงการตีขนาบข้าง (ค่าเริ่มต้น 0)
--พิมพ์-แสดงความคิดเห็น
แสดงบรรทัดความคิดเห็นสำหรับแต่ละ Hit
ตัวเลือกเอาท์พุตการจัดตำแหน่ง
-N, --ไม่ยาว
ไม่มีความยาวอินตรอนในการจัดตำแหน่ง
-I, --โหมดกลับด้าน=INT
โหมดสำหรับการจัดตำแหน่งเป็นสายพันธุกรรม (-): 0=อย่ากลับค่า cDNA (ค่าเริ่มต้น)
1=สลับ cDNA และพิมพ์ genomic (-) strand 2=Invert cDNA และพิมพ์ genomic (+)
เส้นใย
-i, --intronap=INT
นิวคลีโอไทด์ที่จะแสดงที่ปลายอินตรอนแต่ละด้าน (ค่าเริ่มต้น 3)
-l, --ความยาวห่อ=INT
ความยาวห่อสำหรับการจัดตำแหน่ง (ค่าเริ่มต้น 50)
การกรองตัวเลือกเอาต์พุต
--min-ตัด-ครอบคลุม=ลอย
อย่าพิมพ์แนวที่มีการตัดขอบน้อยกว่าค่านี้ (ค่าเริ่มต้น=0.0 ซึ่ง
หมายถึงไม่มีการกรอง) โปรดทราบว่าการจัดตำแหน่งแบบคิเมริกจะถูกส่งออกโดยไม่คำนึงถึงสิ่งนี้
กรอง
--min-เอกลักษณ์=ลอย
อย่าพิมพ์แนวที่มีข้อมูลประจำตัวน้อยกว่าค่านี้ (ค่าเริ่มต้น = 0.0 ซึ่งหมายถึง no
การกรอง) โปรดทราบว่าการจัดตำแหน่งแบบคิเมริกจะส่งออกโดยไม่คำนึงถึงตัวกรองนี้
ตัวเลือกความช่วยเหลือ
--ตรวจสอบ
ตรวจสอบสมมติฐานของคอมไพเลอร์
--รุ่น
แสดงเวอร์ชัน
--ช่วยด้วย แสดงข้อความช่วยเหลือนี้
เครื่องมืออื่นๆ ของชุด GMAP จะอยู่ใน /usr/lib/gmap
ใช้ gmap ออนไลน์โดยใช้บริการ onworks.net