นี่คือคำสั่ง leaff ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
leaff - ยูทิลิตี้ลำดับไลบรารีและแอปพลิเคชัน
เรื่องย่อ
ใบไม้ [-f fasta-file] [ตัวเลือก]
DESCRIPTION
LEAFF (Let's Extract Anything From Fasta) เป็นโปรแกรมอรรถประโยชน์สำหรับการทำงานกับ multi-
ไฟล์ fasta นอกเหนือจากการให้การเข้าถึงแบบสุ่มในระดับพื้นฐานแล้ว ยังรวมถึงหลาย ๆ อย่างอีกด้วย
ฟังก์ชันการวิเคราะห์
OPTIONS
ไฟล์ต้นฉบับ
ไฟล์ -f: ใช้ลำดับใน 'ไฟล์' (อนุญาตให้ใช้ -F ด้วยเหตุผลทางประวัติศาสตร์)
- ไฟล์: อ่านการกระทำจาก 'ไฟล์'
การตรวจสอบไฟล์แหล่งที่มา
-d: พิมพ์จำนวนลำดับใน fasta
-i ชื่อ: พิมพ์ดัชนี ติดป้ายกำกับแหล่งที่มา 'ชื่อ'
ตัวเลือกเอาต์พุต
-6 <#>: ใส่บรรทัดใหม่ทุกๆ 60 ตัวอักษร
(ถ้าหาเรื่องถัดไปเป็นตัวเลข ให้ขึ้นบรรทัดใหม่ทุกๆ
n ตัวอักษร เช่น -6 80. ปิดการใช้งานตัวแบ่งบรรทัดด้วย -6 0,
หรือเพียงแค่อย่าใช้ -6!)
-e beg end: พิมพ์เฉพาะฐานจากตำแหน่ง 'beg' ถึงตำแหน่ง 'end'
(ตามช่องว่าง สัมพันธ์กับลำดับ FORWARD!) ถ้า
beg == end จากนั้นลำดับทั้งหมดจะถูกพิมพ์ มันเป็น
ข้อผิดพลาดในการระบุ beg > end หรือ beg > len หรือ end > len
-ends n พิมพ์ n ฐานจากปลายแต่ละด้านของลำดับ หนึ่งอินพุต
ลำดับสร้างลำดับเอาต์พุตสองลำดับ โดยมี '_5' หรือ '_3'
ต่อท้าย ID ถ้า 2n >= ความยาวของลำดับ, the
ลำดับถูกพิมพ์เอง ไม่มีการดึงส่วนปลาย (พวกเขา
ทับซ้อนกัน)
-C: เสริมลำดับ
-H: อย่าพิมพ์ defline
-h: ใช้คำถัดไปเป็นตัวกำหนด ("-H -H" จะรีเซ็ตเป็น
เดิมdefline
-R: ย้อนกลับลำดับ
-u: ตัวพิมพ์ใหญ่ ฐานทั้งหมด
ลำดับการเลือก
-G nsl: พิมพ์ n ลำดับที่สร้างแบบสุ่ม, 0 < s <= length <= l
-L sl: พิมพ์ลำดับทั้งหมดเช่น s <= length < l
-N lh: พิมพ์ลำดับทั้งหมดเพื่อให้ l <= % N องค์ประกอบ < h
(หมายเหตุ 0.0 <= ล. < ชม. < 100.0)
(โปรดทราบว่าคุณไม่สามารถพิมพ์ลำดับด้วย 100% N
นี่เป็นข้อผิดพลาดที่มีประโยชน์)
ไฟล์ -q: พิมพ์ลำดับจากรายการ seqid ใน 'file'
-r num: พิมพ์ 'num' สุ่มเลือกลำดับ
-s seqid: พิมพ์ลำดับเดียว 'seqid'
-S fl: พิมพ์ลำดับทั้งหมดจาก ID 'f' ถึง 'l' (รวม)
-W: พิมพ์ลำดับทั้งหมด (ทำทั้งไฟล์)
ช่วยนานขึ้น
-ช่วยวิเคราะห์
-ช่วยเหลือตัวอย่าง
ฟังก์ชั่นการวิเคราะห์
--findduplicates a.fasta
รายงานลำดับที่มีอยู่มากกว่าหนึ่งครั้ง เอาท์พุต
เป็นรายการคู่ของ deflines คั่นด้วยการขึ้นบรรทัดใหม่
--mapduplicates a.fasta ข.fasta
สร้างแผนที่ของ IID จาก a.fasta และ b.fasta ที่มี
ลำดับที่เหมือนกัน รูปแบบคือ "IIDA <-> IIDb"
--md5 a.fasta:
อย่าพิมพ์ลำดับ แต่พิมพ์ md5 checksum
(ของลำดับทั้งหมด) ตามด้วย defline ทั้งหมด
--ส่วนนำหน้าพาร์ติชั่น [ n[gmk]bp | n ] a.fasta
--partitionmap [ n[gmk]bp | น. ] ก. อดอาหาร
แบ่งลำดับออกเป็นชิ้นที่มีขนาดเท่ากันโดยประมาณของ
ขนาด nbp, nkbp, nmpp หรือ ngbp; หรือเป็น n ที่มีขนาดเท่ากันโดยประมาณ
ความเสมอภาค ลำดับที่ใหญ่กว่าขนาดพาร์ติชั่นคือ
ในพาร์ทิชันด้วยตัวเอง --partitionmap เขียน a
คำอธิบายของพาร์ติชั่นไปยัง stdout; --partiton สร้าง
ไฟล์ fasta 'prefix-###.fasta' สำหรับแต่ละพาร์ติชั่น
ตัวอย่าง: -F some.fasta --partition parts 130mp
-F some.fasta --พาร์ติชั่น 16
--ส่วนคำนำหน้า n a.fasta
แยกลำดับออกเป็น n ไฟล์ คำนำหน้า-###.fasta
ลำดับจะไม่ถูกจัดลำดับใหม่ n ลำดับแรกอยู่ใน
ไฟล์แรก n ถัดไปในไฟล์ที่สอง ฯลฯ
--gccontent a.fasta
รายงานเนื้อหา GC ผ่านหน้าต่างบานเลื่อนของ
3, 5, 11, 51, 101, 201, 501, 1001, 2001 ขป.
--testindex a.fasta
ทดสอบดัชนีของ 'ไฟล์' หากดัชนีเป็นปัจจุบัน leaff
ออกได้สำเร็จ มิฉะนั้น leaff ออกด้วยรหัส 1 ถ้า an
มีการจัดเตรียมไฟล์ดัชนีไว้ ไฟล์นั้นได้รับการทดสอบแล้ว มิฉะนั้น
ใช้ชื่อไฟล์ดัชนีเริ่มต้น
--dumpblocks a.fasta
สร้างรายการบล็อกของ N และไม่ใช่ N เอาท์พุต
รูปแบบคือ 'base seq# beg end len' 'N 84 483 485 2' หมายถึง
ว่าบล็อกของ 2 N เริ่มต้นที่ตำแหน่งบนอวกาศ 483
ตามลำดับ 84. A '.' เป็นจุดสิ้นสุดของลำดับ
เครื่องหมาย
--ข้อผิดพลาด LNCP a.fasta
สำหรับทุกลำดับในไฟล์อินพุต ให้สร้าง new
ลำดับรวมทั้งข้อผิดพลาดในการจำลองลำดับ
L -- ความยาวของลำดับใหม่ ถ้าศูนย์ ความยาว
ของลำดับเดิมจะถูกใช้
ยังไม่มีข้อความ -- จำนวนของลำดับที่จะสร้าง ถ้า L=0 ทั้งหมด
ลำดับย่อยจะเหมือนกันและคุณควรใช้
ซี แทน.
C -- จำนวนสำเนาที่จะสร้าง N . แต่ละคน
ลำดับถัดมาจะมีสำเนา C แต่ละชุดมีความแตกต่างกัน
ข้อผิดพลาด
P -- ความน่าจะเป็นของข้อผิดพลาด
คำแนะนำ: เพื่อจำลอง EST จากยีน ให้ใช้ L=500, N=10, C=10
-- ทำให้ C=10 ซีเควนเซอร์รัน N=10 EST ลำดับ
ยาวอย่างละ 500bp
เพื่อจำลอง mRNA จากยีน ให้ใช้ L=0, N=10, C=10
เพื่อจำลองการอ่านจากจีโนม ใช้ L=800, N=10, C=1
-- แน่นอน N= ควรเพิ่มขึ้นเพื่อให้
ความลึกที่เหมาะสมของความคุ้มครอง
--stats a.fasta
สถิติขนาดรายงาน หมายเลข N50 ผลรวมที่ใหญ่ที่สุด
--seqstore out.seqStore
แปลงไฟล์อินพุต (-f) เป็นไฟล์ seqStore (เช่น
สำหรับใช้กับแอสเซมเบลอร์ Celera หรือ sim4db)
หมายเหตุ
โปรดทราบว่าตัวเลือกขึ้นอยู่กับคำสั่งซื้อ ลำดับจะถูกพิมพ์เมื่อใดก็ตามที่ SEQUENCE
ตัวเลือก SELECTION เกิดขึ้นบนบรรทัดคำสั่ง OUTPUT OPTIONS จะไม่ถูกรีเซ็ตเมื่อมีซีเควนซ์
ถูกพิมพ์
ลำดับมีการกำหนดหมายเลขเริ่มต้นที่ ZERO ไม่ใช่หนึ่ง!
ตัวอย่าง
1. พิมพ์ 10 เบสแรกของลำดับที่สี่ในไฟล์ 'ยีน':
leaff -f ยีน -e 0 10 -s 3
2. พิมพ์ฐาน 10 แรกของลำดับที่สี่และห้า:
leaff -f ยีน -e 0 10 -s 3 -s 4
3. พิมพ์ลำดับที่สี่และห้าย้อนกลับเสริมและลำดับที่หก
ลำดับไปข้างหน้า ชุดที่สองของ -R -C สลับปิดการเติมเต็มย้อนกลับ:
leaff -f ยีน -R -C -s 3 -s 4 -R -C -s 5
4. แปลงไฟล์ 'ยีน' เป็น 'genes.seqStore' ของ seqStore
leaff -f ยีน --seqstore ยีน.seqStore
ใช้ leaff ออนไลน์โดยใช้บริการ onworks.net