นี่คือคำสั่ง fasttreeMP ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
fasttreeMP - สร้างต้นไม้สายวิวัฒนาการจากการจัดตำแหน่งของนิวคลีโอไทด์หรือลำดับโปรตีน
(เวอร์ชัน openMP)
DESCRIPTION
fasttreeMP อนุมานต้นไม้สายวิวัฒนาการที่มีความเป็นไปได้สูงสุดโดยประมาณจากแนวของ
ลำดับนิวคลีโอไทด์หรือโปรตีน รองรับการจัดตำแหน่งด้วยลำดับสูงสุดล้านรายการ
ในเวลาและความทรงจำที่เหมาะสม
fasttreeMP มีความแม่นยำมากกว่า PhyML 3 ด้วยการตั้งค่าเริ่มต้น และแม่นยำกว่ามาก
มากกว่าวิธีเมทริกซ์ระยะทางที่ปกติใช้สำหรับการจัดตำแหน่งขนาดใหญ่
fasttreeMP ใช้แบบจำลองนิวคลีโอไทด์ของ Jukes-Cantor หรือ Generalized time-reversible (GTR) ของนิวคลีโอไทด์
วิวัฒนาการและแบบจำลอง JTT (โจนส์-เทย์เลอร์-ธอร์นตัน 1992) ของวิวัฒนาการกรดอะมิโน ถึง
บัญชีสำหรับอัตราการวิวัฒนาการที่แตกต่างกันในแต่ละไซต์ fasttreeMP ใช้อัตราเดียวสำหรับ
แต่ละไซต์ (การประมาณ "CAT") เพื่อประเมินความน่าเชื่อถือของแต่ละการแยกอย่างรวดเร็วใน
ต้นไม้ fasttreeMP คำนวณค่าการสนับสนุนในท้องถิ่นด้วยการทดสอบ Shimodaira-Hasegawa
(สิ่งเหล่านี้เหมือนกับ "SH-like local support") ของ PhyML 3
เรื่องย่อ
ฟาสต์ทรี ส.ส โปรตีน_การจัดตำแหน่ง > ต้นไม้
ฟาสต์ทรี ส.ส -nt nucleotide_alignment > ต้นไม้
ฟาสต์ทรี ส.ส -nt -gtr < nucleotide_alignment > ต้นไม้
fasttreeMP ยอมรับการจัดตำแหน่งในรูปแบบ fasta หรือ phylip interleaved
ร่วมกัน ตัวเลือก (ต้อง be ก่อน การวางแนว ไฟล์):
-เงียบ เพื่อระงับข้อมูลการรายงาน
-นพ เพื่อระงับตัวบ่งชี้ความคืบหน้า
- เข้าสู่ระบบ ไฟล์บันทึก -- บันทึกต้นไม้กลาง การตั้งค่า และรายละเอียดโมเดล
-เร็วที่สุด -- เร่งขั้นตอนการเข้าร่วมเพื่อนบ้านและลดการใช้หน่วยความจำ
(แนะนำสำหรับ >50,000 ลำดับ)
-n เพื่อวิเคราะห์การจัดตำแหน่งหลายแนว (เฉพาะรูปแบบฟิลลิปเท่านั้น)
(ใช้สำหรับ global bootstrap กับ seqboot และ CompareToBootstrap.pl)
-ไม่สนับสนุน ที่จะไม่คำนวณค่าสนับสนุน
-อินทรี newick_file เพื่อตั้งค่าต้นไม้เริ่มต้น
-intree1 newick_file เพื่อใช้ทรีเริ่มต้นนี้สำหรับการจัดตำแหน่งทั้งหมด
(สำหรับ global bootstrap ที่เร็วขึ้นในการจัดตำแหน่งขนาดใหญ่)
-หลอก เพื่อใช้ pseudocounts (แนะนำสำหรับลำดับที่มีช่องว่างสูง)
-gtr -- แบบจำลองเวลาผันกลับได้โดยทั่วไป (การจัดตำแหน่งนิวคลีโอไทด์เท่านั้น)
- แวก -- รุ่น Whelan-And-Goldman 2001 (สำหรับการจัดตำแหน่งกรดอะมิโนเท่านั้น)
-อ้าง -- อนุญาตให้เว้นวรรคและอักขระที่จำกัดอื่นๆ (แต่ไม่ใช่ ' อักขระ) ใน
ชื่อลำดับและชื่อใบเสนอราคาในแผนผังเอาต์พุต (อินพุต fasta เท่านั้น fasttreeMP
จะไม่สามารถอ่านต้นไม้เหล่านี้กลับมาได้
-ชื่อ เพื่อปิดความเป็นไปได้สูงสุด
-ชื่อ เพื่อปิด NNI และ SPR ที่มีวิวัฒนาการขั้นต่ำ
(แนะนำหากเรียกใช้ ML NNI เพิ่มเติมด้วย -อินทรี)
-ชื่อ -มิลเลน สีสดสวย -อินทรี เพื่อปรับความยาวสาขาให้เหมาะสมสำหรับโทโพโลยีคงที่
-แมว # เพื่อระบุจำนวนหมวดหมู่อัตราของไซต์ (ค่าเริ่มต้น 20)
or -nocat ใช้อัตราคงที่
-แกมมา -- หลังจากปรับต้นไม้ให้เหมาะสมภายใต้การประมาณ CAT แล้ว
ปรับขนาดความยาวเพื่อปรับความน่าจะเป็นของ Gamma20 ให้เหมาะสม
-ข้อจำกัด constraintAlignment เพื่อจำกัดการค้นหาโทโพโลยี
constraintAlignment ควรมี 1 หรือ 0 เพื่อระบุการแยก
-ผู้เชี่ยวชาญ -- ดูตัวเลือกเพิ่มเติม
รายละเอียด การใช้ สำหรับ ฟาสต์ทรี ส.ส 2.1.4 SSE3:
fasttreeMP [-nt] [-n 100] [-quote] [-pseudo | -หลอก 1.0]
[-บูต 1000 | -ไม่สนับสนุน] [-intree beginning_trees_file | -intree1
start_tree_file] [-เงียบ | -นพพร] [-nni 10] [-spr 2] [-ชื่อ | -มิลเลน | -mlnni
10] [-mlac 2] [-cat 20 | -โนแคท] [-gamma] [-ช้า | -เร็วที่สุด] [-2 | -no2nd]
[-slownni] [-seed 1253] [-top | -โนท็อป] [-topm 1.0 [-ปิด 0.75] [-รีเฟรช 0.8]]
[-เมทริกซ์เมทริกซ์ | -โนมาทริกซ์] [-nj | -bionj] [-wag] [-nt] [-gtr] [-gtrrates ac ag ที่
cg ct gt] [-gtrfreq ACGT] [ -ข้อจำกัด ข้อจำกัดการจัดตำแหน่ง [ -ข้อจำกัดน้ำหนัก
100.0 ] ] [-log ไฟล์บันทึก]
[ Align_file ]
> newick_tree
or
fasttreeMP [-nt] [-เมทริกซ์เมทริกซ์ | -โนมาทริกซ์] [-ดิบ] -เมทริกซ์ [การจัดตำแหน่ง]
[-n 100] > phylip_distance_matrix
fasttreeMP รองรับการจัดตำแหน่ง fasta หรือ phylip interleaved โดยค่าเริ่มต้น fasttreeMP
คาดหวังการจัดตำแหน่งโปรตีน ใช้ -nt สำหรับนิวคลีโอไทด์ fasttreeMP อ่านค่ามาตรฐาน
อินพุตหากไม่มีไฟล์การจัดตำแหน่งให้
อินพุต / เอาต์พุต ตัวเลือก:
-n -- อ่านได้หลายแนวในนี้เท่านั้น
ทำงานร่วมกับรูปแบบฟิลลิปอินเทอร์ลีฟ ตัวอย่างเช่น คุณสามารถใช้กับเอาต์พุต
จาก seqboot ของ phylip ถ้าคุณใช้ -n, fasttreeMP จะเขียน 1 tree ต่อบรรทัดถึง
เอาต์พุตมาตรฐาน
-อินทรี ใหม่ -- อ่านต้นไม้เริ่มต้นจาก newickfile
ความยาวของกิ่งก้านใด ๆ ในต้นไม้เริ่มต้นจะถูกละเว้น
-อินทรี สีสดสวย -n จะอ่านแผนผังเริ่มต้นแยกกันสำหรับการจัดตำแหน่งแต่ละครั้ง
-intree1 ใหม่ -- อ่านต้นไม้เริ่มต้นเดียวกันสำหรับแต่ละการจัดตำแหน่ง
-เงียบ -- อย่าเขียนถึงข้อผิดพลาดมาตรฐานระหว่างการทำงานปกติ (ไม่มีความคืบหน้า
อินดิเคเตอร์, ไม่มีสรุปตัวเลือก, ไม่มีค่าความน่าจะเป็น, ฯลฯ)
-นพ -- อย่าเขียนตัวบ่งชี้ความคืบหน้าไปที่ stderr
- เข้าสู่ระบบ ไฟล์บันทึก -- เก็บต้นไม้กลางไว้เพื่อสกัด
ต้นไม้และเริ่มงานระยะยาวใหม่หากพัง - เข้าสู่ระบบ รายงานด้วย
อัตราต่อไซต์ (1 หมายถึงหมวดหมู่ที่ช้าที่สุด)
-อ้าง -- อ้างชื่อลำดับในเอาต์พุตและอนุญาตให้มีการเว้นวรรค เครื่องหมายจุลภาค
วงเล็บและโคลอนในนั้นแต่ไม่ใช่อักขระ ' (ไฟล์ fasta เท่านั้น)
ระยะทาง:
ค่าเริ่มต้น: สำหรับลำดับโปรตีน ระยะทางที่แก้ไขบันทึกและค่า an
เมทริกซ์ความแตกต่างของกรดอะมิโนที่ได้มาจาก BLOSUM45
หรือสำหรับลำดับนิวคลีโอไทด์ ระยะ Jukes-Cantor เพื่อระบุเมทริกซ์ที่แตกต่างกัน
ใช้ เมทริกซ์ FilePrefix หรือ -โนมาทริกซ์ ใช้ -ดิบ เพื่อปิดการแก้ไขบันทึกหรือ
เพื่อใช้ %different แทน Jukes-Cantor
-หลอก [น้ำหนัก] -- ใช้ pseudocounts เพื่อประมาณระยะทางระหว่าง
ลำดับที่มีการทับซ้อนกันน้อยหรือไม่มีเลย (ปิดโดยค่าเริ่มต้น) แนะนำหากวิเคราะห์
การจัดตำแหน่งมีลำดับที่มีการทับซ้อนกันเพียงเล็กน้อยหรือไม่มีเลย หากไม่ระบุน้ำหนัก
มันคือ 1.0
โทโพโลยี การปรับแต่ง:
ตามค่าเริ่มต้น fasttreeMP จะพยายามปรับปรุงทรีด้วยรอบสูงสุด 4*log2(N)
ขั้นต่ำ-วิวัฒนาการใกล้-เพื่อนบ้านอินเตอร์เชนจ์ (NNI) โดยที่ N คือจำนวนของ
ลำดับที่ไม่ซ้ำกัน 2 รอบของการย้าย subtree-prune-regraft (SPR) (เช่น ต่ำสุด evo)
และสูงสุด 2*log(N) ของ NNI ที่มีความเป็นไปได้สูงสุด ใช้ -นิ เพื่อกำหนดหมายเลข
รอบของนาที อีโว NNI และ -สปริง เพื่อกำหนดรอบของ SPR ใช้ -ชื่อ เพื่อเปิด
ปิดทั้ง NNIs min-evo และ SPR (มีประโยชน์หากกำลังปรับแต่ง
ต้นไม้ความเป็นไปได้สูงสุดโดยประมาณพร้อม NNI เพิ่มเติม)
ใช้ -ความยาวสปริง กำหนดความยาวสูงสุดของการย้าย SPR (ค่าเริ่มต้น 10) Use -mlnni ในการตั้งค่า
จำนวนรอบของ NNI ที่มีความเป็นไปได้สูงสุด Use -mlac 2 หรือ -mlac 3 ถึงเสมอ
เพิ่มประสิทธิภาพทั้ง 5 สาขาที่ NNI แต่ละแห่ง
และเพิ่มประสิทธิภาพทั้ง 5 สาขาใน 2 หรือ 3 รอบ
ใช้ -มิลเลน เพื่อปรับความยาวสาขาให้เหมาะสมโดยไม่ต้องใช้ ML NNI Use -มิลเลน -ชื่อ สีสดสวย -อินทรี
เพื่อปรับความยาวสาขาให้เหมาะสมบนโทโพโลยีคงที่ Use -สโลว์นี เพื่อปิดการวิเคราะห์พฤติกรรม
เพื่อหลีกเลี่ยงต้นไม้ย่อยคงที่ (ส่งผลกระทบต่อทั้ง
ML และ ME NNI)
สูงสุด ความเป็นไปได้ แบบ ตัวเลือก:
- แวก -- Whelan-And-Goldman 2001 model แทน (default) Jones-Taylor-Thorton 1992 model
(aa เท่านั้น)
-gtr -- เวลาทั่วไปแบบย้อนกลับได้แทน (ค่าเริ่มต้น) Jukes-Cantor (เฉพาะเฉพาะ)
-แมว # -- ระบุจำนวนหมวดหมู่อัตราของไซต์ (ค่าเริ่มต้น 20)
-nocat -- ไม่มีรุ่น CAT (เพียง 1 หมวดหมู่)
-แกมมา -- หลังจากรอบสุดท้ายของการปรับความยาวกิ่งให้เหมาะสมที่สุดด้วยแบบจำลอง CAT
รายงานความน่าจะเป็นภายใต้แบบจำลองแกมมาแบบไม่ต่อเนื่องที่มีจำนวนเท่ากัน
หมวดหมู่ fasttreeMP ใช้ความยาวกิ่งเท่ากัน แต่ปรับรูปร่างแกมมาให้เหมาะสม
พารามิเตอร์และขนาดของความยาว ต้นไม้สุดท้ายจะมีการปรับความยาว
ใช้กับ - เข้าสู่ระบบนอกจากนี้ยังสร้างโอกาสต่อไซต์สำหรับใช้กับ CONSEL ดู
GammaLogToPaup.pl และเอกสารประกอบบนเว็บไซต์ fasttreeMP
ฝ่าย Support ที่หลากหลาย ความคุ้มค่า ตัวเลือก:
โดยค่าเริ่มต้น fasttreeMP จะคำนวณค่าการสนับสนุนในเครื่องโดยสุ่มตัวอย่างไซต์ใหม่
โอกาส 1,000 ครั้งและการทดสอบ Shimodaira Hasegawa หากคุณระบุ -ชื่อมัน
จะคำนวณการสนับสนุน bootstrap วิวัฒนาการขั้นต่ำแทน ไม่ว่าในกรณีใด the
ค่าสนับสนุนเป็นสัดส่วนตั้งแต่ 0 ถึง 1
ใช้ -ไม่สนับสนุน เพื่อปิดค่าการสนับสนุนหรือ - บูต 100 ใช้เพียง 100 ตัวอย่าง
ใช้ - เมล็ด เพื่อเริ่มต้นเครื่องกำเนิดตัวเลขสุ่ม
ค้นหา สำหรับ ดีที่สุด เข้าร่วม:
โดยค่าเริ่มต้น fasttreeMP จะรวม 'ชุดที่มองเห็นได้' ของการเข้าร่วมเพื่อนบ้านอย่างรวดเร็วด้วย
ปีนเขาในท้องถิ่นเช่นเดียวกับการเข้าร่วมเพื่อนบ้านที่ผ่อนคลาย
-ช้า -- การค้นหาอย่างละเอียดถี่ถ้วน (เช่น NJ หรือ BIONJ แต่การจัดการช่องว่างต่างกัน)
-ช้า ใช้เวลาครึ่งชั่วโมงแทน 8 วินาทีสำหรับโปรตีน 1,250 ตัว
-เร็วที่สุด -- ค้นหาชุดที่มองเห็นได้ (การตีบนสุดสำหรับแต่ละโหนด) เท่านั้น
ต่างจากการรวมเพื่อนบ้านอย่างรวดเร็วดั้งเดิม -เร็วที่สุด อัปเดตที่มองเห็นได้ (C) หลังจาก
เข้าร่วม A และ B ถ้า join(AB,C) ดีกว่า join(C,visible(C)) -เร็วที่สุด ด้วย
อัพเดททางไกลแบบเกียจคร้าน -เร็วที่สุด ชุด -2nd บนเช่นกัน ใช้
-เร็วที่สุด -no2nd เพื่อหลีกเลี่ยงสิ่งนี้
ยอดฮิต ฮิวริสติก:
ตามค่าเริ่มต้น fasttreeMP จะใช้รายการยอดนิยมเพื่อเพิ่มความเร็วในการค้นหา Use -ไม่ท็อป (หรือ -ช้า)
เพื่อปิดคุณสมบัตินี้
และเปรียบเทียบใบทั้งหมดเข้าด้วยกัน และโหนดที่เชื่อมต่อใหม่ทั้งหมดเข้าด้วยกัน
-topm 1.0 -- ตั้งค่าขนาดรายการยอดนิยมเป็นพารามิเตอร์*sqrt(N)
fasttreeMP ประมาณการ m อันดับต้น ๆ ของ leaf จากยอด 2 * ม. สูงสุดของ 'ปิด'
เพื่อนบ้าน โดยที่ close ถูกกำหนดเป็น d(seed,close) < 0.75 * d(seed, hit of rank
2*m) และอัปเดตเพลงฮิตเมื่อเข้าร่วมต่อไป
-ปิด 0.75 -- แก้ไขฮิวริสติกแบบปิด ด้านล่างเป็นแบบอนุรักษ์นิยมมากกว่า
- รีเฟรช 0.8 -- เปรียบเทียบโหนดที่เข้าร่วมกับโหนดอื่น ๆ ทั้งหมดถ้ามัน
รายการยอดฮิตน้อยกว่า 80% ของความยาวที่ต้องการ หรือถ้าอายุของท็อปฮิต
รายการคือ log2(ม.) หรือมากกว่า
-2nd or -no2nd เพื่อเปิดหรือปิดฮิวริสติกยอดนิยมระดับ 2
ซึ่งจะช่วยลดการใช้หน่วยความจำและเวลาในการทำงานแต่อาจนำไปสู่การลดลงเล็กน้อยใน
คุณภาพของต้นไม้ (โดยค่าเริ่มต้น, -เร็วที่สุด เปิด -2nd.)
ร่วมเป็นผู้ขายกับเราที่ ตัวเลือก:
-nj: ปกติ (ไม่ถ่วงน้ำหนัก) เข้าร่วมเพื่อนบ้าน (ค่าเริ่มต้น)
-bionj: การรวมน้ำหนักเหมือนใน BIONJ
fasttreeMP จะมีน้ำหนักเข้าร่วมในช่วง NNIs
จำกัด โทโพโลยี ค้นหา ตัวเลือก:
-ข้อจำกัด ไฟล์การจัดตำแหน่ง -- การจัดตำแหน่งด้วยค่า 0, 1 และ -
ไม่จำเป็นต้องมีลำดับทั้งหมด คอลัมน์ 0s และ 1s กำหนดข้อจำกัด
แยก. อาจมีการละเมิดข้อจำกัดบางประการ (ดู 'การละเมิดข้อจำกัด:' ในมาตรฐาน
ข้อผิดพลาด).
-ข้อจำกัดน้ำหนัก -- จะให้น้ำหนักกับข้อ จำกัด ได้มากเพียงใด ค่าของ1
หมายถึง ปรับความยาวต้นไม้ 1 ต้น สำหรับการละเมิดข้อจำกัด ค่าเริ่มต้น: 100.0
สำหรับข้อมูลเพิ่มเติมโปรดดูที่ http://www.microbesonline.org/fasttree/
หรือความคิดเห็นในซอร์สโค้ด
fasttreeMP protein_alignment > ต้นไม้ fasttreeMP -nt nucleotide_alignment > ต้นไม้
ฟาสต์ทรี ส.ส -nt -gtr < nucleotide_alignment > ต้นไม้
fasttreeMP ยอมรับการจัดตำแหน่งในรูปแบบ fasta หรือ phylip interleaved
ร่วมกัน ตัวเลือก (ต้อง be ก่อน การวางแนว ไฟล์):
-เงียบ เพื่อระงับข้อมูลการรายงาน
-นพ เพื่อระงับตัวบ่งชี้ความคืบหน้า
- เข้าสู่ระบบ ไฟล์บันทึก -- บันทึกต้นไม้กลาง การตั้งค่า และรายละเอียดโมเดล
-เร็วที่สุด -- เร่งขั้นตอนการเข้าร่วมเพื่อนบ้านและลดการใช้หน่วยความจำ
(แนะนำสำหรับ >50,000 ลำดับ)
-n เพื่อวิเคราะห์การจัดตำแหน่งหลายแนว (เฉพาะรูปแบบฟิลลิปเท่านั้น)
(ใช้สำหรับ global bootstrap กับ seqboot และ CompareToBootstrap.pl)
-ไม่สนับสนุน ที่จะไม่คำนวณค่าสนับสนุน
-อินทรี newick_file เพื่อตั้งค่าต้นไม้เริ่มต้น
-intree1 newick_file เพื่อใช้ทรีเริ่มต้นนี้สำหรับการจัดตำแหน่งทั้งหมด
(สำหรับ global bootstrap ที่เร็วขึ้นในการจัดตำแหน่งขนาดใหญ่)
-หลอก เพื่อใช้ pseudocounts (แนะนำสำหรับลำดับที่มีช่องว่างสูง)
-gtr -- แบบจำลองเวลาผันกลับได้โดยทั่วไป (การจัดตำแหน่งนิวคลีโอไทด์เท่านั้น)
- แวก -- รุ่น Whelan-And-Goldman 2001 (สำหรับการจัดตำแหน่งกรดอะมิโนเท่านั้น)
-อ้าง -- อนุญาตให้เว้นวรรคและอักขระที่จำกัดอื่นๆ (แต่ไม่ใช่ ' อักขระ) ใน
ชื่อลำดับและชื่อใบเสนอราคาในแผนผังเอาต์พุต (อินพุต fasta เท่านั้น fasttreeMP
จะไม่สามารถอ่านต้นไม้เหล่านี้กลับมาได้
-ชื่อ เพื่อปิดความเป็นไปได้สูงสุด
-ชื่อ เพื่อปิด NNI และ SPR ที่มีวิวัฒนาการขั้นต่ำ
(แนะนำหากเรียกใช้ ML NNI เพิ่มเติมด้วย -อินทรี)
-ชื่อ -มิลเลน สีสดสวย -อินทรี เพื่อปรับความยาวสาขาให้เหมาะสมสำหรับโทโพโลยีคงที่
-แมว # เพื่อระบุจำนวนหมวดหมู่อัตราของไซต์ (ค่าเริ่มต้น 20)
or -nocat ใช้อัตราคงที่
-แกมมา -- หลังจากปรับต้นไม้ให้เหมาะสมภายใต้การประมาณ CAT แล้ว
ปรับขนาดความยาวเพื่อปรับความน่าจะเป็นของ Gamma20 ให้เหมาะสม
-ข้อจำกัด constraintAlignment เพื่อจำกัดการค้นหาโทโพโลยี
constraintAlignment ควรมี 1 หรือ 0 เพื่อระบุการแยก
-ผู้เชี่ยวชาญ -- ดูตัวเลือกเพิ่มเติม
สำหรับข้อมูลเพิ่มเติมโปรดดูที่ http://www.microbesonline.org/fasttree/
ใช้ fasttreeMP ออนไลน์โดยใช้บริการ onworks.net
