Phyml - ออนไลน์ในคลาวด์

นี่คือคำสั่ง phyml ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


phyml - การประมาณสายวิวัฒนาการโดยใช้โอกาสสูงสุด

เรื่องย่อ:


phyml [อาร์กิวเมนต์คำสั่ง]

ตัวเลือกทั้งหมดด้านล่างนี้เป็นทางเลือก (ยกเว้น '-i' หากคุณต้องการใช้ command-line
อินเตอร์เฟซ).

ตัวเลือกคำสั่ง:

-i (หรือ --ป้อนข้อมูล) seq_file_name

seq_file_name เป็นชื่อของไฟล์ลำดับนิวคลีโอไทด์หรือกรดอะมิโนใน PHYLIP
จัดรูปแบบ

-d (หรือ --ประเภทข้อมูล) ประเภทข้อมูล

ประเภทข้อมูล คือ 'nt' สำหรับนิวคลีโอไทด์ (ค่าเริ่มต้น), 'aa' สำหรับลำดับกรดอะมิโนหรือ
'ทั่วไป' (ใช้รูปแบบไฟล์ NEXUS และพารามิเตอร์ 'สัญลักษณ์' ที่นี่)

-q (หรือ --ลำดับ)

เปลี่ยนรูปแบบอินเตอร์ลีฟ (ค่าเริ่มต้น) เป็นรูปแบบตามลำดับ

-n (หรือ --หลายรายการ) nb_data_sets

nb_data_sets เป็นจำนวนเต็มที่สอดคล้องกับจำนวนชุดข้อมูลที่จะวิเคราะห์

-p (หรือ --พาร์ส) [] ใช้ต้นไม้เริ่มต้น parsimony ขั้นต่ำ ตัวเลือกนี้ถูกนำมาพิจารณา
เมื่อไม่มีตัวเลือก '-u' และเมื่อต้องแก้ไขโครงสร้างต้นไม้

-b (หรือ --บูตสแตรป) int

int > 0: int คือจำนวนการทำซ้ำบูตสแตรป

int = 0: ทั้งการทดสอบอัตราส่วนความน่าจะเป็นโดยประมาณหรือค่าบูตสแตรปคือ
คำนวณ

int = -1: การทดสอบอัตราส่วนความน่าจะเป็นโดยประมาณที่ส่งคืนสถิติ aLRT

int = -2: การทดสอบอัตราส่วนความน่าจะเป็นโดยประมาณที่ส่งคืนสาขาพารามิเตอร์แบบ Chi2
สนับสนุน

int = -4: (ค่าเริ่มต้น) สาขาเหมือน SH รองรับเพียงอย่างเดียว

-m (หรือ --แบบอย่าง) แบบ

รุ่น : ชื่อรุ่นทดแทน - เบื่อหน่าย-ตามรุ่น : HKY85 (ค่าเริ่มต้น) |
JC69 | K80 | F81 | F84 | TN93 | GTR | ประเพณี (สำหรับตัวเลือกที่กำหนดเอง สตริงของ
ตัวเลขหกหลักระบุรุ่น ตัวอย่างเช่น 000000)

สอดคล้องกับ F81 (หรือ JC69 หากมีการกระจายความถี่ของนิวคลีโอไทด์เป็น
ยูนิฟอร์ม) 012345 สอดคล้องกับ GTR ตัวเลือกนี้สามารถใช้สำหรับการเข้ารหัสใดๆ
โมเดลที่ซ้อนอยู่ภายใน GTR

- กรดอะมิโน โมเดลพื้นฐาน : LG (ค่าเริ่มต้น) | WAG | จขกท | MtREV | เดย์ฮอฟฟ์ | ดี.ซี.มุท |
RtREV | ซีพีอาร์อีวี | VT ดอก62 | เมาท์มัม | ภูเขาศิลปะ | เอชไอวี | เอชไอวี | ประเพณี

--aa_rate_file ชื่อไฟล์

ชื่อไฟล์ เป็นชื่อไฟล์ที่ให้อัตราการแทนที่กรดอะมิโน
เมทริกซ์ในรูปแบบ PAML จำเป็นต้องใช้ตัวเลือกนี้เมื่อวิเคราะห์อะมิโน
ลำดับกรดด้วยโมเดล "กำหนดเอง"

-f e, m,หรือ เอฟเอ,เอฟซี,เอฟจี,เอฟที

e : ความถี่ของอักขระถูกกำหนดดังนี้ :

- ลำดับนิวคลีโอไทด์: (Empirical) ความถี่เบสสมดุลถูกประมาณค่าไว้
โดยนับการเกิดขึ้นของฐานต่าง ๆ ในการเรียงตัว

- ลำดับกรดอะมิโน: (Empirical) ความถี่สมดุลของกรดอะมิโนคือ
ประมาณการโดยนับการเกิดขึ้นของกรดอะมิโนต่างๆ ที่อยู่ในแนวเดียวกัน

m : ความถี่ของอักขระถูกกำหนดดังนี้ :

- ลำดับนิวคลีโอไทด์: (ML) ความถี่ฐานสมดุลถูกประมาณโดยใช้
ความเป็นไปได้สูงสุด

- ลำดับกรดอะมิโน: (แบบจำลอง) ความถี่สมดุลของกรดอะมิโนคือ
ประมาณการโดยใช้ความถี่ที่กำหนดโดยแบบจำลองการแทนที่

"เอฟเอ,เอฟซี,เอฟจี,เอฟที" : ใช้ได้สำหรับแบบจำลองที่มีนิวคลีโอไทด์เป็นหลักเท่านั้น fA, fC, fG และ ft คือ
ตัวเลขลอยตัวที่สอดคล้องกับความถี่ของ A, C, G และ T ตามลำดับ
(คำเตือน: อย่าใช้ช่องว่างระหว่างค่าความถี่นิวคลีโอไทด์ของคุณ
จุลภาคเท่านั้น!)

-t (หรือ --ทส/โทรทัศน์) ts/tv_ratio

ts/tv_ratio : อัตราส่วนการเปลี่ยนแปลง/การเปลี่ยนผ่าน ลำดับดีเอ็นเอเท่านั้น สามารถแก้ไขได้
ค่าบวก (เช่น:4.0) หรือ e เพื่อรับค่าประมาณความน่าจะเป็นสูงสุด

-v (หรือ --พินวี) prop_invar

prop_invar: สัดส่วนของไซต์ที่ไม่เปลี่ยนแปลง สามารถเป็นค่าคงที่ใน [0,1]
ช่วงหรือ e เพื่อรับค่าประมาณความน่าจะเป็นสูงสุด

-c (หรือ --nคลาส) nb_subst_cat

nb_subst_cat : จำนวนหมวดหมู่อัตราการทดแทนแบบสัมพัทธ์ ค่าเริ่มต้น:
nb_subst_cat=4. ต้องเป็นจำนวนเต็มบวก

-a (หรือ --อัลฟ่า) แกมมา

แกมมา : การกระจายพารามิเตอร์รูปร่างการกระจายแกมมา สามารถแก้ไขได้
ค่าบวกหรือ e เพื่อให้ได้ค่าประมาณความน่าจะเป็นสูงสุด

-s (หรือ --ค้นหา) ย้าย

ตัวเลือกการดำเนินการค้นหาทรีโทโพโลจี เป็นได้ทั้ง สนช (ค่าเริ่มต้น เร็ว) หรือ SPR (a
ช้ากว่า NNI เล็กน้อย) หรือ ที่ดีที่สุด (ดีที่สุดของการค้นหา NNI และ SPR)

-u (หรือ --อินพุททรี) user_tree_file

user_tree_file : ชื่อไฟล์เริ่มต้น ต้นไม้ต้องอยู่ในรูปแบบ Newick

-o params

ตัวเลือกนี้เน้นที่การปรับพารามิเตอร์ให้เหมาะสมเฉพาะ

params=tlr : tree topoLOGy (t), ความยาวของกิ่ง (l) และพารามิเตอร์อัตรา (r) are
เหมาะสมที่สุด

params=tl : ปรับโครงสร้างต้นไม้และความยาวของกิ่งให้เหมาะสม

params=lr : พารามิเตอร์ความยาวสาขาและอัตราได้รับการปรับให้เหมาะสม

params=l : ความยาวของกิ่งได้รับการปรับให้เหมาะสม

params=r : พารามิเตอร์อัตราได้รับการปรับให้เหมาะสม

params=n : ไม่มีการเพิ่มประสิทธิภาพพารามิเตอร์

--rand_start

ตัวเลือกนี้จะตั้งค่าทรีเริ่มต้นเป็นแบบสุ่ม ใช้ได้ก็ต่อเมื่อการค้นหา SPR เป็น
ที่จะดำเนินการ

--n_rand_starts NUM

NUM คือจำนวนต้นไม้สุ่มเริ่มต้นที่จะใช้ ใช้ได้ก็ต่อเมื่อ SPR
จะต้องดำเนินการค้นหา

--r_seed NUM

NUM เป็นเมล็ดพันธุ์ที่ใช้ในการเริ่มต้นเครื่องกำเนิดตัวเลขสุ่ม ต้องเป็นจำนวนเต็ม

--print_site_lnl

พิมพ์ความเป็นไปได้ของแต่ละไซต์ในไฟล์ *_phyml_lk.txt

--print_trace

พิมพ์แต่ละสายวิวัฒนาการที่สำรวจระหว่างกระบวนการค้นหาต้นไม้ในไฟล์
*_phyml_trace.txt

--run_id รหัส_สตริง

ต่อท้ายสตริง รหัส_สตริง ที่ส่วนท้ายของไฟล์เอาต์พุต PhyML แต่ละไฟล์ ตัวเลือกนี้อาจ
จะมีประโยชน์เมื่อเรียกใช้การจำลองที่เกี่ยวข้องกับ PhyML

--เงียบ

ไม่มีคำถามแบบโต้ตอบ (สำหรับการเรียกใช้ในโหมดแบทช์) และเอาต์พุตแบบเงียบ

--no_memory_check

ไม่มีคำถามเชิงโต้ตอบสำหรับการใช้หน่วยความจำ (สำหรับการรันในโหมดแบตช์) เอาต์พุตปกติ
มิฉะนั้น.

--alias_subpatt

นามแฝงของไซต์เป็นแบบทั่วไปที่ระดับทรีย่อย บางครั้งก็ทำให้เร็วขึ้น
การคำนวณ ดู Kosakovsky Pond SL, Muse SV, Sytematic Biology (2004) สำหรับ an
ตัวอย่าง.

--boot_progress_display NUM (ค่าเริ่มต้น=20)

NUM คือความถี่ที่จะอัปเดตแถบความคืบหน้าของบูตสแตรป ต้องเป็น
จำนวนเต็ม

ฟิลลิปเหมือน INTERFACE


คุณยังสามารถใช้ PhyML โดยไม่มีอาร์กิวเมนต์ ในกรณีนี้ เปลี่ยนค่าของพารามิเตอร์โดย
พิมพ์อักขระที่เกี่ยวข้องตามที่แสดงบนหน้าจอ

ตัวอย่าง


ไฟล์ลำดับ DNA interleaved พารามิเตอร์เริ่มต้น:

ฟิมล์ -i ลำดับที่ 1

ไฟล์ลำดับ AA interleaved พารามิเตอร์เริ่มต้น:

ฟิมล์ -i ลำดับที่ 2 -d aa

ไฟล์ลำดับ AA พร้อมการปรับแต่ง:

ฟิมล์ -i ลำดับที่ 3 -q -d aa -m จขกท -c 4 -a e

ใช้ phyml ออนไลน์โดยใช้บริการ onworks.net



โปรแกรมออนไลน์ Linux และ Windows ล่าสุด