นี่คือคำสั่ง phytime ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
phytime - การประมาณค่าเบเซียนของเวลาไดเวอร์เจนซ์จากการจัดแนวลำดับขนาดใหญ่
DESCRIPTION
การประมาณค่าเบเซียนของเวลาไดเวอร์เจนซ์จากลำดับโมเลกุลขึ้นอยู่กับความซับซ้อน
เทคนิค Markov chain Monte Carlo และตัวอย่าง Metropolis-Hastings (MH) ได้รับ
ใช้สำเร็จในบริบทนั้น วิธีการนี้เกี่ยวข้องกับภาระการคำนวณที่หนักหน่วงซึ่ง
สามารถขัดขวางการวิเคราะห์ชุดข้อมูลสายวิวัฒนาการขนาดใหญ่ การประมาณค่าไดเวอร์เจนซ์ที่เชื่อถือได้
เวลาอาจใช้เวลานานมาก หากไม่สามารถทำได้สำหรับการจัดตำแหน่งลำดับ
ที่ถ่ายทอดสัญญาณสายวิวัฒนาการที่อ่อนแอหรือขัดแย้งกันโดยเน้นถึงความจำเป็นในการเพิ่มเติม
วิธีการสุ่มตัวอย่างที่มีประสิทธิภาพ บทความนี้อธิบายวิธีการใหม่ที่ประมาณการ
ความหนาแน่นหลังของอัตราการทดแทนและเวลาโหนด การกระจายอัตราก่อน
บัญชีสำหรับความสัมพันธ์อัตโนมัติที่อาจเกิดขึ้นตามเชื้อสายในขณะที่นักบวชบนอายุโหนด
ถูกจำลองด้วยความหนาแน่นสม่ำเสมอ นอกจากนี้ ฟังก์ชันความน่าจะเป็นยังถูกประมาณโดย a
ความหนาแน่นปกติหลายตัวแปร การผสมผสานของส่วนประกอบเหล่านี้ทำให้สะดวก
การทำให้เข้าใจง่ายทางคณิตศาสตร์ ทำให้สามารถกระจายอัตราและเวลาหลังได้
ประมาณโดยใช้อัลกอริธึมการสุ่มตัวอย่าง Gibbs การวิเคราะห์ชุดข้อมูลจริงสี่ชุด
แสดงให้เห็นว่าตัวอย่างนี้มีประสิทธิภาพดีกว่าแนวทาง MH มาตรฐานและแสดงให้เห็นถึง
ความเหมาะสมของวิธีการใหม่นี้ในการวิเคราะห์ชุดข้อมูลขนาดใหญ่และ/หรือข้อมูลที่ยาก
เรื่องย่อ
ไฟไทม์ [อาร์กิวเมนต์คำสั่ง]
OPTIONS
ตัวเลือกทั้งหมดด้านล่างนี้เป็นทางเลือก ยกเว้น '-i','-u' และ '--calibration'
ตัวเลือกคำสั่ง:
-i (หรือ --ป้อนข้อมูล) seq_file_name
seq_file_name เป็นชื่อของไฟล์ลำดับนิวคลีโอไทด์หรือกรดอะมิโนใน PHYLIP
จัดรูปแบบ
-d (หรือ --ประเภทข้อมูล) ประเภทข้อมูล
data_type คือ 'nt' สำหรับนิวคลีโอไทด์ (ค่าเริ่มต้น), 'aa' สำหรับลำดับกรดอะมิโนหรือ
'ทั่วไป' (ใช้รูปแบบไฟล์ NEXUS และพารามิเตอร์ 'สัญลักษณ์' ที่นี่)
-q (หรือ --ลำดับ)
เปลี่ยนรูปแบบอินเตอร์ลีฟ (ค่าเริ่มต้น) เป็นรูปแบบตามลำดับ
-m (หรือ --แบบอย่าง) แบบอย่าง
รุ่น : ชื่อรุ่นทดแทน - โมเดลที่ใช้นิวคลีโอไทด์ : HKY85 (ค่าเริ่มต้น) |
JC69 | K80 | F81 | F84 | TN93 | GTR | custom (*) (*) : สำหรับตัวเลือกที่กำหนดเอง a
สตริงหกหลักระบุรุ่น ตัวอย่างเช่น 000000
สอดคล้องกับ F81 (หรือ JC69 หากมีการกระจายความถี่ของนิวคลีโอไทด์เป็น
ยูนิฟอร์ม) 012345 สอดคล้องกับ GTR ตัวเลือกนี้สามารถใช้สำหรับการเข้ารหัสใดๆ
โมเดลที่ซ้อนอยู่ภายใน GTR
- รุ่นที่ใช้กรดอะมิโน : LG (ค่าเริ่มต้น) | WAG | JTT | MtREV | เดย์ฮอฟฟ์ | DCMut |
RtREV | CpREV | วี.ที
บลอสซัม62 | MtMam | MtArt | HIVw |
HIVb | กำหนดเอง
--aa_rate_file ชื่อไฟล์
filename คือ ชื่อของไฟล์ที่ให้อัตราการแทนที่กรดอะมิโน
เมทริกซ์ในรูปแบบ PAML จำเป็นต้องใช้ตัวเลือกนี้เมื่อวิเคราะห์อะมิโน
ลำดับกรดด้วยโมเดล "กำหนดเอง"
--สอบเทียบ ชื่อไฟล์
filename คือชื่อของไฟล์สอบเทียบที่ให้ลำดับความสำคัญที่กำหนดไว้
ขอบเขตสำหรับอายุโหนด โปรดอ่านคู่มือสำหรับข้อมูลเพิ่มเติมเกี่ยวกับ
รูปแบบของไฟล์นี้
-t (หรือ --ทส/tv) ts/tv_ratio
ts/tv_ratio : อัตราส่วนการเปลี่ยนแปลง/การแปลง ลำดับดีเอ็นเอเท่านั้น สามารถแก้ไขได้
ค่าบวก (เช่น:4.0) หรือ e เพื่อรับค่าประมาณความน่าจะเป็นสูงสุด
-v (หรือ --พินวี) prop_invar
prop_invar : สัดส่วนของไซต์ที่ไม่เปลี่ยนแปลง สามารถเป็นค่าคงที่ใน [0,1]
ช่วงหรือ e เพื่อรับค่าประมาณความน่าจะเป็นสูงสุด
-c (หรือ --nคลาส) nb_subst_cat
nb_subst_cat : จำนวนหมวดหมู่อัตราการทดแทนแบบสัมพัทธ์ ค่าเริ่มต้น :
nb_subst_cat=4. ต้องเป็นจำนวนเต็มบวก
-a (หรือ --อัลฟ่า) แกมมา
แกมมา : การกระจายของพารามิเตอร์รูปร่างการกระจายแกมมา สามารถแก้ไขได้
ค่าบวกหรือ e เพื่อรับค่าประมาณความน่าจะเป็นสูงสุด
-u (หรือ --อินพุททรี) user_tree_file
user_tree_file : ชื่อไฟล์ต้นไม้เริ่มต้น ต้นไม้ต้องอยู่ในรูปแบบ Newick
--r_seed NUM
num คือเมล็ดพันธุ์ที่ใช้ในการเริ่มต้นเครื่องกำเนิดตัวเลขสุ่ม ต้องเป็นจำนวนเต็ม
--run_id รหัส_สตริง
ต่อท้ายสตริง ID_string ที่ส่วนท้ายของไฟล์เอาต์พุต PhyML แต่ละไฟล์ ตัวเลือกนี้อาจ
จะมีประโยชน์เมื่อเรียกใช้การจำลองที่เกี่ยวข้องกับ PhyML
--เงียบ
ไม่มีคำถามแบบโต้ตอบ (สำหรับการเรียกใช้ในโหมดแบทช์) และเอาต์พุตแบบเงียบ
--no_memory_check
ไม่มีคำถามเชิงโต้ตอบสำหรับการใช้หน่วยความจำ (สำหรับการรันในโหมดแบตช์) เอาต์พุตปกติ
มิฉะนั้น.
--chain_len NUM
num คือจำนวนรุ่นหรือรันของ Markov Chain Monte Carlo ตั้งค่าให้
1E+6 เป็นค่าเริ่มต้น ต้องเป็นจำนวนเต็ม
--sample_freq NUM
โซ่ถูกสุ่มตัวอย่างทุกจำนวนรุ่น ตั้งค่าเริ่มต้นเป็น 1E+3 ต้องเป็น
จำนวนเต็ม.
--ไม่มีข้อมูล
ใช้ตัวเลือกนี้เพื่อสุ่มตัวอย่างจากนักบวชเท่านั้น (แทนที่จะเป็นข้อต่อหลัง
ความหนาแน่นของพารามิเตอร์แบบจำลอง)
--fastlk
ใช้การประมาณค่าปกติหลายตัวแปรกับความน่าจะเป็นและเร่งความเร็ว
การคำนวณ
ใช้ phytime ออนไลน์โดยใช้บริการ onworks.net