این دستور phytime است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
phytime - تخمین بیزی زمان های واگرایی از همترازی های توالی بزرگ
شرح
تخمین بیزی زمان های واگرایی از توالی های مولکولی به روش های پیچیده متکی است.
تکنیکهای زنجیرهای مارکوف مونت کارلو، و نمونهگرهای متروپلیس-هیستینگز (MH) بودهاند
با موفقیت در آن زمینه استفاده شد. این رویکرد شامل بارهای محاسباتی سنگینی است که
می تواند از تجزیه و تحلیل مجموعه داده های فیلوژنومیک بزرگ جلوگیری کند. تخمین قابل اعتماد واگرایی
زمانها برای همترازیهای توالی اگر غیرممکن نباشد، میتوانند بسیار وقتگیر باشند
که سیگنالهای فیلوژنتیک ضعیف یا متناقضی را منتقل میکنند و بر نیاز به بیشتر تأکید میکنند
روش های نمونه گیری کارآمد این مقاله یک رویکرد جدید را توصیف می کند که تخمین می زند
چگالی عقبی نرخ جانشینی و زمان گره. توزیع قبلی نرخ ها
به حساب خود همبستگی بالقوه آنها در طول دودمان، در حالی که پیشینیان در سنین گره
با چگالی یکنواخت مدل می شوند. همچنین تابع درستنمایی با a تقریب می شود
چگالی نرمال چند متغیره ترکیب این اجزا منجر به راحتی می شود
ساده سازی های ریاضی، اجازه می دهد تا توزیع پسین نرخ ها و زمان ها باشد
با استفاده از الگوریتم نمونه گیری گیبس برآورد شد. تجزیه و تحلیل چهار مجموعه داده دنیای واقعی
نشان می دهد که این نمونه بردار از روش استاندارد MH بهتر عمل می کند و نشان می دهد
مناسب بودن این روش جدید برای تجزیه و تحلیل مجموعه داده های بزرگ و/یا دشوار.
خلاصه
فیتایم [فرمان args]
OPTIONS
همه گزینه های زیر اختیاری هستند به جز '-i'،'-u' و '--calibration'.
گزینه های فرمان:
-i (یا -- ورودی) seq_file_name
seq_file_name نام فایل توالی نوکلئوتیدی یا آمینو اسیدی در PHYLIP است.
فرمت.
-d (و یا --نوع داده) نوع داده
نوع_داده برای نوکلئوتید «nt» (پیشفرض)، «aa» برای توالیهای اسید آمینه، یا
'generic'، (از فرمت فایل NEXUS و پارامتر "symbols" در اینجا استفاده کنید).
-q (و یا -- ترتیبی)
فرمت میان لایه (پیشفرض) را به فرمت ترتیبی تغییر میدهد.
-m (و یا --مدل) مدل
مدل: نام مدل جایگزین. - مدل های مبتنی بر نوکلئوتید: HKY85 (پیش فرض) |
JC69 | K80 | F81 | F84 | TN93 | GTR | سفارشی (*) (*): برای گزینه سفارشی، a
رشته شش رقمی مدل را مشخص می کند. به عنوان مثال، 000000
مطابق با F81 (یا JC69 به شرط توزیع فرکانس های نوکلئوتیدی است
لباس فرم). 012345 مربوط به GTR است. این گزینه را می توان برای رمزگذاری هر مورد استفاده کرد
مدلی که درون GTR تودرتو است.
- مدل های مبتنی بر اسید آمینه : LG (پیش فرض) | WAG | JTT | MtREV | دیهوف | DCMut |
RtREV | CpREV | VT
Blosum62 | MtMam | MtArt | HIVw |
HIVb | سفارشی
--aa_rate_file نام فایل
filename نام فایلی است که نرخ جایگزینی اسید آمینه را ارائه می دهد
ماتریس در قالب PAML. استفاده از این گزینه هنگام آنالیز آمینو اجباری است
توالی اسید با مدل «سفارشی».
--تنظیم نام فایل
filename نام فایل کالیبراسیونی است که به صورت پیشینی تعریف شده است
مرزهای سنین گره لطفا برای اطلاعات بیشتر در مورد کتابچه راهنمای کاربر مطالعه کنید
فرمت این فایل
-t (و یا --ts/tv) ts/tv_ratio
ts/tv_ratio: نسبت انتقال/تغییر. فقط توالی های DNA می تواند ثابت باشد
مقدار مثبت (به عنوان مثال: 4.0) یا e برای به دست آوردن حداکثر احتمال احتمال.
-v (و یا --pinv) prop_invar
prop_invar : نسبت سایت های متغیر. می تواند یک مقدار ثابت در [0,1] باشد
محدوده یا e برای به دست آوردن حداکثر احتمال احتمال.
-c (و یا -- کلاس ها) nb_subst_cat
nb_subst_cat: تعداد دستههای نرخ جایگزینی نسبی. پیش فرض:
nb_subst_cat=4. باید یک عدد صحیح مثبت باشد.
-a (و یا --آلفا) گاما
گاما: توزیع پارامتر شکل توزیع گاما. می تواند ثابت باشد
مقدار مثبت یا e برای به دست آوردن حداکثر احتمال احتمال.
-u (و یا --inputtree) user_tree_file
user_tree_file : شروع نام فایل درختی. درخت باید در قالب نیویک باشد.
--r_seed تعداد
num دانه ای است که برای شروع مولد اعداد تصادفی استفاده می شود. باید یک عدد صحیح باشد.
--run_id ID_string
رشته ID_string را در انتهای هر فایل خروجی PhyML اضافه کنید. این گزینه ممکن است
هنگام اجرای شبیه سازی های مربوط به PhyML مفید باشد.
--ساکت
بدون سوال تعاملی (برای اجرای در حالت دسته ای) و خروجی بی صدا.
--no_memory_check
بدون سوال تعاملی برای استفاده از حافظه (برای اجرای در حالت دسته ای). خروجی معمولی
در غیر این صورت.
--chain_len تعداد
num تعداد نسل ها یا اجراهای زنجیره مارکوف مونت کارلو است. تنظیم کنید
1E+6 به طور پیش فرض. باید یک عدد صحیح باشد.
--sample_freq تعداد
این زنجیره از هر تعداد نسل نمونه برداری می شود. به طور پیش فرض روی 1E+3 تنظیم کنید. باید یک
عدد صحیح
--بدون اطلاعات
از این گزینه فقط برای نمونه برداری از قسمت های قبلی (و نه از مفصل خلفی) استفاده کنید
چگالی پارامترهای مدل).
--fastlk
از تقریب نرمال چند متغیره برای احتمال و افزایش سرعت استفاده کنید
محاسبات
با استفاده از خدمات onworks.net از phytime آنلاین استفاده کنید