این دستور cmemit است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
cmemit - توالی های نمونه از یک مدل کوواریانس
خلاصه
cmemit [گزینه ها]
شرح
La cmemit نمونه های برنامه (گسترش) دنباله ها از مدل(های) کوواریانس در ، و
آنها را در خروجی می نویسد. توالی های نمونه گیری ممکن است برای اهداف مختلف مفید باشند،
از جمله ایجاد مثبت های مصنوعی مصنوعی برای معیارها یا آزمایش ها.
پیش فرض این است که ده دنباله بدون تراز را از هر CM نمونه برداری کنید. متناوبا، با -c
گزینه، شما می توانید یک توالی اجماع اکثریت را منتشر کنید. یا با -a گزینه، شما
می تواند یک تراز را منتشر کند.
La ممکن است حاوی کتابخانه ای از CM ها باشد، در این صورت هر CM به نوبه خود استفاده می شود.
ممکن است '-' (خط تیره) باشد، که به معنای خواندن این ورودی از است stdin به جای یک فایل
برای مدلهای با جفت پایه صفر، توالیها از فیلتر HMM پروفایل نمونهبرداری میشوند
از CM. با این حال، از آنجایی که این مدل ها تقریباً یکسان خواهند بود (مگر اینکه گزینه های خاص
در استفاده شد cmbuild برای جلوگیری از این امر)، استفاده از HMM به جای CM تغییری در آن ایجاد نخواهد کرد
خروجی به طور قابل توجهی، مگر اینکه -l گزینه استفاده می شود. با -ل، HMM خواهد بود
برای موقعیت های شروع و پایان مدل مشابه پیکربندی شده است، در حالی که CM این کار را نخواهد کرد. تو می توانی
مجبور cmemit همیشه نمونه برداری از CM با -- به طور غیرممکن گزینه.
OPTIONS
-h کمک؛ یک یادآوری مختصر از استفاده از خط فرمان و گزینه های موجود چاپ کنید.
-o دنباله های مصنوعی را در فایل ذخیره کنید به جای نوشتن آنها برای stdout.
-N تولید دنباله ها مقدار پیش فرض برای 10 است
-u دنباله های تولید شده را در قالب بدون تراز (FASTA) بنویسید. این پیش فرض است
رفتار.
-a دنباله های تولید شده را در قالب تراز شده (استکهلم) با اجماع بنویسید
حاشیه نویسی ساختار به جای FASTA. فرمت های خروجی دیگر با
-- فرمت گزینه.
-c بهجای نمونهبرداری، یک توالی اجماع قانون اکثریت را پیشبینی کنید
از توزیع احتمال CM. باقیمانده های بسیار حفاظت شده (پایه جفت شده
باقی مانده هایی که امتیاز بالاتر از 3.0 بیت دارند، یا باقی مانده های تک رشته ای که امتیاز می گیرند
بالاتر از 1.0 بیت) با حروف بزرگ نشان داده شده است. بقیه با حروف کوچک نشان داده شده اند.
-e توالی های منتشر شده CM را در یک توالی طولی بزرگتر که به طور تصادفی تولید می شود جاسازی کنید
تولید شده از HMM که بر روی توالی های ژنومی واقعی با انواع مختلف آموزش داده شده بود
محتویات GC (همان HMM مورد استفاده توسط cm کالیبره کنید). شما می توانید با استفاده از --iid گزینه ای برای
به جای آن توالی 25% A، C، G و U تولید کنید. دنباله انتشار CM آغاز خواهد شد
در یک موقعیت تصادفی در توالی بزرگتر و در آن گنجانده می شود
کامل مگر اینکه --u5p or --u3p گزینه ها استفاده می شود. چه زمانی -e در مورد استفاده می شود
ترکیب با --u5p، دنباله گسیل شده CM همیشه از موقعیت 1 شروع می شود
دنباله بزرگتر است و 5' کوتاه می شود. هنگامی که به صورت ترکیبی استفاده می شود --u3p CM
دنباله ساطع شده همیشه به موقعیت ختم می شود از دنباله بزرگتر و خواهد بود
کوتاه شده 3'.
-l CM ها را قبل از انتشار دنباله ها در حالت محلی پیکربندی کنید. به طور پیش فرض مدل
در حالت جهانی خواهد بود. در حالت محلی، درج و حذف بزرگ بیشتر است
رایج نسبت به حالت جهانی
OPTIONS برای کوتاه کردن منتشر شده توالی
--u5p تمام دنباله های منتشر شده را در یک موقعیت شروع به طور تصادفی انتخاب کنید ، فقط توسط
خروجی باقی مانده در شروع . یک نقطه شروع متفاوت به طور تصادفی انتخاب می شود
برای هر دنباله
--u3p تمام دنباله های منتشر شده را در یک موقعیت انتهایی انتخاب شده به طور تصادفی کوتاه کنید ، فقط توسط
خروجی باقی مانده تا موقعیت . یک نقطه پایان متفاوت به طور تصادفی انتخاب می شود
برای هر دنباله
--a5p
در ترکیب با -a گزینه، تراز منتشر شده را به صورت تصادفی کوتاه کنید
انتخاب موقعیت مسابقه شروع ، تنها با خروجی ستون های تراز برای موقعیت ها
وضعیت بعد از مسابقه - 1 باید یک عدد صحیح بین 0 و اجماع باشد
طول مدل (که می توان با استفاده از cmstat برنامه به عنوان خاص
مورد، با استفاده از 0 به عنوان یک موقعیت شروع به طور تصادفی انتخاب می شود.
--a3p
در ترکیب با -a گزینه، تراز منتشر شده را به صورت تصادفی کوتاه کنید
موقعیت مسابقه پایانی انتخاب شده ، تنها با خروجی ستون های تراز برای موقعیت ها
وضعیت قبل از مسابقه + 1 باید یک عدد صحیح بین 1 و اجماع باشد
طول مدل (که می توان با استفاده از cmstat برنامه). به عنوان یک
مورد خاص، با استفاده از 0 به عنوان منجر به یک موقعیت نهایی انتخابی تصادفی می شود.
OTHER OPTIONS
-- دانه
مولد اعداد تصادفی را با ، یک عدد صحیح >= 0. اگر غیر صفر است،
نمونه برداری تصادفی از توالی ها قابل تکرار خواهد بود. همان دستور را خواهد داد
نتایج مشابه اگر 0 است، مولد اعداد تصادفی به طور دلخواه بذر می شود،
و نمونهبرداریهای تصادفی از اجرا به اجرای همان فرمان متفاوت خواهند بود. در
seed پیش فرض 0 است.
--iid با -ه ، توالی های بزرگتر را به صورت 25 درصد از هر A، C، G و U ایجاد کنید.
-- rna مشخص کنید که توالی های گسیل شده به صورت توالی RNA خروجی باشند. این درست است توسط
به طور پیش فرض
--dna مشخص کنید که توالی های منتشر شده به عنوان توالی DNA خروجی باشند. به طور پیش فرض،
الفبای خروجی RNA است.
--idx
مشخص کنید که دنباله های منتشر شده با شروع نامگذاری شوند . . By
به طور پیش فرض 1 است
-- فرمت
با -آ، فرمت تراز خروجی را به عنوان مشخص کنید . فرمت های قابل قبول عبارتند از: Pfam،
AFA، A2M، Clustal و Phylip. AFA سریع تراز شده است. فقط Pfam و استکهلم
فرمت های تراز شامل حاشیه نویسی ساختار اجماع خواهد بود.
--tfile
توالی جدولی پارستتری (ردیابی) برای هر دنباله منتشر شده به فایل ریخته شود
. در درجه اول برای اشکال زدایی مفید است.
-- Exp
تشریح احتمالات انتشار و انتقال CM توسط و پس از آن
آن توزیع ها را قبل از انتشار دنباله ها عادی کنید. این گزینه تغییر می کند
توزیع احتمال CM parsetrees نسبت به پیش فرض. با کمتر از
1.0 دنبالههای منتشر شده پس از تراز کردن با بیت امتیازات پایینتری دارند
سانتی متر. با بیشتر از 1.0، دنباله های منتشر شده تمایل به بیت بالاتری دارند
امتیازات پس از تراز با CM. این تفاوت امتیاز بیت به عنوان افزایش خواهد یافت
در هر جهت از 1.0 دورتر می شود. اگر این گزینه برابر با 1.0 است
هیچ تاثیری نسبت به پیش فرض ندارد. این گزینه برای ایجاد توالی مفید است
که یا سخت تر هستند ( < 1.0) یا ساده تر ( > 1.0) برای CM به
متمایز کردن همولوگ از پس زمینه، دنباله تصادفی.
-- همونه
به جای CM از نمایه فیلتر HMM منتشر کنید.
-- به طور غیرممکن
هرگز از نمایه فیلتر HMM ساطع نکنید، همیشه از CM استفاده کنید، حتی برای مدل هایی با
جفت پایه صفر
از cmemit آنلاین با استفاده از خدمات onworks.net استفاده کنید