انگلیسیفرانسویاسپانیایی

Ad


فاویکون OnWorks

hmmsim - آنلاین در ابر

hmmsim را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور hmmsim است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


hmmsim - توزیع امتیاز را در دنباله های تصادفی جمع آوری کنید

خلاصه


هممسیم [گزینه ها]

شرح


La هممسیم برنامه توالی های تصادفی را تولید می کند، آنها را با مدل(های) داخل امتیاز می دهد ,
و انواع مختلفی از هیستوگرام ها، نمودارها، و توزیع های برازش را برای نتیجه به دست می آورد
امتیازات

هممسیم بخش اصلی بسته HMMER نیست. اکثر کاربران هیچ دلیلی برای این کار ندارند
از آن استفاده کنید. برای توسعه و آزمایش روش های آماری مورد استفاده برای تعیین مقادیر P استفاده می شود
و مقادیر E در HMMER3. به عنوان مثال، از آن برای تولید بیشتر نتایج در سال 2008 استفاده شد
مقاله در مورد آمار تراز محلی H3 (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

از آنجایی که این یک بستر آزمایشی تحقیقاتی است، نباید انتظار داشته باشید که به اندازه سایرین قوی باشد
برنامه های موجود در بسته برای مثال، گزینه‌ها ممکن است به روش‌های عجیبی با هم تعامل داشته باشند. ما نداریم
آزمایش شده و نه تلاشی برای پیش‌بینی همه ترکیب‌های مختلف ممکن.

وظیفه اصلی تطبیق توزیع گمبل حداکثر احتمال با امتیازات ویتربی یا an است
حداکثر احتمال دم تصاعدی به نمرات فوروارد با امتیاز بالا و آزمایش این که اینها
توزیع های برازش شده از این حدس پیروی می کنند که lambda ~ log_2 برای هر دو Viterbi Gumbel
و دم نمایی رو به جلو.

خروجی جدولی از اعداد است، یک ردیف برای هر مدل. چهار تناسب پارامتری مختلف
داده‌های امتیاز مورد آزمایش قرار می‌گیرند: (1) حداکثر احتمال متناسب با هر دو مکان (mu/tau) و
پارامترهای شیب (لامبدا)؛ (2) با فرض لامبدا=log_2، حداکثر احتمال متناسب با
فقط پارامتر مکان؛ (3) یکسان است اما با فرض یک لامبدا اصلاح شده لبه، با استفاده از جریان
رویه ها در H3 [ادی، 2008]؛ و (4) با استفاده از هر دو پارامتر تعیین شده توسط جریان H3
رویه ها آمار استاندارد ساده، سریع و کثیف برای تناسب خوب، 'E@10' است،
ارزش E محاسبه شده دهمین رتبه برتر که انتظار داریم حدود 10 باشد.

به طور مفصل، ستون های خروجی عبارتند از:

نام نام مدل.

دنبالچه کسری از بالاترین امتیاز برای تناسب توزیع استفاده می شود. برای Viterbi، MSV، و
امتیازات ترکیبی، این به طور پیش‌فرض روی 1.0 است (توزیع Gumbel برای همه موارد نصب شده است
داده ها). برای امتیازات رو به جلو، این به طور پیش فرض روی 0.02 است (یک دنباله نمایی به آن تعبیه شده است
بالاترین امتیاز 2٪).

mu/tau پارامتر مکان برای حداکثر احتمال تناسب با داده ها.

یازدهمین حرف الفبای یونانی پارامتر شیب برای حداکثر احتمال تناسب با داده ها.

E@10 ارزش E محاسبه شده برای رتبه دهی امتیاز بالا ('E@10') با استفاده از ML mu/tau
و لامبدا طبق تعریف، اگر تخمین E-value باشد، انتظار می‌رود این عدد حدود 10 باشد
دقیق.

موفیکس پارامتر مکان، برای حداکثر احتمال تناسب با یک شیب شناخته شده (ثابت).
پارامتر لامبدا log_2 (0.693).

E@10 fix
E-value برای امتیاز رتبه دهم با استفاده از mufix و مورد انتظار محاسبه شد
lambda = log_2 = 0.693.

mufix2 پارامتر مکان، برای حداکثر احتمال تناسب با اثر لبه تصحیح شده است
لامبدا

E@10fix2
E-value برای امتیاز رتبه دهم با استفاده از mufix10 و edge-effect- محاسبه شد.
لامبدا تصحیح شد

pmu پارامتر مکان که توسط روش های تخمین H3 تعیین می شود.

پلمبدا
پارامتر شیب که توسط روش های تخمین H3 تعیین می شود.

pE@10 E-value برای امتیاز رتبه دهم با استفاده از pmu، plambda محاسبه شد.

در انتهای این جدول، یک خط دیگر چاپ می‌شود که با # شروع می‌شود و عبارت را خلاصه می‌کند
زمان کلی CPU مورد استفاده در شبیه سازی ها.

برخی از فایل های خروجی اختیاری با فرمت xmgrace xy هستند. xmgrace قدرتمند و رایگان است
نرم افزار رسم نمودار موجود

متفرقه OPTIONS


-h کمک؛ یک یادآوری مختصر از استفاده از خط فرمان و همه گزینه های موجود چاپ کنید.

-a آمار طول تراز مورد انتظار Viterbi را از هر دنباله شبیه سازی شده جمع آوری کنید.
این فقط با نمرات Viterbi کار می کند (پیش فرض؛ ببینید --vit). دو اضافی
فیلدها در جدول خروجی برای هر مدل چاپ می شوند: میانگین طول Viterbi
ترازها و انحراف استاندارد

-v (پرمخاطب). نمرات را نیز چاپ کنید، یک نمره در هر خط.

-L طول توالی‌های نمونه‌برداری تصادفی (غیر همولوگ) را روی آن تنظیم کنید .
پیش فرض 100 است.

-N تعداد توالی‌های نمونه‌گیری تصادفی را روی آن تنظیم کنید . پیش فرض 1000 است.

--mpi در حالت موازی MPI، زیر اجرا کنید mpirun. در سطح ارسال موازی می شود
یک نمایه در یک زمان به یک فرآیند کارگر MPI، بنابراین موازی سازی فقط در صورتی کمک می کند
شما بیش از یک نمایه در ، و شما می خواهید حداقل به عنوان
بسیاری از پروفایل ها به عنوان فرآیندهای کارگر MPI. (فقط در صورتی در دسترس است که پشتیبانی از MPI اختیاری باشد
در زمان کامپایل فعال شد.)

OPTIONS کنترل OUTPUT


-o جدول خروجی اصلی را در یک فایل ذخیره کنید به جای ارسال آن به stdout.

--یک فایل
هنگام جمع آوری آمار تراز ویتربی ( -a گزینه)، برای هر نمونه
دنباله، خروجی دو فیلد در هر خط به یک فایل : طول بهینه
تراز، و امتیاز بیت ویتربی. مستلزم آن است که -a گزینه نیز استفاده می شود.

-- فایل
خروجی نمودار رتبه در مقابل E-value در قالب XMGRACE xy به فایل . محور x است
رتبه این دنباله، از بالاترین امتیاز به پایین ترین. محور y مقدار E است
برای این دنباله محاسبه می شود. مقادیر E با استفاده از رویه های پیش فرض H3 محاسبه می شوند
(یعنی پارامترهای pmu، plambda در جدول خروجی). انتظار یک مسابقه سخت را دارید
بین رتبه و E-value در صورتی که E-value دقیقاً تخمین زده شود.

-- فایل
خروجی یک فایل "قدرت فیلتر" به : برای هر مدل یک خط با سه فیلد:
نام مدل، تعداد دنباله هایی که از آستانه P-value عبور می کنند و کسری از
توالی هایی که از آستانه P-value عبور می کنند. دیدن -- pthresh برای تنظیم مقدار P
آستانه، که به طور پیش فرض 0.02 است (آستانه پیش فرض فیلتر MSV در H3). P-
مقادیر توسط رویه‌های پیش‌فرض H3 تعیین می‌شوند (پارامترهای pmu، plambda در
جدول خروجی). اگر همه چیز خوب باشد، انتظار دارید قدرت فیلتر برابر با
پیش بینی مقدار P تنظیم آستانه.

--pfile
نمودارهای بقای تجمعی (P(S>x)) را در فایل تولید کنید در قالب XMGRACE xy. آنجا
سه نمودار است: (1) توزیع امتیاز مشاهده شده. (2) حداکثر احتمال
توزیع مناسب؛ (3) حداکثر احتمال متناسب با پارامتر مکان
(مو/تاو) در حالی که
با فرض lambda=log_2.

--xfile
امتیازات بیت را به صورت یک آرایه باینری از شناورهای با دقت دوگانه (8 بایت در هر
امتیاز) به پرونده . برنامه هایی مانند Easel's esl-histplot می تواند چنین فایل های باینری را بخواند.
این در هنگام تولید حجم نمونه بسیار بزرگ مفید است.

OPTIONS کنترل MODEL پیکربندی (روش)


H3 فقط از تراز محلی چند ضربه ای استفاده می کند ( --fs حالت)، و این همان جایی است که ما معتقدیم
برازش های آماری امتیازهای هم ترازی محلی واحد (اسمیت/واترمن؛ -- sw حالت) نیز از ما اطاعت کنید
حدس های آماری آمار هم ترازی گلوکال (چه چند ضربه یا یک ضربه) هستند
هنوز به اندازه کافی درک نشده و به اندازه کافی برازش داده نشده است.

--fs نمرات تراز محلی چند ضربه ای را جمع آوری کنید. این پیش فرض است. تراز به عنوان
"حالت جستجوی قطعه".

-- sw نمرات تراز محلی واحد را جمع آوری کنید. حالت H3 J غیرفعال است. تراز به عنوان
"حالت جستجوی اسمیت/آب مرد".

--ls نمرات تراز گلوکال چند ضربه ای را جمع آوری کنید. در هم ترازی گلوکال (جهانی/محلی)،
کل مدل باید با دنباله ای از هدف هماهنگ شود. ورود/خروج محلی H3
احتمالات انتقال غیرفعال است. "ls" از تاریخچه HMMER2 می آید
اصطلاحات برای ترازهای محلی چند ضربه ای به عنوان "حالت جستجوی محلی".

-- ها نمرات هم ترازی گلوکال واحد را جمع آوری کنید. هر دو حالت H3 J و ورود/خروج محلی
احتمالات انتقال غیرفعال است. 's' از تاریخچه HMMER2 می آید
اصطلاحات برای هم ترازی گلوکال واحد.

OPTIONS کنترل گلزنی الگوریتم


--vit نمرات تراز حداکثر احتمال ویتربی را جمع آوری کنید. این پیش فرض است.

--fwd نمرات احتمال شانس ورود به جلو را جمع آوری کنید، که بر روی گروه تراز جمع آوری می شود.

--hyb نمرات «هیبرید» را جمع آوری کنید، همانطور که در مقالات Yu و Hwa توضیح داده شده است (به عنوان مثال،
بیوانفورماتیک 18:864، 2002). این شامل محاسبه یک ماتریس Forward و گرفتن است
حداکثر مقدار سلول این عدد به خودی خود از نظر آماری تا حدودی بی انگیزه است،
اما انتظار می رود توزیع یک توزیع ارزش افراطی با رفتار خوب باشد
(گمبل).

--msv نمرات MSV (قطعات چندگانه Viterbi بدون شکاف) را با استفاده از اصلی H3 جمع آوری کنید
اکتشافی شتاب

--سریع برای هر یک از گزینه های بالا، از اجرای بهینه سازی تولید H3 استفاده کنید (با استفاده از
برداری SIMD). به طور پیش فرض استفاده از پیاده سازی ها قربانی کوچک است
مقدار دقت عددی این می تواند نویز گیج کننده را وارد کند
شبیه سازی های آماری و تناسب، بنابراین زمانی که فرد فوق العاده نگران دقیق می شود
جزئیات، بهتر است بتوانید منبع نویز را فاکتور بگیرید.

OPTIONS کنترل متناسب دم توده ها برای رو به جلو


در برخی آزمایش‌ها، تناسب امتیازهای Forward به طیفی از دنباله‌های مختلف مفید بود
توده ها، به جای یک نفر. این گزینه ها مکانیزمی برای نصب یکنواخت
محدوده فاصله توده های مختلف دم. برای هر توده دم مختلف، یک خط ایجاد می شود
در خروجی

--tmin
حد پایین را روی توزیع جرم دم تنظیم کنید. (پیش فرض 0.02 برای
توده تک دم پیش فرض.)

--tmax
حد بالایی را روی توزیع جرم دم تنظیم کنید. (پیش فرض 0.02 برای
توده تک دم پیش فرض.)

-- tpoints
تعداد توده های دم را برای نمونه تنظیم کنید، از شروع --tmin و پایان دادن به --tmax.
(پیش‌فرض 1 است، برای 0.02 توده تک دم پیش‌فرض.)

- خطی
طیف وسیعی از توده های دم را با فاصله خطی یکنواخت نمونه برداری کنید. پیش فرض استفاده است
فاصله لگاریتمی یکنواخت

OPTIONS کنترل H3 پارامتر برآورد کردن مواد و روش ها


H3 از سه شبیه‌سازی توالی تصادفی کوتاه برای تخمین پارامترهای مکان استفاده می‌کند
توزیع امتیازات مورد انتظار برای نمرات MSV، امتیازات ویتربی، و نمرات فوروارد. اینها
گزینه ها اجازه می دهند این شبیه سازی ها اصلاح شوند.

--EmL
طول دنباله را در شبیه سازی تنظیم می کند که پارامتر مکان mu را برای تخمین می زند
مقادیر الکترونیکی MSV پیش فرض 200 است.

--EmN
تعداد دنباله ها را در شبیه سازی که پارامتر مکان mu را تخمین می زند تنظیم می کند
برای مقادیر E MSV. پیش فرض 200 است.

--EvL
طول دنباله را در شبیه سازی تنظیم می کند که پارامتر مکان mu را برای تخمین می زند
ارزشهای الکترونیکی ویتربی پیش فرض 200 است.

--EvN
تعداد دنباله ها را در شبیه سازی که پارامتر مکان mu را تخمین می زند تنظیم می کند
برای Viterbi E-values. پیش فرض 200 است.

--EfL
طول دنباله را در شبیه سازی تنظیم می کند که پارامتر مکان tau را تخمین می زند
برای Forward E-values. پیش فرض 100 است.

--EfN
تعداد دنباله هایی را در شبیه سازی که پارامتر مکان را تخمین می زند، تنظیم می کند
tau برای Forward E-values. پیش فرض 200 است.

--عفت
کسر جرم دم را به گونه ای تنظیم می کند که در شبیه سازی که مکان را تخمین می زند، جا بیفتد
پارامتر tau برای ارزش های Forward. پیش فرض 0.04 است.

اشکال زدایی OPTIONS


-- غرفه
برای اشکال زدایی نسخه اصلی/کارگر MPI: پس از شروع مکث کنید تا فعال شود
توسعه دهنده برای پیوست کردن دیباگرها به فرآیندهای اصلی و کارگر(های) در حال اجرا. ارسال
سیگنال SIGCONT برای آزاد کردن مکث. (تحت gdb: (gdb) سیگنال NEXTCONT) (فقط
اگر پشتیبانی اختیاری MPI در زمان کامپایل فعال شده باشد، در دسترس است.)

-- دانه
دانه اعداد تصادفی را روی . پیش فرض 0 است که عدد تصادفی را می سازد
ژنراتور استفاده از دانه دلخواه، به طوری که اجرا می شود مختلف هممسیم تقریبا
مطمئناً یک نمونه آماری متفاوت ایجاد می کند. برای اشکال زدایی، مفید است
با تثبیت یک دانه اعداد تصادفی، نتایج قابل تکرار را مجبور کنید.

تجربی OPTIONS


این گزینه ها در انواع کوچکی از آزمایش های اکتشافی مختلف مورد استفاده قرار گرفتند.

--bgflat
توزیع باقیمانده پس‌زمینه را روی توزیع یکنواخت، هر دو برای
اهداف مدل تهی مورد استفاده در محاسبه امتیازات، و برای تولید
دنباله های تصادفی پیش فرض استفاده از فرکانس پس زمینه اسید آمینه استاندارد است
توزیع.

--bgcomp
توزیع باقیمانده پس‌زمینه را روی ترکیب متوسط ​​پروفایل تنظیم کنید.
این در بررسی برخی از اثرات ترکیب مغرضانه استفاده شد.

--x-no-lengthmodel
مدل طول دنباله هدف H3 را خاموش کنید. خود انتقال ها را برای N,C,J تنظیم کنید
و مدل تهی به 350/351 در عوض. این HMMER2 را شبیه سازی می کند. ایده خوبی نیست در
عمومی. این برای نشان دادن یکی از تفاوت های اصلی H2 در مقابل H3 استفاده شد.

--nu
پارامتر nu را برای الگوریتم MSV تنظیم کنید - تعداد مورد انتظار محلی بدون شکاف
ترازها در هر دنباله هدف پیش فرض 2.0 است که مربوط به E->J است
احتمال انتقال 0.5 از این برای آزمایش اینکه آیا nu دارد یا خیر استفاده شد
اثر قابل توجهی بر نتیجه (به نظر نمی رسد، در حد منطق). فقط این گزینه
اگر کار کند --msv انتخاب شده است (فقط MSV را تحت تاثیر قرار می دهد)، و با آن کار نخواهد کرد --سریع
(زیرا پیاده سازی های بهینه شده برای فرض nu=2.0 سخت سیم کشی شده اند).

-- pthresh
آستانه P-value فیلتر را برای استفاده در تولید فایل های قدرت فیلتر با آن تنظیم کنید
-- فایل. پیش فرض 0.02 است (که برای آزمایش نمرات MSV مناسب است،
زیرا این آستانه فیلتر MSV پیش فرض در خط لوله شتاب H3 است.)
دیگر انتخاب های مناسب (تطبیق پیش فرض ها در خط لوله شتاب) خواهد بود
0.001 برای ویتربی و 1e-5 برای فوروارد.

با استفاده از خدمات onworks.net از hmmsim به صورت آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

دستورات لینوکس

Ad