Amazon Best VPN GoSearch

فاویکون OnWorks

sim4 - آنلاین در ابر

sim4 را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور sim4 است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


sim4 - یک توالی DNA بیان شده را با یک توالی ژنومی تراز کنید

خلاصه


سیم 4 seqfile1 seqfile2 {[WXKCRDAPNB]=ارزش}

شرح


سیم 4 یک ابزار مبتنی بر شباهت برای تراز کردن یک توالی DNA بیان شده (EST، cDNA، mRNA) است.
با یک توالی ژنومی برای ژن. همچنین در هنگام ورود این دو، مطابقت های پایانی را تشخیص می دهد
توالی ها در یک انتها همپوشانی دارند (یعنی شروع یک دنباله با انتهای آن همپوشانی دارد
دیگر). اگر seqfile2 یک پایگاه داده از توالی است، دنباله در seqfile1 تراز خواهد شد
با هر یک از دنباله ها در seqfile2.

سیم 4 از یک تکنیک مبتنی بر انفجار استفاده می کند تا ابتدا بلوک های اصلی تطبیق را تعیین کند
نشان دهنده "هسته های اگزون". در این مرحله اول، تمام تطابقات دقیق ممکن را شناسایی می کند
W-mers (یعنی کلمات DNA با اندازه W) بین دو دنباله و گسترش آنها به
بخش های بدون شکاف امتیاز حداکثر. در مرحله دوم، هسته های اگزون به داخل گسترش می یابند
قطعات مجاور که هنوز همسان نیستند با استفاده از الگوریتم های هم ترازی حریصانه و اکتشافی
برای ترجیح پیکربندی هایی که با سیگنال های تشخیص محل اتصال (GT-
AG، CT-AC). در صورت لزوم، این فرآیند با پارامترهای سختگیرانه کمتری روی آن تکرار می شود
قطعات بی همتا

به طور پیش فرض، سیم 4 هر دو رشته را جستجو می کند و بهترین تطابق را گزارش می دهد که با عدد اندازه گیری می شود
از نوکلئوتیدهای منطبق موجود در تراز. از گزینه خط فرمان R می توان استفاده کرد
جستجو را فقط به یک جهت (رشته) محدود کنید.

در حال حاضر، پنج گزینه نمایش تراز اصلی پشتیبانی می شوند که توسط گزینه A کنترل می شوند.
به طور پیش فرض (A=0)، فقط نقاط پایانی، شباهت کلی و جهت گیری اینترون ها
گزارش می شوند. علامت فلش (`->" یا "<-") جهت اینترون ("+" یا
رشته `-')، هنگامی که سیگنال های طرفین اینترون دارای سه یا چند موقعیت منطبق هستند
سیگنال های تشخیص اتصال GT-AG یا CT-AC. وقتی همان تعداد مسابقات
برای هر دو جهت یافت می شود، اینترون مبهم گزارش می شود و با نشان داده می شود
"--". علامت «==» عدم هم ترازی یک قطعه cDNA را نشان می دهد که از شروع آن شروع می شود
آن موقعیت قالب‌های جایگزین (قالب lav-block، متن، «فایل exons» از نوع PipMaker، یا
ترکیب خاصی از این گزینه ها) را می توان با تعیین مقدار متفاوت درخواست کرد
برای یک.

اگر گزینه P با مقدار غیر صفر مشخص شود، سیم 4 هر 3'-end poly-A را حذف می کند
دم هایی که در تراز تشخیص می دهد.

گاه و بیگاه، سیم 4 ممکن است زمانی که توسط اینترون های بسیار بزرگ احاطه شده باشد، یک اگزون داخلی را از دست بدهد،
معمولاً بیشتر از 100 کیلوبایت است. در صورت مشکوک بودن به این موضوع، می توان از گزینه H برای تنظیم مجدد استفاده کرد
وزن اگزون ها برای جبران جریمه شکاف اینترون.

کدهای ابهام به طور پیش فرض در داده های توالی مجاز هستند، اما سیم 4 با آنها رفتار نمی کند
متفاوت در صورت تمایل، گزینه فرمان B می تواند مجموعه ای از قابل قبول را محدود کند
فقط کاراکترهای A، C، G، T، N و X.

سیم 4 طول توالی های ورودی را برای تمایز بین cDNA ("کوتاه") مقایسه می کند.
و اجزای ژنومی (طولانی) در مقایسه. چه زمانی seqfile2 شامل یک مجموعه
از توالی ها، از اولین ورودی فایل برای تعیین نوع این و استفاده می شود
تمام مقایسه های بعدی

در توضیحات زیر، عبارت MSP به معنی a است Mمحوری Sقطعه Pهوا، یعنی یک جفت
قطعات بسیار مشابه در دو دنباله، به دست آمده در طول روش انفجار مانند توسط
گسترش ضربه W-mer توسط مسابقات و شاید چند عدم تطابق.

OPTIONS


پارامترهای الگوریتم (شامل دو بخش اول زیر) قبلاً وجود داشته است
تنظیم شده و معمولاً نیازی به تنظیم توسط کاربر ندارد.

پارامترهای داخلی رویه انفجار مانند:

W اندازه کلمه را برای ضربه های انفجار در مرحله اول الگوریتم تنظیم می کند. پیشفرض
مقدار 12 است، اما می توان آن را برای جستجوی دقیق تر افزایش داد یا به آن کاهش داد
موارد ضعیف تری پیدا کنید

X محدودیت های خاتمه پسوندهای کلمه را در مرحله انفجار مانند کنترل می کند
الگوریتم مقدار پیش فرض 12 است.

K آستانه را برای امتیازات MSP هنگام تعیین هسته های اگزون اصلی تعیین می کند.
در مرحله اول الگوریتم (اگر این گزینه مشخص نشده باشد،
آستانه از طول توالی ها با استفاده از آماری محاسبه می شود
معیارها.) به عنوان مثال، یک مقدار خوب برای توالی های ژنومی در محدوده چند
صد کیلوبایت 16 است. برای جلوگیری از تطابقات جعلی، ممکن است به یک مقدار بزرگتر نیاز باشد
برای سکانس های طولانی تر

C آستانه امتیازات MSP را هنگام تراز کردن قطعاتی که هنوز همسان نیستند، تعیین می کند.
در مرحله دوم الگوریتم به طور پیش فرض، کوچکتر از ثابت
12 و یک آستانه مبتنی بر آمار انتخاب می شود.

پارامترهای الگوریتم اضافی:

D کران فاصله "مورب" را در MSPهای متوالی در یک اگزون تنظیم می کند. در
مقدار پیش فرض 10 است.

پارامترهای زمینه:

R جهت جستجو را مشخص می کند. اگر R=0 باشد، فقط رشته «+» (مستقیم) است
جستجو کرد. اگر R=1 باشد، فقط «-» (مکمل معکوس) مطابقت دارد. به صورت پیش فرض
(R=2)، sim4 هر دو رشته را جستجو می‌کند و بهترین تطابق را گزارش می‌کند، اندازه‌گیری می‌شود
تعداد جفت های منطبق در تراز

A فرمت خروجی را مشخص می کند: فقط نقاط انتهایی اگزون (A=0)، نقاط انتهایی اگزون و
مرزهای منطقه کد کننده (CDS) در توالی ژنومی، زمانی که برای آن مشخص شده است
mRNA ورودی (A=5)، ​​متن تراز (A=1)، تراز در قالب lav-block (A=2)، یا
هم نقطه انتهایی اگزون و هم متن تراز (A=3 یا A=4). اگر مکمل معکوس مطابقت داشته باشد
یافت می شود، A=0,1,2,3,5،XNUMX،XNUMX،XNUMX،XNUMX موقعیت خود را در رشته "+" طولانی تر نشان می دهد.
دنباله و رشته "-" دنباله کوتاهتر. A=4 موقعیت خود را در می دهد
رشته «+» سکانس اول (seqfile1) و رشته «-» دومین
دنباله (seqfile2)، صرف نظر از اینکه کدام دنباله طولانی تر است. گزینه A=5 می تواند باشد
با گزینه خط فرمان S برای تعیین نقاط انتهایی CDS در
mRNA، و خروجی را در قالب «پرونده exons» مورد نیاز PipMaker تولید می کند.

P مشخص می کند که آیا برنامه باید قطعه تراز را گزارش کند یا خیر
حاوی دم poly-A (در صورت یافتن). به طور پیش فرض (P=0) تراز نمایش داده می شود
همانطور که محاسبه می شود، اما با تعیین یک مقدار غیر صفر، از sim4 برای حذف poly-A درخواست می شود
دم وقتی این ویژگی فعال است، همه گزینه های نمایش lav اضافی تولید می کنند
سرصفحه های تراز

H وزن MSP ها را برای جبران اینترون های بسیار بزرگ بازنشانی می کند. مقدار پیش فرض است
H=500، اما برخی از اینترون های بزرگتر از 100 کیلوبایت ممکن است به مقادیر بالاتری نیاز داشته باشند، معمولا
بین 1000 تا 2500. این گزینه معمولاً در موارد باید با احتیاط استفاده شود
جایی که یک بخش داخلی بی همتا از cDNA ممکن است یک اگزون از دست رفته در a را پنهان کند
اینترون بسیار بزرگ برای EST ها توصیه نمی شود، جایی که ممکن است جعلی تولید کنند
اگزون ها

N درخواست جستجوی اضافی برای اگزون های حاشیه ای کوچک (N=1) که توسط اسپلایس هدایت می شوند.
سیگنال های تشخیص سایت این گزینه زمانی قابل استفاده است که یک تطابق با دقت بالا باشد
انتظار می رود. مقدار پیش فرض N=0 است که هیچ جستجوی اضافی را مشخص نمی کند.

B مجموعه کاراکترهای مجاز در توالی های ورودی را کنترل می کند. به طور پیش فرض (B=1)،
کاراکترهای ابهام (ABCDGHKMNRSTVWXY) مجاز هستند. با تعیین B=0، مجموعه ای از
کاراکترهای قابل قبول فقط به A، C، G، T، N و X محدود شده است.

S به کاربر اجازه می دهد تا نقاط پایانی CDS را در mRNA ورودی با
نحو: S=n1..n2. این گزینه فقط با پرچم A=5 موجود است که تولید می کند
خروجی در فرمت مورد نیاز PipMaker. متناوبا، مختصات CDS می تواند
در یک ساختار CDS=n1..n2 در هدر FastA توالی mRNA ظاهر می شود. وقتی که
فایل دوم یک پایگاه داده mRNA است، مشخصات خط فرمان برای CDS خواهد بود
فقط به دنباله اول فایل اعمال شود.

مثال ها


sim4 ژنومیک است

sim4 ژنومیک estdb

sim4 est ژنومی A=1 P=1

sim4 est1 est2 R=1

sim4 mRNA ژنومیک A=5 S=123..1020

sim4 mouse_cDNA human_genomic K=15 C=11 A=3 W=10

AUTHORS


sim4 توسط Liliana Florea نوشته شده است[ایمیل محافظت شده]> و اسکات شوارتز.

این صفحه راهنما توسط Nelson A. de Oliveira نوشته شده است[ایمیل محافظت شده]>، بر اساس
مستندات آنلاین در http://globin.cse.psu.edu/html/docs/sim4.html، برای دبیان
پروژه (اما ممکن است توسط دیگران استفاده شود).

چهارشنبه ، 03 آگوست 2005 18:40:58 -0300 SIM4(1)

با استفاده از خدمات onworks.net از sim4 به صورت آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

دستورات لینوکس

Ad




×
تبلیغات
❤️اینجا خرید کنید، رزرو کنید یا بخرید - رایگان است، به رایگان ماندن خدمات کمک می‌کند.