Amazon Best VPN GoSearch

فاویکون OnWorks

ncbi-seg - آنلاین در ابر

ncbi-seg را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور ncbi-seg است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


ncbi-seg - توالی(های) قطعه بر اساس پیچیدگی محلی

خلاصه


دنباله ncbi-seg [ W ] [ K(1) ] [ K(2) ] [-x] [گزینه ها]

شرح


ncbi-seg دنباله ها را به بخش های متضاد کم پیچیدگی و بالا تقسیم می کند.
پیچیدگی بخش های کم پیچیدگی تعریف شده توسط الگوریتم نشان دهنده "دنباله های ساده" هستند.
یا "مناطق با سوگیری ترکیبی".

بخش های کم پیچیدگی بهینه شده محلی در سطوح مشخصی از سختی تولید می شوند.
بر اساس تعاریف رسمی از پیچیدگی ترکیبی محلی (Wootton & Federhen، 1993).
طول قطعه و تعداد قطعات در هر دنباله به طور خودکار تعیین می شود
توسط الگوریتم

ورودی یک فایل توالی با فرمت FASTA یا یک فایل پایگاه داده حاوی تعداد زیادی FASTA- است.
دنباله های فرمت شده ncbi-seg برای توالی اسیدهای آمینه تنظیم شده است. برای نوکلئوتید
دنباله ها، نمونه هایی از مجموعه پارامترها را در زیر ببینید.

سختی جستجو برای بخش های کم پیچیدگی توسط سه کاربر تعیین می شود.
پارامترهای تعریف شده، طول پنجره ماشه [W]، پیچیدگی ماشه [ K(1) ] و پسوند
پیچیدگی [ K(2)] (زیر را در بخش پارامترها ببینید). پیش فرض های ارائه شده مناسب هستند
پوشاندن کم پیچیدگی دنباله‌های جستجوی پایگاه داده [گزینه x مورد نیاز است، ببینید
زیر].

خروجی و کاربردها


(1) توالی بخش‌بندی شده قابل خواندن [پیش‌فرض]. مناطق با پیچیدگی متضاد هستند
در "فرمت درختی" نمایش داده می شود. به مثال ها مراجعه کنید.

(2) پوشش با پیچیدگی کم (به Altschul و همکاران، 1994 مراجعه کنید). یک قالب ماسک دار با فرمت FASTA تولید کنید
فایل آماده برای ورودی به عنوان دنباله پرس و جو برای برنامه های جستجوی پایگاه داده مانند BLAST یا
FASTA. اسیدهای آمینه در مناطق کم پیچیدگی با کاراکترهای "x" [-x" جایگزین می شوند
گزینه]. به مثال ها مراجعه کنید.

(3) ساخت پایگاه داده. فایل های با فرمت FASTA حاوی پیچیدگی کم تولید کنید
بخش‌ها [-l option]، یا بخش‌های با پیچیدگی بالا [-h option]، یا هر دو [-a option]. هر یک
بخش یک ورودی توالی جداگانه با یک خط سرصفحه اطلاعاتی است.

الگوریتم


الگوریتم SEG دو مرحله دارد. اول، شناسایی بخش های خام تقریبی از
کم پیچیدگی؛ دوم بهینه سازی محلی

در مرحله اول، سختگیری و وضوح جستجو برای پیچیدگی کم است
بخش ها توسط W تعیین می شود، K(1) و K(2) پارامترها تمام پنجره های ماشه هستند
تعریف شده، از جمله پنجره های همپوشانی، با طول W و پیچیدگی کمتر یا مساوی
K(1). "پیچیدگی" در اینجا با معادله (3) Wootton & Federhen (1993) تعریف می شود. هر یک
سپس پنجره ماشه با ادغام با پسوند به یک contig در هر دو جهت گسترش می یابد
پنجره هایی که پنجره های همپوشانی با طول W و پیچیدگی کمتر یا مساوی هستند
K(2). هر contig یک بخش خام است.

در مرحله دوم، هر بخش خام به یک کم پیچیدگی بهینه کاهش می یابد
بخش، که ممکن است کل بخش خام باشد اما معمولاً دنباله ای است. بهینه
دنباله بعدی کمترین مقدار احتمال را دارد P(0) (معادله (5) Wootton &
فدرهن، 1993).

پارامترهای


این سه پارامتر عددی به ترتیب اجباری بعد از نام فایل توالی قرار دارند.

طول پنجره ماشه [ W ]. یک عدد صحیح بزرگتر از صفر [پیش فرض 12].

پیچیدگی ماشه [K1]. حداکثر پیچیدگی یک پنجره ماشه در واحد بیت.
K1 باید مساوی یا بزرگتر از صفر باشد. حداکثر مقدار 4.322 (log[base 2]20) برای است
توالی اسیدهای آمینه [پیش فرض 2.2].

پیچیدگی پسوند [K2]. حداکثر پیچیدگی یک پنجره افزونه بر حسب واحد
بیت ها فقط مقادیر بیشتر از K1 در گسترش پنجره های راه اندازی شده موثر هستند. محدوده از
مقادیر ممکن مانند K1 [پیش‌فرض 2.5] است.

OPTIONS


گزینه های زیر ممکن است به هر ترتیبی در خط فرمان بعد از W، K1 و قرار گیرند
پارامترهای K2:

-a خروجی هر دو بخش کم پیچیدگی و پیچیدگی بالا در یک فایل با فرمت FASTA، به عنوان
مجموعه ای از ورودی های جداگانه با خطوط سرصفحه.

-c [نویسه در هر خط]
تعداد کاراکترهای دنباله در هر خط خروجی [پیش‌فرض 60]. شخصیت های دیگر، مانند
به عنوان اعداد باقیمانده، اضافی هستند.

-h فقط بخش‌های با پیچیدگی بالا را در یک فایل با فرمت FASTA به عنوان مجموعه‌ای از
ورودی های جداگانه با خطوط سرصفحه

-l فقط بخش های کم پیچیدگی را در یک فایل با فرمت FASTA به عنوان مجموعه ای از
ورودی های جداگانه با خطوط سرصفحه

-m [طول]
حداقل طول در باقیمانده ها برای یک بخش با پیچیدگی بالا [پیش فرض 0]. کوتاه تر
بخش ها با بخش های کم پیچیدگی مجاور ادغام می شوند.

-o نمایش تمام بخش‌های با پیچیدگی کم با هم تداخل دارند [اینها هستند
به طور پیش فرض ادغام شد].

-q یک قالب خروجی با دنباله آن در یک بلوک شماره دار با علامت هایی برای کمک تولید کنید
شمارش باقی مانده بخش های کم پیچیدگی و پیچیدگی بالا در پایین و
به ترتیب حروف بزرگ

-t [طول]
پارامتر "حداکثر طول برش" [پیش‌فرض 100]. این فضای جستجو را کنترل می کند (و
زمان جستجو) در طول بهینه سازی بخش های خام (به الگوریتم بالا مراجعه کنید). توسط
به طور پیش فرض، دنباله های 100 یا بیشتر باقی مانده کوتاه تر از بخش خام حذف می شوند
از جستجو این پارامتر ممکن است افزایش یابد تا جستجوی گسترده تری ارائه دهد
بخش های خام بیشتر از 100 باقیمانده هستند.

-x گزینه پوشش برای توالی اسیدهای آمینه. هر دنباله ورودی با a نشان داده می شود
دنباله خروجی واحد در قالب FASTA با مناطق کم پیچیدگی جایگزین رشته ها
از شخصیت های "x".

مثال ها OF پارامتر SETS


پارامترهای پیش‌فرض با «دنباله ncbi-seg» (معادل «دنباله ncbi-seg 12» داده می‌شوند.
2.2 2.5'). این پارامترها برای پوشش کم پیچیدگی بسیاری از آمینوها مناسب هستند
دنباله های اسیدی [با گزینه -x].

پایگاه داده-پایگاه داده مقایسه:
پارامترهای پیچیدگی دقیق تر (کمتر) زمانی مناسب هستند که توالی های پوشانده شده باشند
در مقایسه با توالی های پوشیده شده به عنوان مثال، برای جستجوهای BLAST یا FASTA که دو مورد را با هم مقایسه می کنند
پایگاه های داده توالی اسید آمینه، پوشش زیر ممکن است برای هر دو پایگاه داده اعمال شود:

پایگاه داده ncbi-seg 12 1.8 2.0 -x

هموپلیمر تحلیل و بررسی:
برای بررسی تمام دنباله های فرعی همپلیمری با طول (مثلا) 7 یا بیشتر:

دنباله ncbi-seg 7 0 0

غیر کروی مناطق of پروتئين دنباله ها:
بسیاری از دامنه های طولانی غیر کروی ممکن است در طول پنجره های طولانی تر تشخیص داده شوند، به طور معمول:

دنباله ncbi-seg 45 3.4 3.75

برای برخی از دامنه‌های کوتاه‌تر غیر کروی، مجموعه زیر مناسب است:

دنباله ncbi-seg 25 3.0 3.3

نوکلئوتید دنباله ها:
حداکثر مقدار پارامترهای پیچیدگی 2 است (log[base 2]4). برای ماسک کردن،
زیر تقریباً معادل پارامترهای پیش فرض اسید آمینه است
دنباله ها:

ncbi-seg sequence.na 21 1.4 1.6

مثال ها


فایل زیر فایلی با نام "prion" با فرمت FASTA است:

> PRIO_HUMAN MJOR PRION PROTEIN PRECURSOR
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQP
HGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGA
VVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCV
NITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPV
ILLISFLIFLIVG

خط فرمان:

ncbi-seg /usr/share/doc/ncbi-seg/examples/prion.fa

خروجی استاندارد زیر را می دهد

> PRIO_HUMAN MJOR PRION PROTEIN PRECURSOR

1-49 MANLGCWMLVLFVATWSDLGLCKKRPKPGG
WNTGGSRYPGQGSPGGNRY
ppqggggwgqphgggwgqphgggwgqphgg 50-94
گوگقفگگگگگ
95-112 THSQWNKPSKPKTNMKHM
آگاااااگاوووگلگیملگسامس 113-135
136-187 RPIIHFGSDYEDRYYRENMHRYPNQVYYRP
MDEYSNQNNFVHDCVNITIKQH
tvttttkgenftet 188-201
202-236 DVKMMERVVEQMCITQYERESQAYYQRGSS
MVLFS
sppvillisflifliv 237-252
253-253 گرم

دنباله های کم پیچیدگی در سمت چپ (حروف کوچک) و دنباله های با پیچیدگی بالا هستند.
در سمت راست (حروف بزرگ) قرار دارند. تمام بخش های دنباله از چپ به راست و آنها خوانده می شود
ترتیب در دنباله از بالا به پایین است، همانطور که توسط ستون مرکزی باقیمانده نشان داده شده است
اعداد.

خط فرمان:

ncbi-seg /usr/share/doc/ncbi-seg/examples/prion.fa -x

فایل با فرمت FASTA زیر را ارائه می دهد:

> PRIO_HUMAN MJOR PRION PROTEIN PRECURSOR
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYx
xxxxTHSQWNKPSKPKTNMKHMxxx
RPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCV
NITIKQHxxxxDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSxxxx
xxG

با استفاده از خدمات onworks.net از ncbi-seg آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

دستورات لینوکس

Ad




×
تبلیغات
❤️اینجا خرید کنید، رزرو کنید یا بخرید - رایگان است، به رایگان ماندن خدمات کمک می‌کند.