این دستور formatdb است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
formatdb - پایگاه داده های پروتئین یا نوکلئوتیدی را برای BLAST قالب بندی کنید
خلاصه
formatdb [-] [-B نام فایل] [-F نام فایل] [-L نام فایل] [-T نام فایل] [-V] [-a] [-b] [-e]
[-i نام فایل] [-l نام فایل] [-n خ] [-o] [-p F] [-s] [-t خ] [-v N]
شرح
formatdb باید برای قالببندی پایگاههای اطلاعاتی منبع پروتئین یا نوکلئوتیدی استفاده شود
این پایگاه داده ها را می توان با blastall، blastpgp یا MegaBLAST جستجو کرد. پایگاه داده منبع
ممکن است در قالب FASTA یا ASN.1 باشد. اگرچه فرمت FASTA اغلب به عنوان استفاده می شود
ورودی به formatdb، استفاده از ASN.1 برای کسانی که از ASN.1 به عنوان استفاده می کنند سودمند است
منبع مشترک برای فرمت های دیگر مانند گزارش GenBank. یک بار فایل پایگاه داده منبع
فرمت شده است توسط formatdb BLAST به آن نیاز ندارد. لطفا توجه داشته باشید که اگر هستید
بهروزرسانیهای دورهای را با استفاده از پایگاههای داده BLAST خود اعمال کنید fmerge(1)، شما نیاز دارید
فایل پایگاه داده منبع را نگه دارید.
OPTIONS
خلاصه ای از گزینه ها در زیر آمده است.
- پیام مصرف چاپ
-B نام فایل
Gifile باینری تولید شده از Gifile مشخص شده توسط -F. این گزینه را مشخص می کند
نام یک فایل لیست دودویی GI. این گزینه باید با -F گزینه. آ
متن لیست GI ممکن است با -F گزینه و -B گزینه تولید خواهد شد
آن لیست GI در قالب باینری. فایل باینری کوچکتر است و BLAST نیازی ندارد
برای تبدیل آن، بنابراین می توان آن را سریعتر خواند.
-F نام فایل
Gifile (فایل حاوی لیست gi) برای استفاده با -B or -L
-L نام فایل
یک فایل نام مستعار ایجاد کنید نام فایل، توالی های جستجو شده را به آن محدود می کند
مشخص شده توسط -F.
-T نام فایل
شناسههای طبقهبندی را در ASN.1 طبق جدول موجود تنظیم کنید نام فایل.
-V Verbose: شناسه های رشته غیر منحصر به فرد را در پایگاه داده بررسی کنید
-a فایل ورودی پایگاه داده با فرمت ASN.1 است (در غیر این صورت FASTA مورد انتظار است)
-b پایگاه داده ASN.1 باینری است (برخلاف متن ASCII)
-e ورودی یک ورودی متوالی است. یک پایگاه داده منبع ASN.1 (اعم از متن ascii یا باینری) ممکن است
حاوی یک مجموعه Bioseq یا فقط یک Bioseq باشد. در مورد دوم -e باید فراهم گردد.
-i نام فایل
فایل(های) ورودی برای قالب بندی
-l نام فایل
نام فایل گزارش (پیشفرض = formatdb.log)
-n خ نام پایه برای فایل های BLAST (به طور پیش فرض به نام فایل اصلی FASTA)
-o SeqID را تجزیه کنید و ایندکس ایجاد کنید. اگر پایگاه داده منبع در قالب FASTA باشد،
شناسه های پایگاه داده در خط تعریف FASTA باید از قراردادها پیروی کنند
فرمت FASTA Defline.
-p F ورودی یک نوکلئوتید است نه یک پروتئین.
-s شاخص فقط بر اساس الحاق، نه بر اساس مکان. این به ویژه برای مجموعه های دنباله ای مفید است
مانند EST که در آن نام الحاق و مکان یکسان است. Formatdb اجرا می شود
سریعتر است و در صورت استفاده از این گزینه فایلهای موقت کوچکتری تولید می کند. به شدت است
برای EST، STS، GSS، و HTGS توصیه می شود.
-t خ عنوان فایل پایگاه داده [String]
-v N فایل های بزرگ FASTA را به حجم های بزرگ تقسیم کنید N میلیون نامه (4000 توسط
پیش فرض). به عنوان بخشی از ایجاد یک جلد، formatdb نوع جدیدی از BLAST را می نویسد
فایل پایگاه داده، به نام فایل مستعار، با پسوند «nal» یا «pal».
با استفاده از خدمات onworks.net از formatdb به صورت آنلاین استفاده کنید