انگلیسیفرانسویاسپانیایی

Ad


فاویکون OnWorks

bgzip - آنلاین در ابر

bgzip را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور bgzip است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


bgzip - ابزار فشرده سازی/فشرده سازی را مسدود کنید

tabix - نمایه‌گر عمومی برای فایل‌های موقعیت ژنوم محدود شده با TAB

خلاصه


bgzip [-cdhB] [-b virtualOffset] [-s اندازه] [پرونده]

تبیکس [-0lf] [-p gff|تخت|سام|vcf] [-s seqCol] [-b begCol] [-e endCol] [-S خط پرش] [-c
متاچار] in.tab.bgz [منطقه 1 [منطقه 2 [...]]]

شرح


Tabix یک فایل موقعیت ژنوم محدود شده با TAB را نمایه می کند in.tab.bgz و یک فایل فهرست ایجاد می کند (
in.tab.bgz.tbi or in.tab.bgz.csi ) چه زمانی منطقه از خط فرمان غایب است. ورودی
فایل داده باید بر اساس موقعیت مرتب شده و فشرده شود bgzip که دارای یک از gzip(1) دوست دارم
رابط. پس از نمایه سازی، tabix می تواند به سرعت خطوط داده که روی هم قرار گرفته اند را بازیابی کند
مناطق در قالب "chr:beginPos-endPos" مشخص شده است. بازیابی سریع داده ها نیز کار می کند
شبکه اگر URI به عنوان نام فایل داده شود و در این صورت فایل فهرست دانلود می شود
اگر به صورت محلی وجود نداشته باشد.

نمایه سازی OPTIONS


-0، -- بر اساس صفر
مشخص کنید که موقعیت در فایل داده ها بر اساس 0 باشد (مثلا فایل های UCSC).
از 1 مبتنی بر.

-ب، --شروع INT
ستون موقعیت کروموزومی شروع. [4]

-c، --اظهار نظر CHAR
رد شدن از خطوط با کاراکتر CHAR شروع شد. [#]

-C ، --csi رد شدن از خطوط با کاراکتر CHAR شروع شد. [#]

-ه ، --پایان INT
ستون موقعیت کروموزومی انتهایی. ستون پایانی می تواند همان شروع باشد
ستون [5]

-f، --زور
در صورت وجود، فایل فهرست را مجبور به بازنویسی کنید.

-m، -- دقیقه شیفتINT
حداقل اندازه بازه را برای شاخص های CSI روی 2^INT تنظیم کنید [14]

-پ، -- از پیش تعیین شده STR
فرمت ورودی برای نمایه سازی مقادیر معتبر عبارتند از: gff، bed، sam، vcf. این گزینه
نباید همراه با هیچ یک از آنها اعمال شود -s, -b, -e, -c و -0; استفاده نمی شود
برای بازیابی داده ها زیرا این تنظیم در فایل فهرست ذخیره می شود. [gff]

-s ، --توالی INT
ستون نام دنباله. گزینه -s, -b, -e, -S, -c و -0 همه در ذخیره می شوند
فایل ایندکس و بنابراین در بازیابی داده ها استفاده نمی شود. [1]

-S، - خطوط پرش INT
از اولین خطوط INT در فایل داده رد شوید. [0]

پرس و جو و OTHER OPTIONS


-h، ---print-header
هدر/خطوط متا را نیز چاپ کنید.

-H، --فقط سربرگ
فقط هدر/خطوط متا را چاپ کنید.

-من، --اطلاعات فایل
چاپ اطلاعات فرمت فایل

-ل، --list-chroms
نام دنباله های ذخیره شده در فایل فهرست را فهرست کنید.

-r، -- سر سر فایل
هدر را با محتوای FILE جایگزین کنید

-ر، -- مناطق فایل
محدود به مناطق فهرست شده در FILE. FILE می تواند فایل BED باشد (به .bed نیاز دارد،
.bed.gz، پسوند نام فایل .bed.bgz) یا یک فایل جدا شده با TAB با CHROM، POS،
و به صورت اختیاری، ستون‌های POS_TO، که در آن موقعیت‌ها مبتنی بر 1 و شامل هستند. چه زمانی
این گزینه در حال استفاده است، فایل ورودی ممکن است مرتب نشده باشد. مناطق

-T، --اهداف فایل
مشابه -R اما کل ورودی به صورت متوالی خوانده می شود و مناطق لیست نشده اند
در FILE حذف خواهد شد.

مثال


(grep ^"#" in.gff; grep -v ^"#" in.gff | مرتب سازی -k1,1 -k4,4n) | bgzip > sorted.gff.gz;

tabix -p gff sorted.gff.gz;

tabix sorted.gff.gz chr1:10,000,000-20,000,000;

NOTES


دستیابی به پرس و جوهای همپوشانی با استفاده از شاخص استاندارد B-tree (با یا
بدون binning) در تمام پایگاه های داده SQL، یا شاخص درخت R در PostgreSQL و
اوراکل. اما هنوز دلایل زیادی برای استفاده از tabix وجود دارد. اولا، tabix مستقیماً با آن کار می کند
بسیاری از فرمت های پرکاربرد محدود شده با TAB مانند GFF/GTF و BED. ما نیاز نداریم
طراحی شمای پایگاه داده یا فرمت های باینری تخصصی. داده ها نیازی به تکرار ندارند
فرمت های مختلف، یا ثانیاً، tabix بر روی فایل های داده فشرده کار می کند در حالی که اکثر SQL ها
پایگاه های داده نمی کنند. حاشیه نویسی GenCode GTF را می توان تا 4 درصد فشرده کرد. ثالثاً تبیکس
سریع است. شناخته شده است که همان الگوریتم نمایه سازی برای تراز با a کارآمد است
چند میلیارد مطالعه کوتاه پایگاه داده های SQL احتمالاً نمی توانند به راحتی داده ها را در این مقیاس مدیریت کنند.
آخرین اما نه کم اهمیت ترین، tabix از بازیابی اطلاعات از راه دور پشتیبانی می کند. می توان فایل دیتا را قرار داد
و ایندکس در یک سرور FTP یا HTTP و سایر کاربران یا حتی وب سرویس ها قادر خواهند بود
برای دریافت یک قطعه بدون دانلود کل فایل.

با استفاده از خدمات onworks.net از bgzip آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

  • 1
    فازر
    فازر
    Phaser یک باز سریع، رایگان و سرگرم کننده است
    منبع چارچوب بازی HTML5 که ارائه می دهد
    WebGL و Canvas Rendering در سراسر
    مرورگرهای وب دسکتاپ و موبایل بازی ها
    می تواند با ...
    دانلود فازر
  • 2
    موتور VASSAL
    موتور VASSAL
    VASSAL یک موتور بازی برای ایجاد است
    نسخه های الکترونیکی تخته سنتی
    و بازی های کارتی پشتیبانی می کند
    رندر و تعامل قطعه بازی،
    و ...
    دانلود VASSAL Engine
  • 3
    OpenPDF - Fork of iText
    OpenPDF - Fork of iText
    OpenPDF یک کتابخانه جاوا برای ایجاد است
    و ویرایش فایل های PDF با LGPL و
    مجوز منبع باز MPL. OpenPDF است
    LGPL/MPL جانشین منبع باز iText،
    و ...
    OpenPDF - Fork of iText را دانلود کنید
  • 4
    GIS SAGA
    GIS SAGA
    SAGA - سیستم برای خودکار
    تجزیه و تحلیل جغرافیایی - یک جغرافیا است
    نرم افزار سیستم اطلاعات (GIS) با
    قابلیت های بسیار زیاد برای داده های جغرافیایی
    پردازش و آنا...
    دانلود SAGA GIS
  • 5
    جعبه ابزار برای جاوا/JTOpen
    جعبه ابزار برای جاوا/JTOpen
    جعبه ابزار IBM برای جاوا / JTOpen یک است
    کتابخانه کلاس های جاوا که از
    کلاینت/سرور و برنامه نویسی اینترنتی
    مدل های سیستمی که دارای OS/400 است،
    i5/OS، o...
    جعبه ابزار را برای جاوا/JTOpen دانلود کنید
  • 6
    D3.js
    D3.js
    D3.js (یا D3 برای اسناد داده محور)
    یک کتابخانه جاوا اسکریپت است که به شما اجازه می دهد
    برای تولید داده های پویا و تعاملی
    تجسم در مرورگرهای وب با D3
    شما...
    D3.js را دانلود کنید
  • بیشتر "

دستورات لینوکس

Ad