bgzip - ক্লাউডে অনলাইন

এটি হল bgzip কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


bgzip - ব্লক কম্প্রেশন/ডিকম্প্রেশন ইউটিলিটি

tabix - TAB-সীমাবদ্ধ জিনোম অবস্থান ফাইলের জন্য জেনেরিক ইনডেক্সার

সাইনোপিসিস


bgzip [-সিডিএইচবি] [-b ভার্চুয়াল অফসেট] [-s আয়তন] [ফাইল]

ট্যাবিক্স [-0lf] [-p gff|বেড|sam|vcf] [-s seqCol] [-b begCol] [-e শেষ কল] [-S লাইন স্কিপ] [-c
মেটাচার] in.tab.bgz [অঞ্চল 1 [অঞ্চল 2 [...]]]

বর্ণনাঃ


Tabix একটি TAB-সীমাবদ্ধ জিনোম অবস্থান ফাইল সূচী করে in.tab.bgz এবং একটি সূচক ফাইল তৈরি করে (
in.tab.bgz.tbi or in.tab.bgz.csi ) কখন এলাকা কমান্ড লাইন থেকে অনুপস্থিত. ইনপুট
ডেটা ফাইলের অবস্থান অনুসারে সাজানো এবং সংকুচিত হওয়া আবশ্যক bgzip যা একটি gzip,(1) পছন্দ
ইন্টারফেস. সূচীকরণের পরে, ট্যাবিক্স দ্রুত ডেটা লাইন ওভারল্যাপিং পুনরুদ্ধার করতে সক্ষম হয়
অঞ্চল "chr:beginPos-endPos" বিন্যাসে নির্দিষ্ট করা হয়েছে। দ্রুত ডেটা পুনরুদ্ধারও কাজ করে
নেটওয়ার্ক যদি ইউআরআই একটি ফাইলের নাম হিসাবে দেওয়া হয় এবং এই ক্ষেত্রে সূচক ফাইলটি ডাউনলোড করা হবে
যদি এটি স্থানীয়ভাবে উপস্থিত না হয়।

ইনডেক্সিং বিকল্প


-0, --শূন্য-ভিত্তিক
উল্লেখ করুন যে ডেটা ফাইলের অবস্থানটি 0-ভিত্তিক (যেমন UCSC ফাইল)
1-ভিত্তিক তুলনায়

-খ, --শুরু INT
শুরুর ক্রোমোসোমাল অবস্থানের কলাম। [৪]

-গ, --মন্তব্য চর
স্কিপ লাইনগুলি CHAR অক্ষর দিয়ে শুরু হয়েছে৷ [#]

-সি, --সিএসআই স্কিপ লাইনগুলি CHAR অক্ষর দিয়ে শুরু হয়েছে৷ [#]

-ই, --শেষ INT
শেষ ক্রোমোসোমাল অবস্থানের কলাম। শেষ কলামটি শুরুর মতোই হতে পারে
কলাম [৫]

-চ, -- বল
সূচক ফাইলটি উপস্থিত থাকলে ওভাররাইট করতে বাধ্য করুন।

-মি, --মিন-শিফটINT
CSI সূচকের জন্য ন্যূনতম ব্যবধানের আকার 2^INT এ সেট করুন [14]

-পি, --প্রিসেট STR
ইনডেক্সিংয়ের জন্য ইনপুট বিন্যাস। বৈধ মান হল: gff, bed, sam, vcf. এই বিকল্প
কোনটির সাথে একসাথে প্রয়োগ করা উচিত নয় -s, -b, -e, -c এবং -0; এটা ব্যবহার করা হয় না
ডেটা পুনরুদ্ধারের জন্য কারণ এই সেটিংটি ইনডেক্স ফাইলে সংরক্ষিত আছে। [জিএফএফ]

-স, --ক্রম INT
ক্রম নামের কলাম। বিকল্প -s, -b, -e, -S, -c এবং -0 সব সংরক্ষণ করা হয়
ইনডেক্স ফাইল এবং এইভাবে ডেটা পুনরুদ্ধারে ব্যবহৃত হয় না। [১]

-এস, -- এড়িয়ে যাওয়া লাইন INT
ডেটা ফাইলে প্রথম INT লাইনগুলি এড়িয়ে যান। [০]

প্রশ্ন করা এবং অন্যান্য বিকল্প


-হ, --প্রিন্ট-হেডার
শিরোনাম/মেটা লাইনও প্রিন্ট করুন।

-এইচ, --শুধু হেডার
শুধুমাত্র হেডার/মেটা লাইন প্রিন্ট করুন।

-আমি, --ফাইল তথ্য
ফাইল বিন্যাস তথ্য মুদ্রণ.

-আমি, --তালিকা-ক্রোম
ইনডেক্স ফাইলে সংরক্ষিত সিকোয়েন্সের নামগুলো তালিকাভুক্ত করুন।

-আর, -- রিহেডার ফাইল
FILE এর বিষয়বস্তু দিয়ে হেডার প্রতিস্থাপন করুন

-আর, --অঞ্চল ফাইল
ফাইলে তালিকাভুক্ত অঞ্চলগুলিতে সীমাবদ্ধ করুন৷ ফাইলটি BED ফাইল হতে পারে (. বিছানা প্রয়োজন,
.bed.gz, .bed.bgz ফাইলের নাম এক্সটেনশন) অথবা CHROM, POS সহ একটি TAB-বিন্যস্ত ফাইল,
এবং, ঐচ্ছিকভাবে, POS_TO কলাম, যেখানে অবস্থান 1-ভিত্তিক এবং অন্তর্ভুক্ত। কখন
এই বিকল্পটি ব্যবহার করা হচ্ছে, ইনপুট ফাইল সাজানো নাও হতে পারে। অঞ্চলগুলি

-টি, --লক্ষ্য ফাইল
অনুরূপ, একই, সমতুল্য -R কিন্তু সম্পূর্ণ ইনপুট ক্রমানুসারে পড়া হবে এবং অঞ্চল তালিকাভুক্ত নয়
FILE এ বাদ দেওয়া হবে।

EXAMPLE টি


(grep ^"#" in.gff; grep -v ^"#" in.gff | সাজান -k1,1 -k4,4n) | bgzip > sorted.gff.gz;

tabix -p gff sorted.gff.gz;

tabix sorted.gff.gz chr1:10,000,000-20,000,000;

নোট


স্ট্যান্ডার্ড বি-ট্রি সূচক ব্যবহার করে ওভারল্যাপ প্রশ্নগুলি অর্জন করা সহজবোধ্য (এর সাথে বা
বিনিং ছাড়া) সমস্ত SQL ডাটাবেসে প্রয়োগ করা হয়েছে, অথবা পোস্টগ্রেএসকিউএল-এ আর-ট্রি সূচক এবং
ওরাকল। কিন্তু এখনও ট্যাবিক্স ব্যবহার করার অনেক কারণ আছে। প্রথমত, ট্যাবিক্স সরাসরি কাজ করে
GFF/GTF এবং BED-এর মতো প্রচুর বহুল ব্যবহৃত TAB-সীমাবদ্ধ ফরম্যাট। আমাদের দরকার নেই
ডিজাইন ডাটাবেস স্কিমা বা বিশেষ বাইনারি ফরম্যাট। ডেটার ডুপ্লিকেট করার দরকার নেই
বিভিন্ন বিন্যাস, হয়. দ্বিতীয়ত, ট্যাবিক্স সংকুচিত ডেটা ফাইলগুলিতে কাজ করে যখন বেশিরভাগ এসকিউএল
ডাটাবেস করে না। GenCode টীকা GTF 4% এ সংকুচিত করা যেতে পারে। তৃতীয়ত, ট্যাবিক্স
দ্রুত. একই ইন্ডেক্সিং অ্যালগরিদম a এর সাথে একটি প্রান্তিককরণের জন্য দক্ষতার সাথে কাজ করতে পরিচিত
কয়েক বিলিয়ন ছোট পড়া। SQL ডাটাবেস সম্ভবত এই স্কেলে ডেটা সহজে পরিচালনা করতে পারে না।
সর্বশেষ কিন্তু অন্তত নয়, ট্যাবিক্স দূরবর্তী তথ্য পুনরুদ্ধার সমর্থন করে। এক ডাটা ফাইল রাখতে পারেন
এবং একটি FTP বা HTTP সার্ভারে সূচক, এবং অন্যান্য ব্যবহারকারী বা এমনকি ওয়েব পরিষেবাগুলি সক্ষম হবে
সম্পূর্ণ ফাইল ডাউনলোড না করেই একটি স্লাইস পেতে।

onworks.net পরিষেবা ব্যবহার করে অনলাইনে bgzip ব্যবহার করুন



সর্বশেষ লিনাক্স এবং উইন্ডোজ অনলাইন প্রোগ্রাম