ইংরেজিফরাসিস্প্যানিশ

Ad


অনওয়ার্কস ফেভিকন

vcftools - ক্লাউডে অনলাইন

উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটরের মাধ্যমে OnWorks ফ্রি হোস্টিং প্রদানকারীতে vcftools চালান

এটি হল vcftools কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


vcftools - ভিসিএফ ফাইল বিশ্লেষণ করুন

সাইনোপিসিস


vcftools [বিকল্প]

বর্ণনাঃ


vcftools প্রোগ্রাম কমান্ড লাইন থেকে চালানো হয়। ইন্টারফেস PLINK দ্বারা অনুপ্রাণিত, এবং
তাই সেই প্যাকেজের ব্যবহারকারীদের কাছে অনেকাংশে পরিচিত হওয়া উচিত। কমান্ড নিম্নলিখিত ফর্ম গ্রহণ করে:

vcftools --vcf file1.vcf --chr 20 --freq

উপরের কমান্ডটি vcftoolsকে ফাইল 1.vcf ফাইলে পড়তে বলে, সাইটগুলি বের করতে বলে
ক্রোমোজোম 20, এবং প্রতিটি সাইটে অ্যালিল ফ্রিকোয়েন্সি গণনা করুন। ফলে অ্যালিল
ফ্রিকোয়েন্সি অনুমান আউটপুট ফাইল, out.freq এ সংরক্ষণ করা হয়। উপরের উদাহরণের মতো,
vcftools থেকে আউটপুট প্রধানত আউটপুট ফাইলগুলিতে পাঠানো হয়, যেমনটি দেখানো হয়েছে
পর্দা।

মনে রাখবেন যে কিছু কমান্ড শুধুমাত্র vcftools এর সর্বশেষ সংস্করণে উপলব্ধ হতে পারে। অর্জন
সর্বশেষ সংস্করণ, আপনার সর্বশেষ কোড চেকআউট করতে SVN ব্যবহার করা উচিত, যেমন তে বর্ণিত
হোম পৃষ্ঠা

এছাড়াও মনে রাখবেন যে পলিপ্লয়েড জিনোটাইপগুলি বর্তমানে সমর্থিত নয়।

মৌলিক অপশন সমূহ
--ভিসিএফ
এই বিকল্পটি প্রক্রিয়া করার জন্য VCF ফাইলটিকে সংজ্ঞায়িত করে। ফাইল ডিকম্প্রেস করা প্রয়োজন
vcftools ব্যবহার করার আগে। vcftools VCF বিন্যাসে ফাইলগুলি আশা করে v4.0, a
যার স্পেসিফিকেশন এখানে পাওয়া যাবে।

--gzvcf
সংকুচিত (gzipped) পড়ার জন্য এই বিকল্পটি --vcf বিকল্পের জায়গায় ব্যবহার করা যেতে পারে
ভিসিএফ ফাইল সরাসরি। মনে রাখবেন যে এই বিকল্পটি যখন বড় সাথে ব্যবহার করা হয় তখন বেশ ধীর হতে পারে
ফাইল।

--আউট
এই বিকল্পটি vcftools দ্বারা উত্পন্ন সমস্ত ফাইলের জন্য আউটপুট ফাইলের নাম উপসর্গ সংজ্ঞায়িত করে।
উদাহরণস্বরূপ, যদি output_filename সেট করা হয়, তারপর সব আউটপুট ফাইল হবে
ফর্ম output_filename এর।***। এই বিকল্পটি বাদ দেওয়া হলে, সমস্ত আউটপুট ফাইল হবে
'আউট' উপসর্গ আছে।

সাইট ফিল্টার অপশন সমূহ
--chr
শুধুমাত্র একটি ক্রোমোজোম শনাক্তকারী ম্যাচিং সহ সাইটগুলি প্রক্রিয়া করুন৷

--বিপি থেকে

--টু-বিপি
এই বিকল্পগুলি সাইটগুলির শারীরিক পরিসর প্রক্রিয়া করা হবে তা নির্ধারণ করে। বাইরে সাইট
এই পরিসীমা বাদ দেওয়া হবে. এই বিকল্পগুলি শুধুমাত্র সঙ্গে একযোগে ব্যবহার করা যেতে পারে
--chr

--এসএনপি
মিল আইডি সহ SNP(গুলি) অন্তর্ভুক্ত করুন। এই কমান্ডটি ক্রমানুসারে একাধিকবার ব্যবহার করা যেতে পারে
একাধিক SNP অন্তর্ভুক্ত করতে।

--snps
একটি ফাইলে দেওয়া SNP-এর একটি তালিকা অন্তর্ভুক্ত করুন। ফাইলটিতে SNP আইডিগুলির একটি তালিকা থাকা উচিত,
প্রতি লাইনে একটি আইডি সহ।

--বাদ
একটি ফাইলে দেওয়া SNP-এর একটি তালিকা বাদ দিন। ফাইলটিতে SNP আইডিগুলির একটি তালিকা থাকা উচিত,
প্রতি লাইনে একটি আইডি সহ।

--পজিশন
অবস্থানের তালিকার ভিত্তিতে সাইটগুলির একটি সেট অন্তর্ভুক্ত করুন। ইনপুট প্রতিটি লাইন
ফাইলে একটি (ট্যাব-বিচ্ছিন্ন) ক্রোমোজোম এবং অবস্থান থাকা উচিত। ফাইল করা উচিত
একটি হেডার লাইন আছে তালিকায় অন্তর্ভুক্ত নয় এমন সাইটগুলি বাদ দেওয়া হয়েছে।

--বিছানা

-- বাদ-বিছানা
একটি BED ফাইলের ভিত্তিতে সাইটগুলির একটি সেট অন্তর্ভুক্ত বা বাদ দিন। প্রথম তিনটি মাত্র
কলাম (chrom, chromStart এবং chromEnd) প্রয়োজন। BED ফাইলে একটি থাকতে হবে
হেডার লাইন।

--রিমুভ-ফিল্টার করা-সব

--রিমুভ-ফিল্টার করা

--কিপ-ফিল্টার করা
এই বিকল্পগুলি তাদের ফিল্টার পতাকার ভিত্তিতে সাইটগুলিকে ফিল্টার করতে ব্যবহৃত হয়৷ দ্য
প্রথম বিকল্পটি ফিল্টার পতাকা সহ সমস্ত সাইট সরিয়ে দেয়। দ্বিতীয় বিকল্প ব্যবহার করা যেতে পারে
একটি নির্দিষ্ট ফিল্টার পতাকা সহ সাইটগুলি বাদ দিন। তৃতীয় বিকল্পটি নির্বাচন করতে ব্যবহার করা যেতে পারে
নির্দিষ্ট ফিল্টার পতাকা ভিত্তিতে সাইট. দ্বিতীয় এবং তৃতীয় বিকল্প হতে পারে
একাধিক ফিল্টার নির্দিষ্ট করতে একাধিকবার ব্যবহার করা হয়েছে। --keep-filtered অপশন হল
--remove-filtered বিকল্পের আগে প্রয়োগ করা হয়।

--মিনকিউ
এই থ্রেশহোল্ডের উপরে গুণমানের সাথে শুধুমাত্র সাইটগুলি অন্তর্ভুক্ত করুন।

--মিন-মিন ডিপি

--max-meanDP
এই বিকল্পগুলি দ্বারা সংজ্ঞায়িত থ্রেশহোল্ডের মধ্যে গড় গভীরতা সহ সাইটগুলি অন্তর্ভুক্ত করুন৷

--মাফ

--max-maf
শুধুমাত্র নির্দিষ্ট সীমার মধ্যে মাইনর অ্যালিল ফ্রিকোয়েন্সি সহ সাইটগুলি অন্তর্ভুক্ত করুন৷

--non-ref-af

--max-non-ref-af
নির্দিষ্ট সীমার মধ্যে কেবলমাত্র নন-রেফারেন্স অ্যালিল ফ্রিকোয়েন্সি সহ সাইটগুলি অন্তর্ভুক্ত করুন।

--আভা
একটি সঠিক পরীক্ষা ব্যবহার করে হার্ডি-ওয়েনবার্গ ভারসাম্যের জন্য সাইটগুলি মূল্যায়ন করে, যেমন সংজ্ঞায়িত করা হয়েছে
Wigginton, Cutler এবং Abecasis (2005)। থ্রেশহোল্ডের নিচে একটি p-মান সহ সাইট
এই বিকল্প দ্বারা সংজ্ঞায়িত করা হয় HWE এর বাইরে, এবং তাই বাদ দেওয়া হয়।

--জেনো
অনুপস্থিত ডেটার অনুপাতের ভিত্তিতে সাইটগুলি বাদ দিন (এর মধ্যে হতে সংজ্ঞায়িত৷
0 এবং 1)।

--মিন-অ্যালিলেস

--ম্যাক্স-অ্যালিলেস
নির্দিষ্ট সীমার মধ্যে কয়েকটি অ্যালিল সহ শুধুমাত্র সাইটগুলি অন্তর্ভুক্ত করুন৷ জন্য
উদাহরণস্বরূপ, শুধুমাত্র দ্বি-অ্যালিলিক সাইটগুলি অন্তর্ভুক্ত করতে, কেউ ব্যবহার করতে পারে:

vcftools --vcf file1.vcf --min-alleles 2 --max-alleles 2

-- মুখোশ

--উল্টানো মুখোশ

--মাস্ক-মিন
একটি FASTA-এর মতো ফাইলের ভিত্তিতে সাইটগুলি অন্তর্ভুক্ত করুন৷ প্রদত্ত ফাইলটিতে রয়েছে a
একটি ক্রোমোজোমের প্রতিটি অবস্থানের জন্য পূর্ণসংখ্যার সংখ্যার ক্রম (0 এবং 9 এর মধ্যে)
সেই অবস্থানে একটি সাইট ফিল্টার করা উচিত কিনা তা নির্দিষ্ট করুন। একটি উদাহরণ মাস্ক ফাইল
দেখতে হবে:

>1
0000011111222 ...

এই উদাহরণে, ভিসিএফ ফাইলের সাইটগুলি প্রথম 5টি বেসের মধ্যে অবস্থিত
ক্রোমোজোমের সূচনা 1 রাখা হবে, যেখানে স্থান 6 এর পরের অবস্থানে থাকবে
পরিস্রুত. থ্রেশহোল্ড পূর্ণসংখ্যা যা নির্ধারণ করে যে সাইটগুলি ফিল্টার করা হয়েছে কি না
--mask-min বিকল্প ব্যবহার করে সেট করুন, যা ডিফল্ট 0-এ থাকে।
মাস্ক ফাইলটি VCF ফাইলের মতো একই ক্রমে সাজাতে হবে। --মাস্ক বিকল্প
ব্যবহৃত মাস্ক ফাইলটি নির্দিষ্ট করতে ব্যবহৃত হয়, যেখানে --invert-mask বিকল্পটি ব্যবহার করতে পারে
একটি মাস্ক ফাইল নির্দিষ্ট করতে ব্যবহার করা হবে যা প্রয়োগ করার আগে উল্টানো হবে।

স্বতন্ত্র ফিল্টার
--indv
বিশ্লেষণে রাখা হবে এমন একজন ব্যক্তিকে নির্দিষ্ট করুন। এই বিকল্পটি একাধিক ব্যবহার করা যেতে পারে
একাধিক ব্যক্তি নির্দিষ্ট করার সময়।

-- রাখা
পরবর্তী একটি বিশ্লেষণে অন্তর্ভুক্ত করার জন্য ব্যক্তিদের একটি তালিকা ধারণকারী একটি ফাইল প্রদান করুন।
প্রতিটি স্বতন্ত্র আইডি (VCF হেডারলাইনে সংজ্ঞায়িত করা হয়েছে) একটিতে অন্তর্ভুক্ত করা উচিত
পৃথক লাইন।

--remove-indv
বিশ্লেষণ থেকে সরানো হবে একজন ব্যক্তি নির্দিষ্ট করুন. এই বিকল্পটি ব্যবহার করা যেতে পারে
একাধিক ব্যক্তি নির্দিষ্ট করতে একাধিকবার। যদি --indv বিকল্পটিও হয়
নির্দিষ্ট করা হলে, --indv বিকল্পটি --remove-indv বিকল্পের আগে কার্যকর করা হয়।

--অপসারণ
পরবর্তী বিশ্লেষণে বাদ দেওয়ার জন্য ব্যক্তিদের একটি তালিকা সহ একটি ফাইল প্রদান করুন।
প্রতিটি স্বতন্ত্র আইডি (VCF হেডারলাইনে সংজ্ঞায়িত করা হয়েছে) একটিতে অন্তর্ভুক্ত করা উচিত
পৃথক লাইন। যদি --keep এবং --remove উভয় অপশন ব্যবহার করা হয়, তাহলে
--remove অপশনের আগে --keep অপশনটি কার্যকর করা হয়।

--mon-indv-meanDP

--max-indv-meanDP
প্রতি-ব্যক্তি ভিত্তিতে গড় কভারেজ গণনা করুন। সঙ্গে শুধুমাত্র ব্যক্তি
এই বিকল্পগুলি দ্বারা নির্দিষ্ট সীমার মধ্যে কভারেজ পরবর্তীতে অন্তর্ভুক্ত করা হয়েছে
বিশ্লেষণ।

--মন
প্রতিটি ব্যক্তির জন্য ন্যূনতম কল রেট থ্রেশহোল্ড নির্দিষ্ট করুন।

--পর্যায়ক্রমে
প্রথমে সমস্ত জিনোটাইপ অবিকৃত থাকা সমস্ত ব্যক্তিকে বাদ দেয় এবং পরবর্তীতে
অনফেজড জিনোটাইপ সহ সমস্ত সাইট বাদ দেয়। অবশিষ্ট তথ্য তাই গঠিত
শুধুমাত্র পর্যায়ক্রমে ডেটা।

জেনোটাইপ ফিল্টার
--রিমুভ-ফিল্টার করা-জিনো-সমস্ত

--রিমুভ-ফিল্টারড-জিনো
প্রথম বিকল্পটি একটি ফিল্টার পতাকা সহ সমস্ত জিনোটাইপ সরিয়ে দেয়। দ্বিতীয় বিকল্প হতে পারে
একটি নির্দিষ্ট ফিল্টার পতাকা সহ জিনোটাইপগুলি বাদ দিতে ব্যবহৃত হয়।

--মিনজিকিউ
এই বিকল্প দ্বারা নির্দিষ্ট থ্রেশহোল্ডের নীচে একটি গুণমান সহ সমস্ত জিনোটাইপ বাদ দিন
(জিকিউ)।

--minDP
এই বিকল্প দ্বারা নির্দিষ্ট করা নীচে একটি অনুক্রম গভীরতা সহ সমস্ত জিনোটাইপ বাদ দিন
(ডিপি)

আউটপুট পরিসংখ্যান
--ফ্রিকেস

--গণনা

--freq2

--গণনা ২
আউটপুট প্রতি সাইট ফ্রিকোয়েন্সি তথ্য. --freq অ্যালিল ফ্রিকোয়েন্সি আউটপুট করে
'.frq' প্রত্যয় সহ ফাইল। --counts বিকল্পটি এর সাথে একটি অনুরূপ ফাইল আউটপুট করে
'.frq.count' প্রত্যয়, যেটিতে প্রতিটি সাইটে কাঁচা অ্যালিল গণনা রয়েছে। --freq2
এবং --count2 বিকল্পগুলি আউটপুট ফাইলে অ্যালিল তথ্য দমন করতে ব্যবহৃত হয়। ভিতরে
এই ক্ষেত্রে, ফ্রিকোয়েন্সি/কাউন্টের ক্রম নির্ভর করে ভিসিএফ ফাইলের সংখ্যার উপর।

--গভীরতা
ব্যক্তি প্রতি গড় গভীরতা ধারণকারী একটি ফাইল তৈরি করে। এই ফাইল প্রত্যয় আছে
'.idepth'।

--সাইট-গভীরতা

--সাইট-মিন-গভীরতা
সাইট প্রতি গভীরতা ধারণকারী একটি ফাইল তৈরি করে। --site-depth বিকল্পটি আউটপুট করে
প্রতিটি সাইটের জন্য গভীরতা ব্যক্তি জুড়ে সমষ্টি. এই ফাইলটিতে '.ldepth' প্রত্যয় রয়েছে।
একইভাবে, --site-mean-depth প্রতিটি সাইটের গড় গভীরতা বের করে, এবং
আউটপুট ফাইলে '.ldepth.mean' প্রত্যয় রয়েছে।

--জিনো-গভীরতা
প্রতিটি জিনোটাইপের জন্য গভীরতা ধারণকারী একটি (সম্ভবত খুব বড়) ফাইল তৈরি করে
ভিসিএফ ফাইল। অনুপস্থিত এন্ট্রি মান -1 দেওয়া হয়. ফাইল প্রত্যয় আছে
'.gdepth'।

--সাইট-গুণমান
QUAL কলামে পাওয়া প্রতি-সাইট SNP গুণমান ধারণকারী একটি ফাইল তৈরি করে
ভিসিএফ ফাইলের। এই ফাইলটিতে '.lqual' প্রত্যয় রয়েছে।

--হেট প্রতি-ব্যক্তি ভিত্তিতে হেটেরোজাইগোসিটির একটি পরিমাপ গণনা করে। বিশেষ করে, দ
ইনব্রিডিং সহগ, F, একটি পদ্ধতি ব্যবহার করে প্রতিটি ব্যক্তির জন্য অনুমান করা হয়
মুহূর্ত ফলস্বরূপ ফাইলটিতে '.het' প্রত্যয় রয়েছে।

--হার্ডি
হার্ডি-ওয়েনবার্গ ইকুইলিব্রিয়াম পরীক্ষা থেকে প্রতিটি সাইটের জন্য একটি পি-মান রিপোর্ট করে (সংজ্ঞায়িত হিসাবে
Wigginton, Cutler এবং Abecasis (2005) দ্বারা। ফলস্বরূপ ফাইল ('.hwe' প্রত্যয় সহ)
এছাড়াও হোমোজাইগোট এবং হেটেরোজাইগোট এবং এর পর্যবেক্ষিত সংখ্যা রয়েছে
HWE এর অধীনে সংশ্লিষ্ট প্রত্যাশিত সংখ্যা।

-- অনুপস্থিত
প্রতি-ব্যক্তি এবং প্রতি-সাইটে অনুপস্থিত হওয়ার রিপোর্ট করে দুটি ফাইল তৈরি করে
ভিত্তি দুটি ফাইলে যথাক্রমে '.imiss' এবং '.lmiss' প্রত্যয় রয়েছে।

--hap-r2

--জেনো-আর২

--ld-জানালা

--ld-উইন্ডো-বিপি

--মিন-আর২
এই বিকল্পগুলি লিঙ্কেজ ডিসক্যুইলিব্রিয়াম (LD) পরিসংখ্যান হিসাবে রিপোর্ট করতে ব্যবহৃত হয়
r2 পরিসংখ্যান দ্বারা সংক্ষিপ্ত. --hap-r2 বিকল্পটি vcftools-কে a আউটপুট করতে জানায়
পর্যায়ক্রমে হ্যাপ্লোটাইপ ব্যবহার করে r2 পরিসংখ্যান প্রতিবেদন করা ফাইল। এটাই সনাতন
LD এর পরিমাপ প্রায়ই জনসংখ্যার জেনেটিক্স সাহিত্যে রিপোর্ট করা হয়। যদি পর্যায়ক্রমে
হ্যাপ্লোটাইপগুলি অনুপলব্ধ হলে --geno-r2 বিকল্পটি ব্যবহার করা যেতে পারে, যা গণনা করে
0, 1 এবং 2 হিসাবে এনকোড করা জিনোটাইপের মধ্যে বর্গক্ষেত্র পারস্পরিক সম্পর্ক সহগ
প্রতিটি ব্যক্তির মধ্যে নন-রেফারেন্স অ্যালিলের সংখ্যা উপস্থাপন করে। একই ধরনের
PLINK দ্বারা রিপোর্ট করা LD পরিমাপ হিসাবে। হ্যাপ্লোটাইপ সংস্করণ এর সাথে একটি ফাইল আউটপুট করে
প্রত্যয় '.hap.ld', যেখানে জিনোটাইপ সংস্করণ প্রত্যয় সহ একটি ফাইল আউটপুট করে
'.geno.ld'। হ্যাপ্লোটাইপ সংস্করণটি --phased বিকল্পটি বোঝায়।

--ld-উইন্ডো বিকল্পটি গণনার জন্য সর্বাধিক SNP পৃথকীকরণ নির্ধারণ করে
এলডি। একইভাবে, --ld-window-bp বিকল্পটি সর্বাধিক শারীরিক সংজ্ঞায়িত করতে ব্যবহার করা যেতে পারে
LD গণনার অন্তর্ভুক্ত SNPs এর বিচ্ছেদ। অবশেষে, --min-r2 সেট a
r2-এর ন্যূনতম মান যার নীচে LD পরিসংখ্যান রিপোর্ট করা হয়নি৷

--এসএনপিডিএনসিটি
এই বিকল্প দ্বারা সংজ্ঞায়িত আকারের বিনগুলিতে SNP-এর সংখ্যা এবং ঘনত্ব গণনা করে৷
ফলস্বরূপ আউটপুট ফাইলে '.snpden' প্রত্যয় রয়েছে।

--টিএসটিভি
এটি দ্বারা সংজ্ঞায়িত আকারের বিনগুলিতে ট্রানজিশন / ট্রান্সভার্সন অনুপাত গণনা করে৷
বিকল্প ফলস্বরূপ আউটপুট ফাইলে '.TsTv' প্রত্যয় রয়েছে। একটি সারসংক্ষেপ এছাড়াও
'.TsTv.summary' প্রত্যয় সহ একটি ফাইলে সরবরাহ করা হয়েছে।

--ফিল্টার-সারাংশ
প্রতিটি ফিল্টার বিভাগের জন্য SNP এবং Ts/Tv অনুপাতের সংখ্যার একটি সারাংশ তৈরি করে।
আউটপুট ফাইলে '.FILTER.summary' প্রত্যয় রয়েছে।

--ফিল্টার করা সাইট
ফিল্টার করার পরে রাখা বা সরানো হয়েছে এমন দুটি ফাইল তালিকাভুক্ত সাইট তৈরি করে। দ্য
প্রথম ফাইল, '.kept.sites' প্রত্যয় সহ, ফিল্টারের পরে vcftools দ্বারা রাখা সাইটগুলির তালিকা করে
প্রয়োগ করা হয়েছে। দ্বিতীয় ফাইল, '.removed.sites' প্রত্যয় সহ, তালিকা সাইট
প্রয়োগকৃত ফিল্টার দ্বারা সরানো হয়।

--সিঙ্গলটন
এই বিকল্পটি সিঙ্গেলটনের অবস্থানের বিবরণ দিয়ে একটি ফাইল তৈরি করবে, এবং
ব্যক্তিগতভাবে তারা ঘটে। ফাইলটি সত্য সিঙ্গলটন এবং ব্যক্তিগত উভয়ই রিপোর্ট করে
ডাবলটন (অর্থাৎ এসএনপি যেখানে মাইনর অ্যালিল শুধুমাত্র একজন ব্যক্তির মধ্যে ঘটে এবং
যে ব্যক্তি সেই অ্যালিলের জন্য হোমোজাইগোটিক)। আউটপুট ফাইলের প্রত্যয় আছে
'.singletons'।

--সাইট-পাই

--উইন্ডো-পাই
এই বিকল্পগুলি নিউক্লিওটাইড বৈচিত্র্যের মাত্রা অনুমান করতে ব্যবহৃত হয়। প্রথম বিকল্প
এটি প্রতি-সাইট ভিত্তিতে করে এবং আউটপুট ফাইলে '.sites.pi' প্রত্যয় রয়েছে। দ্য
দ্বিতীয় বিকল্পটি উইন্ডোতে নিউক্লিওটাইড বৈচিত্র্য গণনা করে, জানালার আকার সহ
বিকল্প যুক্তিতে সংজ্ঞায়িত করা হয়েছে। এই বিকল্পের জন্য আউটপুট প্রত্যয় আছে
'.windowed.pi'। উইন্ডোযুক্ত সংস্করণের জন্য পর্যায়ক্রমে ডেটা প্রয়োজন, এবং তাই এটির ব্যবহার
বিকল্পটি --phased বিকল্পকে বোঝায়।

আউটপুট in অন্যান্য বিন্যাস
--O12 এই বিকল্পটি একটি বড় ম্যাট্রিক্স হিসাবে জিনোটাইপগুলিকে আউটপুট করে। তিনটি ফাইল উত্পাদিত হয়. দ্য
প্রথমে, '.012' প্রত্যয় সহ, প্রতিটি ব্যক্তির আলাদা আলাদা জিনোটাইপ ধারণ করে
লাইন জিনোটাইপগুলিকে 0, 1 এবং 2 হিসাবে উপস্থাপন করা হয়, যেখানে সংখ্যাটি এটিকে উপস্থাপন করে
নন-রেফারেন্স অ্যালিলের সংখ্যা। অনুপস্থিত জিনোটাইপগুলি -1 দ্বারা প্রতিনিধিত্ব করা হয়। দ্য
দ্বিতীয় ফাইল, '.012.indv' প্রত্যয় সহ মূলে অন্তর্ভুক্ত ব্যক্তিদের বিবরণ
ফাইল তৃতীয় ফাইল, '.012.pos' প্রত্যয় সহ সাইটের অবস্থানের বিবরণ অন্তর্ভুক্ত
প্রধান ফাইল।

-- IMPUTE
এই বিকল্পটি IMPUTE রেফারেন্স-প্যানেল বিন্যাসে পর্যায়ক্রমে হ্যাপ্লোটাইপগুলিকে আউটপুট করে। IMPUTE হিসাবে
পর্যায়ক্রমে ডেটা প্রয়োজন, এই বিকল্পটি ব্যবহার করে --phasedও বোঝায়। অবিকৃত
ব্যক্তি এবং জিনোটাইপ তাই বাদ দেওয়া হয়. শুধুমাত্র দ্বি-অ্যালিলিক সাইটগুলি
আউটপুটে অন্তর্ভুক্ত। এই বিকল্পটি ব্যবহার করে তিনটি ফাইল তৈরি হয়। IMPUTE
haplotype ফাইলে '.impute.hap' প্রত্যয় আছে এবং IMPUTE লিজেন্ড ফাইলে আছে
প্রত্যয় '.impute.hap.legend'। তৃতীয় ফাইল, '.impute.hap.indv' প্রত্যয় সহ,
হ্যাপ্লোটাইপ ফাইলে অন্তর্ভুক্ত ব্যক্তিদের বিশদ বিবরণ, যদিও এই ফাইলটি নয়
IMPUTE দ্বারা প্রয়োজন।

--ldhat

--ldhat-geno
এই বিকল্পগুলি LDhat ফর্ম্যাটে ডেটা আউটপুট করে। এই বিকল্পগুলির ব্যবহারও প্রয়োজন
--chr অপশন ব্যবহার করে। --ldhat বিকল্প শুধুমাত্র পর্যায়ক্রমে ডেটা আউটপুট করে, এবং তাই
এছাড়াও --ফেজড বোঝায়, যার ফলে ব্যক্তি এবং জিনোটাইপগুলি অ-ফেজ করা হয়
ছাঁটা. বিকল্পভাবে, --ldhat-geno বিকল্পটি সমস্ত ডেটাকে হিসাবে বিবেচনা করে
আনফেজড, এবং তাই LDhat ফাইলগুলিকে জিনোটাইপ/আনফেজড বিন্যাসে আউটপুট করে। দুটোর যে কোনটিতে
ক্ষেত্রে, দুটি ফাইল '.ldhat.sites' এবং '.ldhat.locs' প্রত্যয় দিয়ে তৈরি করা হয়,
যা যথাক্রমে LDhat 'সাইট' এবং 'locs' ইনপুট ফাইলের সাথে মিলে যায়।

--বিগল-জিএল
এই বিকল্পটি BEAGLE-তে ইনপুট করার জন্য জিনোটাইপ সম্ভাবনার তথ্য আউটপুট করে
কার্যক্রম. এই বিকল্পটিতে FORMAT GL ট্যাগ থাকা VCF ফাইলের প্রয়োজন, যা হতে পারে
সাধারণত SNP কলার যেমন GATK দ্বারা আউটপুট হয়। এই বিকল্পটি ব্যবহার করা প্রয়োজন a
ক্রোমোজোম --chr বিকল্পের মাধ্যমে নির্দিষ্ট করা হবে। ফলে আউটপুট ফাইল (সহ
প্রত্যয় '.BEAGLE.GL') বাইলেলিক সাইটগুলির জন্য জিনোটাইপ সম্ভাবনা ধারণ করে, এবং
'like=' আর্গুমেন্টের মাধ্যমে BEAGLE-এ ইনপুট করার জন্য উপযুক্ত।

--plink
এই বিকল্পটি PLINK PED ফর্ম্যাটে জিনোটাইপ ডেটা আউটপুট করে। দুটি ফাইল তৈরি হয়,
'.ped' এবং '.map' প্রত্যয় সহ। মনে রাখবেন যে শুধুমাত্র দ্বি-অ্যালিলিক লোকি আউটপুট হবে।
এই ফাইলগুলির আরও বিশদ বিবরণ PLINK ডকুমেন্টেশনে পাওয়া যাবে।

দ্রষ্টব্য: এই বিকল্পটি বড় ডেটাসেটে খুব ধীর হতে পারে। --chr অপশন ব্যবহার করে
ডেটাসেটটি ভাগ করার পরামর্শ দেওয়া হয়।

--plink-tped
উপরের --plink বিকল্পটি বড় ডেটাসেটের ক্ষেত্রে অত্যন্ত ধীর হতে পারে। একটি বিকল্প
PLINK ট্রান্সপোজড ফরম্যাটে আউটপুট করা যথেষ্ট দ্রুত হতে পারে।
এটি --plink-tped বিকল্পটি ব্যবহার করে অর্জন করা যেতে পারে, যা দুটি ফাইল তৈরি করে
'.tped' এবং '.tfam' প্রত্যয়।

--রিকোড
--recode বিকল্পটি ইনপুট VCF ফাইল থেকে একটি VCF ফাইল তৈরি করতে ব্যবহৃত হয়
ব্যবহারকারী দ্বারা নির্দিষ্ট বিকল্প প্রয়োগ করা হয়েছে. আউটপুট ফাইলের প্রত্যয় আছে
'.recode.vcf'।

ডিফল্টরূপে, INFO ক্ষেত্রগুলি INFO মান হিসাবে আউটপুট ফাইল থেকে সরানো হয়
পুনঃকোডিং দ্বারা অবৈধ হতে পারে (যেমন মোট গভীরতা হতে পারে
ব্যক্তিদের সরানো হলে পুনরায় গণনা করা হয়)। এই ডিফল্ট কার্যকারিতা হতে পারে
--keep-INFO ব্যবহার করে ওভাররাইড করা হয়েছে বিকল্প, কোথায় সংজ্ঞায়িত করে
আউটপুট ফাইলে রাখার জন্য INFO কী। --keep-INFO পতাকা একাধিক ব্যবহার করা যেতে পারে
বার বিকল্পভাবে, --keep-INFO-all বিকল্পটি সমস্ত তথ্য ধরে রাখতে ব্যবহার করা যেতে পারে
ক্ষেত্র।

বিবিধ
--extract-FORMAT-তথ্য
একটি নির্দিষ্ট সম্পর্কিত VCF ফাইলের জিনোটাইপ ক্ষেত্রগুলি থেকে তথ্য বের করুন
ফরম্যাট শনাক্তকারী। উদাহরণস্বরূপ, '--extract-FORMAT-info GT' বিকল্পটি ব্যবহার করা হবে
সমস্ত জিটি (অর্থাৎ জিনোটাইপ) এন্ট্রি বের করুন। ফলে আউটপুট ফাইল আছে
প্রত্যয় ' .FORMAT'।

--তথ্য পেতে
এই বিকল্পটি VCF ফাইলের INFO ক্ষেত্র থেকে তথ্য বের করতে ব্যবহৃত হয়। দ্য
যুক্তি নিষ্কাশন করা INFO ট্যাগ নির্দিষ্ট করে, এবং বিকল্প হতে পারে
একাধিক INFO এন্ট্রি বের করার জন্য একাধিকবার ব্যবহার করা হয়েছে। ফলস্বরূপ ফাইল,
'.INFO' প্রত্যয় সহ, একটি ট্যাবে আলাদা করা প্রয়োজনীয় INFO তথ্য রয়েছে
টেবিল উদাহরণস্বরূপ, NS এবং DB পতাকাগুলি বের করতে, একজন কমান্ডটি ব্যবহার করবে:

vcftools --vcf file1.vcf --get-INFO NS --get-INFO DB

Vcf ফাইল তুলনা অপশন সমূহ
ফাইল তুলনা বিকল্পগুলি বর্তমানে প্রবাহিত অবস্থায় রয়েছে এবং সম্ভবত বগি। আপনি যদি
একটি বাগ খুঁজে, এটি রিপোর্ট করুন. মনে রাখবেন যে জিনোটাইপ-স্তরের ফিল্টারগুলি এতে সমর্থিত নয়
অপশন।

-- পার্থক্য

--gzdiff
--vcf বিকল্প দ্বারা নির্দিষ্ট ফাইলের সাথে তুলনা করার জন্য একটি VCF ফাইল নির্বাচন করুন।
আউটপুট দুটি ফাইল সাইট এবং ব্যক্তিদের প্রত্যেকের জন্য সাধারণ/অনন্য বর্ণনা করে
ফাইল এই ফাইলগুলিতে '.diff.sites_in_files' এবং প্রত্যয় রয়েছে
'.diff.indv_in_files' যথাক্রমে। --gzdiff সংস্করণটি পড়তে ব্যবহার করা যেতে পারে
সংকুচিত ভিসিএফ ফাইল।

-- পার্থক্য-সাইট-অসংগতি
দ্বারা একটি সাইটে বিরোধ গণনা করতে --diff বিকল্পের সাথে একত্রে ব্যবহৃত হয়
সাইটের ভিত্তিতে। ফলস্বরূপ আউটপুট ফাইলে '.diff.sites' প্রত্যয় রয়েছে।

--diff-indv-discordance
প্রতি-তে মতবিরোধ গণনা করতে --diff বিকল্পের সাথে একত্রে ব্যবহৃত হয়
স্বতন্ত্র ভিত্তি। ফলস্বরূপ আউটপুট ফাইলে '.diff.indv' প্রত্যয় রয়েছে।

--ডিফ-ডিসকর্ডেন্স-ম্যাট্রিক্স
ডিসকর্ডেন্স ম্যাট্রিক্স গণনা করতে --diff বিকল্পের সাথে একত্রে ব্যবহৃত হয়। এই
বিকল্পটি শুধুমাত্র বাই-অ্যালিলিক লোকির সাথে কাজ করে যার মধ্যে উপস্থিত অ্যালিলের সাথে মিল রয়েছে
উভয় ফাইল। ফলস্বরূপ আউটপুট ফাইলে '.diff.discordance.matrix' প্রত্যয় রয়েছে।

--ডিফ-সুইচ-ত্রুটি
পর্যায়ক্রমিক ত্রুটিগুলি গণনা করতে --diff বিকল্পের সাথে একত্রে ব্যবহৃত হয়
(বিশেষভাবে 'স্যুইচ ত্রুটি')। এই বিকল্পটি বর্ণনা করে দুটি আউটপুট ফাইল তৈরি করে
সাইটের মধ্যে সুইচ ত্রুটি পাওয়া যায়, এবং প্রতি ব্যক্তির গড় সুইচ ত্রুটি।
এই দুটি ফাইলে '.diff.switch' এবং '.diff.indv.switch' প্রত্যয় রয়েছে
যথাক্রমে.

অপশন সমূহ এখনো in উন্নয়ন
নিম্নলিখিত বিকল্পগুলি এখনও চূড়ান্ত করা হয়নি, এতে বাগ থাকতে পারে এবং সম্ভাবনা রয়েছে
ভবিষ্যতে পরিবর্তন করতে।

--fst

--gzfst
একজোড়া VCF ফাইলের জন্য FST গণনা করুন, দ্বিতীয় ফাইলটি এটি দ্বারা নির্দিষ্ট করা হয়েছে
বিকল্প FST বর্তমানে বর্ণিত সূত্র ব্যবহার করে গণনা করা হয়
পর্যায় I HapMap কাগজের সম্পূরক উপাদান। বর্তমানে, শুধুমাত্র পেয়ারওয়াইজ FST
গণনা সমর্থিত, যদিও এটি সম্ভবত ভবিষ্যতে পরিবর্তিত হবে। দ্য
--gzfst বিকল্পটি সংকুচিত VCF ফাইলগুলি পড়তে ব্যবহার করা যেতে পারে।

--এলআরওএইচ হোমোজাইগোসিটির দীর্ঘ দৌড় সনাক্ত করুন।

--সম্পর্কিততা
আউটপুট পৃথক সম্পর্কিত পরিসংখ্যান.

onworks.net পরিষেবা ব্যবহার করে অনলাইনে vcftools ব্যবহার করুন


বিনামূল্যে সার্ভার এবং ওয়ার্কস্টেশন

উইন্ডোজ এবং লিনাক্স অ্যাপ ডাউনলোড করুন

লিনাক্স কমান্ডগুলি

Ad