Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാവുന്ന bcftools എന്ന കമാൻഡാണിത്.
പട്ടിക:
NAME
samtools - സീക്വൻസ് അലൈൻമെന്റ്/മാപ്പ് (SAM) ഫോർമാറ്റിനുള്ള യൂട്ടിലിറ്റികൾ
bcftools - ബൈനറി കോൾ ഫോർമാറ്റ് (BCF), VCF എന്നിവയ്ക്കുള്ള യൂട്ടിലിറ്റികൾ
സിനോപ്സിസ്
samtools വ്യൂ -bt ref_list.txt -o aln.bam aln.sam.gz
samtools aln.bam aln.sorted
samtools സൂചിക aln.sorted.bam
samtools idxstats aln.sorted.bam
samtools കാണുക aln.sorted.bam chr2:20,100,000-20,200,000
samtools ലയിക്കുന്നു.ബാം ഇൻ1.ബാം ഇൻ2.ബാം ഇൻ3.ബാം
samtools faidx ref.fasta
samtools pileup -vcf ref.fasta aln.sorted.bam
samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam
samtools tview aln.sorted.bam ref.fasta
bcftools സൂചിക in.bcf
bcftools വ്യൂ in.bcf chr2:100-200 > out.vcf
bcftools വ്യൂ -Nvm0.99 in.bcf > out.vcf 2> out.afs
വിവരണം
BAM ഫോർമാറ്റിൽ അലൈൻമെന്റുകൾ കൈകാര്യം ചെയ്യുന്ന ഒരു കൂട്ടം യൂട്ടിലിറ്റിയാണ് Samtools. അത് ഇറക്കുമതി ചെയ്യുന്നു
SAM (സീക്വൻസ് അലൈൻമെന്റ്/മാപ്പ്) ഫോർമാറ്റിൽ നിന്നും കയറ്റുമതി ചെയ്യുന്നു, അടുക്കുകയും ലയിപ്പിക്കുകയും ചെയ്യുന്നു
സൂചികയിലാക്കുന്നു, കൂടാതെ ഏത് പ്രദേശങ്ങളിലുമുള്ള വായനകൾ വേഗത്തിൽ വീണ്ടെടുക്കാൻ അനുവദിക്കുന്നു.
Samtools ഒരു സ്ട്രീമിൽ പ്രവർത്തിക്കാൻ രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതാണ്. ഇത് ഒരു ഇൻപുട്ട് ഫയൽ `-' സ്റ്റാൻഡേർഡായി കണക്കാക്കുന്നു
ഇൻപുട്ട് (stdin) കൂടാതെ ഒരു ഔട്ട്പുട്ട് ഫയലായ `-' സ്റ്റാൻഡേർഡ് ഔട്ട്പുട്ടായി (stdout). നിരവധി കമാൻഡുകൾക്ക് കഴിയും
അങ്ങനെ യുണിക്സ് പൈപ്പുകളുമായി സംയോജിപ്പിക്കുക. സാംടൂൾസ് എല്ലായ്പ്പോഴും മുന്നറിയിപ്പും പിശക് സന്ദേശങ്ങളും നൽകുന്നു
സാധാരണ പിശക് ഔട്ട്പുട്ട് (stderr).
ഒരു റിമോട്ട് FTP അല്ലെങ്കിൽ HTTP സെർവറിൽ ഒരു BAM (SAM അല്ല) ഫയൽ തുറക്കാനും Samtools-ന് കഴിയും
BAM ഫയലിന്റെ പേര് `ftp://' അല്ലെങ്കിൽ `http://' എന്നതിൽ ആരംഭിക്കുന്നു. Samtools നിലവിലെ പ്രവർത്തനം പരിശോധിക്കുന്നു
ഇൻഡെക്സ് ഫയലിനുള്ള ഡയറക്ടറി, അഭാവത്തിൽ സൂചിക ഡൗൺലോഡ് ചെയ്യും. Samtools ഇല്ല
അലൈൻമെന്റ് ഫയൽ മുഴുവനായും വീണ്ടെടുക്കാൻ ആവശ്യപ്പെടുന്നില്ലെങ്കിൽ.
സാംടൂൾസ് കമാൻഡുകൾ ഒപ്പം ഓപ്ഷനുകൾ
കാഴ്ച samtools കാഴ്ച [-bchuHS] [-t in.refList] [-o ഔട്ട്പുട്ട്] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l ലൈബ്രറി] [-r readGroup] [-R rgFile] | [മേഖല1
[...]]
SAM അല്ലെങ്കിൽ BAM ഫോർമാറ്റിൽ എല്ലാം എക്സ്ട്രാക്റ്റ് ചെയ്യുക/പ്രിന്റ് ചെയ്യുക അല്ലെങ്കിൽ സബ് അലൈൻമെന്റുകൾ. ഒരു പ്രദേശവും ഇല്ലെങ്കിൽ
വ്യക്തമാക്കിയിരിക്കുന്നു, എല്ലാ വിന്യാസങ്ങളും അച്ചടിക്കും; അല്ലാത്തപക്ഷം വിന്യാസങ്ങൾ മാത്രം
നിർദ്ദിഷ്ട പ്രദേശങ്ങൾ ഓവർലാപ്പ് ചെയ്യുന്നത് ഔട്ട്പുട്ട് ആയിരിക്കും. ഒരു അലൈൻമെന്റ് നൽകാം
ഇത് പല പ്രദേശങ്ങളെ ഓവർലാപ്പ് ചെയ്യുന്നുണ്ടെങ്കിൽ ഒന്നിലധികം തവണ. ഒരു പ്രദേശം അവതരിപ്പിക്കാം,
ഉദാഹരണത്തിന്, ഇനിപ്പറയുന്ന ഫോർമാറ്റിൽ: `chr2' (മുഴുവൻ chr2), `chr2:1000000'
(1,000,000bp മുതൽ ആരംഭിക്കുന്ന പ്രദേശം) അല്ലെങ്കിൽ `chr2:1,000,000-2,000,000' (ഇതിനിടയിലുള്ള പ്രദേശം
അവസാന പോയിന്റുകൾ ഉൾപ്പെടെ 1,000,000, 2,000,000 ബിപി). കോർഡിനേറ്റ് 1 അടിസ്ഥാനമാക്കിയുള്ളതാണ്.
ഓപ്ഷനുകൾ:
-b BAM ഫോർമാറ്റിൽ ഔട്ട്പുട്ട്.
-f INT FLAG ഫീൽഡിൽ നിലവിലുള്ള INT-യിലെ എല്ലാ ബിറ്റുകളുമായും ഔട്ട്പുട്ട് അലൈൻമെന്റുകൾ മാത്രം.
INT /^0x[0-9A-F]+/ [0] എന്ന ഫോർമാറ്റിൽ ഹെക്സിൽ ആകാം
-F INT INT [0]-ൽ നിലവിലുള്ള ബിറ്റുകൾ ഉപയോഗിച്ച് വിന്യാസം ഒഴിവാക്കുക
-h ഔട്ട്പുട്ടിൽ തലക്കെട്ട് ഉൾപ്പെടുത്തുക.
-H തലക്കെട്ട് മാത്രം ഔട്ട്പുട്ട് ചെയ്യുക.
-l STR ലൈബ്രറി STR [null]-ൽ മാത്രം ഔട്ട്പുട്ട് വായിക്കുന്നു
-o FILE ഔട്ട്പുട്ട് ഫയൽ [stdout]
-q INT INT [0] നേക്കാൾ ചെറിയ MAPQ ഉപയോഗിച്ച് വിന്യാസം ഒഴിവാക്കുക
-r STR റീഡ് ഗ്രൂപ്പായ STR [null]-ൽ മാത്രം ഔട്ട്പുട്ട് വായിക്കുന്നു
-R FILE ലിസ്റ്റുചെയ്തിരിക്കുന്ന റീഡ് ഗ്രൂപ്പുകളിൽ ഔട്ട്പുട്ട് റീഡ് ചെയ്യുന്നു FILE [ശൂന്യം]
-s ഫ്ലോട്ട് ഉപസാമ്പിളിലേക്കുള്ള ടെംപ്ലേറ്റുകളുടെ/ജോഡികളുടെ അംശം; പൂർണ്ണസംഖ്യ ഭാഗം ചികിത്സിക്കുന്നു
റാൻഡം നമ്പർ ജനറേറ്ററിന്റെ വിത്തായി [-1]
-S ഇൻപുട്ട് SAM-ലാണ്. @SQ ഹെഡർ ലൈനുകൾ ഇല്ലെങ്കിൽ, the `-ടി' ഓപ്ഷൻ ആണ്
ആവശ്യമാണ്.
-c വിന്യാസങ്ങൾ അച്ചടിക്കുന്നതിനുപകരം, അവ എണ്ണി പ്രിന്റ് ചെയ്യുക
മൊത്തം എണ്ണം. പോലുള്ള എല്ലാ ഫിൽട്ടർ ഓപ്ഷനുകളും `-f', `-എഫ്' ഒപ്പം `-q' , ആകുന്നു
കണക്കിലെടുക്കുക.
-t FILE ഈ ഫയൽ TAB-ഡിലിമിറ്റഡ് ആണ്. ഓരോ വരിയിലും റഫറൻസ് നാമം ഉണ്ടായിരിക്കണം
കൂടാതെ റഫറൻസിന്റെ ദൈർഘ്യം, ഓരോ പ്രത്യേക റഫറൻസിനും ഒരു വരി;
അധിക ഫീൽഡുകൾ അവഗണിക്കപ്പെടുന്നു. എന്ന ക്രമവും ഈ ഫയൽ നിർവ്വചിക്കുന്നു
സോർട്ടിംഗിലെ റഫറൻസ് സീക്വൻസുകൾ. നിങ്ങൾ `samtools faidx പ്രവർത്തിപ്പിക്കുകയാണെങ്കിൽ ',
ഫലമായുള്ള സൂചിക ഫയൽ .ഫൈ ഇതുപോലെ ഉപയോഗിക്കാം
ഫയൽ.
-u കംപ്രസ് ചെയ്യാത്ത BAM ഔട്ട്പുട്ട്. ഈ ഓപ്ഷൻ ചെലവഴിക്കുന്ന സമയം ലാഭിക്കുന്നു
കംപ്രഷൻ/ഡീകംപ്രഷൻ, അങ്ങനെ ഔട്ട്പുട്ട് ആയിരിക്കുമ്പോൾ മുൻഗണന നൽകുന്നു
മറ്റൊരു samtools കമാൻഡിലേക്ക് പൈപ്പ് ചെയ്തു.
ടിവ്യൂ സാംടൂൾസ് ട്വ്യൂ [-p chr:pos] [-s STR] [-d ഡിസ്പ്ലേ] [ref.fasta]
ടെക്സ്റ്റ് അലൈൻമെന്റ് വ്യൂവർ (ncurses ലൈബ്രറിയെ അടിസ്ഥാനമാക്കി). വ്യൂവറിൽ, `?' അമർത്തുക
സഹായത്തിനായി, ഫോർമാറ്റിലെ ഒരു മേഖലയിൽ നിന്ന് ആരംഭിക്കുന്ന വിന്യാസം പരിശോധിക്കാൻ `g' അമർത്തുക
സമാന റഫറൻസ് കാണുമ്പോൾ `chr10:10,000,000' അല്ലെങ്കിൽ `=10,000,000' പോലെ
ക്രമം.
ഓപ്ഷനുകൾ:
-d ഡിസ്പ്ലേ (H)tml അല്ലെങ്കിൽ (C)urses അല്ലെങ്കിൽ (T)ext ആയി ഔട്ട്പുട്ട് ചെയ്യുക
-p chr:pos ഈ സ്ഥാനത്തേക്ക് നേരിട്ട് പോകുക
-s STR ഈ സാമ്പിൾ അല്ലെങ്കിൽ റീഡ് ഗ്രൂപ്പിൽ നിന്നുള്ള വായനകൾ മാത്രം പ്രദർശിപ്പിക്കുക
mpileup samtools mpileup [-EBugp] [-C capQcoef] [-r reg] [-f in.fa] [-l പട്ടിക] [-M
capMapQ] [-Q minBaseQ] [-q minMapQ] ഇൻ.ബാം [ഇൻ2.ബാം [...]]
ഒന്നോ അതിലധികമോ BAM ഫയലുകൾക്കായി BCF അല്ലെങ്കിൽ പൈലപ്പ് സൃഷ്ടിക്കുക. വിന്യാസ രേഖകളാണ്
@RG ഹെഡർ ലൈനുകളിലെ സാമ്പിൾ ഐഡന്റിഫയറുകൾ ഉപയോഗിച്ച് ഗ്രൂപ്പുചെയ്തു. സാമ്പിൾ ഐഡന്റിഫയറുകൾ ആണെങ്കിൽ
ഇല്ലെങ്കിൽ, ഓരോ ഇൻപുട്ട് ഫയലും ഒരു സാമ്പിളായി കണക്കാക്കുന്നു.
പൈലപ്പ് ഫോർമാറ്റിൽ (ഇല്ലാതെ -uor-g), ഓരോ വരിയും ഒരു ജനിതക സ്ഥാനത്തെ പ്രതിനിധീകരിക്കുന്നു,
ക്രോമസോമിന്റെ പേര്, കോർഡിനേറ്റ്, റഫറൻസ് ബേസ്, റീഡ് ബേസുകൾ, റീഡ് എന്നിവ ഉൾക്കൊള്ളുന്നു
ഗുണങ്ങളും അലൈൻമെന്റ് മാപ്പിംഗ് ഗുണങ്ങളും. പൊരുത്തം, പൊരുത്തക്കേട് എന്നിവയെക്കുറിച്ചുള്ള വിവരങ്ങൾ,
indel, strand, മാപ്പിംഗ് നിലവാരം, ഒരു വായനയുടെ തുടക്കവും അവസാനവും എല്ലാം എൻകോഡ് ചെയ്തിരിക്കുന്നു
വായന അടിസ്ഥാന കോളം. ഈ കോളത്തിൽ, ഒരു ഡോട്ട് റഫറൻസുമായി പൊരുത്തപ്പെടുന്നതിനെ സൂചിപ്പിക്കുന്നു
ഫോർവേഡ് സ്ട്രാൻഡിന്റെ അടിസ്ഥാനം, റിവേഴ്സ് സ്ട്രാൻഡിലെ പൊരുത്തത്തിനുള്ള കോമ, ഒരു '>' അല്ലെങ്കിൽ
ഒരു റഫറൻസ് സ്കിപ്പിന് '<', ഫോർവേഡ് സ്ട്രാൻഡിലെ പൊരുത്തക്കേടിന് `ACGTN' ഒപ്പം
റിവേഴ്സ് സ്ട്രോണ്ടിലെ പൊരുത്തക്കേടിന് `acgtn'. ഒരു പാറ്റേൺ `\+[0-9]+[ACGTNacgtn]+'
ഈ റഫറൻസ് സ്ഥാനത്തിനും അടുത്തതിനും ഇടയിൽ ഒരു ഉൾപ്പെടുത്തൽ ഉണ്ടെന്ന് സൂചിപ്പിക്കുന്നു
റഫറൻസ് സ്ഥാനം. ഇൻസെർഷന്റെ ദൈർഘ്യം നൽകിയിരിക്കുന്നത് in integer ആണ്
പാറ്റേൺ, തുടർന്ന് തിരുകിയ ക്രമം. അതുപോലെ, ഒരു പാറ്റേൺ
`-[0-9]+[ACGTNacgtn]+' എന്നത് റഫറൻസിൽ നിന്നുള്ള ഒരു ഇല്ലാതാക്കലിനെ പ്രതിനിധീകരിക്കുന്നു. ഇല്ലാതാക്കിയത്
ഇനിപ്പറയുന്ന വരികളിൽ അടിസ്ഥാനങ്ങൾ `*' ആയി അവതരിപ്പിക്കും. വായനാ അടിത്തറയിലും
കോളം, ഒരു ചിഹ്നം `^' ഒരു വായനയുടെ തുടക്കം കുറിക്കുന്നു. കഥാപാത്രത്തിന്റെ ASCII
ഇനിപ്പറയുന്ന `^' മൈനസ് 33 മാപ്പിംഗ് നിലവാരം നൽകുന്നു. ഒരു ചിഹ്നം `$' അവസാനത്തെ അടയാളപ്പെടുത്തുന്നു
ഒരു വായന വിഭാഗം.
ഇൻപുട്ട് ഓപ്ഷനുകൾ:
-6 Illumina 1.3+ എൻകോഡിംഗിലാണ് ഗുണനിലവാരം എന്ന് കരുതുക. -A ഒഴിവാക്കരുത്
വേരിയന്റ് കോളിംഗിൽ അസാധാരണമായ റീഡ് ജോഡികൾ.
-B അടിത്തറയുടെ കണക്കുകൂട്ടലിനായി പ്രോബബിലിസ്റ്റിക് റീലൈൻമെന്റ് പ്രവർത്തനരഹിതമാക്കുക
വിന്യാസ നിലവാരം (BAQ). BAQ എന്നത് ഒരു വായനയുടെ Phred-സ്കെയിൽഡ് പ്രോബബിലിറ്റിയാണ്
അടിസ്ഥാനം തെറ്റായി ക്രമീകരിച്ചിരിക്കുന്നു. ഈ ഓപ്ഷൻ പ്രയോഗിക്കുന്നത് കുറയ്ക്കാൻ വളരെയധികം സഹായിക്കുന്നു
തെറ്റായ SNP-കൾ തെറ്റായ ക്രമീകരണങ്ങൾ മൂലമുണ്ടാകുന്നു.
-b FILE ഇൻപുട്ട് BAM ഫയലുകളുടെ ലിസ്റ്റ്, ഓരോ വരിയിലും ഒരു ഫയൽ [null]
-C INT അടങ്ങിയിരിക്കുന്ന വായനകൾക്കായി മാപ്പിംഗ് നിലവാരം തരംതാഴ്ത്തുന്നതിനുള്ള ഗുണകം
അമിതമായ പൊരുത്തക്കേടുകൾ. phred-സ്കെയിൽഡ് പ്രോബബിലിറ്റി q ഉള്ള ഒരു റീഡ് നൽകിയിരിക്കുന്നു
മാപ്പ് ചെയ്ത സ്ഥാനത്ത് നിന്ന് ജനറേറ്റുചെയ്യുന്നത്, പുതിയ മാപ്പിംഗ് ഗുണനിലവാരം
ഏകദേശം sqrt((INT-q)/INT)*INT ആണ്. പൂജ്യം മൂല്യം ഇത് പ്രവർത്തനരഹിതമാക്കുന്നു
പ്രവർത്തനക്ഷമത; പ്രവർത്തനക്ഷമമാക്കിയാൽ, BWA-യ്ക്ക് ശുപാർശ ചെയ്യുന്ന മൂല്യം 50 ആണ്. [0]
-d INT ഒരു സ്ഥാനത്ത്, പരമാവധി വായിക്കുക INT ഓരോ ഇൻപുട്ടിലും BAM വായിക്കുന്നു. [250]
-E വിപുലീകരിച്ച BAQ കണക്കുകൂട്ടൽ. ഈ ഓപ്ഷൻ പ്രത്യേകിച്ച് സംവേദനക്ഷമതയെ സഹായിക്കുന്നു
MNP-കൾ, എന്നാൽ പ്രത്യേകതയെ അൽപ്പം വ്രണപ്പെടുത്തിയേക്കാം.
-f FILE ദി faidx-ഫാസ്റ്റ ഫോർമാറ്റിലുള്ള സൂചികയിലുള്ള റഫറൻസ് ഫയൽ. ഫയൽ ആകാം
ഓപ്ഷണലായി കംപ്രസ് ചെയ്തു razip. [ശൂന്യം]
-l FILE പ്രദേശങ്ങളുടെയോ സൈറ്റുകളുടെയോ ലിസ്റ്റ് അടങ്ങുന്ന BED അല്ലെങ്കിൽ പൊസിഷൻ ലിസ്റ്റ് ഫയൽ
പൈലപ്പ് അല്ലെങ്കിൽ ബിസിഎഫ് സൃഷ്ടിക്കണം [നല്ല്]
-q INT ഒരു വിന്യാസത്തിനുള്ള ഏറ്റവും കുറഞ്ഞ മാപ്പിംഗ് നിലവാരം [0]
-Q INT പരിഗണിക്കേണ്ട ഒരു അടിത്തറയുടെ ഏറ്റവും കുറഞ്ഞ അടിസ്ഥാന നിലവാരം [13]
-r STR പ്രദേശത്ത് മാത്രം പൈലപ്പ് സൃഷ്ടിക്കുക STR [എല്ലാ സൈറ്റുകളും]
ഔട്ട്പുട്ട് ഓപ്ഷനുകൾ:
-D ഓരോ സാമ്പിൾ റീഡ് ഡെപ്ത്തും ഔട്ട്പുട്ട്
-g ജനിതകമാതൃക സാധ്യതകൾ കണക്കാക്കി ബൈനറി കോൾ ഫോർമാറ്റിൽ ഔട്ട്പുട്ട് ചെയ്യുക
(ബിസിഎഫ്).
-S ഔട്ട്പുട്ട് പെർ-സാമ്പിൾ Phred-scaled strand bias P-value
-u സമാനമായ -g ഔട്ട്പുട്ട് കംപ്രസ് ചെയ്യാത്ത BCF ആണ് എന്നതൊഴിച്ചാൽ, അതായത്
പൈപ്പിംഗിന് മുൻഗണന.
ഓപ്ഷനുകൾ വേണ്ടി ജനിതകമാറ്റം സാധ്യത കണക്കുകൂട്ടൽ (വേണ്ടി -g or -u):
-e INT ഫ്രെഡ്-സ്കെയിൽഡ് ഗ്യാപ്പ് എക്സ്റ്റൻഷൻ സീക്വൻസിങ് എറർ പ്രോബബിലിറ്റി. കുറയ്ക്കുന്നു INT
നീളമുള്ള ഇൻഡലുകളിലേക്ക് നയിക്കുന്നു. [20]
-h INT ഹോമോപോളിമർ പിശകുകൾ മോഡലിംഗ് ചെയ്യുന്നതിനുള്ള ഗുണകം. ഒരു നൽകി l-നീളമുള്ള
ഹോമോപോളിമർ റൺ, വലിപ്പമുള്ള ഒരു ഇൻഡലിന്റെ സീക്വൻസിങ് പിശക് s മാതൃകയാക്കിയിരിക്കുന്നു
as INT*s/l. [ക്സനുമ്ക്സ]
-I INDEL കോളിംഗ് നടത്തരുത്
-L INT ഓരോ സാമ്പിളിലും ശരാശരി ആഴം കൂടുതലാണെങ്കിൽ INDEL കോളിംഗ് ഒഴിവാക്കുക INT.
[250]
-o INT ഫ്രെഡ്-സ്കെയിൽഡ് ഗ്യാപ്പ് ഓപ്പൺ സീക്വൻസിങ് എറർ പ്രോബബിലിറ്റി. കുറയ്ക്കുന്നു INT ലീഡുകൾ
കൂടുതൽ ഇൻഡെൽ കോളുകളിലേക്ക്. [40]
-p സംവേദനക്ഷമത വർദ്ധിപ്പിക്കുന്നതിന് ഓരോ സാമ്പിളിലും -m, -F ത്രെഷോൾഡുകൾ പ്രയോഗിക്കുക
വിളിക്കുന്നു. ഡിഫോൾട്ടായി രണ്ട് ഓപ്ഷനുകളും എല്ലാവരിൽ നിന്നും ശേഖരിക്കുന്ന റീഡുകൾക്ക് ബാധകമാണ്
സാമ്പിളുകൾ.
-P STR പ്ലാറ്റ്ഫോമുകളുടെ കോമ ഡിലിമിറ്റഡ് ലിസ്റ്റ് (നിർണ്ണയിച്ചത് @RG-PL) അതിൽ നിന്ന്
indel കാൻഡിഡേറ്റുകൾ ലഭിച്ചു. ഇൻഡൽ ശേഖരിക്കാൻ ശുപാർശ ചെയ്യുന്നു
കുറഞ്ഞ ഇൻഡൽ പിശക് നിരക്ക് ഉള്ള സീക്വൻസിംഗ് സാങ്കേതികവിദ്യകളിൽ നിന്നുള്ള ഉദ്യോഗാർത്ഥികൾ
ILLUMINA പോലുള്ളവ. [എല്ലാം]
റീഹെഡർ samtools റീഹെഡർ
തലക്കെട്ട് മാറ്റിസ്ഥാപിക്കുക ഇൻ.ബാം തലക്കെട്ടിനൊപ്പം in.header.sam. ഈ കമാൻഡ് ആണ്
BAM->SAM->BAM പരിവർത്തനം ഉപയോഗിച്ച് തലക്കെട്ട് മാറ്റിസ്ഥാപിക്കുന്നതിനേക്കാൾ വളരെ വേഗത്തിൽ.
പൂച്ച samtools cat [-h header.sam] [-o out.bam] [...]
BAM-കൾ സംയോജിപ്പിക്കുക. ഓരോ ഇൻപുട്ട് BAM-ന്റെയും സീക്വൻസ് നിഘണ്ടു സമാനമായിരിക്കണം,
ഈ കമാൻഡ് ഇത് പരിശോധിക്കുന്നില്ലെങ്കിലും. ഈ കമാൻഡ് സമാനമായ ഒരു ട്രിക്ക് ഉപയോഗിക്കുന്നു
റീഹെഡർ ഇത് വേഗത്തിലുള്ള BAM സംയോജനം സാധ്യമാക്കുന്നു.
അടുക്കുക samtools അടുക്കുക [-nof] [-m maxMem]
ഇടതുവശത്തെ കോർഡിനേറ്റുകൾ പ്രകാരം അലൈൻമെന്റുകൾ അടുക്കുക. ഫയൽ .ബാം സൃഷ്ടിക്കപ്പെടും.
ഈ കമാൻഡ് താൽക്കാലിക ഫയലുകളും സൃഷ്ടിച്ചേക്കാം .%d.ബാം എപ്പോൾ മുഴുവൻ
വിന്യാസം മെമ്മറിയിൽ ഘടിപ്പിക്കാൻ കഴിയില്ല (ഓപ്ഷൻ -m വഴി നിയന്ത്രിക്കപ്പെടുന്നു).
ഓപ്ഷനുകൾ:
-o സ്റ്റാൻഡേർഡ് ഔട്ട്പുട്ടിലേക്ക് അന്തിമ വിന്യാസം ഔട്ട്പുട്ട് ചെയ്യുക.
-n ക്രോമസോം കോർഡിനേറ്റുകളേക്കാൾ വായനയുടെ പേരുകൾ പ്രകാരം അടുക്കുക
-f ഉപയോഗം പൂർണ്ണ ഔട്ട്പുട്ട് പാഥായി, കൂട്ടിച്ചേർക്കരുത് .ബാം പ്രത്യയം.
-m INT ഏകദേശം ആവശ്യമായ പരമാവധി മെമ്മറി. [500000000]
ലയിപ്പിക്കുക samtools ലയനം [-nur1f] [-h inh.sam] [-R reg]
[...]
ഒന്നിലധികം അടുക്കിയ വിന്യാസങ്ങൾ ലയിപ്പിക്കുക. എല്ലാ ഇൻപുട്ടിന്റെയും ഹെഡർ റഫറൻസ് ലിസ്റ്റുകൾ
BAM ഫയലുകളും @SQ തലക്കെട്ടുകളും inh.sam, എന്തെങ്കിലും ഉണ്ടെങ്കിൽ, എല്ലാം ഒരേപോലെ പരാമർശിക്കേണ്ടതാണ്
റഫറൻസ് സീക്വൻസുകളുടെ ഒരു കൂട്ടം. ഹെഡർ റഫറൻസ് ലിസ്റ്റും (അസാധുവാക്കാത്ത പക്ഷം
-h) ന്റെ `@' തലക്കെട്ടുകൾ ഇൻ1.ബാം എന്നതിലേക്ക് പകർത്തും ഔട്ട്.ബാം, മറ്റുള്ളവയുടെ തലക്കെട്ടുകൾ
ഫയലുകൾ അവഗണിക്കപ്പെടും.
ഓപ്ഷനുകൾ:
-1 ഔട്ട്പുട്ട് കംപ്രസ് ചെയ്യാൻ zlib കംപ്രഷൻ ലെവൽ 1 ഉപയോഗിക്കുക
-f ഔട്ട്പുട്ട് ഫയൽ ഉണ്ടെങ്കിൽ അത് തിരുത്തിയെഴുതാൻ നിർബന്ധിക്കുക.
-h FILE എന്ന വരികൾ ഉപയോഗിക്കുക FILE പകർത്തേണ്ട `@' തലക്കെട്ടുകളായി ഔട്ട്.ബാം, മാറ്റിസ്ഥാപിക്കുന്നു
ഏതെങ്കിലും ശീർഷക വരികളിൽ നിന്ന് പകർത്താൻ കഴിയും ഇൻ1.ബാം. (FILE is
യഥാർത്ഥത്തിൽ SAM ഫോർമാറ്റിലാണ്, ഏതെങ്കിലും വിന്യാസ രേഖകൾ അതിൽ അടങ്ങിയിരിക്കാം
അവഗണിച്ചു.)
-n ഇൻപുട്ട് അലൈൻമെന്റുകൾ ക്രോമസോമുകളേക്കാൾ റീഡ് പേരുകൾ ഉപയോഗിച്ച് അടുക്കുന്നു
നിർദ്ദേശാങ്കങ്ങൾ
-R STR സൂചിപ്പിച്ചിരിക്കുന്ന നിർദ്ദിഷ്ട മേഖലയിൽ ഫയലുകൾ ലയിപ്പിക്കുക STR [ശൂന്യം]
-r ഓരോ വിന്യാസത്തിലും ഒരു RG ടാഗ് അറ്റാച്ചുചെയ്യുക. ടാഗ് മൂല്യം ഫയലിൽ നിന്ന് അനുമാനിച്ചതാണ്
പേരുകൾ.
-u കംപ്രസ് ചെയ്യാത്ത BAM ഔട്ട്പുട്ട്
സൂചിക samtools സൂചിക
വേഗത്തിലുള്ള റാൻഡം ആക്സസിനായി ഇൻഡക്സ് അടുക്കിയ വിന്യാസം. സൂചിക ഫയൽ .ബായ് ആയിരിക്കും
സൃഷ്ടിച്ചു.
idxstats samtools idxstats
സൂചിക ഫയലിൽ സ്ഥിതിവിവരക്കണക്കുകൾ വീണ്ടെടുക്കുകയും പ്രിന്റ് ചെയ്യുകയും ചെയ്യുക. ഔട്ട്പുട്ട് TAB ഉപയോഗിച്ച് വേർതിരിച്ചിരിക്കുന്നു
റഫറൻസ് സീക്വൻസ് പേര്, സീക്വൻസ് ദൈർഘ്യം, # മാപ്പ് ചെയ്ത റീഡുകൾ എന്നിവ അടങ്ങുന്ന ഓരോ വരിയും
കൂടാതെ # മാപ്പ് ചെയ്യാത്ത വായനകളും.
faidx samtools faidx [മേഖല1 [...]]
ഫാസ്റ്റ ഫോർമാറ്റിലുള്ള ഇൻഡെക്സ് റഫറൻസ് സീക്വൻസ് അല്ലെങ്കിൽ ഇൻഡെക്സ് ചെയ്തതിൽ നിന്ന് സബ്സീക്വൻസ് എക്സ്ട്രാക്റ്റ് ചെയ്യുക
റഫറൻസ് ക്രമം. ഒരു പ്രദേശവും വ്യക്തമാക്കിയിട്ടില്ലെങ്കിൽ, faidx ഫയലിനെ സൂചികയിലാക്കുകയും ചെയ്യും
സൃഷ്ടിക്കാൻ .ഫൈ ഡിസ്കിൽ. പ്രദേശങ്ങൾ വ്യക്തമാക്കിയിട്ടുണ്ടെങ്കിൽ, അനന്തരഫലങ്ങൾ
ഫാസ്റ്റ ഫോർമാറ്റിൽ stdout-ലേക്ക് വീണ്ടെടുക്കുകയും പ്രിന്റ് ചെയ്യുകയും ചെയ്യും. ഇൻപുട്ട് ഫയലിന് കഴിയും
ൽ കംപ്രസ് ചെയ്യണം RAZF ഫോർമാറ്റ്.
ഫിക്സ്മേറ്റ് samtools fixmate
ഇണയുടെ കോർഡിനേറ്റുകൾ, ISIZE, ഇണയുമായി ബന്ധപ്പെട്ട ഫ്ലാഗുകൾ എന്നിവയിൽ ഒരു പേര് ക്രമീകരിച്ചതിൽ നിന്ന് പൂരിപ്പിക്കുക
വിന്യാസം.
rmdup samtools rmdup [-sS]
സാധ്യതയുള്ള PCR ഡ്യൂപ്ലിക്കേറ്റുകൾ നീക്കം ചെയ്യുക: ഒന്നിലധികം റീഡ് ജോഡികൾക്ക് സമാനമായ ബാഹ്യമുണ്ടെങ്കിൽ
കോർഡിനേറ്റുകൾ, ഉയർന്ന മാപ്പിംഗ് നിലവാരമുള്ള ജോഡി മാത്രം നിലനിർത്തുക. ജോടിയാക്കിയതിൽ-
എൻഡ് മോഡ്, ഈ കമാൻഡ് മാത്രം FR ഓറിയന്റേഷനിൽ പ്രവർത്തിക്കുന്നു കൂടാതെ ISIZE ആവശ്യമാണ്
ശരിയായി സജ്ജമാക്കി. ജോടിയാക്കാത്ത വായനകൾക്ക് ഇത് പ്രവർത്തിക്കില്ല (ഉദാഹരണത്തിന് മാപ്പ് ചെയ്ത രണ്ട് അറ്റങ്ങൾ
വ്യത്യസ്ത ക്രോമസോമുകൾ അല്ലെങ്കിൽ അനാഥ വായനകൾ).
ഓപ്ഷനുകൾ:
-s സിംഗിൾ-എൻഡ് റീഡുകൾക്ക് ഡ്യൂപ്ലിക്കേറ്റ് നീക്കം ചെയ്യുക. സ്ഥിരസ്ഥിതിയായി, കമാൻഡ് പ്രവർത്തിക്കുന്നു
ജോടിയാക്കിയ അവസാന വായനകൾ മാത്രം.
-S പെയർ-എൻഡ് റീഡുകളും സിംഗിൾ-എൻഡ് റീഡുകളും കൈകാര്യം ചെയ്യുക.
ശാന്തമാക്കി samtools ശാന്തമാക്കി [-EeubSr] [-C capQcoef]
MD ടാഗ് ജനറേറ്റ് ചെയ്യുക. MD ടാഗ് നിലവിലുണ്ടെങ്കിൽ, ഈ കമാൻഡ് a തരും
ജനറേറ്റ് ചെയ്ത MD ടാഗ് നിലവിലുള്ള ടാഗിൽ നിന്ന് വ്യത്യസ്തമാണെങ്കിൽ മുന്നറിയിപ്പ്. ഔട്ട്പുട്ട് SAM
സ്ഥിരസ്ഥിതിയായി.
ഓപ്ഷനുകൾ:
-A സംയുക്തമായി ഉപയോഗിക്കുമ്പോൾ -r ഈ ഓപ്ഷൻ യഥാർത്ഥ അടിത്തറയെ പുനരാലേഖനം ചെയ്യുന്നു
ഗുണമേന്മയുള്ള.
-e വിന്യസിച്ച റഫറൻസിന് സമാനമാണെങ്കിൽ = എന്നതിലേക്ക് റീഡ് ബേസ് പരിവർത്തനം ചെയ്യുക
അടിസ്ഥാനം. ഇൻഡൽ കോളർ ഇപ്പോൾ = അടിസ്ഥാനങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല.
-u കംപ്രസ് ചെയ്യാത്ത BAM ഔട്ട്പുട്ട്
-b ഔട്ട്പുട്ട് കംപ്രസ് ചെയ്ത BAM
-S ഇൻപുട്ട് ഹെഡർ ലൈനുകളുള്ള SAM ആണ്
-C INT മോശമായി മാപ്പ് ചെയ്ത റീഡുകളുടെ ഗുണമേന്മ മാപ്പുചെയ്യുന്നതിനുള്ള ഗുണകം. കാണുക
പൈലപ്പ് വിശദാംശങ്ങൾക്ക് കമാൻഡ്. [0]
-r BQ ടാഗ് (-A ഇല്ലാതെ) അല്ലെങ്കിൽ BAQ (-A ഉപയോഗിച്ച്) അടിസ്ഥാന നിലവാരം കണക്കാക്കുക.
-E വിപുലീകരിച്ച BAQ കണക്കുകൂട്ടൽ. ഈ ഓപ്ഷൻ സ്പെസിഫിറ്റി ട്രേഡ് ചെയ്യുന്നു
പ്രഭാവം ചെറുതാണെങ്കിലും സംവേദനക്ഷമത.
ലക്ഷ്യം samtools targetcut [-Q minBaseQ] [-i in Penalty] [-0 em0] [-1 em1] [-2 em2] [-f
ref]
വായനയുടെ തുടർച്ച പരിശോധിച്ചുകൊണ്ട് ഈ കമാൻഡ് ടാർഗെറ്റ് മേഖലകളെ തിരിച്ചറിയുന്നു
ഡെപ്ത്, ടാർഗെറ്റുകളുടെ ഹാപ്ലോയിഡ് കൺസെൻസസ് സീക്വൻസുകൾ കണക്കാക്കുകയും ഒരു SAM ഉപയോഗിച്ച് ഔട്ട്പുട്ട് ചെയ്യുകയും ചെയ്യുന്നു
ഓരോ ക്രമവും ഒരു ലക്ഷ്യവുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. എപ്പോൾ ഓപ്ഷൻ -f ഉപയോഗത്തിലാണ്, BAQ ആയിരിക്കും
അപേക്ഷിച്ചു. ഈ കമാൻഡ് ആണ് മാത്രം ഫോസ്മിഡിൽ നിന്ന് ഫോസ്മിഡ് ക്ലോണുകൾ മുറിക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്
പൂൾ സീക്വൻസിങ് [Ref. കിറ്റ്സ്മാൻ et al. (2010)].
ഘട്ടം samtools ഘട്ടം [-AF] [-k len] [-b prefix] [-q minLOD] [-Q minBaseQ]
ഹെറ്ററോസൈഗസ് എസ്എൻപികളെ വിളിക്കുകയും ഘട്ടം ചെയ്യുകയും ചെയ്യുക. ഓപ്ഷനുകൾ:
-A അവ്യക്തമായ ഘട്ടത്തോടുകൂടിയ ഡ്രോപ്പ് റീഡുകൾ.
-b STR BAM ഔട്ട്പുട്ടിന്റെ പ്രിഫിക്സ്. ഈ ഓപ്ഷൻ ഉപയോഗിക്കുമ്പോൾ, ഘട്ടം-0 റീഡുകൾ ആയിരിക്കും
ഫയലിൽ സേവ് ചെയ്തു STR.0.ബാം, ഘട്ടം-1 എന്നിവ വായിക്കുന്നു STR.1.ബാം. ഘട്ടം അജ്ഞാതമാണ്
രണ്ട് ഫയലുകളിലൊന്നിലേക്ക് റീഡുകൾ ക്രമരഹിതമായി അനുവദിക്കും. ചിമെറിക് വായിക്കുന്നു
സ്വിച്ച് പിശകുകൾ ഉപയോഗിച്ച് സംരക്ഷിക്കപ്പെടും STR.chimeric.bam. [ശൂന്യം]
-F ചിമെറിക് റീഡുകൾ ശരിയാക്കാൻ ശ്രമിക്കരുത്.
-k INT ലോക്കൽ ഫേസിംഗിനുള്ള പരമാവധി ദൈർഘ്യം. [13]
-q INT ഒരു ഹെറ്ററോസൈഗോട്ട് വിളിക്കാൻ ഏറ്റവും കുറഞ്ഞ ഫ്രെഡ് സ്കെയിൽ ചെയ്ത LOD. [40]
-Q INT ഹെറ്റ് കോളിംഗിൽ ഉപയോഗിക്കേണ്ട ഏറ്റവും കുറഞ്ഞ അടിസ്ഥാന നിലവാരം. [13]
BCFTOOLS കമാൻഡുകൾ ഒപ്പം ഓപ്ഷനുകൾ
കാഴ്ച bcftools കാഴ്ച [-AbFGNQSucgv] [-D seqDict] [-l ലിസ്റ്റ്ലോസി] [-s പട്ടികസാമ്പിൾ] [-i
gapSNPratio] [-t mutRate] [-p varThres] [-m varThres] [-P മുൻകൂർ] [-1 nഗ്രൂപ്പ്1]
[-d minFrac] [-U nPerm] [-X permThres] [-T trioType] in.bcf [പ്രദേശം]
BCF-നും VCF-നും ഇടയിൽ പരിവർത്തനം ചെയ്യുക, വേരിയന്റ് കാൻഡിഡേറ്റുകളെ വിളിക്കുക, അല്ലീലിനെ കണക്കാക്കുക
ആവൃത്തികൾ.
ഇൻപുട്ട് ഔട്ട്പുട്ട് ഓപ്ഷനുകൾ:
-A വേരിയന്റ് സൈറ്റുകളിൽ സാധ്യമായ എല്ലാ ഇതര അല്ലീലുകളും നിലനിർത്തുക. സ്വതവേ,
വ്യൂ കമാൻഡ് സാധ്യതയുള്ള അല്ലീലുകൾ നിരസിക്കുന്നു.
-b BCF ഫോർമാറ്റിലുള്ള ഔട്ട്പുട്ട്. ഡിഫോൾട്ട് VCF ആണ്.
-D FILE VCF->BCF പരിവർത്തനത്തിനായുള്ള സീക്വൻസ് നിഘണ്ടു (ക്രോമസോം പേരുകളുടെ പട്ടിക).
[ശൂന്യം]
-F PL സൃഷ്ടിച്ചത് r921 അല്ലെങ്കിൽ അതിന് മുമ്പുള്ളതാണെന്ന് സൂചിപ്പിക്കുക (ഓർഡറിംഗ് വ്യത്യസ്തമാണ്).
-G എല്ലാ വ്യക്തിഗത ജനിതകരൂപ വിവരങ്ങളും അടിച്ചമർത്തുക.
-l FILE വിവരങ്ങൾ ഔട്ട്പുട്ട് ചെയ്യുന്ന സൈറ്റുകളുടെ ലിസ്റ്റ് [എല്ലാ സൈറ്റുകളും]
-N REF ഫീൽഡ് A/C/G/T അല്ലാത്ത സൈറ്റുകൾ ഒഴിവാക്കുക
-Q QCALL സാധ്യത ഫോർമാറ്റ് ഔട്ട്പുട്ട് ചെയ്യുക
-s FILE ഉപയോഗിക്കേണ്ട സാമ്പിളുകളുടെ ലിസ്റ്റ്. ഇൻപുട്ടിലെ ആദ്യ കോളം സാമ്പിൾ നൽകുന്നു
പേരുകളും രണ്ടാമത്തേത് പ്ലോയിഡി നൽകുന്നു, അത് 1 അല്ലെങ്കിൽ 2 മാത്രമായിരിക്കും. എപ്പോൾ
രണ്ടാമത്തെ കോളം ഇല്ല, സാമ്പിൾ പ്ലോയിഡി 2 ആയി കണക്കാക്കുന്നു
ഔട്ട്പുട്ട്, സാമ്പിളുകളുടെ ക്രമം ഇൻ ഒന്നിന് സമാനമായിരിക്കും FILE.
[ശൂന്യം]
-S ഇൻപുട്ട് BCF-ന് പകരം VCF ആണ്.
-u കംപ്രസ് ചെയ്യാത്ത BCF ഔട്ട്പുട്ട് (ഫോഴ്സ് -ബി).
സമവായം/വേരിയന്റ് വിളിക്കുന്നു ഓപ്ഷനുകൾ:
-c ബയേഷ്യൻ അനുമാനം ഉപയോഗിച്ച് വേരിയന്റുകളെ വിളിക്കുക. ഈ ഓപ്ഷൻ സ്വയമേവ
ഓപ്ഷൻ ആവശ്യപ്പെടുന്നു -e.
-d ഫ്ലോട്ട് എപ്പോൾ -v ഉപയോഗത്തിലാണ്, സാമ്പിളുകളുടെ അംശം ഉൾക്കൊള്ളുന്ന സ്ഥലം ഒഴിവാക്കുക
FLOAT-ന് താഴെ വായിക്കുന്നു. [0]
-e സൈറ്റ് കണക്കാക്കുന്നത് ഉൾപ്പെടെ പരമാവധി സാധ്യത അനുമാനം മാത്രം നടത്തുക
അല്ലീൽ ആവൃത്തി, ഹാർഡി-വെയ്ൻബർഗ് സന്തുലിതാവസ്ഥയും പരിശോധനയും
LRT യുമായുള്ള അസോസിയേഷനുകൾ.
-g വേരിയന്റ് സൈറ്റുകളിൽ ഓരോ സാമ്പിൾ ജനിതകരൂപങ്ങളും വിളിക്കുക (force -c)
-i ഫ്ലോട്ട് INDEL-ടു-SNP മ്യൂട്ടേഷൻ നിരക്കിന്റെ അനുപാതം [0.15]
-m ഫ്ലോട്ട് മെച്ചപ്പെട്ട മൾട്ടിഅലെലിക്, അപൂർവ-വേരിയന്റ് കോളിംഗിനുള്ള പുതിയ മോഡൽ. മറ്റൊന്ന്
LRT യുടെ P(chi^2) FLOAT ത്രെഷോൾഡ് കവിയുന്നുവെങ്കിൽ ALT അല്ലീൽ സ്വീകരിക്കപ്പെടും.
പരാമീറ്റർ ശക്തമാണെന്ന് തോന്നുന്നു, യഥാർത്ഥ മൂല്യം സാധാരണയായി അങ്ങനെയല്ല
ഫലങ്ങളെ വളരെയധികം ബാധിക്കുക; ഉപയോഗിക്കാനുള്ള നല്ല മൂല്യം 0.99 ആണ്. ഇതാണ്
ശുപാർശ ചെയ്യുന്ന കോളിംഗ് രീതി. [0]
-p ഫ്ലോട്ട് P(ref|D) ആണെങ്കിൽ ഒരു സൈറ്റ് ഒരു വേരിയന്റായി കണക്കാക്കപ്പെടുന്നു.
-P STR മുൻ അല്ലെങ്കിൽ പ്രാരംഭ അല്ലീൽ ഫ്രീക്വൻസി സ്പെക്ട്രം. STR കഴിയുമെങ്കിൽ നിറഞ്ഞ, വ്യവസ്ഥ2,
പരന്ന അല്ലെങ്കിൽ മുമ്പത്തെ വേരിയന്റിൽ നിന്നുള്ള പിശക് ഔട്ട്പുട്ട് അടങ്ങുന്ന ഫയൽ
ഓട്ടം വിളിക്കുന്നു.
-t ഫ്ലോട്ട് വേരിയന്റ് കോളിംഗിനായുള്ള സ്കെയിൽഡ് മ്യൂഷൻ നിരക്ക് [0.001]
-T STR ജോടി/മൂവർ കോളിംഗ് പ്രവർത്തനക്ഷമമാക്കുക. ട്രിയോ കോളിംഗിന്, ഓപ്ഷൻ -s സാധാരണയായി
ട്രിയോ അംഗങ്ങളെയും അവരുടെ ഓർഡറിംഗിനെയും കോൺഫിഗർ ചെയ്യുന്നതിന് പ്രയോഗിക്കേണ്ടതുണ്ട്.
ഓപ്ഷനിലേക്ക് നൽകിയ ഫയലിൽ -s, ആദ്യത്തെ സാമ്പിൾ ആയിരിക്കണം
കുട്ടി, രണ്ടാമത്തേത് അച്ഛനും മൂന്നാമത്തേത് അമ്മയും. സാധുവായ
ന്റെ മൂല്യങ്ങൾ STR `പെയർ', `ട്രയോഓട്ടോ', `ട്രയോക്സ്ഡ്', `ട്രിയോക്സ്' എന്നിവ
രണ്ട് ഇൻപുട്ട് സാമ്പിളുകൾ തമ്മിലുള്ള വ്യത്യാസങ്ങളെ `ജോടി' വിളിക്കുന്നു, ഒപ്പം `ട്രയോക്സ്ഡ്'
(`trioxs') ഇൻപുട്ട് X ക്രോമസോം നോൺ-PAR-ൽ നിന്നുള്ളതാണെന്ന് വ്യക്തമാക്കുന്നു
പ്രദേശങ്ങളും കുട്ടിയും ഒരു സ്ത്രീയാണ് (ആൺ). [ശൂന്യം]
-v ഔട്ട്പുട്ട് വേരിയന്റ് സൈറ്റുകൾ മാത്രം (force -c)
കോൺട്രാസ്റ്റ് വിളിക്കുന്നു ഒപ്പം അസോസിയേഷൻ പരിശോധന ഓപ്ഷനുകൾ:
-1 INT ഗ്രൂപ്പ്-1 സാമ്പിളുകളുടെ എണ്ണം. വിഭജിക്കുന്നതിന് ഈ ഓപ്ഷൻ ഉപയോഗിക്കുന്നു
കോൺട്രാസ്റ്റ് എസ്എൻപി കോളിംഗിനോ അസോസിയേഷൻ ടെസ്റ്റിനോ വേണ്ടി രണ്ട് ഗ്രൂപ്പുകളായി സാമ്പിളുകൾ.
ഈ ഓപ്ഷൻ ഉപയോഗത്തിലായിരിക്കുമ്പോൾ, ഇനിപ്പറയുന്ന VCF INFO ഔട്ട്പുട്ട് ചെയ്യും:
PC2, PCHI2, QCHI2. [0]
-U INT അസോസിയേഷൻ ടെസ്റ്റിനുള്ള പെർമ്യൂട്ടേഷനുകളുടെ എണ്ണം (ഇതിനൊപ്പം മാത്രം -1)
[0]
-X ഫ്ലോട്ട് P(chi^2) എന്നതിനുള്ള ക്രമമാറ്റങ്ങൾ മാത്രം നടത്തുക -U)
[0.01]
സൂചിക bcftools സൂചിക in.bcf
ക്രമരഹിതമായ ആക്സസിനായി BCF അടുക്കിയ സൂചിക.
പൂച്ച bcftools പൂച്ച in1.bcf [in2.bcf [...]]]
BCF ഫയലുകൾ കൂട്ടിച്ചേർക്കുക. ഇൻപുട്ട് ഫയലുകൾ അടുക്കേണ്ടതും ഉണ്ടായിരിക്കേണ്ടതും ആവശ്യമാണ്
ഒരേ ക്രമത്തിൽ ദൃശ്യമാകുന്ന സമാന സാമ്പിളുകൾ.
SAM ഫോർമാറ്റ്
സീക്വൻസ് അലൈൻമെന്റ്/മാപ്പ് (SAM) ഫോർമാറ്റ് TAB-ഡിലിമിറ്റഡ് ആണ്. ഹെഡർ ലൈനുകൾക്ക് പുറമെ, ഏത്
`@' ചിഹ്നം ഉപയോഗിച്ചാണ് ആരംഭിക്കുന്നത്, ഓരോ വിന്യാസ വരിയിലും ഇവ ഉൾപ്പെടുന്നു:
┌────┬───────┬──────────────────────────────────── ─────────────────────┐
│Col │ ഫീൽഡ് │ വിവരണം │
├────┼───────┼──────────────────────────────────── ─────────────────────┤
│ 1 │ QNAME │ ചോദ്യ ടെംപ്ലേറ്റ്/പേര് ജോടിയാക്കുക │
│ 2 │ ഫ്ലാഗ് │ ബിറ്റ്വൈസ് ഫ്ലാഗ് │
│ 3 │ RNAME │ റഫറൻസ് സീക്വൻസ് NAME │
│ 4 │ POS │ 1-അടിസ്ഥാനത്തിൽ ഇടതുവശത്തുള്ള സ്ഥാനം/ക്ലിപ്പ് ചെയ്ത ക്രമത്തിന്റെ കോർഡിനേറ്റ് │
│ 5 │ MAPQ │ മാപ്പിംഗ് ഗുണനിലവാരം (Phred-scaled) │
│ 6 │ CIAGR │ നീട്ടിയ CIGAR സ്ട്രിംഗ് │
│ 7 │ MRNM │ Mate Reference sequence NaMe (`=' എങ്കിൽ RNAME പോലെ തന്നെ) │
│ 8 │ MPOS │ 1-അടിസ്ഥാനത്തിലുള്ള Mate POSistion │
│ 9 │ TLEN │ അനുമാനിച്ച ടെംപ്ലേറ്റ് ദൈർഘ്യം (ഇൻസേർട്ട് സൈസ്) │
│10 │ SEQ │ റഫറൻസ് │ അതേ സ്ട്രാൻഡിൽ SEQuence അന്വേഷിക്കുക
│11 │ QUAL │ ക്വറി ക്വാളിറ്റി (ASCII-33 Phred അടിസ്ഥാന നിലവാരം നൽകുന്നു) │
│12+ │ OPT │ TAG:VTYPE:VALUE │ ഫോർമാറ്റിലുള്ള വേരിയബിൾ ഓപ്ഷണൽ ഫീൽഡുകൾ
└────┴───────┴──────────────────────────────────── ─────────────────────┘
FLAG ഫീൽഡിലെ ഓരോ ബിറ്റും ഇങ്ങനെ നിർവചിച്ചിരിക്കുന്നു:
┌───────┬─────┬─────────────────────────────────── ──────────────┐
│ ഫ്ലാഗ് │ ച │ വിവരണം │
├───────┼─────┼─────────────────────────────────── ───────────────┤
│0x0001 │ p │ റീഡ് സീക്വൻസിംഗിൽ ജോടിയാക്കിയിരിക്കുന്നു │
│0x0002 │ P │ റീഡ് ശരിയായ ജോഡിയിൽ മാപ്പ് ചെയ്തിരിക്കുന്നു │
│0x0004 │ u │ അന്വേഷണ ക്രമം തന്നെ മാപ്പ് ചെയ്തിട്ടില്ല │
│0x0008 │ U │ ഇണ മാപ്പ് ചെയ്തിട്ടില്ല │
│0x0010 │ r │ ചോദ്യത്തിന്റെ സ്ട്രാൻഡ് (റിവേഴ്സിന് 1) │
│0x0020 │ R │ ഇണയുടെ ഇഴ │
│0x0040 │ 1 │ ഒരു ജോഡിയിലെ ആദ്യത്തെ വായനയാണ് റീഡ് │
│0x0080 │ 2 │ ഒരു ജോഡിയിലെ രണ്ടാമത്തെ വായനയാണ് റീഡ് │
│0x0100 │ s │ വിന്യാസം പ്രാഥമികമല്ല │
│0x0200 │ f │ വായന പരാജയപ്പെടുന്നു പ്ലാറ്റ്ഫോം/വെണ്ടർ ഗുണനിലവാര പരിശോധനകൾ │
│0x0400 │ d │ വായിച്ചത് ഒന്നുകിൽ PCR അല്ലെങ്കിൽ ഒപ്റ്റിക്കൽ ഡ്യൂപ്ലിക്കേറ്റ് ആണ്.
└───────┴─────┴─────────────────────────────────── ───────────────┘
ഇവിടെ രണ്ടാമത്തെ നിര FLAG ഫീൽഡിന്റെ സ്ട്രിംഗ് പ്രാതിനിധ്യം നൽകുന്നു.
വി.സി.എഫ് ഫോർമാറ്റ്
വേരിയന്റ് കോൾ ഫോർമാറ്റ് (VCF) എന്നത് ഓരോ ഡാറ്റാ ലൈനിലും ഉൾപ്പെടുന്ന ഒരു TAB-ഡീലിമിറ്റഡ് ഫോർമാറ്റാണ്
ഇനിപ്പറയുന്ന ഫീൽഡുകൾ:
┌────┬────────┬─────────────────────────────────── ──────────────────────────┐
│Col │ ഫീൽഡ് │ വിവരണം │
├────┼────────┼─────────────────────────────────── ──────────────────────────┤
│ 1 │ CHROM │ CHROMosome പേര് │
│ 2 │ POS │ വേരിയന്റിന്റെ ഏറ്റവും ഇടതുവശത്തുള്ള സ്ഥാനം │
│ 3 │ ID │ തനതായ വേരിയന്റ് ഐഡന്റിഫയർ │
│ 4 │ REF │ റഫറൻസ് അല്ലീൽ │
│ 5 │ ALT │ ALTernate അല്ലീൽ(കൾ), കോമ കൊണ്ട് വേർതിരിച്ചിരിക്കുന്നു │
│ 6 │ QUAL │ വേരിയന്റ്/റഫറൻസ് ക്വാളിറ്റി │
│ 7 │ ഫിൽട്ടർ │ ഫിൽട്ടറുകൾ പ്രയോഗിച്ചു │
│ 8 │ വിവരം │ വേരിയന്റുമായി ബന്ധപ്പെട്ട വിവരങ്ങൾ, അർദ്ധ കോളൻ കൊണ്ട് വേർതിരിച്ചിരിക്കുന്നു │
│ 9 │ ഫോർമാറ്റ് │ കോളൻ കൊണ്ട് വേർതിരിച്ച ജനിതക മണ്ഡലങ്ങളുടെ ഫോർമാറ്റ് (ഓപ്ഷണൽ) │
│10+ │ സാമ്പിൾ │ സാമ്പിൾ ജനിതകരൂപങ്ങളും ഓരോ സാമ്പിൾ വിവരങ്ങളും (ഓപ്ഷണൽ) │
└────┴────────┴─────────────────────────────────── ──────────────────────────
ഇനിപ്പറയുന്ന പട്ടിക നൽകുന്നു INFO samtools, bcftools എന്നിവ ഉപയോഗിക്കുന്ന ടാഗുകൾ.
┌──────┬───────────┬────────────────────────────── ────────────────────────────────────────────────── ───────────────────┐
│ ടാഗ് │ ഫോർമാറ്റ് │ വിവരണം │
├──────┼───────────┼────────────────────────────── ────────────────────────────────────────────────── ───────────────────┤
└──────┴───────────┴────────────────────────────── ────────────────────────────────────────────────── ───────────────────┘
ഉദാഹരണങ്ങൾ
O എപ്പോൾ BAM-ലേക്ക് SAM ഇറക്കുമതി ചെയ്യുക @SQ തലക്കെട്ടിൽ വരികൾ ഉണ്ട്:
samtools view -bS aln.sam > aln.bam
If @SQ വരികൾ ഇല്ല:
samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam
എവിടെ ref.fa.fai വഴി യാന്ത്രികമായി ജനറേറ്റുചെയ്യുന്നു faidx കമാൻഡ്.
o അറ്റാച്ചുചെയ്യുക RG അടുക്കിയ വിന്യാസങ്ങൾ ലയിപ്പിക്കുമ്പോൾ ടാഗ് ചെയ്യുക:
perl -e 'പ്രിന്റ്
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools merge -rh rg.txt merged.bam ga.bam 454.bam
എയിലെ മൂല്യം RG വായിച്ചത് വരുന്ന ഫയലിന്റെ പേര് അനുസരിച്ചാണ് ടാഗ് നിർണ്ണയിക്കുന്നത്. ഇതിൽ
ഉദാഹരണത്തിന്, ൽ ലയിച്ചു.ബാം, നിന്ന് വായിക്കുന്നു ഗ.ബാം ഘടിപ്പിക്കും RG:Z:ga, വായിക്കുമ്പോൾ
454.ബാം ഘടിപ്പിക്കും RG:Z:454.
ഒരു ഡിപ്ലോയിഡ് വ്യക്തിക്ക് വേണ്ടി SNP-കളും ഹ്രസ്വ INDEL-കളും വിളിക്കുക:
samtools mpileup -ugf ref.fa aln.bam | bcftools വ്യൂ -bvcg - > var.raw.bcf
bcftools കാണുക var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf
ദി -D varFilter എന്ന ഓപ്ഷൻ പരമാവധി റീഡ് ഡെപ്ത് നിയന്ത്രിക്കുന്നു, അത് ക്രമീകരിക്കണം
ശരാശരി വായനാ ആഴത്തിന്റെ ഇരട്ടി. ചേർക്കുന്നത് പരിഗണിക്കാം -സി 50 ലേക്ക് mpileup മാപ്പിംഗ് ആണെങ്കിൽ
അമിതമായ പൊരുത്തക്കേടുകൾ അടങ്ങിയ വായനകൾക്ക് ഗുണനിലവാരം അമിതമായി കണക്കാക്കുന്നു. ഈ ഓപ്ഷൻ പ്രയോഗിക്കുന്നു
സാധാരണയായി സഹായിക്കുന്നു BWA-ഹ്രസ്വ എന്നാൽ മറ്റ് മാപ്പർമാർ പാടില്ല.
o ഒരു ഡിപ്ലോയിഡ് വ്യക്തിക്ക് സമവായ ക്രമം സൃഷ്ടിക്കുക:
samtools mpileup -uf ref.fa aln.bam | bcftools കാഴ്ച -cg - | vcfutils.pl vcf2fq >
cns.fq
ഒരു ജോടി സാമ്പിളുകളിൽ നിന്ന് സോമാറ്റിക് മ്യൂട്ടേഷനുകൾ വിളിക്കുക:
samtools mpileup -DSuf ref.fa aln.bam | bcftools വ്യൂ -bvcgT ജോടി - > var.bcf
ഔട്ട്പുട്ട് INFO ഫീൽഡിൽ, CLR വഴി സാധ്യത തമ്മിലുള്ള Phred-log അനുപാതം നൽകുന്നു
രണ്ട് സാമ്പിളുകളും സ്വതന്ത്രമായി കൈകാര്യം ചെയ്യുന്നു, കൂടാതെ ജനിതകരൂപം ആവശ്യമായി വരാനുള്ള സാധ്യതയും
ഒരേപോലെയായിരിക്കുക. ഈ CLR ഫലപ്രദമായി സോമാറ്റിക് ആത്മവിശ്വാസം അളക്കുന്ന ഒരു സ്കോർ ആണ്
വിളിക്കുന്നു. ഉയർന്നത് നല്ലത്.
o ഒരു കുടുംബ ത്രയത്തിൽ നിന്നുള്ള കോൾ ഡി നോവോ, സോമാറ്റിക് മ്യൂട്ടേഷനുകൾ:
samtools mpileup -DSuf ref.fa aln.bam | bcftools കാഴ്ച -bvcgT ജോടി -s samples.txt - >
var.bcf
ഫയല് സാമ്പിളുകൾ.txt അംഗവും ക്രമവും വ്യക്തമാക്കുന്ന മൂന്ന് വരികൾ അടങ്ങിയിരിക്കണം
സാമ്പിളുകൾ (കുട്ടി-അച്ഛൻ-അമ്മ എന്ന ക്രമത്തിൽ). സമാനമായി, CLR Phred-log നൽകുന്നു
ട്രിയോ നിയന്ത്രണത്തോടുകൂടിയതും അല്ലാതെയുമുള്ള സാധ്യത അനുപാതം. യുജിടി ഏറ്റവും സാധ്യത കാണിക്കുന്നു
ട്രയോ കൺസ്ട്രൈന്റ് ഇല്ലാതെ ജനിതകമാതൃക കോൺഫിഗറേഷൻ, കൂടാതെ ച്ഗ്ത് ഏറ്റവും സാധ്യത നൽകുന്നു
ട്രയോ കൺസ്ട്രെയിന്റ് തൃപ്തിപ്പെടുത്തുന്ന ജനിതകരൂപം കോൺഫിഗറേഷൻ.
O ഘട്ടം ഒരു വ്യക്തി:
samtools ശാന്തമായി -AEur aln.bam ref.fa | samtools ഫേസ് -ബി പ്രിഫിക്സ് - > ഘട്ടം.ഔട്ട്
ദി ശാന്തമാക്കി INDEL-കൾക്ക് ചുറ്റുമുള്ള തെറ്റായ ഹെറ്ററോസൈഗോറ്റുകൾ കുറയ്ക്കാൻ കമാൻഡ് ഉപയോഗിക്കുന്നു.
ഒന്നിലധികം ഡിപ്ലോയിഡ് വ്യക്തികൾക്കായി എസ്എൻപികളും ഷോർട്ട് ഇൻഡലുകളും വിളിക്കുക:
samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools വ്യൂ -bcvg - > var.raw.bcf
bcftools കാണുക var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf
എന്നതിൽ നിന്ന് വ്യക്തികളെ തിരിച്ചറിയുന്നു SM എന്നതിലെ ടാഗുകൾ @RG തലക്കെട്ട് വരികൾ. വ്യക്തികൾക്ക് ആകാം
ഒരു വിന്യാസ ഫയലിൽ പൂൾ ചെയ്തു; ഒരു വ്യക്തിയെ ഒന്നിലധികം ഫയലുകളായി വേർതിരിക്കാനും കഴിയും.
ദി -P ഇൻഡെൽ കാൻഡിഡേറ്റുകൾ റീഡ് ഗ്രൂപ്പുകളിൽ നിന്ന് മാത്രമേ ശേഖരിക്കാവൂ എന്ന് ഓപ്ഷൻ വ്യക്തമാക്കുന്നു
കൂടെ @RG-PL ടാഗ് സജ്ജമാക്കി ഇല്ലുമിന. ക്രമീകരിച്ച വായനകളിൽ നിന്ന് ഇൻഡെൽ കാൻഡിഡേറ്റുകൾ ശേഖരിക്കുന്നു
ഇൻഡെൽ-പ്രോൺ ടെക്നോളജി ഇൻഡെൽ കോളിംഗിന്റെ പ്രകടനത്തെ ബാധിച്ചേക്കാം.
അഭ്യർത്ഥിക്കാവുന്ന ഒരു പുതിയ കോളിംഗ് മോഡൽ ഉണ്ടെന്ന് ശ്രദ്ധിക്കുക
bcftools കാഴ്ച -m0.99 ...
ഇത് സ്ഥിരസ്ഥിതി രീതിയുടെ ചില ഗുരുതരമായ പരിമിതികൾ പരിഹരിക്കുന്നു.
ഫിൽട്ടറിംഗിനായി, ആദ്യം പ്രയോഗിക്കുന്നതിലൂടെ മികച്ച ഫലങ്ങൾ നേടാനാകുമെന്ന് തോന്നുന്നു SnpGap ഫിൽട്ടറും
പിന്നീട് ചില മെഷീൻ ലേണിംഗ് സമീപനം പ്രയോഗിക്കുന്നു
vcf-annotate -f SnpGap=n
vcf ഫിൽട്ടർ...
രണ്ടും ഇതിൽ കാണാം vcftools ഒപ്പം htslib പാക്കേജ് (ചുവടെയുള്ള ലിങ്കുകൾ).
ഒ ഒന്നിലധികം വ്യക്തികളിൽ നിന്നുള്ള സൈറ്റുകളുടെ ഒരു ലിസ്റ്റിൽ അല്ലീൽ ഫ്രീക്വൻസി സ്പെക്ട്രം (AFS) നേടുക:
samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools കാണുക -bl sites.list all.bcf > sites.bcf
bcftools view -cGP cond2 sites.bcf > /dev/null 2> sites.1.afs
bcftools view -cGP sites.1.afs sites.bcf > /dev/null 2> sites.2.afs
bcftools view -cGP sites.2.afs sites.bcf > /dev/null 2> sites.3.afs
......
എവിടെ sites.list റഫറൻസ് അടങ്ങുന്ന ഓരോ വരിയിലും സൈറ്റുകളുടെ ലിസ്റ്റ് അടങ്ങിയിരിക്കുന്നു
ക്രമത്തിന്റെ പേരും സ്ഥാനവും. ഇനിപ്പറയുന്നവ bcftools കമാൻഡുകൾ എഎഫ്എസ് കണക്കാക്കുന്നത് EM ആണ്.
O Dump BAQ മറ്റ് SNP കോളർമാർക്കായി അലൈൻമെന്റ് പ്രയോഗിച്ചു:
samtools ശാന്തമാക്കി -bAr aln.bam > aln.baq.bam
ഇത് കൂട്ടിച്ചേർക്കുകയും ശരിയാക്കുകയും ചെയ്യുന്നു NM ഒപ്പം MD ഒരേ സമയം ടാഗുകൾ. ദി ശാന്തമാക്കി കമാൻഡും വരുന്നു
കൂടെ -C ഓപ്ഷൻ, ഉള്ളത് പോലെ തന്നെ പൈലപ്പ് ഒപ്പം mpileup. സഹായകമെങ്കിൽ പ്രയോഗിക്കുക.
പരിമിതികൾ
bam_import.c, bam_endian.h, bam.c, bam_aux.c എന്നിവയിൽ അലൈൻ ചെയ്യാത്ത വാക്കുകൾ ഉപയോഗിക്കുന്നു.
ജോടിയാക്കാത്ത വായനകൾക്ക് Samtools പെയർ-എൻഡ് rmdup പ്രവർത്തിക്കില്ല (ഉദാ: അനാഥ വായനകൾ അല്ലെങ്കിൽ അവസാനങ്ങൾ
വ്യത്യസ്ത ക്രോമസോമുകളിലേക്ക് മാപ്പ് ചെയ്തു). ഇത് ഒരു ആശങ്കയാണെങ്കിൽ, ദയവായി Picard's ഉപയോഗിക്കുക
ഈ കേസുകൾ ശരിയായി കൈകാര്യം ചെയ്യുന്ന MarkDuplicate, അൽപ്പം മന്ദഗതിയിലാണെങ്കിലും.
onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് bcftools ഓൺലൈനായി ഉപയോഗിക്കുക