এটি ম্যাক কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
Maq - গুণাবলী সহ ম্যাপিং এবং সমাবেশ
সাইনোপিসিস
ম্যাক হুকুম [অপশন] আর্গুমেন্ট
maq.pl হুকুম [অপশন] আর্গুমেন্ট
বর্ণনাঃ
Maq একটি সফ্টওয়্যার যা পরবর্তী দ্বারা তৈরি করা সংক্ষিপ্ত পাঠ থেকে ম্যাপিং সমাবেশ তৈরি করে-
প্রজন্মের সিকোয়েন্সিং মেশিন। এটি বিশেষভাবে ইলুমিনা-সোলেক্সা 1জি জেনেটিক জন্য ডিজাইন করা হয়েছে
বিশ্লেষক, এবং AB সলিড ডেটা পরিচালনা করার জন্য একটি প্রাথমিক কার্যকারিতা রয়েছে।
Maq এর সাথে আপনি করতে পারেন:
· দ্রুত সারিবদ্ধ ইলুমিনা/এসএলআইডি রেফারেন্স জিনোমে পড়ে। ডিফল্ট বিকল্পগুলির সাথে, এক
প্রায় 10 সিপিইউ ঘন্টার মধ্যে কম দিয়ে মানুষের জিনোমে মিলিয়ন জোড়া রিড ম্যাপ করা যেতে পারে
1G মেমরির চেয়ে।
· প্রতিটি পৃথক পঠিত প্রান্তিককরণের ত্রুটির সম্ভাব্যতা সঠিকভাবে পরিমাপ করুন।
সমজাতীয় এবং বিষমজাইগাস পলিমরফিজম সহ ঐকমত্য জিনোটাইপগুলিকে কল করুন
প্রতিটি বেসের জন্য নির্ধারিত একটি ফ্রেড সম্ভাব্য গুণমান।
পেয়ারড এন্ড রিড সহ ছোট ইনডেল খুঁজুন।
· পেয়ারড এন্ড রিড সহ বৃহৎ আকারের জিনোমিক মুছে ফেলা এবং ট্রান্সলোকেশন সঠিকভাবে খুঁজুন।
· পঠিত গভীরতা পরীক্ষা করে সম্ভাব্য CNV আবিষ্কার করুন।
সিকোয়েন্সার থেকে কাঁচা ভিত্তি গুণাবলীর নির্ভুলতা মূল্যায়ন করুন এবং পরীক্ষা করতে সাহায্য করুন
পদ্ধতিগত ত্রুটি
যাইহোক, Maq পারেন না:
· করো de নতুন সমাবেশ (Maq শুধুমাত্র পরিচিতকে ম্যাপিং রিড করে ঐকমত্য কল করতে পারে
রেফারেন্স।)
· মানচিত্র শর্টস নিজেদের বিরুদ্ধে পড়া. (Maq শুধুমাত্র পড়ার মধ্যে সম্পূর্ণ ওভারল্যাপ খুঁজে পেতে পারে।)
· রেফারেন্সে কৈশিক রিড বা 454 রিড সারিবদ্ধ করুন। (Maq এর চেয়ে দীর্ঘ পঠন সারিবদ্ধ করতে পারে না
63bp।)
ম্যাক কম্যান্ডস
চাবি কমান্ড
fasta2bfa ম্যাক fasta2bfa in.ref.fasta out.ref.bfa
FASTA ফর্ম্যাটে সিকোয়েন্সগুলিকে Maq-এর BFA (বাইনারী FASTA) ফর্ম্যাটে রূপান্তর করুন।
fastq2bfq ম্যাক fastq2bfq [-n nreads] in.read.fastq out.read.bfq⎪out.prefix
FASTQ ফরম্যাটে রিডকে Maq-এর BFQ (বাইনারী FASTQ) ফর্ম্যাটে রূপান্তর করুন।
বিকল্পগুলি:
-n INT প্রতি ফাইল পড়ার সংখ্যা [নির্দিষ্ট নয়]
মানচিত্র ম্যাক মানচিত্র [-n nmis] [-a ম্যাক্সিনস] [-c] [-1 len1] [-2 len2] [-d adap3] [-m পরিবর্তন করা]
[-u আনম্যাপ করা] [-ই maxerr] [-M c⎪g] [-N] [-H সব হিট] [-C maxhits] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log
মানচিত্র রেফারেন্স ক্রম পড়া.
বিকল্পগুলি:
-n INT সর্বাধিক অমিলের সংখ্যা যা সর্বদা পাওয়া যায় [2]
-a INT একটি সঠিক পঠিত জোড়ার জন্য সর্বাধিক বাইরের দূরত্ব [250]
-A INT দুই আরএফ পেইড রিডের সর্বাধিক বাইরের দূরত্ব (অক্ষম করার জন্য 0) [0]
-c মানচিত্রটি রঙের জায়গায় পড়ে (শুধুমাত্র SOLiD এর জন্য)
-1 INT প্রথম পড়ার জন্য পড়ার দৈর্ঘ্য, অটোর জন্য 0 [0]
-2 INT দ্বিতীয় পড়ার জন্য দৈর্ঘ্য পড়ুন, স্বয়ংক্রিয় জন্য 0 [0]
-m ভাসা রেফারেন্স সিকোয়েন্স এবং রিডের মধ্যে মিউটেশন রেট [0.001]
-d ফাইল 3'-অ্যাডাপ্টার অনুক্রমের একটি একক লাইন ধারণকারী একটি ফাইল নির্দিষ্ট করুন
[খালি]
-u ফাইল ডাম্প আনম্যাপড রিড এবং রিড এর থেকে বেশি nmis এর সাথে মেলে না
একটি পৃথক ফাইল [শূন্য]
-e INT অমিল বেস গুণাবলীর যোগফলের থ্রেশহোল্ড [70]
-H ফাইল একাধিক/সমস্ত 01-অমিল হিট ডাম্প করুন ফাইল [খালি]
-C INT আউটপুট হিট সর্বোচ্চ সংখ্যা. 512 এর চেয়ে বড় হলে সীমাহীন। [250]
-M c⎪g মিথাইলেশন অ্যালাইনমেন্ট মোড। ফরোয়ার্ড স্ট্র্যান্ডের সমস্ত সি (বা জি) হবে
T (বা A) এ পরিবর্তিত হয়েছে। এই বিকল্পটি শুধুমাত্র পরীক্ষার জন্য।
-N আউটপুট ফাইলে অমিল অবস্থান সংরক্ষণ করুন out.aln.map। কখন এটা
বিকল্পটি ব্যবহার করা হচ্ছে, সর্বাধিক অনুমোদিত পঠন দৈর্ঘ্য 55bp।
লক্ষ্য করুন:
* জোড়া শেষ রিড দুটি ফাইলে প্রস্তুত করা উচিত, প্রতিটি প্রান্তের জন্য একটি, সঙ্গে
রিড একই ক্রমে সাজানো হয়। এর মানে প্রথমটিতে কে-থ পড়া
ফাইলটি দ্বিতীয় ফাইলে পড়া k-th এর সাথে মিলিত হয়। সংশ্লিষ্ট পড়া
টেলিং `/1' বা `/2' পর্যন্ত নাম অবশ্যই অভিন্ন হতে হবে। উদাহরণস্বরূপ, যেমন একটি
পঠিত নামের জোড়া অনুমোদিত: `EAS1_1_5_100_200/1' এবং
`EAS1_1_5_100_200/2'। টেলিং `/[12]' সাধারণত দ্বারা উত্পন্ন হয়
GAPipeline একটি জোড়া মধ্যে দুই প্রান্ত পার্থক্য.
* আউটপুট একটি সংকুচিত বাইনারি ফাইল। এটা endianness দ্বারা প্রভাবিত হয়.
* এই কমান্ডটি চালানোর সর্বোত্তম উপায় হল প্রায় 1 থেকে 3 মিলিয়ন রিড প্রদান করা
ইনপুট. বেশি পড়া বেশি মেমরি খরচ করে।
* বিকল্প -n প্রান্তিককরণের সংবেদনশীলতা নিয়ন্ত্রণ করে। ডিফল্টরূপে, সঙ্গে একটি আঘাত
2টি পর্যন্ত অমিল সর্বদা পাওয়া যাবে। ঊর্ধ্বতন -n আরো হিট খুঁজে পায় এবং এছাড়াও
ম্যাপিং গুণাবলীর নির্ভুলতা উন্নত করে। যাইহোক, এটি খরচ করা হয়
গতির
* অনেক উচ্চ-মানের অমিল সহ সারিবদ্ধকরণগুলি মিথ্যা হিসাবে বাতিল করা উচিত
প্রান্তিককরণ বা সম্ভাব্য দূষণ। এই আচরণ বিকল্প দ্বারা নিয়ন্ত্রিত হয়
-e. দ্য -e থ্রেশহোল্ড শুধুমাত্র আনুমানিক গণনা করা হয় কারণ মৌলিক গুণাবলী
প্রান্তিককরণের একটি নির্দিষ্ট পর্যায়ে 10 দ্বারা বিভক্ত। দ্য -Q বিকল্প মধ্যে
জড় করা কমান্ড অবিকল থ্রেশহোল্ড সেট.
* পঠিত একটি জোড়া সঠিকভাবে জোড়া বলা হয় যদি এবং শুধুমাত্র যদি
অভিযোজন হয় FR এবং জোড়ার বাইরের দূরত্ব এর চেয়ে বড় নয়
ম্যাক্সিনস. ন্যূনতম সন্নিবেশ আকারের কোন সীমা নেই। এই সেটিং হল
Maq-এ ব্যবহৃত জোড়া শেষ প্রান্তিককরণ অ্যালগরিদম দ্বারা নির্ধারিত। প্রয়োজন a
ন্যূনতম সন্নিবেশ মাপ উচ্চ সঙ্গে কিছু ভুল প্রান্তিককরণ হতে হবে
অত্যধিক মানচিত্র গুণাবলী.
* বর্তমানে, ইলুমিনা/সোলেক্সা লং-ইনসার্ট লাইব্রেরি থেকে জোড়া পড়া RF পড়া আছে
অভিযোজন সর্বাধিক সন্নিবেশ আকার বিকল্প দ্বারা সেট করা হয় -A. তবে দীর্ঘ-
ইনসার্ট লাইব্রেরিও শর্ট-ইনসার্ট রিডের একটি ছোট ভগ্নাংশের সাথে মিশ্রিত হয়
বিদ্যমান জোড়া. -a এছাড়াও সঠিকভাবে সেট করা উচিত।
* কখনও কখনও 5'-এন্ড বা এমনকি সম্পূর্ণ 3'-অ্যাডাপ্টারের ক্রম ক্রম করা হতে পারে।
প্রদান -d অ্যাডাপ্টারের দূষণ দূর করতে Maq রেন্ডার করে।
* ইনপুট হিসাবে 2 মিলিয়ন রিড দেওয়া হয়েছে, ম্যাক সাধারণত 800MB মেমরি লাগে।
ম্যাপ মার্জ ম্যাক ম্যাপ মার্জ out.aln.map in.aln1.map in.aln2.map [...]
পঠিত প্রান্তিককরণের একটি ব্যাচ একসাথে মার্জ করুন।
লক্ষ্য করুন:
* তাত্ত্বিকভাবে, এই কমান্ডটি সীমাহীন সংখ্যক প্রান্তিককরণ একত্রিত করতে পারে। যাইহোক, হিসাবে
ম্যাপমার্জ একই সময়ে সমস্ত ইনপুট পড়া হবে, এটি আঘাত করতে পারে
OS দ্বারা সেট করা ফাইল খোলার সর্বোচ্চ সংখ্যার সীমা। বর্তমানে, এই
endusers দ্বারা ম্যানুয়ালি সমাধান করতে হবে.
* আদেশ ম্যাপ মার্জ বিভিন্ন রিডের সাথে প্রান্তিককরণ ফাইলগুলিকে একত্রিত করতে ব্যবহার করা যেতে পারে
দৈর্ঘ্য পরবর্তী সমস্ত বিশ্লেষণ আর স্থির দৈর্ঘ্য ধরে নেয় না।
rmdup ম্যাক rmdup out.rmdup.map in.ori.map
অভিন্ন বাইরের স্থানাঙ্ক সহ জোড়া সরান। নীতিগতভাবে, সঙ্গে জোড়া
অভিন্ন বাইরের স্থানাঙ্ক খুব কমই ঘটতে হবে। তবে এর কারণে
নমুনা প্রস্তুতিতে পরিবর্ধন, এটি দ্বারা তুলনায় অনেক বেশি ঘন ঘন ঘটে
সুযোগ ব্যবহারিক বিশ্লেষণ দেখায় যে সদৃশ অপসারণ উন্নত করতে সাহায্য করে
SNP কলিং এর সামগ্রিক নির্ভুলতা।
জড় করা ম্যাক জড় করা [-sp] [-m maxmis] [-Q maxerr] [-r হেট্রেট] [-t coef] [-q minQ] [-N
nহ্যাপ] out.cns in.ref.bfa in.aln.map 2> out.cns.log
পঠিত ম্যাপিং থেকে ঐকমত্যের ক্রমগুলিকে কল করুন।
বিকল্পগুলি:
-t ভাসা ত্রুটি নির্ভরতা সহগ [0.93]
-r ভাসা সমস্ত সাইটের মধ্যে হেটেরোজাইগোটের ভগ্নাংশ [0.001]
-s চূড়ান্ত ম্যাপিং গুণমান হিসাবে একক শেষ ম্যাপিং গুণমান নিন;
অন্যথায় জোড়া শেষ ম্যাপিং গুণমান ব্যবহার করা হবে
-p পেয়ার করা শেষ রিডগুলি বাতিল করুন যেগুলি সঠিক জোড়ায় ম্যাপ করা হয়নি৷
-m INT একটি পড়ার জন্য সর্বাধিক সংখ্যক অমিল ব্যবহার করার অনুমতি রয়েছে৷
ঐকমত্য আহ্বান [7]
-Q INT অমিল বেসগুলির গুণমানের মানগুলির সর্বাধিক অনুমোদিত যোগফল [60]
-q INT ন্যূনতম ম্যাপিং গুণমান ঐক্যমত ব্যবহার করার জন্য একটি পড়ার জন্য অনুমোদিত
কল করা [0]
-N INT পুলে হ্যাপ্লোটাইপের সংখ্যা (>=2) [২]
লক্ষ্য করুন:
* বিকল্প -Q অমিল বেস গুণাবলীর সর্বোচ্চ যোগফলের একটি সীমা সেট করে।
অনেক উচ্চ-মানের অমিল রয়েছে এমন রিড বাতিল করা উচিত।
* বিকল্প -N একটি পুলে হ্যাপ্লোটাইপের সংখ্যা সেট করে। এটা জন্য ডিজাইন করা হয়েছে
একাধিক স্ট্রেন/ব্যক্তিকে একসাথে পুল করে নমুনার রিকোয়েন্সিং। জন্য
ডিপ্লয়েড জিনোম রিকোয়েন্সিং, এই বিকল্পটি 2 এর সমান।
glfgen ম্যাক glfgen [-sp] [-m maxmis] [-Q maxerr] [-r হেট্রেট] [-t coef] [-q minQ] [-N
nহ্যাপ] out.cns in.ref.bfa in.aln.map 2> out.cns.log
সমস্ত জিনোটাইপের জন্য লগ-সম্ভাব্যতা গণনা করুন এবং ফলাফলগুলি GLF বিন্যাসে সংরক্ষণ করুন
(জিনোটাইপিং সম্ভাবনা বিন্যাস)। বিস্তারিত জানার জন্য অনুগ্রহ করে MAQ ওয়েবসাইট দেখুন
ফাইল ফরম্যাট এবং সম্পর্কিত ইউটিলিটিগুলির বর্ণনা।
indelpe ম্যাক indelpe in.ref.bfa in.aln.map > out.indelpe
পেয়ারড এন্ড রিড থেকে সামঞ্জস্যপূর্ণ ইনডেল কল করুন। আউটপুট TAB দিয়ে সীমাবদ্ধ করা হয়েছে
প্রতিটি লাইনে ক্রোমোজোম, শুরুর অবস্থান, ইনডেলের ধরন, সংখ্যা
ইনডেল জুড়ে পড়ার সংখ্যা, ইনডেলের আকার এবং সন্নিবেশিত/মুছে ফেলা নিউক্লিওটাইড
(কোলন দ্বারা পৃথক), বিপরীত স্ট্র্যান্ডে ইন্ডেলের সংখ্যা, ইনডেলের সংখ্যা
ফরোয়ার্ড স্ট্র্যান্ডে, ইনডেলের 5' ক্রম এগিয়ে, 3' অনুক্রম অনুসরণ করে
ইনডেল, ইনডেল ছাড়া সারিবদ্ধ পাঠের সংখ্যা এবং তিনটি অতিরিক্ত কলাম
ফিল্টার জন্য.
৩য় কলামে, ইন্ডেলের ধরন, একটি তারা নির্দেশ করে যে ইনডেল নিশ্চিত হয়েছে
উভয় স্ট্র্যান্ড থেকে রিড দ্বারা, একটি প্লাস মানে ইনডেলটি কমপক্ষে দুটি রিড দ্বারা আঘাত করা হয়েছে
কিন্তু একই স্ট্র্যান্ড থেকে, একটি বিয়োগ দেখায় যে ইনডেলটি শুধুমাত্র একটি পাঠে পাওয়া যায়,
এবং একটি বিন্দু মানে indel অন্য indel এর খুব কাছাকাছি এবং ফিল্টার করা হয়েছে।
ব্যবহারকারীদের সংখ্যা সংশোধন করতে `maq.pl indelpe'-এর মাধ্যমে চালানোর পরামর্শ দেওয়া হচ্ছে
indels ছাড়া ম্যাপ পড়া পড়া. আরো বিস্তারিত জানার জন্য, `maq.pl indelpe' দেখুন
অধ্যায়.
indelsoa ম্যাক indelsoa in.ref.bfa in.aln.map > out.indelsoa
অস্বাভাবিক শনাক্ত করে সম্ভাব্য হোমোজাইগাস ইনডেল এবং বিরতি পয়েন্টগুলিকে কল করুন
ইনডেল এবং ব্রেক পয়েন্টের চারপাশে প্রান্তিককরণ প্যাটার্ন। আউটপুটটিও TAB
ক্রোমোজোম সমন্বিত প্রতিটি লাইন দিয়ে সীমাবদ্ধ, আনুমানিক স্থানাঙ্ক,
অস্বাভাবিক অঞ্চলের দৈর্ঘ্য, অবস্থান জুড়ে ম্যাপ করা পড়ার সংখ্যা,
পজিশনের বাম দিকে পঠিত সংখ্যা এবং পঠিত সংখ্যা
ডান দিকে শেষ কলাম উপেক্ষা করা যেতে পারে.
আউটপুট অনেক মিথ্যা ইতিবাচক রয়েছে. একটি প্রস্তাবিত ফিল্টার হতে পারে:
awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa
মনে রাখবেন যে এই কমান্ডটি একটি সঠিক ইনডেল ডিটেক্টর হতে লক্ষ্য করে না, কিন্তু
প্রধানত প্রতিস্থাপন কলিং কিছু মিথ্যা ইতিবাচক এড়াতে সাহায্য করে. ভিতরে
উপরন্তু, এটি শুধুমাত্র গভীর গভীরতা দেওয়া ভাল কাজ করে (উদাহরণস্বরূপ ~40X); অন্যথায়
মিথ্যা নেতিবাচক হার খুব উচ্চ হবে.
বিন্যাস রূপান্তর
sol2sanger ম্যাক sol2sanger in.sol.fastq out.sanger.fastq
Solexa FASTQ কে স্ট্যান্ডার্ড/Sanger FASTQ ফরম্যাটে রূপান্তর করুন।
bfq2fastq ম্যাক bfq2fastq in.read.bfq out.read.fastq
Maq-এর BFQ ফর্ম্যাটকে স্ট্যান্ডার্ড FASTQ ফর্ম্যাটে রূপান্তর করুন।
mapass2maq ম্যাক mapass2maq in.mapass2.map out.maq.map
অপ্রচলিত mapass2-এর মানচিত্র বিন্যাসকে Maq-এর মানচিত্রের বিন্যাসে রূপান্তর করুন। পুরানো বিন্যাস করে
পঠিত নাম ধারণ করে না।
তথ্য নিষ্কাশন হচ্ছে
মানচিত্র দেখা ম্যাক মানচিত্র দেখা [-বিএন] in.aln.map > out.aln.txt
প্লেইন টেক্সটে পঠিত প্রান্তিককরণ প্রদর্শন করুন। স্মিথের আগে সারিবদ্ধ পাঠের জন্য-
ওয়াটারম্যান সারিবদ্ধকরণ, প্রতিটি লাইনে পঠিত নাম, ক্রোমোজোম, অবস্থান,
স্ট্র্যান্ড, একটি জোড়ার বাইরের কোরনিয়াট থেকে আকার সন্নিবেশ করান, জোড়া পতাকা, ম্যাপিং
গুণমান, একক-এন্ড ম্যাপিং গুণমান, বিকল্প ম্যাপিং গুণমান, সংখ্যা
সেরা হিটের অমিল, সেরার অমিল বেসের গুণাবলীর যোগফল
হিট, প্রথম 0bp-এর 24-অমিল হিটের সংখ্যা, 1-অমিল হিটের সংখ্যা
রেফারেন্সের প্রথম 24bp, পড়ার দৈর্ঘ্য, পড়ার ক্রম এবং এর
গুণমান বিকল্প ম্যাপিং গুণমান সবসময় ম্যাপিং মানের সমান হয় যদি
রিডস জোড়া হয় না। যদি পঠনগুলি জোড়া হয় তবে এটি ছোট ম্যাপিংয়ের সমান
দুই প্রান্তের গুণমান। এই বিকল্প ম্যাপিং গুণমান আসলে
একটি অস্বাভাবিক জোড়া মানচিত্র মানচিত্র.
পঞ্চম কলাম, জোড়া পতাকা, একটি বিটওয়াইজ পতাকা। এর নিচের ৪ বিট দেয়
ওরিয়েন্টেশন: 1 মানে FF, 2 FR, 4 RF এবং 8 RR, যেখানে FR মানে
যে ছোট স্থানাঙ্ক সহ রিড ফরোয়ার্ড স্ট্র্যান্ডে রয়েছে এবং এর সঙ্গী
বিপরীত স্ট্র্যান্ড উপর. একটি সঠিক জুটির জন্য শুধুমাত্র FR অনুমোদিত। উচ্চতর বিট
এই পতাকা আরও তথ্য দিতে. জুটি শেষ হলে জুটি মিলবে
প্রয়োজন, 16 সেট করা হবে। যদি দুটি রিড ভিন্ন ম্যাপ করা হয়
ক্রোমোজোম, 32 সেট করা হবে। যদি দুটি পাঠের মধ্যে একটিকে মোটেও ম্যাপ করা না যায়,
64 সেট করা হবে। একটি সঠিক জুটির জন্য পতাকা সর্বদা 18 এর সমান।
পরে স্মিথ-ওয়াটারম্যান প্রান্তিককরণ দ্বারা সারিবদ্ধ পাঠের জন্য, পতাকাটি
সর্বদা 130. একটি লাইনে পঠিত নাম, ক্রোমোজোম, অবস্থান, স্ট্র্যান্ড, সন্নিবেশ করা হয়
আকার, পতাকা (সর্বদা 130), পঠিত ইনডেলের অবস্থান (0 যদি না থাকে তবে),
ইনডেলের দৈর্ঘ্য (সন্নিবেশের জন্য ইতিবাচক এবং মুছে ফেলার জন্য নেতিবাচক),
এর সঙ্গীর মানচিত্র ম্যাপিং, সেরা হিটের অমিলের সংখ্যা, যোগফল
সেরা হিটের অমিল বেসের গুণাবলী, দুটি শূন্য, পড়ার দৈর্ঘ্য,
ক্রম এবং এর গুণমান পড়ুন। একটি 130-পতাকা পড়া সাথী সবসময় একটি পায়
পতাকা 18.
পতাকা 192 ইঙ্গিত করে যে রিড ম্যাপ করা হয়নি তবে এর সঙ্গী ম্যাপ করা হয়েছে। এমন একটি
একটি পঠিত জোড়া, একটি পতাকা আছে 64 এবং অন্যটিতে 192টি।
বিকল্পগুলি:
-b পঠিত ক্রম এবং গুণমান প্রদর্শন করবেন না
-N যেখানে অমিল ঘটবে সেখানে অবস্থান প্রদর্শন করুন। এই পতাকা শুধুমাত্র কাজ করে
'maq মানচিত্র -N' দ্বারা উত্পন্ন একটি .map ফাইল সহ।
মানচিত্র পরীক্ষা ম্যাক মানচিত্র পরীক্ষা [-s] [-m maxmis] [-q minQ] in.ref.bfa in.aln.map > out.mapcheck
মান পরীক্ষা পড়ুন. ম্যাপচেক প্রথমে কম্পোজিশন এবং এর গভীরতা রিপোর্ট করে
উল্লেখ. তার পরে একটি ফর্ম আছে। প্রথম কলামটি নির্দেশ করে
একটি পড়া উপর অবস্থান. চারটি কলাম অনুসরণ করে যা নিউক্লিওটাইড দেখায়
রেফারেন্স এবং রিডের মধ্যে কম্পোজিশন, প্রতিস্থাপনের হার দেওয়া হবে।
এই হারগুলি এবং নিম্নলিখিত কলামের সংখ্যাগুলি 999 এবং স্কেল করা হয়েছে
নিকটতম পূর্ণসংখ্যাতে বৃত্তাকার। কলামের পরবর্তী গ্রুপের বিতরণ দেখায়
10 এর মানের ব্যবধানে রিড বরাবর মৌলিক গুণাবলী। মানের একটি ক্ষয়
সাধারণত লক্ষ্য করা যায়, যার অর্থ পড়ার শেষে বেস কম থাকে
সঠিক কলামের শেষ গ্রুপটি প্রতিস্থাপনের ভগ্নাংশ উপস্থাপন করে
একটি মানের ব্যবধানে বেস পড়ুন। এটি বেস মানের নির্ভুলতা পরিমাপ করে
অনুমান আদর্শভাবে, আমরা 1 3 দেখতে আশা করি? কলাম, 10 এর মধ্যে 2? কলাম
এবং 100? কলাম
বিকল্পগুলি:
-s চূড়ান্ত ম্যাপিং গুণমান হিসাবে একক শেষ ম্যাপিং গুণমান নিন
-m INT একটি পঠন গণনা করার জন্য সর্বাধিক সংখ্যক অসঙ্গতি অনুমোদিত [৪]
-q INT ন্যূনতম ম্যাপিং গুণমান একটি পাঠ গণনা করার জন্য অনুমোদিত [30]
পাইলআপ ম্যাক পাইলআপ [-এসপিভিপি] [-m maxmis] [-Q maxerr] [-q minQ] [-l সাইটফাইল] in.ref.bfa
in.aln.map > out.pileup
একটি 'পাইলআপ' পাঠ্য বিন্যাসে প্রান্তিককরণ প্রদর্শন করুন। প্রতিটি লাইন গঠিত
ক্রোমোজোম, অবস্থান, রেফারেন্স বেস, গভীরতা এবং সেই কভার পড়ার উপর ভিত্তি করে
এই অবস্থান. যদি -v কমান্ড লাইন, বেস গুণাবলী এবং ম্যাপিং এ যোগ করা হয়
গুণাবলী ক্রমানুসারে ষষ্ঠ এবং সপ্তম কলামে উপস্থাপন করা হবে।
পঞ্চম কলাম সবসময় `@' দিয়ে শুরু হয়। এই কলামে, বেস অভিন্ন পড়ুন
রেফারেন্সে কমা `,' বা ডট `.' দেখানো হয়, এবং পাঠের ভিত্তি ভিন্ন
চিঠির রেফারেন্স থেকে। একটি কমা বা একটি বড় হাতের অক্ষর নির্দেশ করে যে বেস
ফরোয়ার্ড স্ট্র্যান্ডে সারিবদ্ধ একটি রিড থেকে আসে, যখন একটি বিন্দু বা একটি ছোট হাত চালু থাকে
বিপরীত স্ট্র্যান্ড
এই কমান্ডটি ব্যবহারকারীদের জন্য যারা তাদের নিজস্ব SNP কলার বিকাশ করতে চান।
বিকল্পগুলি:
-s চূড়ান্ত ম্যাপিং গুণমান হিসাবে একক শেষ ম্যাপিং গুণমান নিন
-p পেয়ার করা শেষ রিডগুলি বাতিল করুন যেগুলি সঠিক জোড়া হিসাবে ম্যাপ করা হয়নি৷
-v মূল গুণাবলী এবং ম্যাপিং সহ আউটপুট ভার্বোজ তথ্য
গুণাবলী
-m INT একটি পড়ার জন্য সর্বাধিক সংখ্যক অমিল ব্যবহার করার অনুমতি দেওয়া হয়েছে [7]
-Q INT অমিলের গুণমানের মানগুলির সর্বাধিক অনুমোদিত সংখ্যা [60]
-q INT একটি রিড ব্যবহার করার জন্য ন্যূনতম ম্যাপিং গুণমান অনুমোদিত [0]
-l ফাইল ফাইল যেখানে পাইলআপ প্রিন্ট করা হবে সেই সাইটগুলি রয়েছে৷ এই
ফাইলের প্রথম কলামটি রেফারেন্সের নাম দেয় এবং দ্বিতীয়টি
স্থানাঙ্ক অতিরিক্ত কলাম উপেক্ষা করা হবে. [খালি]
-P এছাড়াও পড়ার উপর ভিত্তি অবস্থান আউটপুট
cns2fq ম্যাক cns2fq [-Q minMapQ] [-n minNeiQ] [-d মিনিটপথ] [-D সর্বোচ্চ গভীরতা] in.cns >
out.cns.fastq
FASTQ বিন্যাসে ঐকমত্যের ক্রমগুলি বের করুন। ক্রম লাইন, ঘাঁটি
ছোট ক্ষেত্রে অপরিহার্যভাবে পুনরাবৃত্তি হয় বা পর্যাপ্ত কভারেজ নেই; ঘাঁটি
উপরের ক্ষেত্রে এমন অঞ্চলগুলি নির্দেশ করে যেখানে SNPs নির্ভরযোগ্যভাবে বলা যেতে পারে। মধ্যে
মানের লাইন, একটি অক্ষর বিয়োগ 33 এর ASCII PHRED গুণমান দেয়।
বিকল্পগুলি:
-Q INT ন্যূনতম ম্যাপিং গুণমান [40]
-d INT ন্যূনতম পঠিত গভীরতা [3]
-n INT ন্যূনতম প্রতিবেশী গুণমান [20]
-D INT সর্বাধিক পঠিত dpeth. >=255 সীমাহীন জন্য। [255]
cns2snp ম্যাক cns2snp in.cns > out.snp
SNP সাইটগুলি বের করুন। প্রতিটি লাইনে ক্রোমোজোম, অবস্থান, রেফারেন্স বেস,
ঐক্যমত বেস, ফ্রেডের মত ঐক্যমত্য গুণমান, গভীরতা পড়া, গড় সংখ্যা
এই পজিশন কভার করে রিডের হিট, রিডের সর্বোচ্চ মানচিত্র
অবস্থান কভার করে, 3bp ফ্ল্যাঙ্কিং-এ ন্যূনতম ঐকমত্য গুণমান
সাইটের প্রতিটি পাশের অঞ্চল (মোট 6bp), দ্বিতীয় সেরা কল, লগ
দ্বিতীয় সেরা এবং তৃতীয় সেরা কলের সম্ভাবনা অনুপাত এবং তৃতীয় সেরা
কল
আপনি যখন একটি SNP এর নির্ভরযোগ্যতা বিচার করেন তখন 5ম কলামটি হল মূল মাপকাঠি।
যাইহোক, যেহেতু এই গুণমানটি শুধুমাত্র সাইটের স্বাধীনতা ধরে নিয়ে গণনা করা হয়, আপনি
আরও নির্ভুল SNP কল পেতে অন্যান্য কলামগুলিও বিবেচনা করা উচিত। লিপি
আদেশ `maq.pl এসএনপিফিল্টার' এর জন্য ডিজাইন করা হয়েছে (নীচে দেখুন)।
7ম কলামটি বোঝায় যে সাইটটি পুনরাবৃত্তিমূলক অঞ্চলে পড়ে কিনা। যদি না
সাইট কভার পড়া উচ্চ ম্যাপিং গুণমান, flanking সঙ্গে ম্যাপ করা যেতে পারে
অঞ্চলটি সম্ভবত পুনরাবৃত্তিমূলক বা ভাল পড়ার অভাবের মধ্যে রয়েছে। এই ধরনের সাইটে একটি SNP
সাধারণত নির্ভরযোগ্য নয়।
8ম কলাম মোটামুটিভাবে ফ্ল্যাঙ্কিং অঞ্চলের কপি নম্বর দেয়৷
রেফারেন্স জিনোম। বেশিরভাগ ক্ষেত্রে, এই সংখ্যাটি 1.00 এর কাছে পৌঁছায়, যার মানে
অঞ্চলটি অনন্য। কখনও কখনও আপনি নন-জিরো রিড ডেপথ কিন্তু 0.00 এ দেখতে পারেন
7 ম কলাম। এটি ইঙ্গিত করে যে পজিশন কভার করা সমস্ত রিড এ আছে
অন্তত দুটি অমিল। Maq শুধুমাত্র 0- এবং 1-অমিল হিটের সংখ্যা গণনা করে
উল্লেখ. এটি একটি জটিল প্রযুক্তিগত সমস্যার কারণে।
9 ম কলাম প্রতিবেশী গুণমান দেয়। এই কলামে ফিল্টারিংও হয়
নির্ভরযোগ্য SNP পেতে প্রয়োজন। এই ধারণা NQS দ্বারা অনুপ্রাণিত, যদিও NQS হয়
প্রাথমিকভাবে একটি ঐক্যমতের পরিবর্তে একক পড়ার জন্য ডিজাইন করা হয়েছে।
cns2view ম্যাক cns2view in.cns > out.view
সব সাইটে বিস্তারিত তথ্য দেখান. আউটপুট বিন্যাস অনুরূপ
cns2snp রিপোর্ট।
cns2ref ম্যাক cns2ref in.cns > out.ref.fasta
রেফারেন্স ক্রম নিষ্কাশন.
cns2win ম্যাক cns2win [-w winsize] [-c chr,] [-b শুরু করা] [-e শেষ] [-q minQ] in.cns >
আউট.জয়
একটি টিলিং উইন্ডোতে গড় তথ্য বের করুন। আউটপুট TAB সীমাবদ্ধ,
যেটিতে রেফারেন্স নাম, 1,000,000 দ্বারা বিভক্ত স্থানাঙ্ক, SNP হার,
het হার, কাঁচা পড়ার গভীরতা, প্রায় অনন্য অঞ্চলে গভীরতা পড়া,
উইন্ডোতে পড়ার হিটের গড় সংখ্যা এবং শতাংশ GC।
বিকল্পগুলি:
-w INT একটি জানালার আকার [1000]
-c STR গন্তব্য রেফারেন্স ক্রম; অন্যথায় সমস্ত রেফারেন্স ব্যবহার করা হবে
[খালি]
-b INT স্টার্ট পজিশন, কোন বাধা ছাড়াই 0 [0]
-e INT শেষ অবস্থান, কোন বাধা ছাড়াই 0 [0]
-q INT ব্যবহার করা সাইটগুলির সর্বনিম্ন ঐক্যমতের গুণমান [0]
ব্যাজ সংশ্লিষ্ট
জাল ম্যাক জাল [-r পরিবর্তন করা] [-R ইনডেলফ্রাক] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp
রেফারেন্সে এলোমেলোভাবে প্রতিস্থাপন এবং ইনডেল প্রবর্তন করুন। প্রতিস্থাপন এবং
sinlge বেস-পেয়ার indels যোগ করা যেতে পারে.
বিকল্পগুলি:
-r ভাসা মিউটেশন হার [0.001]
-R ভাসা মিউটেশনের ভগ্নাংশ indels হবে [0.1]
সিমুট্রেন ম্যাক সিমুট্রেন out.simupars.dat in.read.fastq
রিড সিমুলেশনের জন্য অনুমান/ট্রেন প্যারামিটার।
অনুকরণ ম্যাক অনুকরণ [-d মাপে] [-s stdev] [-N nপড়ে] [-1 readLen1] [-2 readLen2] [-r
মিউটরেট] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat
জোড়া শেষ পড়া অনুকরণ. ফাইল in.simupars.dat পড়ার দৈর্ঘ্য নির্ধারণ করে এবং
গুণমান বিতরণ। থেকে উৎপন্ন হয় সিমুট্রেন, অথবা থেকে ডাউনলোড করা যেতে পারে
Maq ওয়েবসাইট। আউটপুট রিড ফাইলগুলিতে, একটি পঠিত নাম রেফারেন্স নিয়ে গঠিত
অনুক্রমের নাম এবং সিমুলেটেড রিডের জোড়ার বাইরের স্থানাঙ্ক। দ্বারা
ডিফল্ট, অনুকরণ অনুমান করা হয় রিড একটি ডিপ্লয়েড সিকোয়েন্স থেকে আসে যা তৈরি হয়
একটি বেস-পেয়ার ইনডেল সহ, মিউটেশনের দুটি ভিন্ন সেট যোগ করে
in.ref.fasta.
বিকল্পগুলি:
-d INT সন্নিবেশ মাপের বাইরের দূরত্বের গড় [170]
-s INT সন্নিবেশ মাপের আদর্শ বিচ্যুতি [২০]
-N INT পঠিত জোড়ার সংখ্যা তৈরি করা হবে [1000000]
-1 INT প্রথম পঠিত দৈর্ঘ্য [ দ্বারা সেট in.simupars.dat]
-2 INT দ্বিতীয় পঠিত দৈর্ঘ্য [ দ্বারা সেট in.simupars.dat]
-r ভাসা মিউটেশন হার [0.001]
-R ভাসা 1bp indels এর ভগ্নাংশ [0.1]
-h সব মিউটেশন যোগ করুন in.ref.fasta এবং একক থেকে রিড জেনারেট করুন
পরিবর্তিত ক্রম (হ্যাপ্লয়েড মোড)
লক্ষ্য করুন:
* এই কমান্ড থেকে উৎপন্ন রিডগুলি স্বাধীন, যা থেকে বিচ্যুত হয়
সত্য. যেখানে প্রান্তিককরণ মূল্যায়ন এই দ্বারা কম প্রভাবিত হয়, মূল্যায়ন চালু
SNP কলিং সতর্কতার সাথে সঞ্চালিত করা উচিত। ত্রুটি নির্ভরতা এক হতে পারে
ভুল SNP কলের প্রধান কারণ।
simustat ম্যাক simustat in.simu-aln.map > out.simustat
সিমুলেটেড রিড থেকে ম্যাপিং গুণাবলী মূল্যায়ন করুন।
সোলিড সংশ্লিষ্ট
fasta2csfa ম্যাক fasta2csfa in.nucl-ref.fasta > out.colour-ref.fasta
নিউক্লিওটাইড FASTA কে রঙ-কোডেড FASTA তে রূপান্তর করুন। পতাকা -c তারপর প্রয়োগ করা উচিত
থেকে মানচিত্র আদেশ আউটপুটে, অক্ষর 'A' মানে 0 রঙ, 'C' 1 এর জন্য, 'G'
2 এর জন্য এবং 3 এর জন্য 'T'। আউটপুটের প্রতিটি সিকোয়েন্স ইনপুটের থেকে 1bp ছোট।
csmap2nt ম্যাক csmap2nt out.nt.map in.ref.nt.bfa in.cs.map
রঙের প্রান্তিককরণকে নিউক্লিওটাইড প্রান্তিককরণে রূপান্তর করুন। ইনপুট in.ref.nt.bfa হয়
নিউক্লিওটাইড বাইনারি FASTA রেফারেন্স ফাইল। এটি মূল ফাইলের সাথে সঙ্গতিপূর্ণ হতে হবে
যা থেকে রঙের রেফারেন্স রূপান্তরিত হয়। নিউক্লিওটাইড ঐক্যমত বলা যেতে পারে
ফলের প্রান্তিককরণ থেকে।
বিবিধ/উন্নত কমান্ড
সাবম্যাপ ম্যাক সাবম্যাপ [-q minMapQ] [-Q maxSumErr] [-m maxMM] [-p] out.map in.map
খারাপ প্রান্তিককরণ ফিল্টার করুন in.map. কমান্ড-লাইন বিকল্পগুলি বর্ণনা করা হয়েছে
`জড় করা' আদেশ।
eland2maq ম্যাক eland2maq [-q defqual] out.map in.list in.eland
ইল্যান্ড সারিবদ্ধকরণকে maq এর .map বিন্যাসে রূপান্তর করুন। ফাইল in.list গঠিত
ইল্যান্ড অ্যালাইনমেন্ট ফাইলের সপ্তম কলামে প্রদর্শিত সিকোয়েন্সের নাম
in.eland এবং নামটি আপনি maq সারিবদ্ধকরণে দেখতে আশা করছেন। নিম্নলিখিত একটি
উদাহরণস্বরূপ:
cX.fa chrX
c1.fa chr1
c2.fa chr2
আপনি eland ব্যবহার করে বেশ কয়েকটি ব্যাচে পঠন সারিবদ্ধ করা হয়, এটা গুরুত্বপূর্ণ
একই ব্যবহার করুন in.list রূপান্তরের জন্য। উপরন্তু, maq সব লোড হবে
প্রান্তিককরণ এবং মেমরিতে তাদের সাজান। আপনি যদি বেশ কিছু ইল্যান্ড একত্রিত করেন
একটি বিশাল ফাইলে আউটপুট, আপনার এটিকে ছোট ফাইলগুলিতে আলাদা করা উচিত
আপনার সমস্ত মেশিন মেমরি খাওয়া থেকে maq প্রতিরোধ করুন.
এই কমান্ডটি আসলে ম্যাকভিউতে ইল্যান্ড সারিবদ্ধতা দেখানোর লক্ষ্য। কোন মানের হিসাবে
তথ্য পাওয়া যায়, ফলস্বরূপ maq প্রান্তিককরণ ফাইল ব্যবহার করা উচিত নয়
ঐক্যমত্য জিনোটাইপ কল করতে.
export2maq ম্যাক export2maq [-1 read1len] [-2 read2len] [-a maxdist] [-n] out.map in.list
in.export
ইলুমিনার এক্সপোর্ট ফরম্যাটকে Maq-এ রূপান্তর করুন .মানচিত্র বিন্যাস রপ্তানি বিন্যাস একটি নতুন
SolexaPipeline-0.3.0 থেকে প্রান্তিককরণ বিন্যাস যা ম্যাপিংকেও গণনা করে
maq এর মত গুণাবলী। ফলাফলের ফাইলটি ঐক্যমত্য জিনোটাইপ কল করতে ব্যবহার করা যেতে পারে
এটি সঠিকভাবে করার জন্য maq-এর জন্য বেশিরভাগ প্রয়োজনীয় তথ্য উপলব্ধ।
বিকল্পগুলি:
-1 INT প্রথম পড়ার দৈর্ঘ্য [0]
-2 INT দ্বিতীয় পাঠের দৈর্ঘ্য [0]
-a INT একটি সঠিক পঠিত জোড়ার জন্য সর্বাধিক বাইরের দূরত্ব [250]
-n ফিল্টার করা পড়া ধরে রাখুন
MAQ-PERL কম্যান্ডস
ডেমো maq.pl ডেমো [-h] [-s] [-N nজোড়া] [-d outDir] in.fasta in.simudat
এর ব্যবহার প্রদর্শন করুন ম্যাক এবং এর সহচর স্ক্রিপ্ট। এই আদেশ হবে
একটি FASTA ফাইল থেকে রিড অনুকরণ করুন in.fasta. ক্রম দৈর্ঘ্য এবং গুণাবলী
দ্বারা নির্ধারিত হয় in.simudat যা থেকে উৎপন্ন হয় ম্যাক সিমুট্রেন বা হতে পারে
Maq ওয়েবসাইট থেকে ডাউনলোড করা হয়েছে। সিমুলেটেড রিডগুলি তারপর ম্যাপ করা হবে
maq.pl সহজ রান. প্রান্তিককরণ নির্ভুলতা দ্বারা মূল্যায়ন করা হয় ম্যাক simustat, দ্য
দ্বারা ঐক্যমত নির্ভুলতা ম্যাক simucns, এবং দ্বারা SNP নির্ভুলতা maq_eval.pl.
ডিফল্টরূপে, পেয়ারড এন্ড রিডগুলি সিমুলেটেড হবে এবং একটি ডিপ্লয়েড সিকোয়েন্স হবে
হ্যাপ্লয়েড প্রকারে মিউটেশন যোগ করে ইনপুট থেকে উৎপন্ন হয়। সন্নিবেশ
আকার এবং মিউটেশন হার দ্বারা নিয়ন্ত্রিত হয় ম্যাক অনুকরণ.
বিকল্পগুলি:
-h একটি ডিপ্লয়েড অনুক্রমের পরিবর্তে একটি হ্যাপ্লয়েড ক্রম অনুকরণ করুন
-s পেয়ারড-এন্ড মোডের পরিবর্তে রিডগুলি সারিবদ্ধ করতে একক-এন্ড মোড ব্যবহার করুন
-N INT সিমুলেটেড রিডের জোড়া সংখ্যা [1000000]
-d থেকে DIR আউটপুট ডিরেক্টরি [maqdemo]
লক্ষ্য করুন:
* থেকে আউটপুট ফাইল maq_eval.pl নথিভুক্ত করা হয়নি, কিন্তু আপনি করতে পারেন
এই ফাইলগুলির কিছুতে একটি ভাল অনুমান।
* এই কমান্ডটি শুধু maq স্যুটের ব্যবহার প্রদর্শন করে। বাস্তব উপর নির্ভুলতা
বিশুদ্ধ সিমুলেশন থেকে আপনি যা দেখেন তার চেয়ে ডেটা প্রায় সবসময়ই কম।
সহজ রান maq.pl সহজ রান [-1 read1Len] [-d out.dir] [-n nপড়ে] [-A 3 অ্যাডাপ্টার] [-e minDep]
[-q minCnsQ] [-p] [-2 read2Len] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]
ছোট জিনোমের জন্য পাইপলাইন বিশ্লেষণ করে। Easyrun কমান্ড বেশিরভাগ বিশ্লেষণ চালাবে
বাস্তবায়িত ম্যাক। গতানুগতিক, সহজ রান সমস্ত ইনপুট রিড সিকোয়েন্স অনুমান করে
ফাইল একক শেষ এবং স্বাধীন; কখন -p নির্দিষ্ট করা হয়েছে, দুটি পঠিত ক্রম
ফাইল প্রয়োজন, প্রতিটি প্রান্তের জন্য একটি।
বেশ কিছু ফাইল তৈরি করা হবে out.dir, যার মধ্যে নিম্নলিখিত ফাইলগুলি রয়েছে
কী আউটপুট:
cns.final.snp নিম্ন মানের সঙ্গে চূড়ান্ত SNP কল ফিল্টার আউট
cns.fq FASTQ বিন্যাসে ঐকমত্য ক্রম এবং গুণাবলী
বিকল্পগুলি:
-d থেকে DIR আউটপুট ডিরেক্টরি [easyrun]
-n INT সারিবদ্ধকরণের এক ব্যাচে পঠিত/জোড়ার সংখ্যা [2000000]
-S ছোট ইনডেলের বিভক্ত-পঠিত বিশ্লেষণ প্রয়োগ করুন (হয়তো খুব ধীর)
-N INT পুলে হ্যাপ্লোটাইপ/স্ট্রেনের সংখ্যা (>=2) [২]
-A ফাইল 3'-অ্যাডাপ্টারের জন্য ফাইল। ফাইলটিতে একটি একক লাইন ক্রম থাকা উচিত
[খালি]
-1 INT প্রথম পড়ার দৈর্ঘ্য, স্বয়ংক্রিয় জন্য 0 [0]
-e INT একটি SNP কল করার জন্য ন্যূনতম পঠিত গভীরতা প্রয়োজন (SNPfilter এর জন্য) [3]
-q INT SNP-এর জন্য সর্বনিম্ন ঐকমত্যের গুণমান cns.final.snp [30]
-p জোড়া শেষ প্রান্তিককরণ মোডে স্যুইচ করুন
-2 INT দ্বিতীয় পড়া যখন দৈর্ঘ্য -p প্রয়োগ করা হয় [0]
-a INT সর্বোচ্চ সন্নিবেশ মাপ যখন -p প্রয়োগ করা হয় [250]
নোট:
* পুল করা নমুনাগুলিতে SNP কল করার জন্য, ব্যবহারকারীদের সঠিক ` সেট করা উচিত-N' পাশাপাশি
`-E 0'।
* ইনপুট ফাইলটি maq এর বাইনারি বিন্যাস হতে পারে। maq.pl স্বয়ংক্রিয়ভাবে সনাক্ত করা হবে
ফাইল বিন্যাস।
এসএনপিফিল্টার maq.pl এসএনপিফিল্টার [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s মিনস্কোর] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp
কিছু রিড দ্বারা আচ্ছাদিত SNPগুলি বাতিল করুন (এর দ্বারা নির্দিষ্ট করা হয়েছে -d), অনেকের দ্বারা
পড়ে (দ্বারা নির্দিষ্ট করা হয়েছে -D), কাছাকাছি (দ্বারা নির্দিষ্ট করা হয়েছে -w) একটি সম্ভাব্য indel, পতনশীল
একটি সম্ভাব্য পুনরাবৃত্তিমূলক অঞ্চলে (এর দ্বারা বৈশিষ্ট্যযুক্ত -Q), অথবা নিম্নমানের
প্রতিবেশী ঘাঁটি (এর দ্বারা নির্দিষ্ট করা হয়েছে -n)। যদি maxWinSNP বা আরও বেশি SNP যে কোনোটিতে উপস্থিত হয়
densWinSize উইন্ডো, তারা একসঙ্গে ফিল্টার আউট করা হবে.
বিকল্পগুলি:
-d INT একটি SNP কল করার জন্য ন্যূনতম পঠিত গভীরতা প্রয়োজন [3]
-D INT একটি SNP কল করার জন্য সর্বাধিক পঠিত গভীরতা প্রয়োজন (<255, অন্যথায় উপেক্ষা করা হয়)
[256]
-Q INT SNP কভার করা রিডের সর্বোচ্চ ম্যাপিং মানের প্রয়োজনীয় [40]
-q INT সর্বনিম্ন ঐকমত্য গুণমান [20]
-n INT ন্যূনতম সংলগ্ন ঐকমত্য গুণমান [20]
-w INT সম্ভাব্য ইনডেলের চারপাশে উইন্ডোর আকার। SNPs যে কাছাকাছি
indels থেকে দমন করা হবে [3]
-F ফাইল সার্জারির indelpe আউটপুট [শূন্য]
-f ফাইল সার্জারির indelsoa আউটপুট [শূন্য]
-s INT একটি সো-ইন্ডেলের জন্য সর্বনিম্ন স্কোর বিবেচনা করা হবে [3]
-m INT একটি সো-ইন্ডেল জুড়ে ম্যাপ করা যেতে পারে এমন সর্বাধিক পাঠের সংখ্যা [1]
-a একক শেষ প্রান্তিককরণের জন্য বিকল্প ফিল্টার
indelpe maq.pl indelpe in.indelpe > out.indelpe
হোমোপলিমার ট্র্যাক্টের জন্য ইনডেল ছাড়া ম্যাপ করা রিডের সংখ্যা ঠিক করুন। এই
কমান্ড এর 4র্থ, 10ম এবং শেষ তিনটি কলাম পরিবর্তন করে in.indelpe এবং
ফলাফল আউটপুট out.indelpe. সংশোধন করার পরে, নিম্নলিখিত অজস্র
কমান্ড পুটেটিভ হোমোজাইগাস ইনডেল দেয়:
awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'
এবং নিম্নলিখিতগুলি হেটেরোজাইগোট দেয়:
awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'
এই যে নোট করুন indelpe কমান্ড শুধু বেশ কিছু হিউরিস্টিক নিয়ম প্রয়োগ করে।
এটি অপবিত্র হোমোপলিমার রান বা ডাই-নিউক্লিওটাইড/ট্রিপলেটের জন্য সঠিক নয়
পুনরাবৃত্তি ফলস্বরূপ, দুটি awk কমান্ড শুধুমাত্র আনুমানিক hom/het দেয়
indels
উদাহরণ
ইজিরান স্ক্রিপ্ট:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq
ইজিরানের পিছনে মূল কমান্ড:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
maq মানচিত্র part1.map ref.bfa part1.bfq;
maq মানচিত্র part2.map ref.bfa part2.bfq;
maq ম্যাপমার্জ aln.map part1.map part2.map;
maq অ্যাসেম্বল cns.cns ref.bfa aln.map;
onworks.net পরিষেবা ব্যবহার করে অনলাইনে maq ব্যবহার করুন