এটি হল hmmscan কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
hmmscan - প্রোটিন প্রোফাইল ডাটাবেসের বিরুদ্ধে প্রোটিন ক্রম(গুলি) অনুসন্ধান করুন
সাইনোপিসিস
hmmscan [বিকল্প]
বর্ণনাঃ
hmmscan প্রোটিন প্রোফাইলের সংগ্রহের বিরুদ্ধে প্রোটিন ক্রম অনুসন্ধান করতে ব্যবহৃত হয়। জন্য
প্রতিটি ক্রম মধ্যে , টার্গেট ডাটাবেস অনুসন্ধান করতে যে ক্যোয়ারী ক্রম ব্যবহার করুন
প্রোফাইলে , এবং আউটপুট সবচেয়ে তাৎপর্যপূর্ণ প্রোফাইলের র্যাঙ্ক করা তালিকা
অনুক্রমের সাথে মিলে যায়।
সার্জারির একাধিক ক্যোয়ারী ক্রম থাকতে পারে। এটি FASTA বিন্যাসে হতে পারে, বা
অন্যান্য সাধারণ সিকোয়েন্স ফাইল ফরম্যাট (জেনব্যাঙ্ক, এমবিএল, এবং ইউনিপ্রট, অন্যদের মধ্যে), অথবা
প্রান্তিককরণ ফাইল বিন্যাসে (স্টকহোম, সারিবদ্ধ ফাস্টা এবং অন্যান্য)। দেখুন --qformat পছন্দ
একটি সম্পূর্ণ তালিকার জন্য।
সার্জারির ব্যবহার করে চাপ দিতে হবে hmmpress এটি দিয়ে অনুসন্ধান করা যেতে পারে আগে hmmscan.
এটি চারটি বাইনারি ফাইল তৈরি করে, প্রত্যয় যুক্ত .h3{fimp}।
প্রশ্ন '-' (একটি ড্যাশ অক্ষর) হতে পারে, যে ক্ষেত্রে ক্যোয়ারী সিকোয়েন্স হয়
একটি থেকে পড়া একটি ফাইলের পরিবর্তে পাইপ। দ্য ক থেকে পড়া যাবে না
স্ট্রীম, কারণ এটির দ্বারা তৈরি করা সেই চারটি অক্জিলিয়ারী বাইনারি ফাইল থাকা দরকার
hmmpress.
আউটপুট বিন্যাসটি মানুষের-পাঠযোগ্য হওয়ার জন্য ডিজাইন করা হয়েছে, তবে প্রায়শই এটি এত বড় হয় যে
এটি পড়া অবাস্তব, এবং এটি পার্স করা একটি বেদনাদায়ক। দ্য --tblout এবং --ডমটব্লাউট অপশন
সহজ সারণী বিন্যাসে আউটপুট সংরক্ষণ করুন যা সংক্ষিপ্ত এবং পার্স করা সহজ। দ্য -o পছন্দ
মূল আউটপুটকে পুনঃনির্দেশিত করার অনুমতি দেয়, এটিকে /dev/null এ ফেলে দেওয়া সহ।
বিকল্প
-h সাহায্য; কমান্ড লাইন ব্যবহার এবং সমস্ত উপলব্ধ বিকল্পগুলির একটি সংক্ষিপ্ত অনুস্মারক মুদ্রণ করুন।
বিকল্প জন্য কন্ট্রোলিং আউটপুট
-o একটি ফাইলে প্রধান মানব-পাঠযোগ্য আউটপুটকে নির্দেশ করুন ডিফল্ট stdout এর পরিবর্তে।
--tblout
প্রতি-টার্গেট আউটপুট সংক্ষিপ্ত করে একটি সাধারণ ট্যাবুলার (স্পেস-ডিলিমিটেড) ফাইল সংরক্ষণ করুন,
সমজাতীয় লক্ষ্য মডেলের প্রতি একটি ডেটা লাইন পাওয়া গেছে।
--ডমটব্লাউট
প্রতি-ডোমেন আউটপুট সংক্ষিপ্ত করে একটি সাধারণ ট্যাবুলার (স্পেস-ডিলিমিটেড) ফাইল সংরক্ষণ করুন,
সমজাতীয় ডোমেন প্রতি একটি ডেটা লাইনের সাথে প্রতিটির জন্য একটি ক্যোয়ারী সিকোয়েন্সে সনাক্ত করা হয়েছে
সমজাতীয় মডেল।
--pfamtblout
একটি বিশেষ করে সংক্ষিপ্ত সারণী (স্পেস-ডিলিমিটেড) ফাইল সংরক্ষণ করুন
টার্গেট আউটপুট, প্রতি সমজাতীয় টার্গেট মডেলের জন্য একটি ডেটা লাইন পাওয়া গেছে।
--এসিসি প্রধান আউটপুটে নামের পরিবর্তে অ্যাক্সেসগুলি ব্যবহার করুন, যেখানে প্রোফাইলগুলির জন্য উপলব্ধ
এবং/অথবা ক্রম।
--নোয়ালি
প্রধান আউটপুট থেকে প্রান্তিককরণ বিভাগটি বাদ দিন। এটি ব্যাপকভাবে আউটপুট কমাতে পারে
ভলিউম।
--notextw
মূল আউটপুটে প্রতিটি লাইনের দৈর্ঘ্য সীমাহীন করুন। ডিফল্ট 120 এর সীমা
প্রতি লাইনে অক্ষর, যা টার্মিনালগুলিতে পরিষ্কারভাবে আউটপুট প্রদর্শন করতে সাহায্য করে এবং
এডিটরগুলিতে, কিন্তু টার্গেট প্রোফাইল বর্ণনা লাইন ছেঁটে ফেলতে পারে।
--textw
প্রধান আউটপুট এর লাইন দৈর্ঘ্য সীমা সেট করুন প্রতি লাইনে অক্ষর। ডিফল্ট হয়
120.
বিকল্প জন্য প্রতিবেদনের তিনটি
রিপোর্টিং থ্রেশহোল্ড নিয়ন্ত্রণ করে কোন হিটগুলি আউটপুট ফাইলগুলিতে রিপোর্ট করা হয় (প্রধান আউটপুট,
--tblout, এবং --ডমটব্লাউট).
-E প্রতি-টার্গেট আউটপুটে, <= এর ই-মান সহ লক্ষ্য প্রোফাইল রিপোর্ট করুন . দ্য
ডিফল্ট হল 10.0, যার মানে গড়ে প্রায় 10টি মিথ্যা ইতিবাচক রিপোর্ট করা হবে
প্রতি ক্যোয়ারী, যাতে আপনি গোলমালের শীর্ষ দেখতে পারেন এবং নিজের জন্য সিদ্ধান্ত নিতে পারেন যে এটি কিনা
সত্যিই গোলমাল
-T ই-মানে প্রতি-প্রোফাইল আউটপুট থ্রেশহোল্ডিংয়ের পরিবর্তে, লক্ষ্য রিপোর্ট করুন
>= এর বিট স্কোর সহ প্রোফাইল .
--গম্বুজ
প্রতি-ডোমেন আউটপুটে, লক্ষ্য প্রোফাইলগুলির জন্য যা ইতিমধ্যে প্রতি-কে সন্তুষ্ট করেছে-
প্রোফাইল রিপোর্টিং থ্রেশহোল্ড, একটি শর্তাধীন ই-মান সহ পৃথক ডোমেন রিপোর্ট করুন
এর <= . ডিফল্ট হল 10.0। একটি শর্তসাপেক্ষ ই-মান মানে প্রত্যাশিত সংখ্যা
অতিরিক্ত মিথ্যা ইতিবাচক ডোমেনগুলির ছোট অনুসন্ধান স্থানে
তুলনা যা ইতিমধ্যেই প্রতি-প্রোফাইল রিপোর্টিং থ্রেশহোল্ডকে সন্তুষ্ট করেছে (এবং এইভাবে
ইতিমধ্যে অন্তত একটি সমজাতীয় ডোমেন থাকতে হবে)।
--domT
ই-মানে প্রতি-ডোমেন আউটপুট থ্রেশহোল্ডিংয়ের পরিবর্তে, একটি সহ ডোমেন রিপোর্ট করুন
>= এর বিট স্কোর .
বিকল্প জন্য অন্তর্ভুক্ত তিনটি
অন্তর্ভুক্তি থ্রেশহোল্ড রিপোর্টিং থ্রেশহোল্ডের চেয়ে কঠোর। অন্তর্ভুক্তি থ্রেশহোল্ড নিয়ন্ত্রণ
কোন হিটগুলিকে আউটপুট সারিবদ্ধকরণে অন্তর্ভুক্ত করার জন্য যথেষ্ট নির্ভরযোগ্য বলে মনে করা হয় বা a
পরবর্তী অনুসন্ধান রাউন্ড। ভিতরে hmmscan, যার কোনো প্রান্তিককরণ আউটপুট নেই (যেমন
হুম অনুসন্ধান or phmmer) বা কোনো পুনরাবৃত্তিমূলক অনুসন্ধান পদক্ষেপ (যেমন jackhmmer), অন্তর্ভুক্তি থ্রেশহোল্ড
সামান্য প্রভাব আছে তারা শুধুমাত্র কি ডোমেইন গুরুত্বপূর্ণ (!) হিসাবে চিহ্নিত করা হয় বা প্রভাবিত করে
ডোমেইন আউটপুটে সন্দেহজনক (?)।
--incE
<= এর একটি ই-মান ব্যবহার করুন প্রতি-টার্গেট অন্তর্ভুক্তি থ্রেশহোল্ড হিসাবে। ডিফল্ট হয়
0.01, যার মানে গড়ে, প্রায় 1টি মিথ্যা ইতিবাচক আশা করা হবে প্রতিটিতে
বিভিন্ন ক্যোয়ারী সিকোয়েন্স সহ 100টি অনুসন্ধান।
--incT
অন্তর্ভুক্তি থ্রেশহোল্ড সেট করার জন্য ই-মান ব্যবহার করার পরিবর্তে, একটু ব্যবহার করুন
>= এর স্কোর প্রতি-টার্গেট অন্তর্ভুক্তি থ্রেশহোল্ড হিসাবে। এটি ব্যবহার করা অস্বাভাবিক হবে
সঙ্গে বিট স্কোর থ্রেশহোল্ড hmmscan, কারণ আপনি একটি একক স্কোর আশা করেন না
বিভিন্ন প্রোফাইলের জন্য কাজ করার থ্রেশহোল্ড; বিভিন্ন প্রোফাইল সামান্য আছে
বিভিন্ন প্রত্যাশিত স্কোর বিতরণ।
--incdomE
<= এর একটি শর্তসাপেক্ষ ই-মান ব্যবহার করুন প্রতি-ডোমেন অন্তর্ভুক্তি থ্রেশহোল্ড হিসাবে, মধ্যে
লক্ষ্যমাত্রা যা ইতিমধ্যেই সামগ্রিক প্রতি-টার্গেট অন্তর্ভুক্তি থ্রেশহোল্ডকে সন্তুষ্ট করেছে।
ডিফল্ট 0.01।
--incdomT
ই-মান ব্যবহার করার পরিবর্তে,>= এর একটি বিট স্কোর ব্যবহার করুন প্রতি-ডোমেন হিসাবে
অন্তর্ভুক্তি থ্রেশহোল্ড সঙ্গে --incT উপরে, একক বিট ব্যবহার করা অস্বাভাবিক হবে
স্কোর থ্রেশহোল্ড মধ্যে hmmscan.
বিকল্প জন্য মডেল-নির্দিষ্ট স্কোর থ্রেসহোল্ডিং
কিউরেটেড প্রোফাইল ডাটাবেস প্রতিটি প্রোফাইলের জন্য নির্দিষ্ট বিট স্কোর থ্রেশহোল্ড সংজ্ঞায়িত করতে পারে,
শুধুমাত্র পরিসংখ্যানগত তাত্পর্যের উপর ভিত্তি করে যেকোন থ্রেশহোল্ডিংকে ছাড়িয়ে যাচ্ছে।
এই বিকল্পগুলি ব্যবহার করার জন্য, প্রোফাইলে অবশ্যই উপযুক্ত (GA, TC, এবং/অথবা NC) থাকতে হবে
ঐচ্ছিক স্কোর থ্রেশহোল্ড টীকা; এই দ্বারা কুড়ান হয় hmmbuild স্টকহোম ফরম্যাট থেকে
প্রান্তিককরণ ফাইল। প্রতিটি থ্রেশহোল্ডিং বিকল্পের দুটি স্কোর রয়েছে: প্রতি-ক্রম থ্রেশহোল্ড
এবং প্রতি-ডোমেন থ্রেশহোল্ড এগুলি যেন কাজ করে -T --incT --domT
--incdomT প্রতিটি মডেলের কিউরেটেড থ্রেশহোল্ড ব্যবহার করে বিশেষভাবে প্রয়োগ করা হয়েছে।
--কাট_গা
পার-সিকোয়েন্স (GA1) এবং প্রতি- সেট করতে মডেলে GA (জড়ো করা) বিট স্কোর ব্যবহার করুন
ডোমেইন (GA2) রিপোর্টিং এবং অন্তর্ভুক্তি থ্রেশহোল্ড। GA থ্রেশহোল্ড সাধারণত হয়
পারিবারিক সদস্যতা সংজ্ঞায়িত নির্ভরযোগ্য কিউরেটেড থ্রেশহোল্ড হিসাবে বিবেচিত; জন্য
উদাহরণস্বরূপ, Pfam-এ, এই থ্রেশহোল্ডগুলি Pfam Full-এ কী অন্তর্ভুক্ত করা হয় তা সংজ্ঞায়িত করে
Pfam বীজ মডেলের সাথে অনুসন্ধানের উপর ভিত্তি করে প্রান্তিককরণ।
--cut_nc
প্রতি-ক্রম সেট করতে মডেলে NC (শব্দ কাটঅফ) বিট স্কোর থ্রেশহোল্ড ব্যবহার করুন
(NC1) এবং প্রতি-ডোমেন (NC2) রিপোর্টিং এবং অন্তর্ভুক্তি থ্রেশহোল্ড। NC থ্রেশহোল্ড হয়
সাধারণত সর্বাধিক স্কোরিং পরিচিত মিথ্যা ইতিবাচক স্কোর হিসাবে বিবেচিত হয়।
--cut_tc
প্রতি-ক্রম সেট করতে মডেলে NC (বিশ্বস্ত কাটঅফ) বিট স্কোর থ্রেশহোল্ড ব্যবহার করুন
(TC1) এবং প্রতি-ডোমেন (TC2) রিপোর্টিং এবং অন্তর্ভুক্তি থ্রেশহোল্ড। TC থ্রেশহোল্ড হয়
সাধারণত সর্বনিম্ন স্কোরিং স্কোর হিসাবে বিবেচিত সত্য ইতিবাচক যে
সব পরিচিত মিথ্যা ইতিবাচক উপরে.
নিয়ন্ত্রণ OF দ্য ত্বরণ পাইপলাইন
HMMER3 অনুসন্ধানগুলি একটি তিন-পদক্ষেপ ফিল্টার পাইপলাইনে ত্বরান্বিত হয়: MSV ফিল্টার,
ভিটারবি ফিল্টার এবং ফরোয়ার্ড ফিল্টার। প্রথম ফিল্টারটি দ্রুততম এবং সর্বাধিক
আনুমানিক; শেষটি সম্পূর্ণ ফরোয়ার্ড স্কোরিং অ্যালগরিদম। একটি পক্ষপাত ফিল্টার আছে
MSV এবং Viterbi এর মধ্যে ধাপ। লক্ষ্যগুলি যা ত্বরণ পাইপলাইনের সমস্ত ধাপ অতিক্রম করে৷
তারপর পোস্টপ্রসেসিং - ডোমেন শনাক্তকরণ এবং ব্যবহার করে স্কোরিং করা হয়
ফরোয়ার্ড/ব্যাকওয়ার্ড অ্যালগরিদম।
ফিল্টার থ্রেশহোল্ড পরিবর্তন করা শুধুমাত্র বিবেচনা থেকে লক্ষ্যগুলি সরিয়ে দেয় বা অন্তর্ভুক্ত করে; পরিবর্তন
ফিল্টার থ্রেশহোল্ডগুলি বিট স্কোর, ই-মান, বা প্রান্তিককরণগুলিকে পরিবর্তন করে না, যার সবগুলিই
শুধুমাত্র পোস্টপ্রসেসিং এ নির্ধারিত।
-- সর্বোচ্চ বায়াস ফিল্টার সহ সমস্ত ফিল্টার বন্ধ করুন এবং সম্পূর্ণ ফরওয়ার্ড/ব্যাকওয়ার্ড চালান
প্রতিটি লক্ষ্যে পোস্টপ্রসেসিং। এটি কিছুটা সংবেদনশীলতা বাড়ায়
গতিতে খরচ।
--F1
MSV ফিল্টার ধাপের জন্য P-মান থ্রেশহোল্ড সেট করুন। ডিফল্ট হল 0.02, মানে
যে মোটামুটি 2% সর্বোচ্চ স্কোরিং nonhomologous লক্ষ্য পাস হতে প্রত্যাশিত
ফিল্টার।
--F2
ভিটারবি ফিল্টার ধাপের জন্য P-মান থ্রেশহোল্ড সেট করুন। ডিফল্ট হল 0.001।
--F3
ফরোয়ার্ড ফিল্টার ধাপের জন্য P-মান থ্রেশহোল্ড সেট করুন। ডিফল্ট হল 1e-5।
--নোবিয়াস
বায়াস ফিল্টার বন্ধ করুন। এটি কিছুটা সংবেদনশীলতা বাড়ায়, তবে এ আসতে পারে
গতিতে উচ্চ খরচ, বিশেষ করে যদি ক্যোয়ারীতে পক্ষপাতমূলক অবশিষ্টাংশের গঠন থাকে (যেমন
একটি পুনরাবৃত্ত ক্রম অঞ্চল, অথবা যদি এটি একটি ঝিল্লি প্রোটিন হয় যার বড় অঞ্চল রয়েছে
হাইড্রোফোবিসিটি)। বায়াস ফিল্টার ছাড়া, অনেকগুলো সিকোয়েন্স ফিল্টারটি পাস করতে পারে
পক্ষপাতদুষ্ট প্রশ্নগুলির সাথে, যা প্রত্যাশিত কর্মক্ষমতার চেয়ে ধীর হয়ে যায়
গণনামূলকভাবে নিবিড় ফরোয়ার্ড/ব্যাকওয়ার্ড অ্যালগরিদম একটি অস্বাভাবিকভাবে ভারী
ভার.
অন্যান্য বিকল্প
--nonull2
পক্ষপাতদুষ্ট রচনার জন্য null2 স্কোর সংশোধন বন্ধ করুন।
-Z আপনার অনুসন্ধানে লক্ষ্যের মোট সংখ্যা নিশ্চিত করুন , উদ্দেশ্যে
লক্ষ্যের প্রকৃত সংখ্যার পরিবর্তে প্রতি-ক্রম ই-মান গণনার
দেখা
--domZ
আপনার অনুসন্ধানে লক্ষ্যের মোট সংখ্যা নিশ্চিত করুন , উদ্দেশ্যে
প্রতি-ডোমেন শর্তসাপেক্ষ ই-মান গণনার, লক্ষ্য সংখ্যার পরিবর্তে
যে রিপোর্টিং থ্রেশহোল্ড পাস.
--বীজ
এলোমেলো সংখ্যা বীজ সেট করুন . পোস্টপ্রসেসিংয়ের কিছু পদক্ষেপের জন্য মন্টের প্রয়োজন
কার্লো সিমুলেশন। ডিফল্ট একটি স্থির বীজ ব্যবহার করা হয় (42), যাতে ফলাফল হয়
ঠিক পুনরুৎপাদনযোগ্য। অন্য যেকোনো ধনাত্মক পূর্ণসংখ্যা ভিন্ন দেবে (কিন্তু এছাড়াও
প্রজননযোগ্য) ফলাফল। 0 এর পছন্দ একটি ইচ্ছামত নির্বাচিত বীজ ব্যবহার করে।
--qformat
নিশ্চিত করুন যে ক্যোয়ারী সিকোয়েন্স ফাইল ফরম্যাটে আছে . গৃহীত বিন্যাস অন্তর্ভুক্ত
ফাস্ট, embl, genbank, ddbj, ইউনিপ্রট, স্টকহোম-এর, pfam, a2m, এবং AFA.
--সিপিইউ
সমান্তরাল কর্মী থ্রেডের সংখ্যা সেট করুন . ডিফল্টরূপে, HMMER এটি সেট করে
এটি আপনার মেশিনে সনাক্ত করা CPU কোরের সংখ্যা - অর্থাৎ, এটি সর্বাধিক করার চেষ্টা করে
আপনার উপলব্ধ প্রসেসর কোর ব্যবহার. বিন্যাস সংখ্যার চেয়ে বেশি
উপলব্ধ কোর সামান্য, যদি কোন মান, কিন্তু আপনি এটি কিছু সেট করতে চাইতে পারেন
কম আপনি একটি পরিবেশ পরিবর্তনশীল সেট করে এই সংখ্যা নিয়ন্ত্রণ করতে পারেন,
HMMER_NCPU.
এই বিকল্পটি শুধুমাত্র তখনই পাওয়া যায় যদি HMMER POSIX থ্রেড সমর্থন সহ কম্পাইল করা হয়।
এটি ডিফল্ট, তবে এটি আপনার সাইট বা মেশিনের জন্য বন্ধ হয়ে থাকতে পারে
কিছু কারণ.
--স্টল
MPI মাস্টার/কর্মী সংস্করণ ডিবাগ করার জন্য: শুরু করার পরে বিরতি, সক্রিয় করতে
চলমান মাস্টার এবং কর্মী(গুলি) প্রক্রিয়াগুলিতে ডিবাগার সংযুক্ত করতে বিকাশকারী৷ পাঠান
বিরতি ছেড়ে দিতে SIGCONT সংকেত। (জিডিবির অধীনে: (GDB) সংকেত SignCont)
(শুধুমাত্র উপলভ্য যদি ঐচ্ছিক MPI সমর্থন কম্পাইল-টাইমে সক্ষম করা হয়।)
--এমপিআই ব্যবহার করে MPI মাস্টার/কর্মী মোডে চালান mpirun.
(শুধুমাত্র উপলভ্য যদি ঐচ্ছিক MPI সমর্থন কম্পাইল-টাইমে সক্ষম করা হয়।)
onworks.net পরিষেবা ব্যবহার করে hmmscan অনলাইন ব্যবহার করুন