এটি হল tigr-long-orfs কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
long-orfs — icm-তে সম্ভাব্যতা মডেল ব্যবহার করে জিনোম-ফাইলে সম্ভাব্য জিন খুঁজুন/স্কোর করুন-
ফাইল
সাইনোপিসিস
tigr-long-orgs [জিনোম-ফাইল বিকল্প]
বর্ণনাঃ
প্রোগ্রাম long-orfs একটি সিকোয়েন্স ফাইল নেয় (FASTA ফরম্যাটে) এবং সমস্ত লম্বা একটি তালিকা আউটপুট করে
এতে "সম্ভাব্য জিন" যা খুব বেশি ওভারল্যাপ করে না। "সম্ভাব্য জিন" দ্বারা আমি বলতে চাচ্ছি
একটি orf এর অংশ প্রথম স্টার্ট কোডন থেকে শেষে স্টপ কোডন পর্যন্ত।
আউটপুটের প্রথম কয়েকটি লাইন প্রোগ্রামের বিভিন্ন প্যারামিটারের সেটিংস নির্দিষ্ট করে:
ন্যূনতম জিনের দৈর্ঘ্য হল একটি জিন হিসাবে বিবেচিত ক্ষুদ্রতম খণ্ডটির দৈর্ঘ্য। দ্য
দৈর্ঘ্য পরিমাপ করা হয় স্টার্ট কোডনের প্রথম বেস থেকে শেষ বেস পর্যন্ত *এর আগে*
কোডন বন্ধ করুন। -g বিকল্পের সাথে প্রোগ্রাম চালানোর সময় এই মানটি নির্দিষ্ট করা যেতে পারে।
ডিফল্টরূপে, প্রোগ্রাম এখন (এপ্রিল 2003) এর জন্য একটি সর্বোত্তম দৈর্ঘ্য গণনা করবে
প্যারামিটার, যেখানে "অনুকূল" হল সেই মান যা সর্বাধিক সংখ্যক দীর্ঘ ORF তৈরি করে,
যার ফলে প্রশিক্ষণের জন্য ব্যবহৃত ডেটার পরিমাণ বৃদ্ধি পায়।
ন্যূনতম ওভারল্যাপ দৈর্ঘ্য হল 2 টি জিনের মধ্যে ওভারল্যাপ বেসের সংখ্যার উপর একটি নিম্ন আবদ্ধ
এটি একটি সমস্যা হিসাবে বিবেচিত হয়। এর চেয়ে ছোট ওভারল্যাপ উপেক্ষা করা হয়।
ন্যূনতম ওভারল্যাপ শতাংশ হল বেস ওভারল্যাপের সংখ্যার উপর আরেকটি নিম্ন আবদ্ধ
একটি সমস্যা হিসাবে বিবেচিত। *উভয়* জিনের এই শতাংশের চেয়ে ছোট ওভারল্যাপগুলি উপেক্ষা করা হয়।
আউটপুটের পরবর্তী অংশটি সম্ভাব্য জিনের একটি তালিকা:
কলাম 1 রেফারেন্সের উদ্দেশ্যে একটি আইডি নম্বর। এটা ক্রমানুসারে শুরু বরাদ্দ করা হয়
1 থেকে সমস্ত দীর্ঘ সম্ভাব্য জিন সহ। যদি ওভারল্যাপিং জিনগুলি বাদ দেওয়া হয়, তবে এর মধ্যে ফাঁকগুলি
সংখ্যা ঘটবে। আইডি উপসর্গটি ধ্রুবক ID_PREFIX-এ নির্দিষ্ট করা হয়েছে।
কলাম 2 হল orf-এ প্রথম স্টার্ট কোডনের প্রথম বেসের অবস্থান। বর্তমানে
আমি স্টার্ট কোডন হিসাবে atg, এবং gtg ব্যবহার করি। এটি সহজেই Is_Start () ফাংশনে পরিবর্তন করা হয়।
কলাম 3 হল স্টপ কোডনের *আগে* শেষ বেসের অবস্থান। স্টপ কোডন হল taa,
ট্যাগ, এবং tga. মনে রাখবেন যে বিপরীত রিডিং ফ্রেমে orf-এর জন্য তাদের শুরুর অবস্থান রয়েছে
শেষ অবস্থানের চেয়ে উচ্চতর। যে ক্রমে orfs তালিকাভুক্ত করা হয়েছে তা ক্রমবর্ধমান ক্রমে রয়েছে
সর্বোচ্চ {OrfStart, End} দ্বারা, অর্থাৎ, orf-এ সর্বোচ্চ সংখ্যাযুক্ত অবস্থান, orfs ব্যতীত
যে ক্রম শেষ "চারপাশে মোড়ানো".
যখন আইডি নম্বর সহ দুটি জিন কমপক্ষে একটি পর্যাপ্ত পরিমাণ দ্বারা ওভারল্যাপ হয় (যেমন দ্বারা নির্ধারিত হয়
Min_Olap এবং Min_Olap_Percent ), এগুলি বাদ দেওয়া হয় এবং আউটপুটে প্রদর্শিত হয় না।
প্রোগ্রামের চূড়ান্ত আউটপুট (স্ট্যান্ডার্ড ত্রুটি ফাইলে পাঠানো হয়েছে যাতে এটি দেখানো হয় না
যখন আউটপুট একটি ফাইলে পুনঃনির্দেশিত হয়) পাওয়া যায় দীর্ঘতম orf এর দৈর্ঘ্য।
বিভিন্ন স্টার্ট এবং স্টপ কোডন নির্দিষ্ট করা:
স্টার্ট এবং স্টপ কোডনগুলির বিভিন্ন সেট নির্দিষ্ট করতে, gene.h ফাইলটি পরিবর্তন করুন।
বিশেষ করে, ফাংশন:
Is_Forward_Start Is_Reverse_Start Is_Start Is_Forward_Stop is_Reverse_Stop
ইস_স্টপ
স্টার্ট এবং স্টপ কোডনগুলির জন্য কী ব্যবহার করা হয় তা নির্ধারণ করতে ব্যবহৃত হয়।
Is_Start এবং Is_Stop কোন প্যাটার্ন ব্যবহার করা হয় তা নির্দিষ্ট করতে সহজ স্ট্রিং তুলনা করে।
একটি নতুন প্যাটার্ন যোগ করতে, শুধু এটির জন্য তুলনা যোগ করুন। একটি প্যাটার্ন সরাতে, মন্তব্য আউট বা
এর জন্য তুলনা মুছে ফেলুন।
অন্য চারটি ফাংশন স্টার্ট এবং স্টপ প্যাটার্ন নির্ধারণ করতে কিছুটা তুলনা ব্যবহার করে। তারা
একটি কোডনকে 12-বিট প্যাটার্ন হিসাবে উপস্থাপন করুন, প্রতিটি বেসের জন্য 4 বিট সহ, প্রতিটির জন্য একটি বিট
ঘাঁটির সম্ভাব্য মান, T, G, C বা A। এইভাবে বিট প্যাটার্ন 0010 0101 1100
ভিত্তি প্যাটার্ন প্রতিনিধিত্ব করে [C] [A বা G] [G বা T]। বিট অপারেশন করে (& | ~) এবং
তুলনা, অস্পষ্ট পাঠ জড়িত আরো জটিল নিদর্শন পরীক্ষা করা যেতে পারে
দক্ষতার সাথে বর্তমান কোড হিসাবে সহজ নিদর্শন পরীক্ষা করা যেতে পারে.
উদাহরণস্বরূপ, CAT-এর একটি অতিরিক্ত স্টার্ট কোডন সন্নিবেশ করার জন্য 3টি পরিবর্তন প্রয়োজন: 1. লাইন ||
(Codon & 0x218) == Is_Forward_Start-এ কোডন ঢোকানো উচিত, যেহেতু 0x218 = 0010
0001 1000 CAT প্রতিনিধিত্ব করে। 2. লাইন || (Codon & 0x184) == কোডন ঢুকিয়ে দিতে হবে
Is_Reverse_Start, যেহেতু 0x184 = 0001 1000 0100 ATG প্রতিনিধিত্ব করে, যা বিপরীত-
CAT এর পরিপূরক। বিকল্পভাবে, #define ধ্রুবক ATG_MASK ব্যবহার করা যেতে পারে। 3. দ
লাইন || strncmp (S, "cat", 3) == 0 Is_Start এ ঢোকাতে হবে।
বিকল্প
-g n ন্যূনতম জিনের দৈর্ঘ্য n এ সেট করুন। ডিফল্ট হল একটি সর্বোত্তম মান গণনা করা
স্বয়ংক্রিয়ভাবে. আপনি কি করছেন তা না জানলে এটি পরিবর্তন করবেন না।
-l জিনোমকে রৈখিক হিসাবে বিবেচনা করুন (বৃত্তাকার নয়), অর্থাৎ, জিনগুলিকে "মোড়ানোর অনুমতি দেবেন না
চারপাশে" জিনোমের শেষ
. ডিফল্ট আচরণ হল জিনোমকে বৃত্তাকার হিসাবে বিবেচনা করা।
-o n সর্বোচ্চ ওভারল্যাপ দৈর্ঘ্য n এ সেট করুন। এর চেয়ে ছোট ওভারল্যাপ অনুমোদিত।
(ডিফল্ট 0 bp।)
-p n সর্বোচ্চ ওভারল্যাপ শতাংশ n% এ সেট করুন। এই শতাংশের চেয়ে ছোট ওভারল্যাপ
*উভয়* স্ট্রিং উপেক্ষা করা হয়। (ডিফল্ট 10%।)
onworks.net পরিষেবা ব্যবহার করে অনলাইনে tigr-long-orfs ব্যবহার করুন