cdhit-2d - ക്ലൗഡിൽ ഓൺലൈനിൽ

Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാൻ കഴിയുന്ന cdhit-2d കമാൻഡ് ഇതാണ്.

പട്ടിക:

NAME


cdhit-2d - db1 അല്ലെങ്കിൽ db2 ഫോർമാറ്റിൽ വേഗത്തിൽ ഗ്രൂപ്പ് സീക്വൻസുകൾ

സിനോപ്സിസ്


cdit-2d [ഓപ്ഷനുകൾ]

വിവരണം


====== CD-HIT പതിപ്പ് 4.6 (23 ജനുവരി 2016-ന് നിർമ്മിച്ചത്) ======

ഓപ്ഷനുകൾ

-i ഫാസ്റ്റ ഫോർമാറ്റിൽ db1-നുള്ള ഫയൽനാമം നൽകേണ്ടതുണ്ട്

-i2 ഫാസ്റ്റ ഫോർമാറ്റിൽ db2-നുള്ള ഫയൽനാമം നൽകേണ്ടതുണ്ട്

-o ഔട്ട്‌പുട്ട് ഫയലിന്റെ പേര്, ആവശ്യമാണ്

-c സീക്വൻസ് ഐഡന്റിറ്റി ത്രെഷോൾഡ്, ഡിഫോൾട്ട് 0.9 ഇതാണ് ഡിഫോൾട്ട് സിഡി-ഹിറ്റിന്റെ "ഗ്ലോബൽ"
സീക്വൻസ് ഐഡന്റിറ്റി" ഇതായി കണക്കാക്കുന്നു: വിന്യാസത്തിലുള്ള സമാന അമിനോ ആസിഡുകളുടെ എണ്ണം
ചെറിയ ശ്രേണിയുടെ മുഴുവൻ നീളം കൊണ്ട് ഹരിക്കുക

-G ഗ്ലോബൽ സീക്വൻസ് ഐഡന്റിറ്റി ഉപയോഗിക്കുക, 1 ആയി സജ്ജീകരിച്ചാൽ ഡിഫോൾട്ട് 0, തുടർന്ന് ലോക്കൽ സീക്വൻസ് ഉപയോഗിക്കുക
ഐഡന്റിറ്റി, കണക്കാക്കുന്നത് : വിന്യാസത്തിലുള്ള ഒരേ അമിനോ ആസിഡുകളുടെ എണ്ണം കൊണ്ട് ഹരിക്കുന്നു
വിന്യാസത്തിന്റെ ദൈർഘ്യം കുറിപ്പ്!!! ഉപയോഗിക്കരുത് -G നിങ്ങൾ വിന്യാസം ഉപയോഗിക്കുന്നില്ലെങ്കിൽ 0
കവറേജ് നിയന്ത്രണങ്ങൾ ഓപ്ഷനുകൾ കാണുക -അൽ, -അൽ, -എഎസ്, -എ.എസ്

-b വിന്യാസത്തിന്റെ ബാൻഡ്_വിഡ്ത്ത്, ഡിഫോൾട്ട് 20

-M പ്രോഗ്രാമിനുള്ള മെമ്മറി പരിധി (MB-യിൽ), ഡിഫോൾട്ട് 800; പരിധിയില്ലാത്തതിന് 0;

-T ത്രെഡുകളുടെ എണ്ണം, സ്ഥിരസ്ഥിതി 1; 0 ഉപയോഗിച്ച്, എല്ലാ CPU-കളും ഉപയോഗിക്കും

-n word_length, default 5, അത് തിരഞ്ഞെടുക്കുന്നതിനുള്ള ഉപയോക്തൃ ഗൈഡ് കാണുക

-l ത്രോ_എവേ_സീക്വൻസുകളുടെ ദൈർഘ്യം, ഡിഫോൾട്ട് 10

-t ആവർത്തനത്തിനുള്ള സഹിഷ്ണുത, സ്ഥിരസ്ഥിതി 2

-d .clstr ഫയലിലെ വിവരണത്തിന്റെ ദൈർഘ്യം, ഡിഫോൾട്ട് 20 0 ആയി സജ്ജീകരിച്ചാൽ, അത് ഫാസ്റ്റ എടുക്കും
നിർവചിക്കുകയും ആദ്യ സ്ഥലത്ത് നിർത്തുകയും ചെയ്യുന്നു

-s ദൈർഘ്യ വ്യത്യാസം കട്ട്ഓഫ്, ഡിഫോൾട്ട് 0.0 0.9 ആയി സജ്ജീകരിച്ചാൽ, ചെറിയ സീക്വൻസുകൾ ആവശ്യമാണ്
ക്ലസ്റ്ററിന്റെ പ്രതിനിധിയുടെ 90% ദൈർഘ്യമെങ്കിലും ഉണ്ടായിരിക്കണം

-S അമിനോ ആസിഡിലെ ദൈർഘ്യ വ്യത്യാസം കട്ട്ഓഫ്, 999999 ആയി സജ്ജീകരിച്ചാൽ ഡിഫോൾട്ട് 60, ദൈർഘ്യം
ഷോർട്ട് സീക്വൻസുകളും ക്ലസ്റ്ററിന്റെ പ്രതിനിധിയും തമ്മിലുള്ള വ്യത്യാസം
60-ൽ കൂടരുത്

-സെ2 db1-നുള്ള ദൈർഘ്യ വ്യത്യാസം കട്ട്ഓഫ്, ഡിഫോൾട്ട് 1.0 ഡിഫോൾട്ട്, seqs in db1 >= seqs in
2 ആയി സജ്ജീകരിച്ചാൽ അതേ ക്ലസ്റ്ററിലെ db0.9, db1 ലെ seqs വെറും >= 90% seqs db2 ൽ

-എസ് 2 ദൈർഘ്യ വ്യത്യാസം കട്ട്ഓഫ്, ഡിഫോൾട്ടായി ഡിഫോൾട്ട് 0, db1 ലെ seqs >= seqs in db2 ൽ a
അതേ ക്ലസ്റ്റർ 60 ആയി സജ്ജീകരിച്ചാൽ, db2 ലെ seqs db60 ലെ seqs-നേക്കാൾ 1aa ദൈർഘ്യമേറിയതാണ്

-അൽ ദൈർഘ്യമേറിയ ക്രമത്തിനുള്ള വിന്യാസ കവറേജ്, ഡിഫോൾട്ട് 0.0 0.9 ആയി സജ്ജമാക്കിയാൽ,
വിന്യാസം ക്രമത്തിന്റെ 90% ഉൾക്കൊള്ളണം

-അൽ ദൈർഘ്യമേറിയ ക്രമത്തിനുള്ള അലൈൻമെന്റ് കവറേജ് നിയന്ത്രണം, 99999999 ആയി സജ്ജീകരിച്ചാൽ ഡിഫോൾട്ട് 60,
ക്രമത്തിന്റെ ദൈർഘ്യം 400 ആണ്, അപ്പോൾ വിന്യാസം >= 340 (400-60) ആയിരിക്കണം
അവശിഷ്ടങ്ങൾ

-എഎസ് ചെറിയ ക്രമത്തിനുള്ള അലൈൻമെന്റ് കവറേജ്, ഡിഫോൾട്ട് 0.0 0.9 ആയി സജ്ജീകരിച്ചാൽ,
വിന്യാസം ക്രമത്തിന്റെ 90% ഉൾക്കൊള്ളണം

-എ.എസ് ചെറിയ ക്രമത്തിനുള്ള അലൈൻമെന്റ് കവറേജ് നിയന്ത്രണം, 99999999 ആയി സജ്ജീകരിച്ചാൽ ഡിഫോൾട്ട് 60,
ക്രമത്തിന്റെ ദൈർഘ്യം 400 ആണ്, അപ്പോൾ വിന്യാസം >= 340 (400-60) ആയിരിക്കണം
അവശിഷ്ടങ്ങൾ

-A രണ്ട് സീക്വൻസുകൾക്കുമുള്ള ഏറ്റവും കുറഞ്ഞ അലൈൻമെന്റ് കവറേജ് നിയന്ത്രണം, ഡിഫോൾട്ട് 0 അലൈൻമെന്റ് നിർബന്ധമാണ്
കവർ >= രണ്ട് സീക്വൻസുകൾക്കും ഈ മൂല്യം

-uL ദൈർഘ്യമേറിയ ശ്രേണിയിൽ പരമാവധി പൊരുത്തപ്പെടാത്ത ശതമാനം, 1.0 ആയി സജ്ജീകരിച്ചാൽ ഡിഫോൾട്ട് 0.1,
സമാനതകളില്ലാത്ത പ്രദേശം (ലീഡിംഗ്, ടെയ്‌ലിംഗ് വിടവുകൾ ഒഴികെ) 10% ൽ കൂടുതലാകരുത്
ക്രമത്തിന്റെ

-യുഎസ് ഹ്രസ്വമായ ശ്രേണിയുടെ പരമാവധി സമാനതകളില്ലാത്ത ശതമാനം, 1.0 ആയി സജ്ജമാക്കിയാൽ ഡിഫോൾട്ട് 0.1,
സമാനതകളില്ലാത്ത പ്രദേശം (ലീഡിംഗ്, ടെയ്‌ലിംഗ് വിടവുകൾ ഒഴികെ) 10% ൽ കൂടുതലാകരുത്
ക്രമത്തിന്റെ

-U പരമാവധി പൊരുത്തപ്പെടാത്ത ദൈർഘ്യം, സ്ഥിരസ്ഥിതി 99999999 10 ആയി സജ്ജീകരിച്ചാൽ, പൊരുത്തപ്പെടാത്ത മേഖല
(ലീഡിംഗ്, ടെയ്‌ലിംഗ് വിടവുകൾ ഒഴികെ) 10 ബേസിൽ കൂടരുത്

-B 1 അല്ലെങ്കിൽ 0, ഡിഫോൾട്ട് 0, ഡിഫോൾട്ടായി, 1 ആയി സജ്ജീകരിച്ചാൽ സീക്വൻസുകൾ RAM-ൽ സംഭരിക്കും, ക്രമം
ഹാർഡ് ഡ്രൈവിൽ സൂക്ഷിച്ചിരിക്കുന്നു, അത് ഉപയോഗിക്കാൻ ശുപാർശ ചെയ്യുന്നു -B വലിയ ഡാറ്റാബേസുകൾക്ക് 1

-p 1 അല്ലെങ്കിൽ 0, ഡിഫോൾട്ട് 0 1 ആയി സജ്ജമാക്കിയാൽ, .clstr ഫയലിൽ പ്രിന്റ് അലൈൻമെന്റ് ഓവർലാപ്പ്

-g 1 അല്ലെങ്കിൽ 0, സിഡി-ഹിറ്റിന്റെ ഡിഫോൾട്ട് അൽഗോരിതം വഴി ഡിഫോൾട്ട് 0, ഒരു സീക്വൻസ് ക്ലസ്റ്റർ ചെയ്തിരിക്കുന്നു
ത്രെഷോൾഡ് (ഫാസ്റ്റ് ക്ലസ്റ്റർ) പാലിക്കുന്ന ആദ്യ ക്ലസ്റ്റർ. 1 ആയി സജ്ജീകരിച്ചാൽ, പ്രോഗ്രാം ചെയ്യും
ത്രെഷോൾഡ് (കൃത്യമായതും എന്നാൽ മന്ദഗതിയിലുള്ളതും) പാലിക്കുന്ന ഏറ്റവും സമാനമായ ക്ലസ്റ്ററിലേക്ക് അതിനെ ക്ലസ്റ്റർ ചെയ്യുക
മോഡ്) എന്നാൽ 1 അല്ലെങ്കിൽ 0 അന്തിമ ക്ലസ്റ്ററുകളുടെ പ്രതിനിധികളെ മാറ്റില്ല

-ബാക്ക് ബാക്കപ്പ് ക്ലസ്റ്റർ ഫയൽ എഴുതുക (1 അല്ലെങ്കിൽ 0, ഡിഫോൾട്ട് 0)

-h ഈ സഹായം അച്ചടിക്കുക

ചോദ്യങ്ങൾ, ബഗുകൾ, വെയ്‌ഷോംഗ് ലീ എന്ന വിലാസത്തിൽ ബന്ധപ്പെടുക liwz@sdsc.edu

നിങ്ങൾക്ക് സിഡി-ഹിറ്റ് ഉപയോഗപ്രദമെന്ന് തോന്നുകയാണെങ്കിൽ, ദയവായി ഉദ്ധരിക്കുക:

"വലിയ പ്രോട്ടീന്റെ വലിപ്പം കുറയ്ക്കുന്നതിന് ഉയർന്ന ഹോമോലോഗസ് സീക്വൻസുകളുടെ ക്ലസ്റ്ററിംഗ്
ഡാറ്റാബേസ്", വെയ്‌ഷോങ് ലി, ലൂക്കാസ് ജറോസ്‌വെസ്‌കി & ആദം ഗോഡ്‌സിക്. ബയോഇൻഫോർമാറ്റിക്‌സ്, (2001)
17:282-283 "സിഡി-ഹിറ്റ്: വലിയ സെറ്റുകളുടെ ക്ലസ്റ്ററിങ്ങിനും താരതമ്യം ചെയ്യുന്നതിനുമുള്ള ഒരു ഫാസ്റ്റ് പ്രോഗ്രാം
പ്രോട്ടീൻ അല്ലെങ്കിൽ ന്യൂക്ലിയോടൈഡ് സീക്വൻസസ്", വെയ്‌ഷോംഗ് ലി & ആദം ഗോഡ്‌സിക്. ബയോ ഇൻഫോർമാറ്റിക്സ്, (2006)
XXX: 22- നം

onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് cdhit-2d ഓൺലൈനായി ഉപയോഗിക്കുക



ഏറ്റവും പുതിയ ലിനക്സ്, വിൻഡോസ് ഓൺലൈൻ പ്രോഗ്രാമുകൾ