ഇംഗ്ലീഷ്ഫ്രഞ്ച്സ്പാനിഷ്

Ad


OnWorks ഫെവിക്കോൺ

ഓട്ടോക്ലാസ് - ക്ലൗഡിൽ ഓൺലൈനിൽ

ഉബുണ്ടു ഓൺലൈൻ, ഫെഡോറ ഓൺലൈൻ, വിൻഡോസ് ഓൺലൈൻ എമുലേറ്റർ അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിവയിലൂടെ OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് പ്രൊവൈഡറിൽ ഓട്ടോക്ലാസ് പ്രവർത്തിപ്പിക്കുക

Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാവുന്ന ഓട്ടോക്ലാസ് കമാൻഡ് ആണിത്.

പട്ടിക:

NAME


ഓട്ടോക്ലാസ് - ഡാറ്റയിലെ ക്ലാസുകൾ സ്വയമേവ കണ്ടെത്തുക

സിനോപ്സിസ്


ഓട്ടോക്ലാസ് -തിരയൽ ഡാറ്റ_ഫയൽ തലക്കെട്ട്_ ഫയൽ model_file s_param_file
ഓട്ടോക്ലാസ് -റിപ്പോർട്ട് ഫലങ്ങൾ_ഫയൽ തിരയൽ_ഫയൽ r_params_file
ഓട്ടോക്ലാസ് - പ്രവചിക്കുക ഫലങ്ങൾ_ഫയൽ തിരയൽ_ഫയൽ ഫലങ്ങൾ_ഫയൽ

വിവരണം


ഓട്ടോക്ലാസ് ഡാറ്റയിലെ ക്ലാസുകൾ സ്വയമേവ കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിക്കുന്നു (ചിലപ്പോൾ വിളിക്കുന്നു
ക്ലസ്റ്ററിംഗ് അല്ലെങ്കിൽ മേൽനോട്ടമില്ലാത്ത പഠനം), ക്ലാസ്സിന്റെ ജനറേഷനിൽ നിന്ന് വ്യത്യസ്തമായി
ലേബൽ ചെയ്ത ഉദാഹരണങ്ങളിൽ നിന്നുള്ള വിവരണങ്ങൾ (സൂപ്പർവൈസ്ഡ് ലേണിംഗ് എന്ന് വിളിക്കുന്നു). എന്ന കണ്ടെത്തലാണ് ഇത് ലക്ഷ്യമിടുന്നത്
ഡാറ്റയിലെ "സ്വാഭാവിക" ക്ലാസുകൾ. ഓട്ടോക്ലാസ് സാധ്യമായ കാര്യങ്ങളുടെ നിരീക്ഷണങ്ങൾക്ക് ഇത് ബാധകമാണ്
മറ്റ് കാര്യങ്ങളെ പരാമർശിക്കാതെ ഒരു കൂട്ടം ആട്രിബ്യൂട്ടുകൾ ഉപയോഗിച്ച് വിവരിക്കാം. ഡാറ്റ മൂല്യങ്ങൾ
ഓരോ ആട്രിബ്യൂട്ടിനും അനുസൃതമായി സംഖ്യകളോ a യുടെ ഘടകങ്ങളോ ആയി പരിമിതപ്പെടുത്തിയിരിക്കുന്നു
ചിഹ്നങ്ങളുടെ നിശ്ചിത സെറ്റ്. സംഖ്യാ ഡാറ്റയ്ക്കൊപ്പം, ഒരു അളക്കൽ പിശക് നൽകണം.

ഓട്ടോക്ലാസ് അത് കണ്ടെത്താനാകുന്ന ഡാറ്റയുടെ മികച്ച വർഗ്ഗീകരണം(കൾ) തിരയുന്നു. എ
വർഗ്ഗീകരണം ഇനിപ്പറയുന്നവ ഉൾക്കൊള്ളുന്നു:

1) ക്ലാസുകളുടെ ഒരു കൂട്ടം, അവയിൽ ഓരോന്നിനും ഒരു കൂട്ടം ക്ലാസ് പാരാമീറ്ററുകൾ വിവരിക്കുന്നു
വിവിധ ആട്രിബ്യൂട്ടുകൾക്കൊപ്പം ക്ലാസ് എങ്ങനെ വിതരണം ചെയ്യപ്പെടുന്നുവെന്ന് വ്യക്തമാക്കുക. ഉദാഹരണത്തിന്,
"ഉയരം സാധാരണയായി വിതരണം ചെയ്യുന്നത് ശരാശരി 4.67 അടിയും സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ .32 അടിയും",

2) ക്ലാസ് വെയ്റ്റുകളുടെ ഒരു കൂട്ടം, എത്ര ശതമാനം കേസുകൾ ഉണ്ടാകാൻ സാധ്യതയുണ്ടെന്ന് വിവരിക്കുന്നു
ഓരോ ക്ലാസ്സും.

3) ഈ ക്ലാസുകളിലേക്കുള്ള ഡാറ്റയിലെ കേസുകളുടെ പ്രോബബിലിസ്റ്റിക് അസൈൻമെന്റ്. അതായത് ഓരോന്നിനും
കേസ്, അത് ഓരോ ക്ലാസിലെയും അംഗമാകാനുള്ള ആപേക്ഷിക സംഭാവ്യത.

കർശനമായ ബയേഷ്യൻ സംവിധാനമെന്ന നിലയിൽ (പകരം സ്വീകരിക്കരുത്!), ഗുണനിലവാര അളവ് ഓട്ടോക്ലാസ് ഉപയോഗങ്ങൾ
നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചോ അതിന്റെ ഡൊമെയ്‌നെക്കുറിച്ചോ നിങ്ങൾക്ക് ഒന്നും അറിയില്ലായിരുന്നെങ്കിൽ, നിങ്ങൾക്കുള്ള മൊത്തം സംഭാവ്യതയാണിത്
ഈ അടിസ്ഥാന മോഡൽ സൃഷ്ടിച്ച ഈ ഡാറ്റ സെറ്റ് കണ്ടെത്തുമായിരുന്നു. ഇതിൽ ഉൾപ്പെടുന്നു
"ലോകം" ഈ ക്ലാസുകളുടെ എണ്ണം തിരഞ്ഞെടുത്തിരിക്കാനുള്ള മുൻകൂർ സാധ്യത
ആപേക്ഷിക ക്ലാസ് വെയിറ്റുകളും, ഓരോ ക്ലാസിനുമുള്ള ഈ പാരാമീറ്ററുകൾ, അതിനുള്ള സാധ്യത
എന്നതിലെ ആട്രിബ്യൂട്ടുകൾക്കായി അത്തരം ഒരു കൂട്ടം ക്ലാസുകൾ ഈ മൂല്യങ്ങളുടെ കൂട്ടം സൃഷ്ടിക്കുമായിരുന്നു
ഡാറ്റ കേസുകൾ.

ഈ പ്രോബബിലിറ്റികൾ സാധാരണയായി വളരെ ചെറുതാണ്, ഇ^-30000 പരിധിയിലാണ്, സാധാരണയായി
എക്സ്പോണൻഷ്യൽ നൊട്ടേഷനിൽ പ്രകടിപ്പിക്കുന്നു.

കൂടെ ഓടുമ്പോൾ -തിരയൽ കമാൻഡ്, ഓട്ടോക്ലാസ് ഒരു വർഗ്ഗീകരണത്തിനായി തിരയുന്നു. ആവശ്യമുള്ളത്
ഡാറ്റ, ഡാറ്റ ഫോർമാറ്റ്, വിതരണം ചെയ്യുന്ന നാല് ഇൻപുട്ട് ഫയലുകളിലേക്കുള്ള പാതകളാണ് ആർഗ്യുമെന്റുകൾ.
യഥാക്രമം ആവശ്യമുള്ള വർഗ്ഗീകരണ മാതൃകയും തിരയൽ പരാമീറ്ററുകളും.

സ്ഥിരസ്ഥിതിയായി, ഓട്ടോക്ലാസ് ഒരു ബൈനറി ഫയലിൽ ഇന്റർമീഡിയറ്റ് ഫലങ്ങൾ എഴുതുന്നു. കൂടെ -റിപ്പോർട്ട്
കമാൻഡ്, ഓട്ടോക്ലാസ് ഒരു ASCII റിപ്പോർട്ട് സൃഷ്ടിക്കുന്നു. വാദങ്ങൾ മുഴുവൻ പാത നാമങ്ങളാണ്
.ഫലങ്ങൾ, .തിരയൽ, .r-params ഫയലുകൾ.

കൂടെ ഓടുമ്പോൾ - പ്രവചിക്കുക കമാൻഡ്, ഓട്ടോക്ലാസ് ഒരു "ടെസ്റ്റിന്റെ" ക്ലാസ് അംഗത്വം പ്രവചിക്കുന്നു
ഒരു "പരിശീലന" ഡാറ്റാ സെറ്റിൽ കാണുന്ന ക്ലാസുകളെ അടിസ്ഥാനമാക്കിയുള്ള ഡാറ്റ സെറ്റ് (ചുവടെയുള്ള "പ്രവചനങ്ങൾ" കാണുക).

ഇൻപുട്ട് ഫയലുകൾ


ഒരു ഓട്ടോക്ലാസ് ഡാറ്റ സെറ്റ് രണ്ട് ഫയലുകളിലാണ്. ഒരു ഹെഡ്ഡർ ഫയൽ (ഫയൽ തരം "hd2") ഉണ്ട്
നിർദ്ദിഷ്ട ഡാറ്റ ഫോർമാറ്റും ആട്രിബ്യൂട്ട് നിർവചനങ്ങളും വിവരിക്കുന്നു. യഥാർത്ഥ ഡാറ്റ മൂല്യങ്ങൾ
ഒരു ഡാറ്റ ഫയലിൽ (ഫയൽ തരം "db2"). ഡാറ്റ വിവരണങ്ങൾ എഡിറ്റുചെയ്യാൻ അനുവദിക്കുന്നതിന് ഞങ്ങൾ രണ്ട് ഫയലുകൾ ഉപയോഗിക്കുന്നു
മുഴുവൻ ഡാറ്റാ സെറ്റും കൈകാര്യം ചെയ്യാതെ തന്നെ. ഇത് പരീക്ഷണം എളുപ്പമാക്കുന്നു
ഡാറ്റാ സെറ്റ് പുനർനിർമ്മിക്കാതെ തന്നെ ഡാറ്റാബേസിന്റെ വ്യത്യസ്ത വിവരണങ്ങൾ.
ആന്തരികമായി, ഒരു ഓട്ടോക്ലാസ് ഡാറ്റാബേസ് ഘടന അതിന്റെ ഹെഡറും ഡാറ്റാ ഫയലുകളും ഉപയോഗിച്ച് തിരിച്ചറിയുന്നു,
ലോഡ് ചെയ്ത ഡാറ്റയുടെ എണ്ണവും.

ഈ ഫയലുകളുടെ ഫോർമാറ്റുകളെക്കുറിച്ചുള്ള കൂടുതൽ വിശദമായ വിവരങ്ങൾക്ക്, കാണുക
/usr/share/doc/autoclass/preparation-c.text.

ഡാറ്റ FILE
ഡാറ്റ ഫയലിൽ ഡാറ്റ ഒബ്‌ജക്‌റ്റുകളുടെ (ഡാറ്റം അല്ലെങ്കിൽ കേസ്) അവസാനത്തോടെ അവസാനിപ്പിച്ച ഒരു ശ്രേണി അടങ്ങിയിരിക്കുന്നു
ഫയല്. ഓരോ ഡാറ്റാ ഒബ്‌ജക്റ്റിനും ഉള്ള മൂല്യങ്ങളുടെ എണ്ണം അതിന്റെ എണ്ണത്തിന് തുല്യമായിരിക്കണം
ഹെഡർ ഫയലിൽ നിർവചിച്ചിരിക്കുന്ന ആട്രിബ്യൂട്ടുകൾ. ഡാറ്റാ ഒബ്‌ജക്‌റ്റുകൾ വേർതിരിച്ചിരിക്കുന്ന ടോക്കണുകളുടെ ഗ്രൂപ്പുകളായിരിക്കണം
"പുതിയ വര". ആട്രിബ്യൂട്ടുകൾ റിയൽ, ഡിസ്‌ക്രീറ്റ് അല്ലെങ്കിൽ ഡമ്മി എന്നിങ്ങനെ ടൈപ്പ് ചെയ്യുന്നു. യഥാർത്ഥ ആട്രിബ്യൂട്ട് മൂല്യങ്ങളാണ്
സംഖ്യകൾ, ഒന്നുകിൽ പൂർണ്ണസംഖ്യ അല്ലെങ്കിൽ ഫ്ലോട്ടിംഗ് പോയിന്റ്. വ്യതിരിക്ത ആട്രിബ്യൂട്ട് മൂല്യങ്ങൾ സ്ട്രിംഗുകളാകാം,
ചിഹ്നങ്ങൾ, അല്ലെങ്കിൽ പൂർണ്ണസംഖ്യകൾ. ഒരു ഡമ്മി ആട്രിബ്യൂട്ട് മൂല്യം ഈ തരങ്ങളിൽ ഏതെങ്കിലും ആകാം. ഡമ്മികൾ വായിക്കുന്നു
ഇൻ എന്നാൽ മറ്റുവിധത്തിൽ അവഗണിക്കപ്പെടുന്നു -- ആന്തരിക ഡാറ്റാബേസിൽ അവ പൂജ്യങ്ങളായി സജ്ജീകരിക്കും. അങ്ങനെ
റിപ്പോർട്ട് ഔട്ട്പുട്ടിൽ ഉപയോഗിക്കുന്നതിന് യഥാർത്ഥ മൂല്യങ്ങൾ ലഭ്യമല്ല. ഈ ആട്രിബ്യൂട്ട് ഉണ്ടായിരിക്കാൻ
ലഭ്യമായ മൂല്യങ്ങൾ, ഒന്നുകിൽ REAL എന്ന് ടൈപ്പ് ചെയ്യുക അല്ലെങ്കിൽ ഡിസ്‌ക്രീറ്റ് എന്ന് ടൈപ്പ് ചെയ്യുക, കൂടാതെ അവയുടെ മോഡൽ തരം ഇതായി നിർവചിക്കുക
.model ഫയലിൽ IGNORE ചെയ്യുക. ഏതെങ്കിലും ആട്രിബ്യൂട്ട് തരത്തിനായുള്ള നഷ്‌ടമായ മൂല്യങ്ങൾ പ്രതിനിധീകരിക്കാം
ഒന്നുകിൽ "?", അല്ലെങ്കിൽ ഹെഡർ ഫയലിൽ വ്യക്തമാക്കിയ മറ്റ് ടോക്കൺ. എല്ലാം ഒരു പ്രത്യേക രീതിയിലേക്ക് വിവർത്തനം ചെയ്യപ്പെടുന്നു
വായിച്ചതിനുശേഷം തനതായ മൂല്യം, അതിനാൽ ഈ ചിഹ്നം അജ്ഞാത/കാണാതായതിന് ഫലപ്രദമായി സംവരണം ചെയ്തിരിക്കുന്നു
മൂല്യങ്ങൾ.

ഉദാഹരണത്തിന്:
വെള്ള 38.991306 0.54248405 2 2 1
ചുവപ്പ് 25.254923 0.5010235 9 2 1
മഞ്ഞ 32.407973 8 2 1
all_white 28.953982 0.5267696 0 1 1

ഹെഡർ FILE
ഹെഡർ ഫയൽ ഡാറ്റ ഫയൽ ഫോർമാറ്റും ഡാറ്റയുടെ നിർവചനങ്ങളും വ്യക്തമാക്കുന്നു
ഗുണവിശേഷങ്ങൾ. ഹെഡർ ഫയൽ ഫങ്ഷണൽ സ്പെസിഫിക്കേഷനുകൾ രണ്ട് ഭാഗങ്ങൾ ഉൾക്കൊള്ളുന്നു -- ഡാറ്റ
ഫോർമാറ്റ് ഡെഫനിഷൻ സ്പെസിഫിക്കേഷനുകളും ആട്രിബ്യൂട്ട് ഡിസ്ക്രിപ്റ്ററുകളും സജ്ജമാക്കുക. ";" കോളം 1 ൽ
ഒരു അഭിപ്രായം തിരിച്ചറിയുന്നു.

ഒരു തലക്കെട്ട് ഫയൽ ഈ പൊതു ഫോർമാറ്റ് പിന്തുടരുന്നു:

;; num_db2_format_defs മൂല്യം (ഫോർമാറ്റ് ഡെഫ് ലൈനുകളുടെ എണ്ണം
;; അത് പിന്തുടരുന്നു), n ന്റെ ശ്രേണി 1 -> 5 ആണ്
num_db2_format_defs n
;; number_of_attributes ടോക്കണും മൂല്യവും ആവശ്യമാണ്
ആട്രിബ്യൂട്ടുകളുടെ_സംഖ്യ
;; ഇനിപ്പറയുന്നവ ഓപ്ഷണൽ ആണ് - ഡിഫോൾട്ട് മൂല്യങ്ങൾ വ്യക്തമാക്കിയിരിക്കുന്നു
Separator_char ' '
comment_char ';'
unknown_token '?'
Separator_char ','

;; ആട്രിബ്യൂട്ട് ഡിസ്ക്രിപ്റ്ററുകൾ
;;
;;

ഓരോ ആട്രിബ്യൂട്ട് ഡിസ്ക്രിപ്റ്ററും ഇനിപ്പറയുന്ന വരികളാണ്:

ആട്രിബ്യൂട്ട് സൂചിക (പൂജ്യം അടിസ്ഥാനമാക്കി, കോളം 1 ൽ ആരംഭിക്കുന്നു)
ആട്രിബ്യൂട്ട് തരം. താഴെ നോക്കുക.
ആട്രിബ്യൂട്ട് സബ്ടൈപ്പ്. താഴെ നോക്കുക
ആട്രിബ്യൂട്ട് വിവരണം: ചിഹ്നം (ഉൾച്ചേർത്ത ശൂന്യതകളില്ല) അല്ലെങ്കിൽ
സ്ട്രിംഗ്; <= 40 പ്രതീകങ്ങൾ
നിർദ്ദിഷ്ട പ്രോപ്പർട്ടി, മൂല്യ ജോഡികൾ.
നിലവിൽ ലഭ്യമായ കോമ്പിനേഷനുകൾ:

തരം സബ്ടൈപ്പ് പ്രോപ്പർട്ടി തരം(കൾ)
---- ----------------------
ഡമ്മി ഒന്നുമില്ല / ഇല്ല --
വ്യതിരിക്ത നാമമാത്ര ശ്രേണി
യഥാർത്ഥ ലൊക്കേഷൻ പിശക്
യഥാർത്ഥ സ്കെയിലർ പൂജ്യം_പോയിന്റ് rel_error

ERROR പ്രോപ്പർട്ടി പ്രതീക്ഷിക്കുന്ന ശരാശരി പിശകിന്റെ നിങ്ങളുടെ ഏറ്റവും മികച്ച അനുമാനത്തെ പ്രതിനിധീകരിക്കണം
ആ യഥാർത്ഥ ആട്രിബ്യൂട്ടിന്റെ അളവും റെക്കോർഡിംഗും. മെച്ചപ്പെട്ട വിവരങ്ങളുടെ അഭാവം,
അളന്ന മൂല്യങ്ങൾ തമ്മിലുള്ള ഏറ്റവും കുറഞ്ഞ വ്യത്യാസത്തിന്റെ 1/2 ആയി പിശക് കണക്കാക്കാം. ഇതിന് കഴിയും
യഥാർത്ഥ മൂല്യങ്ങൾ പലപ്പോഴും വെട്ടിച്ചുരുക്കപ്പെടുന്നു, അതിനാൽ ചെറിയ പിശകുകൾ ന്യായീകരിക്കപ്പെടാം,
പ്രത്യേകിച്ചും ജനറേറ്റഡ് ഡാറ്റയ്ക്ക്. എന്നാൽ ഓട്ടോക്ലാസ് രേഖപ്പെടുത്തിയ മൂല്യങ്ങൾ മാത്രമേ കാണൂ. അങ്ങനെ അത്
യഥാർത്ഥ മെഷർമെന്റ് പിശകിനേക്കാൾ, രേഖപ്പെടുത്തിയ മൂല്യങ്ങളിലെ പിശക് ആവശ്യമാണ്. ക്രമീകരണം
ഈ പിശക് ഏറ്റവും കുറഞ്ഞ പ്രകടിപ്പിക്കാവുന്ന വ്യത്യാസത്തേക്കാൾ വളരെ ചെറുതാണ്, ഇത് സാധ്യതയെ സൂചിപ്പിക്കുന്നു
ഡാറ്റയിൽ പ്രകടിപ്പിക്കാൻ കഴിയാത്ത മൂല്യങ്ങൾ. മോശമായത്, രണ്ട് സമാന മൂല്യങ്ങൾ സൂചിപ്പിക്കുന്നു
യഥാർത്ഥത്തിൽ ഉണ്ടായിരുന്നതിനേക്കാൾ വളരെ അടുത്ത അളവുകൾ പ്രതിനിധീകരിക്കണം.
ഇത് വർഗ്ഗീകരണത്തിന്റെ അമിതമായ ഫിറ്റിംഗിലേക്ക് നയിക്കുന്നു.

പിശക് ആനുപാതികമായിരിക്കുമ്പോൾ SCALAR റിയലുകൾക്കായി REL_ERROR പ്രോപ്പർട്ടി ഉപയോഗിക്കുന്നു
അളന്ന മൂല്യം. ERROR പ്രോപ്പർട്ടി പിന്തുണയ്ക്കുന്നില്ല.

ഓട്ടോക്ലാസ് സാധാരണ വിതരണത്തിന്റെ വീതിയിൽ ഒരു താഴ്ന്ന ബൗണ്ടായി പിശക് ഉപയോഗിക്കുന്നു. അങ്ങനെ
ചെറിയ പിശക് കണക്കുകൾ ഇടുങ്ങിയ കൊടുമുടികൾ നൽകുകയും രണ്ട് എണ്ണം വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു
ക്ലാസുകളും വർഗ്ഗീകരണ സാധ്യതയും. വിശാലമായ പിശക് കണക്കുകൾ പരിമിതപ്പെടുത്തുന്നു
ക്ലാസുകളുടെ എണ്ണം.

സ്കെയിലർ ZERO_POINT പ്രോപ്പർട്ടി എന്നത് അളക്കൽ പ്രക്രിയയ്ക്ക് കഴിയുന്ന ഏറ്റവും ചെറിയ മൂല്യമാണ്
ഉത്പാദിപ്പിച്ചിട്ടുണ്ട്. ഇത് പലപ്പോഴും 0.0 ആണ്, അല്ലെങ്കിൽ ചില പിശക് ശ്രേണിയിൽ കുറവാണ്. അതുപോലെ, ബൗണ്ടഡ്
റിയലിന്റെ മിനിമം, പരമാവധി പ്രോപ്പർട്ടികൾ ആട്രിബ്യൂട്ടുകൾ സൃഷ്ടിക്കുന്ന പ്രക്രിയയുടെ പ്രത്യേക പരിധികളാണ്.
കണക്കാക്കിയ ശതമാനത്തിന് ഇവ 0-e, 100+e എന്നിവ ആയിരിക്കും, ഇവിടെ e എന്നത് ഒരു പിശക് മൂല്യമാണ്. ദി
വ്യതിരിക്ത ആട്രിബ്യൂട്ടിന്റെ ശ്രേണി എന്നത് ആട്രിബ്യൂട്ടിന് എടുക്കാൻ കഴിയുന്ന മൂല്യങ്ങളുടെ എണ്ണമാണ്.
അത്തരം മൂല്യങ്ങൾ സംഭവിക്കുമ്പോൾ ഈ ശ്രേണിയിൽ അറിയപ്പെടാത്ത മൂല്യം ഉൾപ്പെടുത്തണം.

ഹെഡ്ഡർ ഫയൽ ഉദാഹരണം:

!#; ഓട്ടോക്ലാസ് സി ഹെഡ്ഡർ ഫയൽ -- എക്സ്റ്റൻഷൻ .hd2
!#; കോളം 1 ലെ ഇനിപ്പറയുന്ന അക്ഷരങ്ങൾ വരിയെ ഒരു അഭിപ്രായമാക്കുന്നു:
!#; '!', '#', ';', ' ', '\n' (ശൂന്യമായ വരി)

;#! num_db2_format_defs
num_db2_format_defs 2
;; ആവശ്യമാണ്
സംഖ്യ_ഓഫ്_ആട്രിബ്യൂട്ടുകൾ 7
;; ഓപ്ഷണൽ - ഡിഫോൾട്ട് മൂല്യങ്ങൾ വ്യക്തമാക്കിയിരിക്കുന്നു
;; Separator_char ' '
;; comment_char ';'
;; unknown_token '?'
Separator_char ','

;;

0 ഡമ്മി ഇല്ല "ട്രൂ ക്ലാസ്, ശ്രേണി = 1 - 3"
1 യഥാർത്ഥ സ്ഥാനം "X ലൊക്കേഷൻ, m. 25.0 - 40.0 പരിധിയിൽ" പിശക് .25
2 യഥാർത്ഥ സ്ഥാനം "Y ലൊക്കേഷൻ, m. 0.5 - 0.7 പരിധിയിൽ" പിശക് .05
3 യഥാർത്ഥ സ്കെയിലർ "ഭാരം, കി.ഗ്രാം. 5.0 - 10.0" സീറോ_പോയിന്റ് 0.0
rel_error .001
4 വ്യതിരിക്ത നാമമാത്രമായ "സത്യ മൂല്യം, ശ്രേണി = 1 - 2" ശ്രേണി 2
5 വ്യതിരിക്ത നാമമാത്രമായ "ഫൂബാറിന്റെ നിറം, 10 മൂല്യങ്ങൾ" ശ്രേണി 10
6 വ്യതിരിക്ത നാമമാത്രമായ Spectral_color_group ശ്രേണി 6

മോഡൽ FILE
ഒരു ഡാറ്റാ സെറ്റിന്റെ ഒരു വർഗ്ഗീകരണം അതിന്റെ ഫോം വ്യക്തമാക്കുന്ന ഒരു മോഡലുമായി ബന്ധപ്പെട്ട് ഉണ്ടാക്കിയിരിക്കുന്നു
ആ ഡാറ്റാ സെറ്റിലെ ക്ലാസുകൾക്കുള്ള പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ ഫംഗ്‌ഷൻ. സാധാരണ മോഡൽ
ഒന്നോ അതിലധികമോ മോഡലുകൾ അടങ്ങുന്ന ഒരു മോഡൽ ഫയലിൽ (ഫയൽ തരം "മോഡൽ") ഘടന നിർവചിച്ചിരിക്കുന്നു.
ആന്തരികമായി, ഒരു പ്രത്യേക ഡാറ്റാബേസുമായി ബന്ധപ്പെട്ട് ഒരു മോഡൽ നിർവചിക്കപ്പെടുന്നു. അങ്ങനെ അത് തിരിച്ചറിയപ്പെടുന്നു
അനുബന്ധ ഡാറ്റാബേസ് പ്രകാരം, മോഡലിന്റെ മോഡൽ ഫയലും അതിന്റെ തുടർച്ചയായ സ്ഥാനവും
ഫയൽ.

ഓരോ മോഡലും ഒന്നോ അതിലധികമോ മോഡൽ ഗ്രൂപ്പ് ഡെഫനിഷൻ ലൈനുകളാൽ വ്യക്തമാക്കുന്നു. ഓരോ മോഡൽ ഗ്രൂപ്പും
ലൈൻ അസോസിയേറ്റ്സ് ഒരു മോഡൽ ടേം തരം ഉള്ള സൂചികകൾ ആട്രിബ്യൂട്ട് ചെയ്യുന്നു.

ഒരു ഉദാഹരണ മോഡൽ ഫയൽ ഇതാ:

# ഓട്ടോക്ലാസ് സി മോഡൽ ഫയൽ -- എക്സ്റ്റൻഷൻ .മോഡൽ
model_index 0 7
0 അവഗണിക്കുക
single_normal_cn 3
single_normal_cn 17 18 21
multi_normal_cn 1 2
multi_normal_cn 8 9 10
multi_normal_cn 11 12 13
സിംഗിൾ_മൾട്ടിനോമിയൽ ഡിഫോൾട്ട്

ഇവിടെ, ആദ്യത്തെ വരി ഒരു കമന്റാണ്. കോളം 1 ലെ ഇനിപ്പറയുന്ന പ്രതീകങ്ങൾ വരി a ഉണ്ടാക്കുന്നു
കമന്റ്: `!', `#', ` ', `;', '\n' (ശൂന്യമായ വരി).

ടോക്കണുകൾ "model_index n m"ആദ്യത്തെ നോൺ-കമൻറ് ലൈനിൽ ദൃശ്യമാകണം, അതിന് മുമ്പുള്ളതും ആയിരിക്കണം
മോഡൽ ടേം ഡെഫനിഷൻ ലൈനുകൾ. n പൂജ്യം അടിസ്ഥാനമാക്കിയുള്ള മോഡൽ സൂചികയാണ്, സാധാരണയായി 0 ഉള്ളിടത്ത്
ഒരു മോഡൽ മാത്രം -- ഭൂരിഭാഗം തിരയൽ സാഹചര്യങ്ങളും. m മോഡൽ ടേമിന്റെ സംഖ്യയാണ്
പിന്തുടരുന്ന നിർവചന വരികൾ.

അവസാനത്തെ ഏഴ് വരികൾ മോഡൽ ഗ്രൂപ്പ് ലൈനുകളാണ്. ഓരോ മോഡൽ ഗ്രൂപ്പ് ലൈനിലും ഇവ ഉൾപ്പെടുന്നു:

ഒരു മോഡൽ ടേം തരം (ഒന്ന് സിംഗിൾ_മൾട്ടിനോമിയൽ, ഒറ്റ_സാധാരണ_സെ.മീ, സിംഗിൾ_നോർമൽ_സിഎൻ,
മൾട്ടി_നോർമൽ_സിഎൻ, അഥവാ അവഗണിക്കുക).

ആട്രിബ്യൂട്ട് സൂചികകളുടെ ഒരു ലിസ്റ്റ് (ആട്രിബ്യൂട്ട് സെറ്റ് ലിസ്റ്റ്), അല്ലെങ്കിൽ ചിഹ്നം സ്ഥിരസ്ഥിതി. ആട്രിബ്യൂട്ട്
സൂചികകൾ പൂജ്യം അടിസ്ഥാനമാക്കിയുള്ളതാണ്. സിംഗിൾ മോഡൽ നിബന്ധനകൾക്ക് ഒന്നോ അതിലധികമോ ആട്രിബ്യൂട്ട് സൂചികകൾ ഉണ്ടായിരിക്കാം
ഓരോ വരിയിലും, മൾട്ടി മോഡൽ നിബന്ധനകൾക്ക് ഓരോ വരിയിലും രണ്ടോ അതിലധികമോ ആട്രിബ്യൂട്ട് സൂചികകൾ ആവശ്യമാണ്. എ
ആട്രിബ്യൂട്ട് സൂചിക ഒരു മോഡൽ ലിസ്റ്റിൽ ഒന്നിലധികം തവണ ദൃശ്യമാകാൻ പാടില്ല.

കുറിപ്പുകൾ:

1) കുറഞ്ഞത് ഒരു മോഡൽ നിർവചനം ആവശ്യമാണ് (model_index ടോക്കൺ).

2) ഏത് മോഡൽ ടേം തരത്തിനും ഒരു മോഡലിൽ ഒന്നിലധികം എൻട്രികൾ ഉണ്ടായിരിക്കാം.

3) മോഡൽ ടേം തരങ്ങൾ നിലവിൽ ഉൾക്കൊള്ളുന്നു:

സിംഗിൾ_മൾട്ടിനോമിയൽ
നഷ്‌ടമായ മൂല്യങ്ങളുള്ള മൾട്ടിനോമിയലുകളായി മോഡലുകൾ ഡിസ്‌ക്രീറ്റ് ആട്രിബ്യൂട്ടുകൾ.

സിംഗിൾ_നോർമൽ_സിഎൻ
നോർമലുകൾ പോലെ യഥാർത്ഥ മൂല്യമുള്ള ആട്രിബ്യൂട്ടുകൾ മോഡലുകൾ; നഷ്‌ടമായ മൂല്യങ്ങളൊന്നുമില്ല.

ഒറ്റ_സാധാരണ_സെ.മീ
നഷ്‌ടമായ മൂല്യങ്ങളുള്ള യഥാർത്ഥ മൂല്യമുള്ള ആട്രിബ്യൂട്ടുകൾ മോഡലുകൾ.

മൾട്ടി_നോർമൽ_സിഎൻ
മൂല്യങ്ങൾ നഷ്‌ടപ്പെടാതെയുള്ള ഒരു സാധാരണ മാതൃകയാണ്.

അവഗണിക്കുക ഒന്നോ അതിലധികമോ ആട്രിബ്യൂട്ടുകൾ അവഗണിക്കാൻ മോഡലിനെ അനുവദിക്കുന്നു. അവഗണിക്കുക സാധുവല്ല
സ്ഥിര മോഡൽ ടേം തരം.

നിർദ്ദിഷ്ട മോഡലിനെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്ക് models-c.text-ലെ ഡോക്യുമെന്റേഷൻ കാണുക
നിബന്ധനകൾ.

4) Single_normal_cn, ഒറ്റ_സാധാരണ_സെ.മീ, ഒപ്പം മൾട്ടി_നോർമൽ_സിഎൻ മാതൃകാപരമായ ഡാറ്റ, അതിന്റെ ഉപവിഭാഗം
is സ്കെയിലർ (മൂല്യം വിതരണം 0.0 ൽ നിന്ന് അകലെയാണ്, അതിനാൽ ഇത് "സാധാരണ" അല്ല
ഡിസ്ട്രിബ്യൂഷൻ) ലോഗ്-നോർമൽ മോഡൽ ഉപയോഗിച്ച് ലോഗ് രൂപാന്തരപ്പെടുകയും മാതൃകയാക്കുകയും ചെയ്യും. വേണ്ടി
ഉപവിഭാഗമായ ഡാറ്റ ലൊക്കേഷൻ (മൂല്യം വിതരണം ഏകദേശം 0.0 ആണ്), പരിവർത്തനം ഇല്ല
ചെയ്തു, സാധാരണ മോഡൽ ഉപയോഗിക്കുന്നു.

തിരയുന്നു


ഓട്ടോക്ലാസ്, "തിരയൽ" മോഡിൽ അഭ്യർത്ഥിക്കുമ്പോൾ, ഡാറ്റാ സെറ്റിന്റെ സാധുത പരിശോധിക്കും,
ഹെഡർ, മോഡൽ, സെർച്ച് പാരാമീറ്റർ ഫയലുകൾ. പിശകുകൾ തിരയൽ ആരംഭിക്കുന്നതിൽ നിന്ന് തടയും, കൂടാതെ
തുടരണമോ എന്ന് മുന്നറിയിപ്പുകൾ ഉപയോക്താവിനോട് ചോദിക്കും. പിശകിന്റെയും മുന്നറിയിപ്പിന്റെയും ചരിത്രം
സന്ദേശങ്ങൾ സ്ഥിരസ്ഥിതിയായി, ലോഗ് ഫയലിൽ സംരക്ഷിക്കപ്പെടുന്നു.

ഒരു ഹെഡർ ഫയലും മോഡൽ ഫയലും ഉപയോഗിച്ച് നിങ്ങളുടെ ഡാറ്റ വിവരിക്കുന്നതിൽ നിങ്ങൾ വിജയിച്ചുകഴിഞ്ഞാൽ
AUTOCLASS -SEARCH <...> ഇൻപുട്ട് പരിശോധനകൾ പാസ്സായി, നിങ്ങൾ തിരയൽ ഡൊമെയ്‌നിൽ പ്രവേശിക്കും.
എവിടെ ഓട്ടോക്ലാസ് നിങ്ങളുടെ ഡാറ്റയെ തരംതിരിക്കുന്നു. (ഒടുവിൽ!)

നിങ്ങളുടെ ഡാറ്റയുടെ നല്ല വർഗ്ഗീകരണം കണ്ടെത്തുന്നതിനുള്ള പ്രധാന പ്രവർത്തനം ഓട്ടോക്ലാസ് ആണ്
-തിരയുക, ഇത് ഉപയോഗിക്കുന്നതിന് കൂടുതൽ സമയമെടുക്കും. ഇനിപ്പറയുന്നവ ഉപയോഗിച്ച് തിരയലുകൾ അഭ്യർത്ഥിക്കുന്നു:

autoclass -search <.db2 file path> <.hd2 file path>
<.model file path> <.s-params file path>

എല്ലാ ഫയലുകളും പൂർണ്ണ യോഗ്യതയുള്ള ആപേക്ഷിക അല്ലെങ്കിൽ കേവല പാത്ത് നെയിമുകളായി വ്യക്തമാക്കിയിരിക്കണം. ഫയലിന്റെ പേര്
എല്ലാ ഫയലുകൾക്കുമുള്ള വിപുലീകരണങ്ങൾ (ഫയൽ തരങ്ങൾ) ആവശ്യമായ കാനോനിക്കൽ മൂല്യങ്ങളിലേക്ക് നിർബന്ധിതരാകുന്നു
ഓട്ടോക്ലാസ് പ്രോഗ്രാം:

ഡാറ്റ ഫയൽ ("ascii") db2
ഡാറ്റ ഫയൽ ("ബൈനറി") db2-bin
ഹെഡ്ഡർ ഫയൽ hd2
മോഡൽ ഫയൽ മോഡൽ
s-params ഫയൽ തിരയുക

സാമ്പിൾ-റൺ (/usr/share/doc/autoclass/examples/) കൂടെ വരുന്നു ഓട്ടോക്ലാസ് ചിലത് കാണിക്കുന്നു
സാമ്പിൾ തിരയലുകൾ, ഇവ ബ്രൗസുചെയ്യുന്നത് എങ്ങനെയെന്ന് അറിയാനുള്ള ഏറ്റവും വേഗതയേറിയ മാർഗമാണ്
തിരയലുകൾ നടത്താൻ. ടെസ്റ്റ് ഡാറ്റ സെറ്റുകൾക്ക് കീഴിൽ സ്ഥിതിചെയ്യുന്നു /usr/share/doc/autoclass/examples/ ഉദ്ദേശിക്കുന്ന
നിങ്ങൾക്ക് മറ്റ് ചില തലക്കെട്ടുകൾ (.hd2), മോഡൽ (. മോഡൽ), സെർച്ച് പാരാകൾ (.s-params) ഫയൽ എന്നിവ കാണിക്കുക
സജ്ജീകരണങ്ങൾ. ഈ വിഭാഗത്തിന്റെ ബാക്കി ഭാഗം കുറച്ചുകൂടി കൂടുതൽ തിരയലുകൾ എങ്ങനെ ചെയ്യാമെന്ന് വിവരിക്കുന്നു
വിശദാംശങ്ങൾ.

ദി ധീരമായ അഭിമുഖീകരിച്ചു താഴെയുള്ള ടോക്കണുകൾ സാധാരണയായി സെർച്ച് പാരാ ഫയൽ പരാമീറ്ററുകളാണ്. കൂടുതൽ
s-params ഫയലിലെ വിവരങ്ങൾ, കാണുക തിരയൽ പാരാമീറ്ററുകൾ താഴെ, അല്ലെങ്കിൽ
/usr/share/doc/autoclass/search-c.text.gz.

എന്ത് ഫലം ആകുന്നു
ഓട്ടോക്ലാസ് അത് കണ്ടെത്താനാകുന്ന ഡാറ്റയുടെ മികച്ച വർഗ്ഗീകരണം(കൾ) തിരയുന്നു. എ
വർഗ്ഗീകരണം ഇനിപ്പറയുന്നവ ഉൾക്കൊള്ളുന്നു:

1) ഒരു കൂട്ടം ക്ലാസുകൾ, അവയിൽ ഓരോന്നും ഒരു കൂട്ടം ക്ലാസ് പാരാമീറ്ററുകൾ വിവരിക്കുന്നു
വിവിധ ആട്രിബ്യൂട്ടുകൾക്കൊപ്പം ക്ലാസ് എങ്ങനെ വിതരണം ചെയ്യപ്പെടുന്നുവെന്ന് വ്യക്തമാക്കുക. ഉദാഹരണത്തിന്,
"ഉയരം സാധാരണയായി വിതരണം ചെയ്യുന്നത് ശരാശരി 4.67 അടിയും സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ .32 അടിയും",

2) ക്ലാസ് വെയ്റ്റുകളുടെ ഒരു കൂട്ടം, എത്ര ശതമാനം കേസുകൾ ഉണ്ടാകാൻ സാധ്യതയുണ്ടെന്ന് വിവരിക്കുന്നു
ഓരോ ക്ലാസ്സും.

3) ഈ ക്ലാസുകളിലേക്കുള്ള ഡാറ്റയിലെ കേസുകളുടെ പ്രോബബിലിസ്റ്റിക് അസൈൻമെന്റ്. അതായത് ഓരോന്നിനും
കേസ്, അത് ഓരോ ക്ലാസിലെയും അംഗമാകാനുള്ള ആപേക്ഷിക സംഭാവ്യത.

കർശനമായ ബയേഷ്യൻ സംവിധാനമെന്ന നിലയിൽ (പകരം സ്വീകരിക്കരുത്!), ഗുണനിലവാര അളവ് ഓട്ടോക്ലാസ് ഉപയോഗങ്ങൾ
നിങ്ങളുടെ ഡാറ്റയെക്കുറിച്ചോ അതിന്റെ ഡൊമെയ്‌നെക്കുറിച്ചോ നിങ്ങൾക്ക് ഒന്നും അറിയില്ലായിരുന്നെങ്കിൽ, നിങ്ങൾക്കുള്ള മൊത്തം സംഭാവ്യതയാണിത്
ഈ അടിസ്ഥാന മോഡൽ സൃഷ്ടിച്ച ഈ ഡാറ്റ സെറ്റ് കണ്ടെത്തുമായിരുന്നു. ഇതിൽ ഉൾപ്പെടുന്നു
"ലോകം" ഈ ക്ലാസുകളുടെ എണ്ണം തിരഞ്ഞെടുത്തിരിക്കാനുള്ള മുൻകൂർ സാധ്യത
ആപേക്ഷിക ക്ലാസ് വെയിറ്റുകളും, ഓരോ ക്ലാസിനുമുള്ള ഈ പാരാമീറ്ററുകൾ, അതിനുള്ള സാധ്യത
എന്നതിലെ ആട്രിബ്യൂട്ടുകൾക്കായി അത്തരം ഒരു കൂട്ടം ക്ലാസുകൾ ഈ മൂല്യങ്ങളുടെ കൂട്ടം സൃഷ്ടിക്കുമായിരുന്നു
ഡാറ്റ കേസുകൾ.

ഈ പ്രോബബിലിറ്റികൾ സാധാരണയായി വളരെ ചെറുതാണ്, ഇ^-30000 പരിധിയിലാണ്, സാധാരണയായി
എക്സ്പോണൻഷ്യൽ നൊട്ടേഷനിൽ പ്രകടിപ്പിക്കുന്നു.

എന്ത് ഫലം അർത്ഥം
ഈ പ്രോബബിലിറ്റികളെല്ലാം യഥാർത്ഥ മാതൃകയാണെന്ന് ഓർമ്മിക്കേണ്ടത് പ്രധാനമാണ്
മാതൃകാ കുടുംബത്തിലാണ് ഓട്ടോക്ലാസ് അതിന്റെ ശ്രദ്ധ പരിമിതപ്പെടുത്തിയിരിക്കുന്നു. എങ്കിൽ ഓട്ടോക്ലാസ് is
ഗൗസിയൻ ക്ലാസുകൾക്കായി തിരയുന്നു, യഥാർത്ഥ ക്ലാസുകൾ പോയിസൺ ആണ്, അപ്പോൾ വസ്തുതയാണ്
ഓട്ടോക്ലാസ് 5 ഗൗസിയൻ ക്ലാസുകൾ അവിടെ എത്ര പോയിസൺ ക്ലാസുകളെക്കുറിച്ച് കൂടുതൽ പറയില്ല
ശരിക്കും ആകുന്നു.

കണ്ടെത്തിയ വ്യത്യസ്ത വർഗ്ഗീകരണങ്ങൾ തമ്മിലുള്ള ആപേക്ഷിക സംഭാവ്യത വളരെ വലുതായിരിക്കും
e^1000, അതിനാൽ കണ്ടെത്തിയ ഏറ്റവും മികച്ച വർഗ്ഗീകരണം സാധാരണയായി അതിനേക്കാൾ കൂടുതൽ സാധ്യതയുള്ളതാണ്
ബാക്കിയുള്ളവ (ഇതുവരെയുള്ള മികച്ച വർഗ്ഗീകരണങ്ങളേക്കാൾ വളരെ കുറവാണ്
കണ്ടെത്താത്തത്). എങ്കിൽ ഓട്ടോക്ലാസ് ഉള്ളിലുള്ള രണ്ട് വർഗ്ഗീകരണങ്ങൾ കണ്ടെത്താൻ കൈകാര്യം ചെയ്യണം
ഏകദേശം (5-10) പരസ്പരം (അതായത് 100 മുതൽ 10,000 മടങ്ങ് വരെ കൂടുതൽ സാധ്യതയുള്ളത്) അപ്പോൾ നിങ്ങൾ
ഞങ്ങളുടെ കണക്കുകൂട്ടൽ സാധാരണയായി കൂടുതൽ അല്ലാത്തതിനാൽ, അവ ഏകദേശം തുല്യമായി സാദ്ധ്യതയുള്ളതായി കണക്കാക്കണം
ഇതിലും കൃത്യത (ചിലപ്പോൾ വളരെ കുറവാണ്).

എങ്ങനെ IT രചനകളുടെ
ഓട്ടോക്ലാസ് ആവർത്തിച്ച് ക്രമരഹിതമായ ഒരു വർഗ്ഗീകരണം സൃഷ്ടിക്കുകയും തുടർന്ന് ഇത് a ആയി മസാജ് ചെയ്യാൻ ശ്രമിക്കുകയും ചെയ്യുന്നു
പ്രാദേശിക മാറ്റങ്ങൾ ആണെങ്കിലും ഉയർന്ന പ്രോബബിലിറ്റി വർഗ്ഗീകരണം, അത് ചില "ലോക്കൽ" ആയി ഒത്തുചേരുന്നത് വരെ
മാക്സിമം". പിന്നീട് അത് കണ്ടെത്തിയ കാര്യങ്ങൾ ഓർമ്മിക്കുകയും വീണ്ടും ആരംഭിക്കുകയും നിങ്ങൾ വരെ തുടരുകയും ചെയ്യുന്നു
നിർത്താൻ പറയൂ. ഓരോ പ്രയത്നത്തെയും ഒരു "ശ്രമിക്കുക" എന്ന് വിളിക്കുന്നു, കൂടാതെ കണക്കുകൂട്ടിയ സംഭാവ്യതയാണ് ഉദ്ദേശിക്കുന്നത്
ഈ പരമാവധി ചുറ്റളവിൽ പാരാമീറ്റർ സ്‌പെയ്‌സിൽ മുഴുവൻ വോളിയവും കവർ ചെയ്യാൻ, പകരം
പീക്ക്.

മസാജ് ചെയ്യുന്നതിനുള്ള സ്റ്റാൻഡേർഡ് സമീപനം

1) ക്ലാസ് പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് കേസുകളുടെ പ്രോബബിലിസ്റ്റിക് ക്ലാസ് അംഗത്വങ്ങൾ കണക്കാക്കുക
സൂചിപ്പിക്കുന്ന ആപേക്ഷിക സാധ്യതകൾ.

2) പുതിയ ക്ലാസ് അംഗങ്ങളെ ഉപയോഗിച്ച്, ക്ലാസ് സ്ഥിതിവിവരക്കണക്കുകൾ (ശരാശരി പോലെ) കണക്കാക്കുകയും പരിഷ്കരിക്കുകയും ചെയ്യുക
ക്ലാസ് പാരാമീറ്ററുകൾ.

അവ മാറുന്നത് നിർത്തുന്നത് വരെ ആവർത്തിക്കുക. മൂന്ന് കൺവേർജൻസ് അൽഗോരിതങ്ങൾ ലഭ്യമാണ്:
"converge_search_3" (ഡിഫോൾട്ട്), "converge_search_4", "converge" എന്നിവ. അവരുടെ
സ്പെസിഫിക്കേഷൻ നിയന്ത്രിക്കുന്നത് തിരയൽ പരമുകൾ ഫയൽ പരാമീറ്ററാണ് try_fn_type.

എപ്പോൾ TO നിർത്തുക
നിങ്ങൾക്ക് AUTOCLASS -SEARCH നിർത്താൻ പറയാം: 1) കൊടുക്കുന്നത് a പരമാവധി_ദൈർഘ്യം (സെക്കൻഡിൽ) വാദം
തുടക്കത്തിൽ; 2) നൽകുന്നത് എ പരമാവധി_n_ശ്രമങ്ങൾ (ഒരു പൂർണ്ണസംഖ്യ) വാദം തുടക്കത്തിൽ; അല്ലെങ്കിൽ 3) വഴി
ഒരു "q" ടൈപ്പുചെയ്യുന്നു ഒപ്പം നിങ്ങൾ മതിയായ ശ്രമങ്ങൾ കണ്ടതിന് ശേഷം. ദി പരമാവധി_ദൈർഘ്യം ഒപ്പം
പരമാവധി_n_ശ്രമങ്ങൾ ബാച്ച് മോഡിൽ AUTOCLASS -SEARCH പ്രവർത്തിപ്പിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ ആർഗ്യുമെന്റുകൾ ഉപയോഗപ്രദമാണ്. എങ്കിൽ
നിങ്ങൾ മുമ്പത്തെ തിരയലിൽ നിന്ന് AUTOCLASS -SEARCH പുനരാരംഭിക്കുന്നു, മൂല്യം പരമാവധി_n_ശ്രമങ്ങൾ നിങ്ങളെ
നൽകുക, ഉദാഹരണത്തിന് 3, കൂടാതെ 3 ശ്രമങ്ങൾ കൂടി കണക്കാക്കാൻ പ്രോഗ്രാമിനോട് പറയും
എന്നിരുന്നാലും പലതും ഇതിനകം ചെയ്തിട്ടുണ്ട്. അതേ വർദ്ധിച്ചുവരുന്ന സ്വഭാവം പ്രകടമാക്കുന്നു
പരമാവധി_ദൈർഘ്യം.

എപ്പോൾ നിർത്തണമെന്ന് തീരുമാനിക്കുന്നത് ഒരു വിധിന്യായമാണ്, അത് നിങ്ങളുടേതാണ്. തിരയലിൽ ഉൾപ്പെടുന്നതിനാൽ എ
ക്രമരഹിതമായ ഘടകം, നിങ്ങൾ അത് തുടരാൻ അനുവദിച്ചാൽ അത് കണ്ടെത്താനുള്ള അവസരമുണ്ട്
എന്തെങ്കിലും നല്ലത്. അതിനാൽ, അത് എത്രത്തോളം മികച്ചതായിരിക്കുമെന്ന് നിങ്ങൾ ട്രേഡ് ചെയ്യേണ്ടതുണ്ട്
അത് കണ്ടെത്താൻ എടുത്തേക്കാം. ഒരു പുതിയ മികച്ചതായിരിക്കുമ്പോൾ അച്ചടിക്കുന്ന തിരയൽ സ്റ്റാറ്റസ് റിപ്പോർട്ടുകൾ
വർഗ്ഗീകരണം കണ്ടെത്തി, ഇത് നിങ്ങളെ സഹായിക്കുന്നതിന് നിങ്ങൾക്ക് വിവരങ്ങൾ നൽകാൻ ഉദ്ദേശിച്ചുള്ളതാണ്
തുല്യതയ്ക്കായുള്ള കൈമാറ്റം.

കണ്ടെത്തിയ വർഗ്ഗീകരണങ്ങളിൽ ഭൂരിഭാഗവും നിങ്ങൾ നിർത്തേണ്ടതിന്റെ വ്യക്തമായ സൂചനയാണ്
മുമ്പത്തെവയുടെ തനിപ്പകർപ്പുകൾ (കണ്ടെത്തുമ്പോൾ "ഡ്യൂപ്പ്" എന്ന് ഫ്ലാഗുചെയ്‌തു). ഇത് മാത്രമേ സംഭവിക്കാവൂ
വളരെ ചെറിയ ഡാറ്റ സെറ്റുകൾക്ക് അല്ലെങ്കിൽ രണ്ടെണ്ണം പോലെ വളരെ ചെറിയ എണ്ണം ക്ലാസുകൾ ശരിയാക്കുമ്പോൾ.

ഞങ്ങളുടെ അനുഭവം മിതമായ വലിയ മുതൽ വളരെ വലിയ ഡാറ്റാ സെറ്റുകൾക്ക് (~200 മുതൽ ~10,000 വരെ
ഡാറ്റ), പ്രവർത്തിപ്പിക്കേണ്ടത് ആവശ്യമാണ് ഓട്ടോക്ലാസ് കുറഞ്ഞത് 50 ട്രയലുകൾക്ക്.

എന്ത് നേടുന്നു തിരികെ നൽകി
മടങ്ങിവരുന്നതിന് തൊട്ടുമുമ്പ്, AUTOCLASS -SEARCH മികച്ചവയുടെ ഹ്രസ്വ വിവരണങ്ങൾ നൽകും
വർഗ്ഗീകരണങ്ങൾ കണ്ടെത്തി. എത്രയെണ്ണം വിവരിക്കുമെന്നത് നിയന്ത്രിക്കാനാകും n_ഫൈനൽ_സംഗ്രഹം.

ഡിഫോൾട്ടായി ഓട്ടോക്ലാസ് -സെർച്ച് അവസാനത്തിലും ഫയലുകളിലും നിരവധി ഫയലുകൾ എഴുതും
തിരച്ചിലിനിടയിൽ ഇടയ്ക്കിടെ (നിങ്ങളുടെ സിസ്റ്റം പൂർത്തിയാകുന്നതിന് മുമ്പ് തകരാറിലായാൽ). ഇവ
എല്ലാ ഫയലുകൾക്കും ഒരേ പേര് ഉണ്ടായിരിക്കും (തിരയൽ പാരാം പാത്ത് നെയിമിൽ നിന്ന് എടുത്തത് [ .s-
പാരാകൾ]), അവയുടെ ഫയൽ എക്സ്റ്റൻഷനുകളിൽ മാത്രം വ്യത്യാസമുണ്ട്. നിങ്ങളുടെ തിരയൽ റണ്ണുകൾ വളരെ ദൈർഘ്യമേറിയതാണെങ്കിൽ
നിങ്ങളുടെ മെഷീൻ തകരാറിലാകാൻ സാധ്യതയുണ്ട്, നിങ്ങൾക്ക് ഇന്റർമീഡിയറ്റ് "ഫലങ്ങൾ" ലഭിക്കും
എഴുതിയ ഫയലുകൾ. കുറഞ്ഞ നഷ്ടത്തോടെ നിങ്ങളുടെ തിരയൽ റൺ പുനരാരംഭിക്കാൻ ഇവ ഉപയോഗിക്കാനാകും
തിരയൽ ശ്രമം. ഡോക്യുമെന്റേഷൻ ഫയൽ കാണുക /usr/share/doc/autoclass/checkpoint-c.text.

ഒരു ".log" ഫയലിൽ സ്‌ക്രീനിൽ പ്രിന്റ് ചെയ്‌ത മിക്കവയുടെയും ലിസ്‌റ്റിംഗ് ഉണ്ടായിരിക്കും
നിങ്ങൾ സജ്ജമാക്കിയില്ലെങ്കിൽ ഓടുക log_file_p നിങ്ങൾക്ക് അത്തരം വിഡ്ഢിത്തം ആവശ്യമില്ലെന്ന് പറയുന്നത് തെറ്റാണ്. അല്ലാതെ
ഫലങ്ങൾ_ഫയൽ_പി തെറ്റാണ്, ഒരു ബൈനറി ".ഫലങ്ങൾ-ബിൻ" ഫയൽ (ഡിഫോൾട്ട്) അല്ലെങ്കിൽ ഒരു ASCII ".ഫലങ്ങൾ"
ടെക്‌സ്‌റ്റ് ഫയലിൽ, തിരികെ ലഭിച്ച മികച്ച വർഗ്ഗീകരണങ്ങൾ കൈവശം വയ്ക്കും, കൂടാതെ തിരയൽ_ഫയൽ_പി
തെറ്റാണ്, ഒരു ".search" ഫയൽ തിരയൽ ശ്രമങ്ങളുടെ റെക്കോർഡ് സൂക്ഷിക്കും. save_compact_p
"ഫലങ്ങൾ" ഫയലുകൾ ബൈനറി അല്ലെങ്കിൽ ASCII ടെക്‌സ്‌റ്റ് ആയി സേവ് ചെയ്‌തിട്ടുണ്ടോ എന്ന് നിയന്ത്രിക്കുന്നു.

C ഗ്ലോബൽ വേരിയബിൾ "G_safe_file_writing_p" എന്നത് "ഓട്ടോക്ലാസ്-ൽ ട്രൂ" എന്ന് നിർവചിച്ചിട്ടുണ്ടെങ്കിൽ
c/prog/globals.c", "ഫലങ്ങൾ" ഫയലുകളുടെ പേരുകൾ (സംരക്ഷിച്ചവ അടങ്ങിയിരിക്കുന്നവ
വർഗ്ഗീകരണങ്ങൾ) അനാവശ്യമായ ഫയൽ റൈറ്റിംഗിനായി ആന്തരികമായി പരിഷ്‌ക്കരിച്ചിരിക്കുന്നു. എങ്കിൽ
തിരയൽ params ഫയലിന്റെ പേര് "my_saved_clsfs" ആണ്, നിങ്ങൾ ഇനിപ്പറയുന്ന "ഫലങ്ങൾ" ഫയൽ കാണും
പേരുകൾ (ഈ ഉദാഹരണത്തിനുള്ള ഡയറക്‌ടറികളും പാതനാമങ്ങളും അവഗണിക്കുന്നു)

save_compact_p = സത്യം --
"my_saved_clsfs.results-bin" - പൂർണ്ണമായും എഴുതിയ ഫയൽ
"my_saved_clsfs.results-tmp-bin" - ഭാഗികമായി എഴുതിയ ഫയൽ, പേരുമാറ്റി
പൂർത്തിയാകുമ്പോൾ

save_compact_p = തെറ്റ് --
"my_saved_clsfs.results" - പൂർണ്ണമായും എഴുതിയ ഫയൽ
"my_saved_clsfs.results-tmp" - ഭാഗികമായി എഴുതിയ ഫയൽ, പേര് മാറ്റി
പൂർത്തിയാകുമ്പോൾ

ചെക്ക് പോയിന്റിംഗ് നടത്തുകയാണെങ്കിൽ, ഈ അധിക പേരുകൾ ദൃശ്യമാകും

save_compact_p = സത്യം --
"my_saved_clsfs.chkpt-bin" - പൂർണ്ണമായും എഴുതിയ ചെക്ക്‌പോയിന്റ് ഫയൽ
"my_saved_clsfs.chkpt-tmp-bin" - ഭാഗികമായി എഴുതിയ ചെക്ക്‌പോയിന്റ് ഫയൽ,
പൂർത്തിയാകുമ്പോൾ പേരുമാറ്റി
save_compact_p = തെറ്റ് --
"my_saved_clsfs.chkpt" - പൂർണ്ണമായും എഴുതിയ ചെക്ക്‌പോയിന്റ് ഫയൽ
"my_saved_clsfs.chkpt-tmp" - ഭാഗികമായി എഴുതിയ ചെക്ക്‌പോയിന്റ് ഫയൽ,
പൂർത്തിയാകുമ്പോൾ പേരുമാറ്റി

എങ്ങനെ TO നേടുക ആരംഭിച്ചത്
ഓട്ടോക്ലാസ് -സെർച്ച് അഭ്യർത്ഥിക്കാനുള്ള വഴി ഇതാണ്:

autoclass -search <.db2 file path> <.hd2 file path>
<.model file path> <.s-params file path>

മുമ്പത്തെ തിരയൽ പുനരാരംഭിക്കുന്നതിന്, അത് വ്യക്തമാക്കുക force_new_search_p എന്നതിൽ തെറ്റായ മൂല്യമുണ്ട്
params ഫയൽ തിരയുക, കാരണം അതിന്റെ സ്ഥിരസ്ഥിതി ശരിയാണ്. തെറ്റ് വ്യക്തമാക്കുന്നത് ഓട്ടോക്ലാസ്-സെർച്ച് പറയുന്നു
മുമ്പത്തെ അനുയോജ്യമായ തിരയൽ (<...>.ഫലങ്ങൾ[-ബിൻ] & <...>.തിരയൽ) കണ്ടെത്താൻ ശ്രമിക്കുന്നതിന്
മുതൽ തുടരുക, കണ്ടെത്തിയാൽ അത് ഉപയോഗിച്ച് പുനരാരംഭിക്കും. പകരം ഒരു പുതിയ തിരയൽ നിർബന്ധിക്കാൻ
പഴയത് പുനരാരംഭിക്കുക, പരാമീറ്റർ നൽകുക force_new_search_p ശരിയുടെ മൂല്യം, അല്ലെങ്കിൽ ഉപയോഗിക്കുക
സ്ഥിരസ്ഥിതി. നിലവിലുള്ള ഒരു തിരയൽ (<...>.ഫലങ്ങൾ[-ബിൻ] & <...>.തിരയൽ) ഉണ്ടെങ്കിൽ, ഉപയോക്താവ്
തുടർച്ച സ്ഥിരീകരിക്കാൻ ആവശ്യപ്പെടും, കാരണം തുടരൽ നിലവിലുള്ള തിരയൽ നിരസിക്കും.

മുമ്പത്തെ തിരച്ചിൽ തുടരുകയാണെങ്കിൽ, പകരം "RESTARTING SEARCH" എന്ന സന്ദേശം നൽകും
സാധാരണ "ആരംഭ തിരയൽ". മുമ്പത്തെ തിരയൽ തുടരുന്നതാണ് പൊതുവെ നല്ലത്
പുതിയത് ആരംഭിക്കുന്നതിനേക്കാൾ, നിങ്ങൾ കാര്യമായ വ്യത്യസ്തമായ ഒരു തിരയൽ രീതി പരീക്ഷിക്കുന്നില്ലെങ്കിൽ, ഇൻ
മുമ്പത്തെ തിരയലിൽ നിന്നുള്ള സ്ഥിതിവിവരക്കണക്കുകൾ നിലവിലുള്ളതിനെ തെറ്റിദ്ധരിപ്പിച്ചേക്കാം.

പദവി റിപ്പോർട്ടുകൾ
തിരയലിലെ റണ്ണിംഗ് കമന്ററി സ്ക്രീനിലേക്കും ലോഗ് ഫയലിലേക്കും പ്രിന്റ് ചെയ്യപ്പെടും
(അല്ലാതെ log_file_p തെറ്റാണ്). ".log" ഫയലിൽ എല്ലാറ്റിന്റെയും ഒരു ലിസ്റ്റ് അടങ്ങിയിരിക്കുമെന്നത് ശ്രദ്ധിക്കുക
ഡിഫോൾട്ട് സെർച്ച് പാരാ മൂല്യങ്ങളും അസാധുവാക്കപ്പെട്ട എല്ലാ പാരാമുകളുടെയും മൂല്യങ്ങളും.

ഓരോന്നിനും ശേഷം ഒരു ചെറിയ റിപ്പോർട്ട് (കുറച്ച് പ്രതീകങ്ങൾ മാത്രം) നൽകിയിരിക്കുന്നു. ഓരോ പുതിയതിനുശേഷവും
മികച്ച വർഗ്ഗീകരണം, ദൈർഘ്യമേറിയ റിപ്പോർട്ട് നൽകിയിരിക്കുന്നു, എന്നാൽ കൂടുതൽ തവണ അല്ല ചുരുങ്ങിയ_റിപ്പോർട്ട്_കാലയളവ്
(സ്ഥിരസ്ഥിതി 30 സെക്കൻഡ് ആണ്).

തിരയൽ വ്യതിയാനങ്ങൾ
ഓട്ടോക്ലാസ് - ഡിഫോൾട്ടായി തിരയുന്നതിന് ഒരു നിശ്ചിത സ്റ്റാൻഡേർഡ് തിരയൽ രീതി ഉപയോഗിക്കുന്നു അല്ലെങ്കിൽ "പ്രവർത്തിക്കാൻ ശ്രമിക്കുക"
(try_fn_type = "converge_search_3"). മറ്റ് രണ്ട് കൂടി ലഭ്യമാണ്: "converge_search_4"
ഒപ്പം "കൺവേർജ്"). നിങ്ങളുടെ പ്രശ്‌നം പ്രയോജനകരമായേക്കാവുന്ന ഒന്നാണെങ്കിൽ അവ നൽകിയിട്ടുണ്ട്
അവരിൽനിന്ന്. പൊതുവേ, ഡിഫോൾട്ട് രീതി മികച്ച വർഗ്ഗീകരണങ്ങൾ കണ്ടെത്തുന്നതിന് കാരണമാകും
ദൈർഘ്യമേറിയ തിരയൽ സമയത്തിന്റെ ചെലവ്. ദൃഢമായ, നൽകുന്ന തരത്തിലാണ് ഡിഫോൾട്ട് തിരഞ്ഞെടുത്തത്
പല പ്രശ്‌നങ്ങളിലും പ്രകടനം പോലും. ഡിഫോൾട്ടിനുള്ള ഇതരമാർഗങ്ങൾ കൂടുതൽ മെച്ചപ്പെട്ടേക്കാം
ചില പ്രശ്നങ്ങൾ, എന്നാൽ മറ്റുള്ളവയിൽ കാര്യമായി മോശമായേക്കാം.

"converge_search_3" ഒരു സമ്പൂർണ്ണ സ്റ്റോപ്പിംഗ് മാനദണ്ഡം ഉപയോഗിക്കുന്നു (rel_delta_range, ഡിഫോൾട്ട് മൂല്യം
0.0025) ഇത് ലോഗിന്റെ ഡെൽറ്റയുടെ ഓരോ ക്ലാസിന്റെയും വ്യതിയാനം പരിശോധിക്കുന്നു.
ക്ലാസ് സിദ്ധാന്തവുമായി ബന്ധപ്പെട്ട് ക്ലാസ് സ്ഥിതിവിവരക്കണക്കുകളുടെ നാമമാത്ര-സാധ്യത
(class->log_a_w_s_h_j) ക്ലാസ് വെയിറ്റ് (class->w_j) കൊണ്ട് ഹരിച്ചാൽ തുടർച്ചയായി
ഒത്തുചേരൽ ചക്രങ്ങൾ. ഈ മൂല്യം കൂട്ടുന്നത് ഒത്തുചേരൽ അയവുള്ളതാക്കുകയും എണ്ണം കുറയ്ക്കുകയും ചെയ്യുന്നു
ചക്രങ്ങളുടെ. ഈ മൂല്യം കുറയ്ക്കുന്നത് സംയോജനത്തെ ശക്തമാക്കുകയും അവയുടെ എണ്ണം വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു
ചക്രങ്ങൾ. n_ശരാശരി (3 ന്റെ സ്ഥിര മൂല്യം) തുടർച്ചയായി എത്ര സൈക്കിളുകൾ പാലിക്കണമെന്ന് വ്യക്തമാക്കുന്നു
വിചാരണ അവസാനിക്കുന്നതിന് മുമ്പ് നിർത്തൽ മാനദണ്ഡം.

"converge_search_4" ഒരു സമ്പൂർണ്ണ സ്റ്റോപ്പിംഗ് മാനദണ്ഡം ഉപയോഗിക്കുന്നു (cs4_delta_range, ഡിഫോൾട്ട് മൂല്യം
0.0025) ഇത് ഓരോ ക്ലാസ് ലോഗിനുമുള്ള ചരിവിന്റെ ഓരോ ക്ലാസിന്റെയും വ്യതിയാനം പരിശോധിക്കുന്നു
ക്ലാസുമായി ബന്ധപ്പെട്ട് ക്ലാസ് സ്ഥിതിവിവരക്കണക്കുകളുടെ ഏകദേശ-മാർജിനൽ-സാധ്യത
അനുമാനം (class->log_a_w_s_h_j) ക്ലാസ് ഭാരം (class->w_j) കൊണ്ട് ഹരിച്ചിരിക്കുന്നു
sigma_beta_n_values (സ്ഥിര മൂല്യം 6) ഒത്തുചേരൽ ചക്രങ്ങൾ. മൂല്യം വർദ്ധിപ്പിക്കുന്നു
cs4_delta_range ഒത്തുചേരൽ അയവുള്ളതാക്കുകയും സൈക്കിളുകളുടെ എണ്ണം കുറയ്ക്കുകയും ചെയ്യുന്നു. ഇത് കുറയ്ക്കുന്നു
മൂല്യം ഒത്തുചേരൽ ശക്തമാക്കുകയും സൈക്കിളുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു. കണക്കുകൂട്ടലനുസരിച്ച്, ഇത്
"കൺവെർജ്_സെർച്ച്_3" എന്നതിനേക്കാൾ ചെലവേറിയ ഫംഗ്‌ഷൻ പരീക്ഷിക്കൂ, എന്നാൽ ഇത് ഉപയോഗപ്രദമാണെന്ന് തെളിഞ്ഞേക്കാം
കമ്പ്യൂട്ടേഷണൽ "ശബ്ദം" കണക്കാക്കിയ മൂല്യങ്ങളിലെ വ്യതിയാനങ്ങളുമായി താരതമ്യം ചെയ്യുമ്പോൾ പ്രാധാന്യമർഹിക്കുന്നു.
പ്രധാന കണക്കുകൂട്ടലുകൾ ഇരട്ട പ്രിസിഷൻ ഫ്ലോട്ടിംഗ് പോയിന്റിലും ഏറ്റവും വലിയ ഡാറ്റയ്ക്കായും ചെയ്യുന്നു
ഞങ്ങൾ ഇതുവരെ പരീക്ഷിച്ച അടിസ്ഥാനം (5,420 ആട്രിബ്യൂട്ടുകളുടെ 93 കേസുകൾ), കമ്പ്യൂട്ടേഷണൽ നോയിസ് ഇല്ല
മൂല്യമാണെങ്കിലും ഒരു പ്രശ്നമാണ് max_cycles 400 ആയി ഉയർത്തണം.

"കൺവെർജ്" രണ്ട് സമ്പൂർണ്ണ സ്റ്റോപ്പിംഗ് മാനദണ്ഡങ്ങളിൽ ഒന്ന് ഉപയോഗിക്കുന്നു, ഇത് വ്യതിയാനത്തെ പരിശോധിക്കുന്നു
വർഗ്ഗീകരണം (clsf) log_marginal (clsf->log_a_x_h) ഡെൽറ്റ തുടർച്ചയായി ഒത്തുചേരൽ
ചക്രങ്ങൾ. ഏറ്റവും വലുത് halt_range (സ്ഥിര മൂല്യം 0.5) കൂടാതെ halt_factor *
current_clsf_log_marginal) ഉപയോഗിക്കുന്നു (സ്ഥിര മൂല്യം halt_factor 0.0001 ആണ്). വർദ്ധിച്ചുവരുന്ന
ഈ മൂല്യങ്ങൾ സംയോജനത്തെ അയവുള്ളതാക്കുകയും സൈക്കിളുകളുടെ എണ്ണം കുറയ്ക്കുകയും ചെയ്യുന്നു. ഇവ കുറയ്ക്കുന്നു
മൂല്യങ്ങൾ സംയോജനത്തെ ശക്തമാക്കുകയും സൈക്കിളുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു. n_ശരാശരി (സ്ഥിരസ്ഥിതി
മൂല്യം 3) ട്രയലിന് മുമ്പ് എത്ര സൈക്കിളുകൾ സ്റ്റോപ്പിംഗ് മാനദണ്ഡങ്ങൾ പാലിക്കണമെന്ന് വ്യക്തമാക്കുന്നു
അവസാനിപ്പിക്കുന്നു. ഇത് വളരെ ഏകദേശ സ്റ്റോപ്പിംഗ് മാനദണ്ഡമാണ്, എന്നാൽ നിങ്ങൾക്ക് കുറച്ച് അനുഭവം നൽകും
പ്രതീക്ഷിക്കുന്ന തരത്തിലുള്ള തരംതിരിവുകൾക്കായി. "പര്യവേക്ഷണ" തിരയലുകൾക്ക് ഇത് ഉപയോഗപ്രദമാകും
ഒരു ഡാറ്റാ ബേസ്.

ഇതിന്റെ ഉദ്ദേശ്യം reconverge_type = "chkpt" എന്നത് ഒരു തടസ്സപ്പെട്ട വർഗ്ഗീകരണം പൂർത്തിയാക്കുക എന്നതാണ്
അതിന്റെ അവസാന ചെക്ക് പോയിന്റിൽ നിന്ന് തുടരുന്നു. ഉദ്ദേശ്യം reconverge_type = "ഫലങ്ങൾ" എന്നതാണ്
വ്യത്യസ്‌ത മൂല്യം ഉപയോഗിച്ച് പൂർത്തിയാക്കിയ മികച്ച വർഗ്ഗീകരണം കൂടുതൽ പരിഷ്‌ക്കരിക്കാൻ ശ്രമിക്കുക
try_fn_type ("converge_search_3", "converge_search_4", "converge"). എങ്കിൽ പരമാവധി_n_ശ്രമങ്ങൾ is
1-ൽ കൂടുതൽ, പിന്നെ ഓരോ സാഹചര്യത്തിലും, പുനഃസ്ഥാപിക്കൽ പൂർത്തിയായ ശേഷം, ഓട്ടോക്ലാസ് ഉദ്ദേശിക്കുന്ന
<...>.s-params ഫയലിലെ പാരാമീറ്റർ മൂല്യങ്ങളെ അടിസ്ഥാനമാക്കി കൂടുതൽ തിരയൽ ട്രയലുകൾ നടത്തുക.

ഉപയോഗത്തോടെ reconverge_type ( ഡിഫോൾട്ട് മൂല്യം ""), നിങ്ങൾക്ക് ഒന്നിലധികം തവണ ശ്രമിക്കാവുന്നതാണ്
ഒരു വർഗ്ഗീകരണത്തിലേക്കുള്ള പ്രവർത്തനം. ഉപയോഗിച്ച് നിങ്ങൾ നിരവധി പര്യവേക്ഷണ പരീക്ഷണങ്ങൾ സൃഷ്ടിക്കുന്നുവെന്ന് പറയുക
try_fn_type = "കൺവെർജ്", കൂടാതെ .search, .results[-bin] ഫയലുകൾ സംരക്ഷിക്കുന്ന തിരയൽ ഉപേക്ഷിക്കുക.
തുടർന്ന് നിങ്ങൾക്ക് മറ്റൊരു തിരയൽ ആരംഭിക്കാം try_fn_type = "converge_search_3", reconverge_type
= "ഫലങ്ങൾ", ഒപ്പം പരമാവധി_n_ശ്രമങ്ങൾ = 1. ഇത് മികച്ചതിന്റെ കൂടുതൽ ഒത്തുചേരലിന് കാരണമാകും
ഉപയോഗിച്ച് സൃഷ്ടിച്ച വർഗ്ഗീകരണം try_fn_type = "കൺവെർജ്", കൂടെ try_fn_type =
"converge_search_3". എപ്പോൾ ഓട്ടോക്ലാസ് ഈ തിരയൽ ശ്രമം പൂർത്തിയാക്കുന്നു, നിങ്ങൾക്ക് ഒരു ലഭിക്കും
അധിക പരിഷ്കൃത വർഗ്ഗീകരണം.

ഇതരമാർഗ്ഗങ്ങളിൽ ഏതെങ്കിലുമുണ്ടോ എന്ന് പരിശോധിക്കാനുള്ള നല്ലൊരു വഴി try_fun_type ഒരു കിണർ ഉത്പാദിപ്പിക്കുന്നു
സംയോജിപ്പിച്ച വർഗ്ഗീകരണം പ്രവർത്തിപ്പിക്കുക എന്നതാണ് ഓട്ടോക്ലാസ് ഉപയോഗിച്ച അതേ ഡാറ്റയിൽ പ്രവചന മോഡിൽ
വർഗ്ഗീകരണം സൃഷ്ടിക്കുന്നു. തുടർന്ന് അനുബന്ധ കേസ് അല്ലെങ്കിൽ ക്ലാസ് ജനറേറ്റ് ചെയ്ത് താരതമ്യം ചെയ്യുക
യഥാർത്ഥ വർഗ്ഗീകരണത്തിനും പ്രവചനത്തിനുമുള്ള ക്രോസ് റഫറൻസ് ഫയലുകൾ. ചെറുത്
ഈ ഫയലുകൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ പ്രതീക്ഷിക്കേണ്ടതാണ്, അതേസമയം വലിയ വ്യത്യാസങ്ങൾ സൂചിപ്പിക്കുന്നു
അപൂർണ്ണമായ ഒത്തുചേരൽ. അത്തരം ഫയൽ ജോഡികൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ ശരാശരിയിലും മൊഡ്യൂളിലും ആയിരിക്കണം
ക്ലാസ് ഇല്ലാതാക്കലുകൾ, കൂടുതൽ ഒത്തുചേരലിനൊപ്പം ഏകതാനമായി കുറയുന്നു.

ഒരു ശ്രമം ആരംഭിക്കുന്നതിന് ക്രമരഹിതമായ വർഗ്ഗീകരണം സൃഷ്ടിക്കുന്നതിനുള്ള സ്റ്റാൻഡേർഡ് മാർഗം ഡിഫോൾട്ടാണ്
"റാൻഡം" എന്നതിന്റെ മൂല്യം start_fn_type. ഈ ഘട്ടത്തിൽ ബദലുകളൊന്നുമില്ല. വ്യക്തമാക്കുന്നത്
വേണ്ടി "തടയുക" start_fn_type ആവർത്തിക്കാവുന്ന ക്രമരഹിതമായ തിരയലുകൾ നിർമ്മിക്കുന്നു. അങ്ങനെയാണ്
ഓട്ടോക്ലാസ്-സി/ഡാറ്റ/.. സബ് ഡയറക്‌ടറികളിലെ <..>.s-params ഫയലുകൾ വ്യക്തമാക്കിയിരിക്കുന്നു. ഇങ്ങനെയാണ്
വികസന പരിശോധന നടത്തി.

max_cycles ഏതെങ്കിലും ഒന്നിൽ നിർവ്വഹിക്കുന്ന പരമാവധി എണ്ണം കൺവെർജൻസ് സൈക്കിളുകൾ നിയന്ത്രിക്കുന്നു
കൺവെർജൻസ് ഫംഗ്‌ഷനുകളുടെ ഒരു ട്രയൽ. അതിന്റെ ഡിഫോൾട്ട് മൂല്യം 200 ആണ്. സ്ക്രീൻ ഔട്ട്പുട്ട്
പൂർത്തിയാക്കിയ ഓരോ സൈക്കിളിനും ഒരു കാലയളവ് ("") കാണിക്കുന്നു. നിങ്ങളുടെ തിരയൽ ട്രയലുകൾ 200 സൈക്കിളുകൾക്കായി പ്രവർത്തിക്കുന്നുവെങ്കിൽ,
ഒന്നുകിൽ നിങ്ങളുടെ ഡാറ്റാ ബേസ് വളരെ സങ്കീർണ്ണമാണ് (മൂല്യം വർദ്ധിപ്പിക്കുക), അല്ലെങ്കിൽ try_fn_type അല്ല
സാഹചര്യത്തിന് പര്യാപ്തമാണ് (ലഭ്യമായ മറ്റൊന്ന് പരീക്ഷിച്ച് ഉപയോഗിക്കുക converge_print_p ലഭിക്കാൻ
എന്താണ് സംഭവിക്കുന്നത് എന്നതിനെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾ).

വ്യക്തമാക്കുന്നത് converge_print_p ശരിയാണെങ്കിൽ ഓരോ സൈക്കിളിനും ഒരു ഹ്രസ്വ പ്രിന്റ് ഔട്ട് സൃഷ്ടിക്കും
എന്നതിന്റെ ഡിഫോൾട്ട് മൂല്യങ്ങൾ നിങ്ങൾക്ക് പരിഷ്കരിക്കാൻ കഴിയുന്ന തരത്തിൽ വിവരങ്ങൾ നൽകുന്നതാണ്
rel_delta_range & n_ശരാശരി "converge_search_3" എന്നതിനായി; cs4_delta_range & sigma_beta_n_values
"converge_search_4" എന്നതിനായി; ഒപ്പം halt_range, halt_factor, ഒപ്പം n_ശരാശരി "കൺവേർജ്" എന്നതിന്. അവരുടെ
ഓട്ടോക്ലാസ്-സി/ഡാറ്റ/.. ഉപ-യിലെ <..>.s-params ഫയലുകളിൽ ഡിഫോൾട്ട് മൂല്യങ്ങൾ നൽകിയിരിക്കുന്നു.
ഡയറക്ടറികൾ.

എങ്ങനെ നിരവധി ക്ലാസുകൾ?
ഓരോ പുതിയ ശ്രമവും ഒരു നിശ്ചിത എണ്ണം ക്ലാസുകളിൽ ആരംഭിക്കുകയും ചെറിയ സംഖ്യയിൽ അവസാനിക്കുകയും ചെയ്യാം.
ചില ക്ലാസുകൾ ഒത്തുചേരലിൽ നിന്ന് പുറത്തുപോയേക്കാം. പൊതുവേ, നിങ്ങൾ ശ്രമം ആരംഭിക്കാൻ ആഗ്രഹിക്കുന്നു
മുമ്പത്തെ ശ്രമങ്ങൾ ലുക്ക് വാഗ്ദാനമാണെന്ന് സൂചിപ്പിച്ച കുറച്ച് ക്ലാസുകൾക്കൊപ്പം, നിങ്ങൾ
നിങ്ങൾക്ക് മുമ്പ് എന്തെങ്കിലും നഷ്‌ടമായ സാഹചര്യത്തിൽ നിങ്ങൾ മറ്റെവിടെയെങ്കിലും മത്സ്യബന്ധനം നടത്തുന്നുണ്ടെന്ന് ഉറപ്പാക്കാൻ ആഗ്രഹിക്കുന്നു.

n_classes_fn_type = "random_ln_normal" ആണ് ഈ തിരഞ്ഞെടുപ്പ് നടത്താനുള്ള ഡിഫോൾട്ട് മാർഗം. എ യോജിക്കുന്നു
മികച്ച 10 ക്ലാസുകളുടെ എണ്ണത്തിലേക്ക് നോർമൽ ലോഗ് ചെയ്യുക (സാധാരണയായി "j" എന്ന് ചുരുക്കത്തിൽ)
ഇതുവരെ കണ്ടെത്തിയ വർഗ്ഗീകരണങ്ങൾ, അതിൽ നിന്ന് ക്രമരഹിതമായി തിരഞ്ഞെടുക്കുന്നു. നിലവിൽ ഇല്ല
ബദൽ.

ഗെയിം ആരംഭിക്കുന്നതിന്, ഡിഫോൾട്ട് താഴേക്ക് പോകുക എന്നതാണ് start_j_list ആദ്യ കുറച്ച് ശ്രമങ്ങൾക്ക്, ഒപ്പം
തുടർന്ന് സ്വിച്ചുചെയ്യുക n_classes_fn_type. ക്ലാസുകളുടെ സാധ്യതയുള്ള എണ്ണം എന്ന് നിങ്ങൾ വിശ്വസിക്കുന്നുവെങ്കിൽ
നിങ്ങളുടെ ഡാറ്റാ ബേസ് 75 ആണ്, തുടർന്ന് സ്ഥിര മൂല്യം ഉപയോഗിക്കുന്നതിന് പകരം start_j_list (2, 3,
5, 7, 10, 15, 25), 50, 60, 70, 80, 90, 100 പോലെയുള്ള ഒന്ന് വ്യക്തമാക്കുക.

ഒരാൾക്ക് എല്ലായ്പ്പോഴും മൂന്ന് ക്ലാസുകൾ നോക്കണമെങ്കിൽ, ഒരാൾക്ക് ഉപയോഗിക്കാം fixed_j അസാധുവാക്കുക
മുകളിൽ. j തിരഞ്ഞെടുക്കുന്നതിനുള്ള നിലവിലെ രീതി എന്താണെന്ന് തിരയൽ സ്റ്റാറ്റസ് റിപ്പോർട്ടുകൾ വിവരിക്കും.

DO I ഉണ്ട് മതി MEMORY ഒപ്പം ഡിസ്ക് സ്പേസ്?
ആന്തരികമായി, നിലവിലെ സിസ്റ്റത്തിലെ സ്റ്റോറേജ് ആവശ്യകതകൾ ക്രമം n_classes_per_clsf ആണ്
* (n_data + n_stored_clsfs * n_attributes * n_attribute_values). ഇത് ആശ്രയിച്ചിരിക്കുന്നു
കേസുകളുടെ എണ്ണം, ആട്രിബ്യൂട്ടുകളുടെ എണ്ണം, ആട്രിബ്യൂട്ടിലെ മൂല്യങ്ങൾ (യഥാർത്ഥമാണെങ്കിൽ 2 ഉപയോഗിക്കുക
മൂല്യം), കൂടാതെ മറ്റുള്ളവയാണോ എന്നറിയാൻ താരതമ്യത്തിനായി സംഭരിച്ചിരിക്കുന്ന വർഗ്ഗീകരണങ്ങളുടെ എണ്ണം
തനിപ്പകർപ്പുകൾ -- നിയന്ത്രിക്കുന്നത് max_n_store (സ്ഥിര മൂല്യം = 10). തിരയൽ പ്രക്രിയ ഇല്ല
സ്വയം കാര്യമായ മെമ്മറി ഉപയോഗിക്കുന്നു, പക്ഷേ ഫലങ്ങളുടെ സംഭരണം അങ്ങനെ ചെയ്തേക്കാം.

ഓട്ടോക്ലാസ് C പരമാവധി 999 ആട്രിബ്യൂട്ടുകൾ കൈകാര്യം ചെയ്യാൻ ക്രമീകരിച്ചിരിക്കുന്നു. നിങ്ങൾ ഓടാൻ ശ്രമിക്കുകയാണെങ്കിൽ
അതിലുപരിയായി നിങ്ങൾക്ക് അറേ ബൗണ്ട് ലംഘനങ്ങൾ ലഭിക്കും. അങ്ങനെയെങ്കിൽ ഇവ മാറ്റുക
prog/autoclass.h-ലെ കോൺഫിഗറേഷൻ പാരാമീറ്ററുകൾ, വീണ്ടും കമ്പൈൽ ചെയ്യുക ഓട്ടോക്ലാസ് C:

#എല്ലാ_ആട്രിബ്യൂട്ടുകളും 999 നിർവചിക്കുക
#നിർവ്വചിക്കുക VERY_LONG_STRING_LENGTH 20000
#നിർവ്വചിക്കുക VERY_LONG_TOKEN_LENGTH 500

ഉദാഹരണത്തിന്, ഈ മൂല്യങ്ങൾ ആയിരക്കണക്കിന് ആട്രിബ്യൂട്ടുകൾ കൈകാര്യം ചെയ്യും:

#എല്ലാ_ആട്രിബ്യൂട്ടുകളും 9999 നിർവചിക്കുക
#നിർവ്വചിക്കുക VERY_LONG_STRING_LENGTH 50000
#നിർവ്വചിക്കുക VERY_LONG_TOKEN_LENGTH 50000

"ലോഗ്" ഫയൽ എടുക്കുന്ന ഡിസ്ക് സ്പേസ് തീർച്ചയായും തിരയലിന്റെ ദൈർഘ്യത്തെ ആശ്രയിച്ചിരിക്കും.
n_save (സ്ഥിര മൂല്യം = 2) എത്ര മികച്ച വർഗ്ഗീകരണങ്ങൾ സംരക്ഷിച്ചിട്ടുണ്ടെന്ന് നിർണ്ണയിക്കുന്നു
".ഫലങ്ങൾ[-ബിൻ]" ഫയൽ. save_compact_p "ഫലങ്ങൾ", "ചെക്ക് പോയിന്റ്" എന്നിവ നിയന്ത്രിക്കുന്നു
ഫയലുകൾ ബൈനറി ആയി സേവ് ചെയ്യുന്നു. ബൈനറി ഫയലുകൾ വേഗതയേറിയതും കൂടുതൽ ഒതുക്കമുള്ളതുമാണ്, പക്ഷേ അല്ല
പോർട്ടബിൾ. യുടെ ഡിഫോൾട്ട് മൂല്യം save_compact_p സത്യമാണ്, ഇത് ബൈനറി ഫയലുകൾ ആകുന്നതിന് കാരണമാകുന്നു
എഴുതി.

"ഫലങ്ങൾ" ഫയലുകൾ സംരക്ഷിക്കാൻ എടുക്കുന്ന സമയം ഒരു പ്രശ്നമാണെങ്കിൽ, വർദ്ധിപ്പിക്കുന്നത് പരിഗണിക്കുക
മിനിട്ട്_സേവ്_പിരീഡ് (സ്ഥിര മൂല്യം = 1800 സെക്കൻഡ് അല്ലെങ്കിൽ 30 മിനിറ്റ്). ഫയലുകൾ ഡിസ്കിലേക്ക് സംരക്ഷിച്ചു
റിപ്പോർട്ട് ചെയ്യാൻ വ്യത്യസ്തമായ എന്തെങ്കിലും ഉണ്ടെങ്കിൽ ഇത് പലപ്പോഴും.

JUST എങ്ങനെ സ്ലോ IS ഐടി?
കമ്പ്യൂട്ട് സമയം ക്രമത്തിലാണ് n_data * n_attributes * n_classes * n_triries *
converge_cycles_per_try. ഇതിലെ പ്രധാന അനിശ്ചിതത്വങ്ങൾ അടിസ്ഥാന പിൻഭാഗങ്ങളുടെ എണ്ണമാണ്
ഓരോ ശ്രമത്തിലും ഒത്തുചേരുന്നത് വരെ മുന്നോട്ടുള്ള ചക്രങ്ങൾ, തീർച്ചയായും ശ്രമങ്ങളുടെ എണ്ണം. അക്കം
ഓരോ ട്രയലിനും ചക്രങ്ങളുടെ എണ്ണം സാധാരണയായി 10-100 ആണ് try_fn_type "കൺവെർജ്", കൂടാതെ 10-200+ എന്നതിന്
"converge_search_3", "converge_search-4". പരമാവധി സംഖ്യ വ്യക്തമാക്കിയിരിക്കുന്നു
പരമാവധി_n_ശ്രമങ്ങൾ (സ്ഥിര മൂല്യം = 200). ട്രയലുകളുടെ എണ്ണം നിങ്ങളെയും നിങ്ങളുടെ ലഭ്യവുമാണ്
കമ്പ്യൂട്ടിംഗ് ഉറവിടങ്ങൾ.

വളരെ വലിയ ഡാറ്റാ സെറ്റുകളുടെ പ്രവർത്തന സമയം തീർത്തും അനിശ്ചിതത്വത്തിലായിരിക്കും. ഞങ്ങൾ കുറച്ച് ഉപദേശിക്കുന്നു
അടിസ്ഥാനം നിർണ്ണയിക്കാൻ നിങ്ങളുടെ സിസ്റ്റത്തിൽ ചെറിയ തോതിലുള്ള ടെസ്റ്റ് റണ്ണുകൾ നടത്തണം. വ്യക്തമാക്കുക n_data ലേക്ക്
എത്ര ഡാറ്റ വെക്‌ടറുകൾ വായിക്കുന്നു എന്നതിനെ പരിമിതപ്പെടുത്തുക. വളരെ വലിയ അളവിലുള്ള ഡാറ്റ നൽകുമ്പോൾ, ഓട്ടോക്ലാസ് കഴിയുക
നൂറിലധികം ക്ലാസുകളിൽ അതിന്റെ ഏറ്റവും സാധ്യതയുള്ള വർഗ്ഗീകരണങ്ങൾ കണ്ടെത്തുക, ഇത് ചെയ്യും
അത് ആവശ്യമാണ് start_j_list ഉചിതമായി വ്യക്തമാക്കണം (മുകളിലുള്ള വിഭാഗം കാണുക എങ്ങനെ നിരവധി
ക്ലാസുകൾ?). നിങ്ങൾക്ക് കുറച്ച് ക്ലാസുകൾ മാത്രമേ ആവശ്യമുള്ളൂ എന്ന് നിങ്ങൾക്ക് ഉറപ്പുണ്ടെങ്കിൽ, നിങ്ങൾക്ക് നിർബന്ധിക്കാം
ഓട്ടോക്ലാസ് വ്യക്തമാക്കിയ ക്ലാസുകളുടെ ഒരു നിശ്ചിത എണ്ണം ഉപയോഗിച്ച് തിരയാൻ fixed_j. അപ്പോൾ നിങ്ങൾ ചെയ്യും
ഓരോ വ്യത്യസ്‌ത നിശ്ചിത എണ്ണം ക്ലാസുകൾക്കൊപ്പം വെവ്വേറെ തിരയലുകൾ നടത്തേണ്ടതുണ്ട്.

മാറ്റുന്നതിൽ ഫയലുകളുടെ പേരുകൾ IN A സംരക്ഷിച്ചു വർഗ്ഗീകരണം FILE
ഓട്ടോക്ലാസ് സംരക്ഷിച്ച വർഗ്ഗീകരണത്തിലെ ഡാറ്റ, ഹെഡർ, മോഡൽ ഫയൽ പാത്ത് നെയിമുകൾ എന്നിവ കാഷെ ചെയ്യുന്നു
ബൈനറി (".ഫലങ്ങൾ-ബിൻ") അല്ലെങ്കിൽ ASCII (".ഫലങ്ങൾ") "ഫലങ്ങൾ" ഫയലുകളുടെ ഘടന. എങ്കിൽ
"ഫലങ്ങൾ", "തിരയൽ" ഫയലുകൾ മറ്റൊരു ഡയറക്‌ടറി ലൊക്കേഷനിലേക്ക് നീക്കി, തിരയൽ
നിങ്ങൾ സമ്പൂർണ്ണ പാതനാമങ്ങൾ ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിൽ വിജയകരമായി പുനരാരംഭിക്കാൻ കഴിയില്ല. അത് അങ്ങനെയാണ്
ഇൻവോക്ക് പ്രവർത്തിപ്പിക്കുന്നത് പ്രയോജനകരമാണ് ഓട്ടോക്ലാസ് ഡാറ്റ, ഹെഡർ, മോഡൽ എന്നിവയുടെ പാരന്റ് ഡയറക്ടറിയിൽ
ഫയലുകൾ, അതുവഴി ആപേക്ഷിക പാത്ത്നെയിമുകൾ ഉപയോഗിക്കാനാകും. കാഷെ ചെയ്‌ത പാത്ത്‌നാമങ്ങൾ അപ്പോൾ ആയിരിക്കും
ആപേക്ഷികമായി, ഫയലുകൾ മറ്റൊരു ഹോസ്റ്റിലേക്കോ ഫയൽ സിസ്റ്റത്തിലേക്കോ നീക്കി പുനരാരംഭിക്കാൻ കഴിയും --
ഒരേ ആപേക്ഷിക പാത നാമം നൽകുന്ന ശ്രേണി നിലവിലുണ്ട്.

എന്നിരുന്നാലും, ".ഫലങ്ങൾ" ഫയൽ ASCII ടെക്സ്റ്റ് ആയതിനാൽ, ആ പാത്ത് നെയിമുകൾ a ഉപയോഗിച്ച് മാറ്റാവുന്നതാണ്
ടെക്സ്റ്റ് എഡിറ്റർ (save_compact_p തെറ്റാണെന്ന് വ്യക്തമാക്കണം).

തിരയൽ പാരാമീറ്ററുകൾ
തിരയൽ നിയന്ത്രിക്കുന്നത് ".s-params" ഫയലാണ്. ഈ ഫയലിൽ, ഒരു ശൂന്യമായ വരി അല്ലെങ്കിൽ ഒരു വരി
ഈ പ്രതീകങ്ങളിലൊന്നിൽ നിന്ന് ആരംഭിക്കുന്നത് ഒരു കമന്റായി കണക്കാക്കുന്നു: "#", "!", അല്ലെങ്കിൽ ";". ദി
പാരാമീറ്ററിന്റെ പേരും അതിന്റെ മൂല്യവും ഒരു തുല്യ ചിഹ്നം, ഒരു സ്പേസ് അല്ലെങ്കിൽ ഒരു ടാബ് ഉപയോഗിച്ച് വേർതിരിക്കാവുന്നതാണ്:

n_clsfs 1
n_clsfs = 1
n_clsfs 1

"=" അല്ലെങ്കിൽ " ആണെങ്കിൽ സ്‌പെയ്‌സ് അവഗണിക്കപ്പെടും " സെപ്പറേറ്ററുകളായി ഉപയോഗിക്കുന്നു. ട്രെയിലിംഗ് ഒന്നുമില്ല
അർദ്ധവിരാമങ്ങൾ.

തിരയൽ പാരാമീറ്ററുകൾ, അവയുടെ ഡിഫോൾട്ട് മൂല്യങ്ങൾ ഇപ്രകാരമാണ്:

rel_error = 0.01
a എന്ന് തീരുമാനിക്കുമ്പോൾ clsf-DS-%= ഉപയോഗിക്കുന്ന ആപേക്ഷിക വ്യത്യാസ അളവ് വ്യക്തമാക്കുന്നു
പുതിയ clsf എന്നത് പഴയതിന്റെ തനിപ്പകർപ്പാണ്.

start_j_list = 2, 3, 5, 7, 10, 15, 25
തിരയൽ വളരെ വേഗത്തിൽ ചുരുക്കാതിരിക്കാൻ, തുടക്കത്തിൽ ഈ ക്ലാസുകളുടെ എണ്ണം പരീക്ഷിക്കുക.
ഈ ലിസ്റ്റിന്റെ അവസ്ഥ <..>.തിരയൽ ഫയലിൽ സംരക്ഷിച്ച് പുനരാരംഭിക്കുമ്പോൾ ഉപയോഗിക്കുന്നു,
ഒരു അസാധുവാക്കൽ സ്പെസിഫിക്കേഷൻ ഒഴികെ start_j_list എന്നതിനായുള്ള .s-params ഫയലിലാണ് നിർമ്മിച്ചിരിക്കുന്നത്
പുനരാരംഭിക്കൽ ഓട്ടം. ഈ ലിസ്റ്റ് നിങ്ങൾ പ്രതീക്ഷിക്കുന്ന ക്ലാസുകളുടെ എണ്ണം ബ്രാക്കറ്റ് ചെയ്യണം
വിശാലമായ മാർജിൻ! "start_j_list = -999" ഒരു ശൂന്യമായ ലിസ്റ്റ് വ്യക്തമാക്കുന്നു (ഇതിൽ മാത്രം അനുവദനീയമാണ്
പുനരാരംഭിക്കുന്നു)

n_classes_fn_type = "random_ln_normal"
ഒരിക്കല് start_j_list ക്ഷീണിച്ചു, ഓട്ടോക്ലാസ് എങ്ങനെ എന്ന് തീരുമാനിക്കാൻ ഈ ഫംഗ്‌ഷൻ വിളിക്കും
10 മികച്ച വർഗ്ഗീകരണങ്ങളെ അടിസ്ഥാനമാക്കി, അടുത്ത ശ്രമത്തിൽ ആരംഭിക്കാൻ നിരവധി ക്ലാസുകൾ
ഇതുവരെ കണ്ടെത്തി. നിലവിൽ "random_ln_normal" മാത്രമേ ലഭ്യമാകൂ.

fixed_j = 0
എപ്പോൾ fixed_j > 0, അസാധുവാക്കുന്നു start_j_list ഒപ്പം n_classes_fn_type, ഒപ്പം ഓട്ടോക്ലാസ് ഉദ്ദേശിക്കുന്ന
ക്ലാസുകളുടെ പ്രാരംഭ എണ്ണത്തിന് എല്ലായ്പ്പോഴും ഈ മൂല്യം ഉപയോഗിക്കുക.

ചുരുങ്ങിയ_റിപ്പോർട്ട്_കാലയളവ് = 30
അവസാന റിപ്പോർട്ട് മുതൽ വാചാലമായി റിപ്പോർട്ടുചെയ്യുന്നത് വരെ ഈ സമയമെങ്കിലും (സെക്കൻഡുകൾക്കുള്ളിൽ) കാത്തിരിക്കുക
വീണ്ടും. പരിശോധിക്കുമ്പോൾ പ്രതീക്ഷിച്ച റൺ സമയത്തേക്കാൾ കൂടുതൽ സമയം സജ്ജീകരിക്കണം
ഫലങ്ങളുടെ ആവർത്തനക്ഷമത. ആവർത്തിക്കാവുന്ന ഫലങ്ങൾക്കായി, ഇതും കാണുക force_new_search_p,
start_fn_type ഒപ്പം randomize_random_p. കുറിപ്പ്: "ഇന്ററാക്ടീവ്_പി" യിൽ ഒരെണ്ണമെങ്കിലും,
"max_duration", "max_n_triries" എന്നിവ സജീവമായിരിക്കണം. അല്ലെങ്കിൽ ഓട്ടോക്ലാസ് പ്രവർത്തിക്കും
അനിശ്ചിതമായി. താഴെ നോക്കുക.

ഇന്ററാക്ടീവ്_പി = സത്യം
തെറ്റായിരിക്കുമ്പോൾ, അല്ലെങ്കിൽ നിർത്തുന്നത് വരെ റൺ തുടരാൻ അനുവദിക്കുന്നു. സത്യമാകുമ്പോൾ, സ്റ്റാൻഡേർഡ്
"q" എന്ന ക്വിറ്റ് പ്രതീകത്തിനായി ഓരോ സൈക്കിളിലും ഇൻപുട്ട് അന്വേഷിക്കുന്നു, അത് കണ്ടെത്തുമ്പോൾ,
ഉടനടി നിർത്താൻ പ്രേരിപ്പിക്കുന്നു.

പരമാവധി_ദൈർഘ്യം = 0
എപ്പോൾ = 0, അല്ലെങ്കിൽ നിർത്തുന്നത് വരെ റൺ തുടരാൻ അനുവദിക്കുന്നു. എപ്പോൾ > 0, വ്യക്തമാക്കുന്നു
പ്രവർത്തിപ്പിക്കാൻ പരമാവധി സെക്കൻഡുകൾ.

പരമാവധി_n_ശ്രമങ്ങൾ = 0
എപ്പോൾ = 0, അല്ലെങ്കിൽ നിർത്തുന്നത് വരെ റൺ തുടരാൻ അനുവദിക്കുന്നു. എപ്പോൾ > 0, വ്യക്തമാക്കുന്നു
പരമാവധി എണ്ണം ശ്രമങ്ങൾ.

n_save = 2
.ഫലങ്ങൾ[-ബിൻ], .സെർച്ച് ഫയലുകൾ എന്നിവയിൽ ഇത്രയും clsf-കൾ ഡിസ്കിലേക്ക് സംരക്ഷിക്കുക. 0 ആണെങ്കിൽ, ചെയ്യരുത്
എന്തും സംരക്ഷിക്കുക (നോ .സെർച്ച് & .ഫലങ്ങൾ[-ബിൻ] ഫയലുകൾ).

log_file_p = സത്യം
തെറ്റാണെങ്കിൽ, ഒരു ലോഗ് ഫയൽ എഴുതരുത്.

തിരയൽ_ഫയൽ_പി = സത്യം
തെറ്റാണെങ്കിൽ, ഒരു തിരയൽ ഫയൽ എഴുതരുത്.

ഫലങ്ങൾ_ഫയൽ_പി = സത്യം
തെറ്റാണെങ്കിൽ, ഫലങ്ങളുടെ ഫയൽ എഴുതരുത്.

മിനിട്ട്_സേവ്_പിരീഡ് = 1800
സിപിയു ക്രാഷ് സംരക്ഷണം. ഇത് പരമാവധി സമയം, സെക്കന്റുകൾക്കുള്ളിൽ, അത് വ്യക്തമാക്കുന്നു ഓട്ടോക്ലാസ്
നിലവിലെ ഫലങ്ങൾ ഡിസ്കിലേക്ക് സംരക്ഷിക്കുന്നതിന് മുമ്പ് പ്രവർത്തിക്കും. സ്ഥിര സമയം 30 ആണ്
മിനിറ്റ്.

max_n_store = 10
ആന്തരികമായി സംഭരിച്ചിരിക്കുന്ന വർഗ്ഗീകരണങ്ങളുടെ പരമാവധി എണ്ണം വ്യക്തമാക്കുന്നു.

n_ഫൈനൽ_സംഗ്രഹം = 10
തിരയൽ അവസാനിച്ചതിന് ശേഷം പ്രിന്റ് ചെയ്യേണ്ട ട്രയലുകളുടെ എണ്ണം വ്യക്തമാക്കുന്നു.

start_fn_type = "റാൻഡം"
{"റാൻഡം", "ബ്ലോക്ക്"} എന്നിവയിൽ ഒന്ന്. ഇത് ക്ലാസ് ഇനീഷ്യലൈസേഷന്റെ തരം വ്യക്തമാക്കുന്നു. വേണ്ടി
സാധാരണ തിരയൽ, "റാൻഡം" ഉപയോഗിക്കുക, ഇത് ക്രമരഹിതമായി പ്രാരംഭ ക്ലാസിലേക്ക് സന്ദർഭങ്ങൾ തിരഞ്ഞെടുക്കുന്നു
അർത്ഥമാക്കുന്നത്, ഉചിതമായ വ്യതിയാനങ്ങൾ ചേർക്കുന്നു. ആവർത്തിച്ചുള്ള തിരയൽ ഉപയോഗിച്ച് പരീക്ഷിക്കുന്നതിന്, ഉപയോഗിക്കുക
"ബ്ലോക്ക്", ഇത് ഡാറ്റാബേസിനെ തുല്യ വലുപ്പത്തിലുള്ള തുടർച്ചയായ ബ്ലോക്കുകളായി വിഭജിക്കുന്നു.
ആവർത്തിക്കാവുന്ന ഫലങ്ങൾക്കായി, ഇതും കാണുക force_new_search_p, ചുരുങ്ങിയ_റിപ്പോർട്ട്_കാലയളവ്, ഒപ്പം
randomize_random_p.

try_fn_type = "converge_search_3"
{"converge_search_3", "converge_search_4", "converge"} എന്നിവയിൽ ഒന്ന്. ഇവ വ്യക്തമാക്കുന്നു
ഇതര തിരയൽ നിർത്തൽ മാനദണ്ഡം. "കൺവെർജ്" എന്നത് മാറ്റത്തിന്റെ നിരക്ക് പരിശോധിക്കുന്നു
ലോഗ്_മാർജിനൽ ക്ലാസിഫിക്കേഷൻ പ്രോബബിലിറ്റി (clsf->log_a_x_h), പരിശോധിക്കാതെ
വ്യക്തിഗത ക്ലാസുകളുടെ മാറ്റത്തിന്റെ നിരക്ക് (കാണുക halt_range ഒപ്പം halt_factor).
"converge_search_3", "converge_search_4" എന്നിവ ഓരോന്നും അനുപാതം നിരീക്ഷിക്കുന്നു
എല്ലാ ക്ലാസുകൾക്കും class->log_a_w_s_h_j/class->w_j, എല്ലാം വരെ ഒത്തുചേരൽ തുടരുക
എന്നതിനായുള്ള നിശബ്‌ദ മാനദണ്ഡങ്ങൾ പാസാക്കുക n_ശരാശരി ചക്രങ്ങൾ. "converge_search_3" ടെസ്റ്റുകൾ
തുടർച്ചയായ കൺവേർജൻസ് സൈക്കിളുകൾ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ (കാണുക rel_delta_range). ഈ
ന്യായമായ, പൊതുവായ ഉദ്ദേശ്യത്തോടെ നിർത്തുന്നതിനുള്ള മാനദണ്ഡം നൽകുന്നു. "converge_search_4"
"sigma_beta_n_values" സൈക്കിളുകളേക്കാൾ ശരാശരി അനുപാതം (കാണുക cs4_delta_range). ഈ
converge_search_3 സമാനമായ നിരവധി ക്ലാസുകൾ നിർമ്മിക്കുമ്പോൾ മുൻഗണന നൽകുന്നു.

പ്രാരംഭ_ചക്രങ്ങൾ_p = സത്യം
ശരിയാണെങ്കിൽ, initialize_parameters-ൽ base_cycle നടത്തുക. കള്ളം എന്നതിന് മാത്രം ഉപയോഗിക്കുന്നു
പരിശോധന.

save_compact_p = സത്യം
മെഷീൻ ആശ്രിത ബൈനറി (.ഫലങ്ങൾ-ബിൻ & .chkpt-bin) ആയി ട്രൂ സേവ്സ് വർഗ്ഗീകരണം.
ascii ടെക്‌സ്‌റ്റായി തെറ്റായ സേവുകൾ (.ഫലങ്ങളും .chkpt)

read_compact_p = സത്യം
മെഷീൻ ആശ്രിത ബൈനറി (.ഫലങ്ങൾ-ബിൻ & .chkpt-bin) ആയി ട്രൂ റീഡ് ക്ലാസിഫിക്കേഷനുകൾ.
തെറ്റായ വായനകൾ ascii ടെക്‌സ്‌റ്റായി (.ഫലങ്ങളും .chkpt).

randomize_random_p = സത്യം
തെറ്റായ വിത്തുകൾ lrand48, ആവർത്തിക്കാവുന്ന തരത്തിൽ 1 ഉപയോഗിച്ച് കപട-റാൻഡം നമ്പർ ഫംഗ്‌ഷൻ
ടെസ്റ്റ് കേസുകൾ. ട്രൂ സാർവത്രിക സമയ ഘടികാരത്തെ വിത്തായി ഉപയോഗിക്കുന്നു, ഇത് അർദ്ധ ക്രമരഹിതമായി നൽകുന്നു
തിരയുന്നു. ആവർത്തിക്കാവുന്ന ഫലങ്ങൾക്കായി, ഇതും കാണുക force_new_search_p, ചുരുങ്ങിയ_റിപ്പോർട്ട്_കാലയളവ്
ഒപ്പം start_fn_type.

n_data = 0
n_data = 0 ഉപയോഗിച്ച്, മുഴുവൻ ഡാറ്റാബേസും .db2 ൽ നിന്ന് വായിക്കുന്നു. n_data > 0 ഉപയോഗിച്ച്, ഇത് മാത്രം
വായിച്ച ഡാറ്റയുടെ എണ്ണം.

halt_range = 0.5
try_fn_type "converge"-ലേക്ക് കടന്നു. "converge" try_fn_type ഉപയോഗിച്ച്, convergence ആണ്
halt_range വലുതാകുമ്പോൾ നിർത്തി (halt_factor * current_log_marginal)
വർഗ്ഗീകരണത്തിന്റെ തുടർച്ചയായ സൈക്കിൾ മൂല്യങ്ങൾ തമ്മിലുള്ള വ്യത്യാസം കവിയുന്നു
log_marginal (clsf->log_a_x_h). ഈ മൂല്യം കുറയുന്നത് ഒത്തുചേരൽ ശക്തമാക്കിയേക്കാം
കൂടാതെ സൈക്കിളുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുക.

halt_factor = 0.0001
try_fn_type "converge"-ലേക്ക് കടന്നു. "converge" try_fn_type ഉപയോഗിച്ച്, convergence ആണ്
halt_range വലുതാകുമ്പോൾ നിർത്തി (halt_factor * current_log_marginal)
വർഗ്ഗീകരണത്തിന്റെ തുടർച്ചയായ സൈക്കിൾ മൂല്യങ്ങൾ തമ്മിലുള്ള വ്യത്യാസം കവിയുന്നു
log_marginal (clsf->log_a_x_h). ഈ മൂല്യം കുറയുന്നത് ഒത്തുചേരൽ ശക്തമാക്കിയേക്കാം
കൂടാതെ സൈക്കിളുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുക.

rel_delta_range = 0.0025
"converge_search_3" എന്ന ഫംഗ്‌ഷൻ പരീക്ഷിക്കാൻ പാസ്സായി, ഇത് ലോഗ് ഏകദേശം- അനുപാതം നിരീക്ഷിക്കുന്നു.
ക്ലാസ് സിദ്ധാന്തവുമായി ബന്ധപ്പെട്ട് ക്ലാസ് സ്ഥിതിവിവരക്കണക്കുകളുടെ നാമമാത്ര-സാധ്യത
(class->log_a_w_s_h_j) ഓരോ ക്ലാസിനും, ക്ലാസ് ഭാരം (class->w_j) കൊണ്ട് ഹരിക്കുന്നു.
"converge_search_3" ഇതിന്റെ സൈക്കിളുകൾ തമ്മിലുള്ള വ്യത്യാസം വരുമ്പോൾ ഒത്തുചേരൽ നിർത്തുന്നു
അനുപാതം, ഓരോ ക്ലാസിനും, "n_average" എന്നതിനായി "rel_delta_range" കവിഞ്ഞു
ചക്രങ്ങൾ. "rel_delta_range" കുറയുന്നത് ഒത്തുചേരലിനെ ശക്തമാക്കുകയും വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു
സൈക്കിളുകളുടെ എണ്ണം.

cs4_delta_range = 0.0025
എന്നതിന്റെ അനുപാതം നിരീക്ഷിക്കുന്ന "converge_search_4" എന്ന ഫംഗ്‌ഷൻ പരീക്ഷിക്കുന്നതിന് പാസ്സായി
(class->log_a_w_s_h_j)/(class->w_j), ഓരോ ക്ലാസിനും ശരാശരി
"sigma_beta_n_values" കൺവെർജൻസ് സൈക്കിളുകൾ. "converge_search_4" ഒത്തുചേരൽ നിർത്തുന്നു
ഈ അനുപാതത്തിന്റെ ശരാശരി മൂല്യങ്ങളിലെ പരമാവധി വ്യത്യാസം താഴെ വീഴുമ്പോൾ
"cs4_delta_range". "cs4_delta_range" കുറയുന്നത് ഒത്തുചേരൽ ശക്തമാക്കുന്നു
സൈക്കിളുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുന്നു.

n_ശരാശരി = 3
"converge_search_3", "converge" എന്നീ ഫംഗ്‌ഷനുകൾ പരീക്ഷിക്കാൻ പാസ്സായി. സൈക്കിളുകളുടെ എണ്ണം
ട്രയൽ അവസാനിപ്പിക്കുന്നതിന് കൺവെർജൻസ് മാനദണ്ഡം പാലിക്കേണ്ടതുണ്ട്.

sigma_beta_n_values = 6
try_fn_type "converge_search_4" എന്നതിലേക്ക് കടന്നു. ഉപയോഗിക്കേണ്ട മുൻകാല മൂല്യങ്ങളുടെ എണ്ണം
കമ്പ്യൂട്ടിംഗ് സിഗ്മ^2 (ശബ്ദം), ബീറ്റ^2 (സിഗ്നൽ).

max_cycles = 200
a യുടെ ഏതെങ്കിലും ഒരു സംയോജനത്തിന് അനുവദനീയമായ പരമാവധി സൈക്കിളുകളുടെ എണ്ണമാണിത്
വർഗ്ഗീകരണം, മറ്റേതെങ്കിലും സ്റ്റോപ്പിംഗ് മാനദണ്ഡങ്ങൾ പരിഗണിക്കാതെ. ഇത് വളരെ ആശ്രിതമാണ്
നിങ്ങളുടെ ഡാറ്റാബേസിലും മോഡൽ, കൺവെർജൻസ് പാരാമീറ്ററുകൾ തിരഞ്ഞെടുക്കുമ്പോഴും, എന്നാൽ ആയിരിക്കണം
സ്‌ക്രീൻ ഡംപിലും .ലോഗ് ഫയലിലും റിപ്പോർട്ട് ചെയ്യപ്പെട്ട സൈക്കിളുകളുടെ ശരാശരി എണ്ണത്തിന്റെ ഇരട്ടി

converge_print_p = തെറ്റ്
ശരിയാണെങ്കിൽ, തിരഞ്ഞെടുത്ത ട്രൈ ഫംഗ്‌ഷൻ ഉപയോഗപ്രദമായ സ്‌ക്രീൻ മൂല്യങ്ങളിലേക്ക് പ്രിന്റ് ചെയ്യും
എന്നതിനായുള്ള സ്ഥിരമല്ലാത്ത മൂല്യങ്ങൾ വ്യക്തമാക്കുന്നു halt_range, halt_factor, rel_delta_range,
n_ശരാശരി, sigma_beta_n_values, ഒപ്പം ശ്രേണി_ഘടകം.

force_new_search_p = സത്യം
ശരിയാണെങ്കിൽ, നിലവിലുള്ള .search നിരസിച്ചുകൊണ്ട് മുമ്പത്തെ ഏതെങ്കിലും തിരയൽ ഫലങ്ങൾ അവഗണിക്കും
കൂടാതെ ഉപയോക്താവ് സ്ഥിരീകരിച്ചതിന് ശേഷം .ഫലങ്ങൾ[-ബിൻ] ഫയലുകൾ; തെറ്റാണെങ്കിൽ തുടരും
നിലവിലുള്ള .search, .results[-bin] ഫയലുകൾ ഉപയോഗിച്ചുള്ള തിരയൽ. ആവർത്തിക്കാൻ
ഫലങ്ങൾ, ഇതും കാണുക ചുരുങ്ങിയ_റിപ്പോർട്ട്_കാലയളവ്, start_fn_type ഒപ്പം randomize_random_p.

ചെക്ക് പോയിന്റ്_p = തെറ്റ്
ശരിയാണെങ്കിൽ, നിലവിലെ വർഗ്ഗീകരണത്തിന്റെ ചെക്ക്‌പോസ്റ്റുകൾ ഓരോന്നും എഴുതപ്പെടും
"min_checkpoint_period" സെക്കൻഡ്, ഫയൽ എക്സ്റ്റൻഷൻ .chkpt[-bin]. ഇത് മാത്രം
വളരെ വലിയ വർഗ്ഗീകരണങ്ങൾക്ക് ഉപയോഗപ്രദമാണ്

മിനിട്ട്_ചെക്ക് പോയിന്റ്_പിരീഡ് = 10800
checkpoint_p = true എങ്കിൽ, ചെക്ക്‌പോയിന്റ് വർഗ്ഗീകരണം ഇത് പലപ്പോഴും എഴുതപ്പെടും
- സെക്കന്റുകൾക്കുള്ളിൽ (സ്ഥിരസ്ഥിതി = 3 മണിക്കൂർ)

reconverge_type = "
ഒന്നുകിൽ "chkpt" അല്ലെങ്കിൽ "ഫലങ്ങൾ" ആകാം. "checkpoint_p" = true ഉം "reconverge_type" ഉം ആണെങ്കിൽ
= "chkpt", തുടർന്ന് അടങ്ങിയിരിക്കുന്ന വർഗ്ഗീകരണത്തിന്റെ സംയോജനം തുടരുക
<...>.chkpt[-bin]. "checkpoint_p " = തെറ്റും "reconverge_type" = "ഫലങ്ങളും" ആണെങ്കിൽ,
<...>.ഫലങ്ങളിൽ[-ബിൻ] അടങ്ങിയിരിക്കുന്ന മികച്ച വർഗ്ഗീകരണത്തിന്റെ സംയോജനം തുടരുക.

സ്ക്രീൻ_ഔട്ട്പുട്ട്_പി = സത്യം
തെറ്റാണെങ്കിൽ, ഒരു ഔട്ട്‌പുട്ടും സ്‌ക്രീനിലേക്ക് നയിക്കില്ല. log_file_p = true എന്ന് അനുമാനിക്കുന്നു, ഔട്ട്പുട്ട്
ലോഗ് ഫയലിലേക്ക് മാത്രം നയിക്കപ്പെടും.

ബ്രേക്ക്_ഓൺ_വാണിംഗ്സ്_പി = സത്യം
ഡാറ്റ നിർവചിക്കുമ്പോൾ, തുടരണമോ വേണ്ടയോ എന്ന് സ്ഥിരസ്ഥിതി മൂല്യം ഉപയോക്താവിനോട് ചോദിക്കുന്നു
മുന്നറിയിപ്പുകൾ കണ്ടെത്തി. തെറ്റാണെന്ന് വ്യക്തമാക്കിയാൽ, പിന്നെ ഓട്ടോക്ലാസ് എങ്കിലും തുടരും
മുന്നറിയിപ്പുകൾ -- മുന്നറിയിപ്പ് ടെർമിനലിലേക്കും ലോഗിലേക്കും ഔട്ട്പുട്ട് ആയി തുടരും
ഫയൽ.

free_storage_p = സത്യം
സ്ഥിര മൂല്യം പറയുന്നു ഓട്ടോക്ലാസ് അനുവദിച്ച സംഭരണത്തിന്റെ ഭൂരിഭാഗവും സ്വതന്ത്രമാക്കാൻ.
ഇത് ആവശ്യമില്ല, DEC ആൽഫയുടെ കാര്യത്തിൽ കോർ ഡമ്പിന് കാരണമാകുന്നു [ഇതാണ്
ഇപ്പോഴും സത്യമാണോ?]. തെറ്റാണെന്ന് വ്യക്തമാക്കിയാൽ, ഓട്ടോക്ലാസ് സംഭരണം സൗജന്യമാക്കാൻ ശ്രമിക്കില്ല.

എങ്ങനെ TO നേടുക ഓട്ടോക്ലാസ് C TO PRODUCE ആവർത്തിക്കാവുന്ന ഫലം
ചില സാഹചര്യങ്ങളിൽ, ആവർത്തിക്കാവുന്ന വർഗ്ഗീകരണങ്ങൾ ആവശ്യമാണ്: അടിസ്ഥാന താരതമ്യം ഓട്ടോക്ലാസ് C
വിവിധ പ്ലാറ്റ്ഫോമുകളിലെ സമഗ്രത, പോർട്ടിംഗ് ഓട്ടോക്ലാസ് C ഒരു പുതിയ പ്ലാറ്റ്ഫോമിലേക്ക്, മുതലായവ
ഇത് പൂർത്തിയാക്കാൻ രണ്ട് കാര്യങ്ങൾ ആവശ്യമാണ്: 1) ഒരേ റാൻഡം നമ്പർ ജനറേറ്റർ ആയിരിക്കണം
ഉപയോഗിച്ചു, കൂടാതെ 2) തിരയൽ പാരാമീറ്ററുകൾ ശരിയായി വ്യക്തമാക്കിയിരിക്കണം.

റാൻഡം നമ്പർ ജനറേറ്റർ. ഈ നടപ്പാക്കൽ ഓട്ടോക്ലാസ് C Unix srand48/lrand48 ഉപയോഗിക്കുന്നു
അറിയപ്പെടുന്ന ലീനിയർ ഉപയോഗിച്ച് വ്യാജ-റാൻഡം നമ്പറുകൾ സൃഷ്ടിക്കുന്ന റാൻഡം നമ്പർ ജനറേറ്റർ
കൺഗ്രൂൻഷ്യൽ അൽഗോരിതം, 48-ബിറ്റ് ഇന്റിജർ അരിത്മെറ്റിക്. lrand48() നെഗറ്റീവ് അല്ലാത്തത് നൽകുന്നു
ദൈർഘ്യമേറിയ പൂർണ്ണസംഖ്യകൾ [0, 2**31] ഇടവേളയിൽ ഒരേപോലെ വിതരണം ചെയ്യപ്പെടുന്നു.

തിരയൽ പരാമീറ്ററുകൾ. ഇനിപ്പറയുന്ന .s-params ഫയൽ പാരാമീറ്ററുകൾ വ്യക്തമാക്കണം:

force_new_search_p = true
start_fn_type "ബ്ലോക്ക്"
randomize_random_p = തെറ്റ്
;; നിങ്ങൾ പ്രവർത്തിപ്പിക്കാൻ ആഗ്രഹിക്കുന്ന ട്രയലുകളുടെ എണ്ണം വ്യക്തമാക്കുക
max_n_triries = 50
;; ഓട്ടത്തിന്റെ ദൈർഘ്യത്തേക്കാൾ വലിയ സമയം വ്യക്തമാക്കുക
min_report_period = 30000

നിലവിലുള്ള മികച്ച വർഗ്ഗീകരണ റിപ്പോർട്ടുകളൊന്നും നിർമ്മിക്കപ്പെടില്ല എന്നത് ശ്രദ്ധിക്കുക. ഒരു ഫൈനൽ മാത്രം
വർഗ്ഗീകരണ സംഗ്രഹം ഔട്ട്പുട്ട് ആയിരിക്കും.

ചെക്ക്‌പോയിന്റിങ്


വളരെ വലിയ ഡാറ്റാബേസുകളിൽ, ഏത് സമയത്തും ഒരു സിസ്റ്റം ക്രാഷിന്റെ കാര്യമായ സംഭാവ്യതയുണ്ട്
ഒരു വർഗ്ഗീകരണ ശ്രമം. അത്തരം സാഹചര്യങ്ങളിൽ സമയമെടുക്കുന്നതാണ് ഉചിതം
സാധ്യമായ പുനരാരംഭിക്കുന്നതിനുള്ള കണക്കുകൂട്ടലുകൾ പരിശോധിക്കുക.

"" എന്ന് വ്യക്തമാക്കുന്നതിലൂടെയാണ് ചെക്ക്പോയിന്റിംഗ് ആരംഭിക്കുന്നത്.ചെക്ക് പോയിന്റ്_p = true" ".s-params" ഫയലിൽ.
ഇത് ക്ലാസിഫിക്കേഷന്റെ ഒരു പകർപ്പ് എന്നതിലേക്ക് സംരക്ഷിക്കുന്നതിന് ആന്തരിക സംയോജന ഘട്ടത്തിന് കാരണമാകുന്നു
ഓരോ തവണയും വർഗ്ഗീകരണം അപ്‌ഡേറ്റ് ചെയ്യുമ്പോൾ ചെക്ക്‌പോയിന്റ് ഫയൽ, ഒരു നിശ്ചിത കാലയളവ് നൽകുന്നു
സമയം കഴിഞ്ഞു. ഫയൽ എക്സ്റ്റൻഷൻ ".chkpt[-bin]" ആണ്.

ഓരോ തവണയും ഒരു ഓട്ടോക്ലാസ് ഒരു സൈക്കിൾ പൂർത്തിയാക്കുമ്പോൾ, ഒരു "." നിങ്ങൾക്ക് നൽകുന്നതിന് സ്ക്രീനിലേക്ക് ഔട്ട്പുട്ട് ആണ്
സജ്ജീകരിക്കുന്നതിന് ഉപയോഗിക്കേണ്ട വിവരങ്ങൾ മിനിട്ട്_ചെക്ക് പോയിന്റ്_പിരീഡ് മൂല്യം (സ്ഥിരസ്ഥിതി 10800 സെക്കൻഡ്
അല്ലെങ്കിൽ 3 മണിക്കൂർ). ചെക്ക്‌പോയിന്റിംഗിന്റെയും ആവൃത്തിയുടെയും ഇടയിൽ വ്യക്തമായും ഒരു ട്രേഡ് ഓഫ് ഉണ്ട്
ചെക്ക് പോയിന്റിന്റെ ആവർത്തിച്ചുള്ള എഴുത്ത് മുതൽ നിങ്ങളുടെ മെഷീൻ തകരാറിലാകാനുള്ള സാധ്യത
ഫയൽ തിരയൽ പ്രക്രിയയെ മന്ദഗതിയിലാക്കും.

ഓട്ടോക്ലാസ് തിരയൽ പുനരാരംഭിക്കുന്നു:

വർഗ്ഗീകരണം വീണ്ടെടുക്കുന്നതിനും റീബൂട്ട് ചെയ്‌ത് വീണ്ടും ലോഡുചെയ്‌തതിനുശേഷം തിരയൽ തുടരുന്നതിനും
ഓട്ടോക്ലാസ്, വ്യക്തമാക്കുക reconverge_type = ".s-params" ഫയലിലെ "chkpt" (വ്യക്തമാക്കുക
force_new_search_p തെറ്റായി).

ഓട്ടോക്ലാസ് ഉചിതമായ ഡാറ്റാബേസും മോഡലുകളും റീലോഡ് ചെയ്യും, ഇല്ലെങ്കിൽ
ചെക്ക്‌പോയിന്റിനായി ലോഡുചെയ്‌ത സമയം മുതൽ അവരുടെ ഫയലുകളുടെ പേരുകൾ മാറ്റുക
വർഗ്ഗീകരണം റൺ. ".s-params" ഫയലിൽ ഡിഫോൾട്ട് അല്ലാത്ത ഏതെങ്കിലും ആർഗ്യുമെന്റുകൾ അടങ്ങിയിരിക്കുന്നു
യഥാർത്ഥ കോളിന് നൽകി.

ഒരു തിരയലിന്റെ തുടക്കത്തിൽ, മുമ്പ് start_j_list ശൂന്യമാക്കിയിരിക്കുന്നു, അത് ആവശ്യമായി വരും
ക്രാഷ് ചെയ്‌ത തിരയലിൽ അവശേഷിക്കുന്നവയിലേക്ക് യഥാർത്ഥ ലിസ്റ്റ് ട്രിം ചെയ്യാൻ. ഇത് ആകാം
ഏതൊക്കെ മൂല്യങ്ങൾ ഇതിനകം ഉപയോഗിച്ചുവെന്ന് നിർണ്ണയിക്കാൻ ".log" ഫയൽ നോക്കി നിർണ്ണയിക്കപ്പെടുന്നു. എങ്കിൽ
The start_j_list ശൂന്യമാക്കി, പിന്നെ ഒരു ശൂന്യം start_j_list എന്നതിൽ വ്യക്തമാക്കണം
".s-params" ഫയൽ. ഇത് ഒന്നുകിൽ ചെയ്യുന്നു

start_j_list =

or

start_j_list = -9999

ചെക്ക്-പോയിന്റിംഗ് കാണിക്കുന്നതിനുള്ള ഒരു കൂട്ടം സ്ക്രിപ്റ്റുകൾ ഇതാ:

autoclass -search data/glass/glassc.db2 data/glass/glass-3c.hd2 \
data/glass/glass-mnc.model data/glass/glassc-chkpt.s-params

ഓട്ടം 1)
## glassc-chkpt.s-params
max_n_triries = 2
force_new_search_p = true
## ----------------------
;; പൂർത്തീകരണത്തിലേക്ക് ഓടുക

ഓട്ടം 2)
## glassc-chkpt.s-params
force_new_search_p = തെറ്റ്
max_n_triries = 10
checkpoint_p = true
min_checkpoint_period = 2
## ----------------------
;; 1 ചെക്ക് പോയിന്റിന് ശേഷം, cpu ക്രാഷിനെ അനുകരിക്കാൻ ctrl-C

ഓട്ടം 3)
## glassc-chkpt.s-params
force_new_search_p = തെറ്റ്
max_n_triries = 1
checkpoint_p = true
min_checkpoint_period = 1
reconverge_type = "chkpt"
## ----------------------
;; ചെക്ക്പോയിന്റ് ട്രയൽ പൂർത്തിയാക്കണം

ഔട്ട്പ് ഫയലുകൾ


സ്റ്റാൻഡേർഡ് റിപ്പോർട്ടുകളാണ്

1) ആട്രിബ്യൂട്ട് സ്വാധീന മൂല്യങ്ങൾ: ആപേക്ഷിക സ്വാധീനമോ പ്രാധാന്യമോ അവതരിപ്പിക്കുന്നു
ഡാറ്റയുടെ ആട്രിബ്യൂട്ടുകൾ ആഗോളതലത്തിലും (എല്ലാ ക്ലാസുകളിലും ശരാശരി), പ്രാദേശികമായും
(പ്രത്യേകിച്ച് ഓരോ ക്ലാസിനും). ആപേക്ഷിക ക്ലാസ് ശക്തിക്കുള്ള ഒരു ഹ്യൂറിസ്റ്റിക് കൂടിയാണ്
ലിസ്റ്റ് ചെയ്തു;

2) ക്രോസ് റഫറൻസ് ബൈ കേസ് (ഡേറ്റം) നമ്പർ: ഇതിനായുള്ള പ്രൈമറി ക്ലാസ് പ്രോബബിലിറ്റി ലിസ്റ്റുചെയ്യുന്നു
ഓരോ ഡാറ്റയും, കേസ് നമ്പർ അനുസരിച്ച് ക്രമീകരിച്ചിരിക്കുന്നു. റിപ്പോർട്ട്_മോഡ് = "ഡാറ്റ" ചെയ്യുമ്പോൾ, കൂടുതൽ കുറവ്
ക്ലാസ് പ്രോബബിലിറ്റികൾ (0.001-നേക്കാൾ വലുതോ അതിന് തുല്യമോ) ഓരോ ഡാറ്റയ്ക്കും ലിസ്റ്റ് ചെയ്തിരിക്കുന്നു;

3) ക്ലാസ് നമ്പർ പ്രകാരം ക്രോസ് റഫറൻസ്: ഓരോ ക്ലാസിനും പ്രൈമറി ക്ലാസ് പ്രോബബിലിറ്റിയും
ഓരോന്നിനും ഏതെങ്കിലും കുറഞ്ഞ ക്ലാസ് പ്രോബബിലിറ്റികൾ (0.001-നേക്കാൾ വലുതോ അതിന് തുല്യമോ) ലിസ്റ്റ് ചെയ്തിരിക്കുന്നു
ക്ലാസ്സിലെ ഡാറ്റ, കേസ് നമ്പർ പ്രകാരം ഓർഡർ ചെയ്തു. ഓരോന്നിനും പട്ടികപ്പെടുത്താനും സാധിക്കും
datum, നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന ആട്രിബ്യൂട്ടുകളുടെ മൂല്യങ്ങൾ.

ആട്രിബ്യൂട്ട് സ്വാധീന മൂല്യങ്ങൾ റിപ്പോർട്ട് ആപേക്ഷിക അളവുകൾ നൽകാൻ ശ്രമിക്കുന്നു
വർഗ്ഗീകരണം കണ്ടെത്തിയ ക്ലാസുകളിലെ ഡാറ്റ ആട്രിബ്യൂട്ടുകളുടെ "സ്വാധീനം". ദി
നോർമലൈസ്ഡ് ക്ലാസ് ശക്തികൾ, നോർമലൈസ്ഡ് ആട്രിബ്യൂട്ട് സ്വാധീന മൂല്യങ്ങൾ എല്ലാം സംഗ്രഹിച്ചു
ക്ലാസുകളും വ്യക്തിഗത സ്വാധീന മൂല്യങ്ങളും (I[jkl]) എല്ലാം ആപേക്ഷിക അളവുകൾ മാത്രമാണ്
റാങ്ക് ഓർഡറിംഗിനെക്കാൾ കൂടുതൽ അർത്ഥത്തിൽ വ്യാഖ്യാനിക്കണം, പക്ഷേ ഒന്നും പോലെയല്ല
കേവല മൂല്യങ്ങളെ സമീപിക്കുന്നു.

".r-params" ൽ നിന്ന് പേരുകളും പാത്ത് നെയിമുകളും എടുത്ത ഫയലുകളിലേക്കാണ് റിപ്പോർട്ടുകൾ ഔട്ട്പുട്ട് ചെയ്യുന്നത്.
ഫയൽ പാതയുടെ പേര്. റിപ്പോർട്ട് ഫയൽ തരങ്ങൾ (വിപുലീകരണങ്ങൾ) ഇവയാണ്:

സ്വാധീനിക്കുന്നു മൂല്യങ്ങൾ റിപ്പോർട്ട്
"ഇൻഫ്ലു-ഒ-ടെക്സ്റ്റ്-n"അല്ലെങ്കിൽ "ഇൻഫ്ലു-നോ-ടെക്സ്റ്റ്-n"

ഒത്തു നോക്കുക by കേസ്
"കേസ്-ടെക്സ്റ്റ്-n"

ഒത്തു നോക്കുക by ക്ലാസ്
"ക്ലാസ്-ടെക്സ്റ്റ്-n"

അല്ലെങ്കിൽ, റിപ്പോർട്ട്_മോഡ് "ഡാറ്റ" എന്നതിലേക്ക് അസാധുവാക്കുകയാണെങ്കിൽ:

സ്വാധീനിക്കുന്നു മൂല്യങ്ങൾ റിപ്പോർട്ട്
"ഇൻഫ്ലു-ഓ-ഡാറ്റ-n"അല്ലെങ്കിൽ" ഇൻഫ്ലു-നോ-ഡാറ്റ-n"

ഒത്തു നോക്കുക by കേസ്
"കേസ്-ഡാറ്റ-n"

ഒത്തു നോക്കുക by ക്ലാസ്
"ക്ലാസ്-ഡാറ്റ-n"

എവിടെ n "ഫലങ്ങൾ" ഫയലിൽ നിന്നുള്ള വർഗ്ഗീകരണ നമ്പർ ആണ്. ആദ്യത്തേത് അല്ലെങ്കിൽ മികച്ചത്
വർഗ്ഗീകരണം നമ്പർ 1, അടുത്ത ഏറ്റവും മികച്ചത് 2, മുതലായവ. സ്ഥിരസ്ഥിതി റിപ്പോർട്ടുകൾ സൃഷ്ടിക്കുക എന്നതാണ്
"ഫലങ്ങൾ" ഫയലിലെ മികച്ച വർഗ്ഗീകരണത്തിന് മാത്രം. മറ്റുള്ളവർക്കായി നിങ്ങൾക്ക് റിപ്പോർട്ടുകൾ ഹാജരാക്കാം
റിപ്പോർട്ട് പാരാകൾ കീവേഡുകൾ ഉപയോഗിച്ച് വർഗ്ഗീകരണങ്ങൾ സംരക്ഷിച്ചു n_clsfs ഒപ്പം clsf_n_list. ദി
"ഇൻഫ്ലു-ഒ-ടെക്സ്റ്റ്-n" ഫയൽ തരം സ്ഥിരസ്ഥിതിയാണ് (order_attributes_by_influence_p = സത്യം), കൂടാതെ
ആട്രിബ്യൂട്ട് സ്വാധീന മൂല്യത്തിന്റെ അവരോഹണ ക്രമത്തിൽ ഓരോ ക്ലാസിന്റെയും ആട്രിബ്യൂട്ടുകൾ പട്ടികപ്പെടുത്തുന്നു. എങ്കിൽ
ന്റെ മൂല്യം order_attributes_by_influence_p <...>.r-params-ൽ തെറ്റായി അസാധുവാക്കിയിരിക്കുന്നു
ഫയൽ, തുടർന്ന് ഓരോ ക്ലാസിന്റെയും ആട്രിബ്യൂട്ടുകൾ ആട്രിബ്യൂട്ട് നമ്പർ പ്രകാരം ആരോഹണ ക്രമത്തിൽ ലിസ്റ്റ് ചെയ്യും.
സൃഷ്ടിച്ച ഫയലിന്റെ വിപുലീകരണം "influ-no-text-" ആയിരിക്കുംn". ഈ ലിസ്റ്റിംഗ് രീതി
ക്ലാസുകൾ തമ്മിലുള്ള ആട്രിബ്യൂട്ട് മൂല്യങ്ങളുടെ ദൃശ്യ താരതമ്യം സുഗമമാക്കുന്നു.

ഉദാഹരണത്തിന്, ഈ കമാൻഡ്:

autoclass -reports sample/imports-85c.results-bin
സാമ്പിൾ/ഇറക്കുമതി-85c.തിരയൽ സാമ്പിൾ/ഇറക്കുമതി-85c.r-പാരാമുകൾ

".r-params" ഫയലിലെ ഈ വരിയിൽ:

xref_class_report_att_list = 2, 5, 6

ഈ ഔട്ട്പുട്ട് ഫയലുകൾ സൃഷ്ടിക്കും:

ഇറക്കുമതി-85.influ-o-text-1
ഇറക്കുമതി-85.കേസ്-ടെക്സ്റ്റ്-1
ഇറക്കുമതി-85.class-text-1

ദി ഓട്ടോക്ലാസ് C സിഗ്മ ക്ലാസ് കോണ്ടൂർ മൂല്യങ്ങൾ കണക്കാക്കാനുള്ള കഴിവ് റിപ്പോർട്ടുകൾ നൽകുന്നു
സ്വാധീന മൂല്യങ്ങളുടെ റിപ്പോർട്ട് സൃഷ്ടിക്കുമ്പോൾ യഥാർത്ഥ മൂല്യമുള്ള ആട്രിബ്യൂട്ടുകളുടെ നിർദ്ദിഷ്ട ജോഡികൾ
ഡാറ്റ ഓപ്‌ഷനോടൊപ്പം (report_mode = "data"). സിഗ്മ ക്ലാസ് കോണ്ടൂർ അല്ല എന്നത് ശ്രദ്ധിക്കുക
വ്യതിരിക്ത തരം ആട്രിബ്യൂട്ടുകളിൽ നിന്ന് ജനറേറ്റ് ചെയ്തത്.

ഒന്നിലെ എൻ-സിഗ്മ പിശക് ബാറുകളുടെ ദ്വിമാന തുല്യതയാണ് സിഗ്മ കോണ്ടൂർ
മാനം. പ്രത്യേകമായി, രണ്ട് സ്വതന്ത്ര ആട്രിബ്യൂട്ടുകൾക്ക് n-sigma കോണ്ടൂർ ഇങ്ങനെ നിർവചിച്ചിരിക്കുന്നു
ദീർഘവൃത്തം എവിടെയാണ്

((x - xMean) / xSigma)^2 + ((y - yMean) / ySigma)^2 == n

കോവേരിയന്റ് ആട്രിബ്യൂട്ടുകൾ ഉപയോഗിച്ച്, ഭ്രമണപഥത്തിൽ n-sigma രൂപരേഖകൾ ഒരേപോലെ നിർവചിക്കപ്പെടുന്നു
വിതരണത്തിന്റെ തത്വ അക്ഷങ്ങളുടെ കോർഡിനേറ്റ് സിസ്റ്റം. അങ്ങനെ സ്വതന്ത്രമായ ആട്രിബ്യൂട്ടുകൾ നൽകുന്നു
ആട്രിബ്യൂട്ട് അക്ഷങ്ങൾക്ക് സമാന്തരമായി ദീർഘവൃത്താകൃതിയിലുള്ളവയാണ്, അതേസമയം സിഗ്മയുടെ അക്ഷങ്ങൾ
കോവേരിയന്റ് ആട്രിബ്യൂട്ടുകൾ മാർഗങ്ങളാൽ നിർണ്ണയിക്കപ്പെട്ട കേന്ദ്രത്തെ ചുറ്റിപ്പറ്റിയാണ്. രണ്ടായാലും
ക്ലാസ് പ്രോബബിലിറ്റി പരിഗണിക്കാതെ സ്ഥിരമായിരിക്കുന്ന ഒരു വരയെയാണ് സിഗ്മ കോണ്ടൂർ പ്രതിനിധീകരിക്കുന്നത്
മറ്റേതെങ്കിലും ക്ലാസ് സാധ്യതകൾ.

മൂന്നോ അതിലധികമോ ആട്രിബ്യൂട്ടുകൾ ഉപയോഗിച്ച് n-sigma രൂപരേഖകൾ k-dimensional ellipsoidal ആയി മാറുന്നു
പ്രതലങ്ങൾ. ഒരു n- ന്റെ സമാന്തര പ്രൊജക്ഷൻ എന്ന വസ്തുത ഈ കോഡ് പ്രയോജനപ്പെടുത്തുന്നു.
ഡൈമൻഷണൽ എലിപ്‌സോയിഡ്, ഏത് 2-മങ്ങിയ തലത്തിലും, ഒരു ദീർഘവൃത്തത്താൽ പരിമിതപ്പെടുത്തിയിരിക്കുന്നു. ഇതിൽ ലളിതമാക്കി
ഏക സിഗ്മ എലിപ്‌സോയിഡ് കോർഡിനേറ്റ് പ്ലെയിനുകളിലേക്ക് പ്രൊജക്റ്റ് ചെയ്യുന്ന കാര്യവും ശരിയാണ്
ഈ ദീർഘവൃത്തത്തിന്റെ 2-മങ്ങിയ കോവേരിയൻസുകൾ അതിന്റെ അനുബന്ധ മൂലകങ്ങൾക്ക് തുല്യമാണ്
എൻ-ഡിം എലിപ്‌സോയിഡിന്റെ കോവേറിയൻസ്. 2-ഡിം കോവേറിയൻസിന്റെ ഈജൻ-സിസ്റ്റം പിന്നീട് നൽകുന്നു
വ്യതിയാനങ്ങൾ ഗ്രഹണത്തിന്റെ പ്രധാന ഘടകങ്ങളെയും അതിനെ വിന്യസിക്കുന്ന ഭ്രമണത്തെയും ബാധിക്കുന്നു
ഡാറ്റയോടൊപ്പം. മാർജിനലിൽ ഒരു വിതരണം പ്രദർശിപ്പിക്കുന്നതിനുള്ള ഏറ്റവും നല്ല മാർഗത്തെ ഇത് പ്രതിനിധീകരിക്കുന്നു
വിമാനം.

കോണ്ടൂർ മൂല്യങ്ങൾ ലഭിക്കാൻ, കീവേഡ് സജ്ജമാക്കുക sigma_contours_att_list യഥാർത്ഥ മൂല്യമുള്ളവരുടെ പട്ടികയിലേക്ക്
ആട്രിബ്യൂട്ട് സൂചികകൾ (.hd2 ഫയലിൽ നിന്ന്), കൂടാതെ ഡാറ്റയ്‌ക്കൊപ്പം സ്വാധീന മൂല്യങ്ങളുടെ റിപ്പോർട്ട് അഭ്യർത്ഥിക്കുക
ഓപ്ഷൻ. ഉദാഹരണത്തിന്,

റിപ്പോർട്ട്_മോഡ് = "ഡാറ്റ"
sigma_contours_att_list = 3, 4, 5, 8, 15

ഔട്ട്പ് റിപ്പോർട്ട് പാരാമീറ്ററുകൾ
ഔട്ട്പുട്ട് റിപ്പോർട്ടിലെ ഉള്ളടക്കങ്ങൾ ".r-params" ഫയലാണ് നിയന്ത്രിക്കുന്നത്. ഈ ഫയലിൽ,
ഒരു ശൂന്യമായ വരി അല്ലെങ്കിൽ ഈ പ്രതീകങ്ങളിലൊന്നിൽ ആരംഭിക്കുന്ന ഒരു വരി ഒരു കമന്റായി കണക്കാക്കുന്നു:
"#", "!", അഥവാ ";". പരാമീറ്ററിന്റെ പേരും അതിന്റെ മൂല്യവും ഒരു തുല്യ ചിഹ്നത്താൽ വേർതിരിക്കാവുന്നതാണ്, a
സ്ഥലം, അല്ലെങ്കിൽ ഒരു ടാബ്:

n_clsfs 1
n_clsfs = 1
n_clsfs 1

"=" അല്ലെങ്കിൽ " ആണെങ്കിൽ സ്‌പെയ്‌സ് അവഗണിക്കപ്പെടും " സെപ്പറേറ്ററുകളായി ഉപയോഗിക്കുന്നു. ട്രെയിലിംഗ് ഒന്നുമില്ല
അർദ്ധവിരാമങ്ങൾ.

ഇനിപ്പറയുന്നവ അനുവദനീയമായ പാരാമീറ്ററുകളും അവയുടെ ഡിഫോൾട്ട് മൂല്യങ്ങളും:

n_clsfs = 1
.ഫലങ്ങൾ ഫയലിലെ clsf-കളുടെ എണ്ണം, അതിനായി റിപ്പോർട്ടുകൾ സൃഷ്‌ടിക്കുക
ആദ്യത്തേത് അല്ലെങ്കിൽ "മികച്ചത്".

clsf_n_list =
വ്യക്തമാക്കിയിട്ടുണ്ടെങ്കിൽ, ഇത് clsf സീക്വൻസ് റീഡിലെ clsfs-ന്റെ ഒരു അധിഷ്ഠിത സൂചിക പട്ടികയാണ്
ഫലങ്ങളുടെ ഫയലിൽ നിന്ന്. ഇത് "n_clsfs" അസാധുവാക്കുന്നു. ഉദാഹരണത്തിന്:

clsf_n_list = 1, 2

അതേ ഔട്ട്പുട്ട് ഉത്പാദിപ്പിക്കും

n_clsfs = 2

പക്ഷേ

clsf_n_list = 2

"രണ്ടാമത്തെ മികച്ച" വർഗ്ഗീകരണ റിപ്പോർട്ട് മാത്രമേ ഔട്ട്പുട്ട് ചെയ്യൂ.

റിപ്പോർട്ട് ഇനം =
ജനറേറ്റുചെയ്യാനുള്ള റിപ്പോർട്ടുകളുടെ തരം: "എല്ലാം", "ഇൻഫ്ലുവൻസ്_വാല്യൂസ്", "xref_case", അല്ലെങ്കിൽ
"xref_class".

റിപ്പോർട്ട്_മോഡ് =
സൃഷ്ടിക്കുന്നതിനുള്ള റിപ്പോർട്ടുകളുടെ മോഡ്. "ടെക്സ്റ്റ്" എന്നത് ഫോർമാറ്റ് ചെയ്ത ടെക്സ്റ്റ് ലേഔട്ടാണ്. "ഡാറ്റ" സംഖ്യാപരമായതാണ്
-- കൂടുതൽ പ്രോസസ്സിംഗിന് അനുയോജ്യം.

comment_data_headers_p = തെറ്റ്
മിക്ക report_mode = "ഡാറ്റ" ഹെഡറിന്റെ കോളം 1-ൽ സ്ഥിര മൂല്യം # ചേർക്കുന്നില്ല
ലൈനുകൾ. ശരിയാണെന്ന് വ്യക്തമാക്കിയാൽ, മിക്ക തലക്കെട്ടുകളിലും കമന്റ് പ്രതീകം ചേർക്കും
ലൈനുകൾ.

പട്ടികയിലേക്ക്_എണ്ണം =
വ്യക്തമാക്കിയിട്ടുണ്ടെങ്കിൽ, സ്വാധീന മൂല്യങ്ങളുടെ റിപ്പോർട്ടിൽ ലിസ്റ്റ് ചെയ്യേണ്ട ആട്രിബ്യൂട്ടുകളുടെ എണ്ണം. അല്ലെങ്കിൽ
വ്യക്തമാക്കിയ, എല്ലാം ആട്രിബ്യൂട്ടുകൾ ലിസ്റ്റ് ചെയ്യും. (ഉദാ: "num_atts_to_list = 5")

xref_class_report_att_list =
വ്യക്തമാക്കിയിട്ടുണ്ടെങ്കിൽ, ആട്രിബ്യൂട്ട് നമ്പറുകളുടെ ഒരു ലിസ്റ്റ് (പൂജ്യം അടിസ്ഥാനമാക്കിയുള്ളത്), അവയുടെ മൂല്യങ്ങൾ ഔട്ട്പുട്ട് ആയിരിക്കും
"xref_class" റിപ്പോർട്ടിൽ കേസ് സാധ്യതകൾക്കൊപ്പം. വ്യക്തമാക്കിയിട്ടില്ലെങ്കിൽ, ഇല്ല
ആട്രിബ്യൂട്ടുകളുടെ മൂല്യങ്ങൾ ഔട്ട്പുട്ട് ആയിരിക്കും. (ഉദാ: "xref_class_report_att_list = 1, 2, 3")

order_attributes_by_influence_p = സത്യം
ഡിഫോൾട്ട് മൂല്യം, ആട്രിബ്യൂട്ടിന്റെ അവരോഹണ ക്രമത്തിൽ ഓരോ ക്ലാസിന്റെയും ആട്രിബ്യൂട്ടുകളെ പട്ടികപ്പെടുത്തുന്നു
സ്വാധീന മൂല്യം, സ്വാധീന മൂല്യങ്ങളുടെ റിപ്പോർട്ട് ഫയലായി ".influ-o-text-n" ഉപയോഗിക്കുന്നു
തരം. തെറ്റ് എന്ന് വ്യക്തമാക്കിയാൽ, ഓരോ ക്ലാസിന്റെയും ആട്രിബ്യൂട്ടുകൾ ലിസ്റ്റ് ചെയ്യും
ആട്രിബ്യൂട്ട് നമ്പർ പ്രകാരം ആരോഹണ ക്രമം. സൃഷ്ടിച്ച ഫയലിന്റെ വിപുലീകരണം ആയിരിക്കും
"influ-no-text-n".

ബ്രേക്ക്_ഓൺ_വാണിംഗ്സ്_പി = സത്യം
ഡാറ്റ നിർവചിക്കുമ്പോൾ തുടരണോ വേണ്ടയോ എന്ന് സ്ഥിരസ്ഥിതി മൂല്യം ഉപയോക്താവിനോട് ചോദിക്കുന്നു
മുന്നറിയിപ്പുകൾ കണ്ടെത്തി. തെറ്റാണെന്ന് വ്യക്തമാക്കിയാൽ, പിന്നെ ഓട്ടോക്ലാസ് എങ്കിലും തുടരും
മുന്നറിയിപ്പുകൾ -- മുന്നറിയിപ്പ് ടെർമിനലിലേക്ക് ഔട്ട്പുട്ട് ആയി തുടരും.

free_storage_p = സത്യം
സ്ഥിര മൂല്യം പറയുന്നു ഓട്ടോക്ലാസ് അനുവദിച്ച സംഭരണത്തിന്റെ ഭൂരിഭാഗവും സ്വതന്ത്രമാക്കാൻ.
ഇത് ആവശ്യമില്ല, DEC ആൽഫയുടെ കാര്യത്തിൽ ഒരു കോർ ഡമ്പിന് കാരണമാകുന്നു [ഇതാണ്
ഇപ്പോഴും സത്യമാണോ?]. തെറ്റാണെന്ന് വ്യക്തമാക്കിയാൽ, ഓട്ടോക്ലാസ് സംഭരണം സൗജന്യമാക്കാൻ ശ്രമിക്കില്ല.

max_num_xref_class_probs = 5
കേസിനായി എത്ര ലെസർ ക്ലാസ് പ്രോബബിലിറ്റികൾ അച്ചടിക്കുമെന്ന് നിർണ്ണയിക്കുന്നു
ക്ലാസ് ക്രോസ് റഫറൻസ് റിപ്പോർട്ടുകൾ. ഏറ്റവും സാധ്യതയുള്ള ക്ലാസ് പ്രിന്റ് ചെയ്യുന്നതാണ് ഡിഫോൾട്ട്
പ്രോബബിലിറ്റി മൂല്യവും 4 വരെ ലെസർ ക്ലാസ് പ്രോബബിലിറ്റികളും. ഇത് ശരിയാണെന്ന് ശ്രദ്ധിക്കുക
"ടെക്‌സ്‌റ്റ്", "ഡാറ്റ" ക്ലാസ് ക്രോസ്-റഫറൻസ് റിപ്പോർട്ടുകൾ, എന്നാൽ ഇതിന് മാത്രം ശരിയാണ്
"ഡാറ്റ" കേസ് ക്രോസ് റഫറൻസ് റിപ്പോർട്ട്. "ടെക്സ്റ്റ്" കേസ് ക്രോസ്-റഫറൻസ് റിപ്പോർട്ട് മാത്രം
ഏറ്റവും സാധ്യതയുള്ള ക്ലാസ് പ്രോബബിലിറ്റി ഉണ്ട്.

sigma_contours_att_list =
വ്യക്തമാക്കിയിട്ടുണ്ടെങ്കിൽ, യഥാർത്ഥ മൂല്യമുള്ള ആട്രിബ്യൂട്ട് സൂചികകളുടെ ഒരു ലിസ്റ്റ് (.hd2 ഫയലിൽ നിന്ന്) ഇനിപ്പറയുന്നതായിരിക്കും
സിഗ്മ ക്ലാസ് കോണ്ടൂർ മൂല്യങ്ങൾ കണക്കാക്കുക, സ്വാധീന മൂല്യങ്ങൾ സൃഷ്ടിക്കുമ്പോൾ ഇതിനൊപ്പം റിപ്പോർട്ട് ചെയ്യുക
ഡാറ്റ ഓപ്ഷൻ (report_mode = "data"). വ്യക്തമാക്കിയിട്ടില്ലെങ്കിൽ, സിഗ്മ ഉണ്ടാകില്ല
ക്ലാസ് കോണ്ടൂർ ഔട്ട്പുട്ട്. (ഉദാ: "sigma_contours_att_list = 3, 4, 5, 8, 15")

വ്യാഖ്യാനം OF ഓട്ടോക്ലാസ് ഫലം


എന്ത് ഉണ്ട് അവിടുന്നാണ് മനസ്സിലായോ?
ഇപ്പോൾ നിങ്ങൾ ഓടി ഓട്ടോക്ലാസ് നിങ്ങളുടെ ഡാറ്റാ സെറ്റിൽ -- നിങ്ങൾക്ക് എന്താണ് ലഭിച്ചത്? സാധാരണഗതിയിൽ, ദി
ഓട്ടോക്ലാസ് തിരയൽ നടപടിക്രമം നിരവധി വർഗ്ഗീകരണങ്ങൾ കണ്ടെത്തുന്നു, എന്നാൽ ചില മികച്ചവ മാത്രം സംരക്ഷിക്കുന്നു. ഇവ
പരിശോധനയ്ക്കും വ്യാഖ്യാനത്തിനും ഇപ്പോൾ ലഭ്യമാണ്. യുടെ ഏറ്റവും പ്രധാനപ്പെട്ട സൂചകം
ഈ ബദൽ വർഗ്ഗീകരണങ്ങളുടെ ആപേക്ഷിക ഗുണം ലോഗ് ടോട്ടൽ പോസ്റ്റീരിയർ പ്രോബബിലിറ്റിയാണ്
മൂല്യം. പ്രോബബിലിറ്റി 1 നും 0 നും ഇടയിലായതിനാൽ, അനുബന്ധ ലോഗ്
പ്രോബബിലിറ്റി നെഗറ്റീവ് ആണ്, കൂടാതെ 0 മുതൽ നെഗറ്റീവ് അനന്തത വരെയുള്ള ശ്രേണികൾ. തമ്മിലുള്ള വ്യത്യാസം
ഈ ലോഗ് പ്രോബബിലിറ്റി മൂല്യങ്ങൾ ശക്തിയിലേക്ക് ഉയർത്തി e യുടെ ആപേക്ഷിക പ്രോബബിലിറ്റി നൽകുന്നു
ഇതര വർഗ്ഗീകരണങ്ങൾ. അതിനാൽ, 100 എന്നതിന്റെ വ്യത്യാസം, ഒരു വർഗ്ഗീകരണത്തെ സൂചിപ്പിക്കുന്നു
e^100 ~= 10^43 മറ്റേതിനേക്കാൾ കൂടുതൽ സാധ്യത. എന്നിരുന്നാലും, ഈ സംഖ്യകൾ വളരെ തെറ്റിദ്ധരിപ്പിക്കുന്നതാണ്,
കാരണം അവർ ഇതര വർഗ്ഗീകരണങ്ങളുടെ ആപേക്ഷിക സാധ്യത നൽകുന്നു
ഓട്ടോക്ലാസ് അനുമാനങ്ങൾ.

അനുമാനങ്ങൾ
പ്രത്യേകിച്ചും, ഏറ്റവും പ്രധാനപ്പെട്ടത് ഓട്ടോക്ലാസ് സാധാരണ മോഡലുകളുടെ ഉപയോഗമാണ് അനുമാനങ്ങൾ
യഥാർത്ഥ വേരിയബിളുകൾ, ഒരു ക്ലാസിനുള്ളിലെ ആട്രിബ്യൂട്ടുകളുടെ സ്വാതന്ത്ര്യത്തിന്റെ അനുമാനം. മുതലുള്ള
ഈ അനുമാനങ്ങൾ പലപ്പോഴും പ്രായോഗികമായി ലംഘിക്കപ്പെടുന്നു, പിൻഭാഗത്തെ സംഭാവ്യതയിലെ വ്യത്യാസം
ഇതര വർഗ്ഗീകരണങ്ങളുടെ ഭാഗികമായി ഒരു വർഗ്ഗീകരണം അടുത്തിരിക്കുന്നതിനാൽ ഉണ്ടാകാം
ഒരു യഥാർത്ഥ വ്യത്യാസത്തിന് പകരം മറ്റൊന്നിനെക്കാൾ അനുമാനങ്ങളെ തൃപ്തിപ്പെടുത്തുന്നു
വർഗ്ഗീകരണ നിലവാരം. ലോഗിന്റെ ഉപയോഗത്തെക്കുറിച്ചുള്ള അനിശ്ചിതത്വത്തിന്റെ മറ്റൊരു ഉറവിടം
പ്രോബബിലിറ്റി മൂല്യങ്ങൾ അവർ ഏതെങ്കിലും പ്രത്യേക മുൻ അറിവ് കണക്കിലെടുക്കുന്നില്ല എന്നതാണ്
ഉപയോക്താവിന് ഡൊമെയ്‌നിനെക്കുറിച്ച് ഉണ്ടായിരിക്കാം. ഇതിനർത്ഥം പലപ്പോഴും ബദൽ നോക്കുന്നത് മൂല്യവത്താണ്
നിങ്ങൾക്ക് അവയെ വ്യാഖ്യാനിക്കാൻ കഴിയുമോ എന്നറിയാൻ വർഗ്ഗീകരണങ്ങൾ, എന്നാൽ ഏറ്റവും കൂടുതൽ ആരംഭിക്കുന്നത് മൂല്യവത്താണ്
ആദ്യം സാധ്യത. ലോഗ് പ്രോബബിലിറ്റി മൂല്യം അതിനേക്കാൾ വളരെ കൂടുതലാണെങ്കിൽ ശ്രദ്ധിക്കുക
വൺ ക്ലാസ് കേസ്, അതിന് ധാരാളം തെളിവുകൾ ഉണ്ടെന്ന് പറയുന്നു കുറെ ലെ ഘടന
ഡാറ്റ, ഈ ഘടനയുടെ ഒരു ഭാഗം ക്യാപ്‌ചർ ചെയ്‌തു ഓട്ടോക്ലാസ് വർഗ്ഗീകരണം.

ഇൻഫ്ലുവൻസ് റിപ്പോർട്ട്
അതിനാൽ, ലോഗ് പ്രോബബിലിറ്റിയെ അടിസ്ഥാനമാക്കി നിങ്ങൾ ഇപ്പോൾ പരിശോധിക്കാൻ ആഗ്രഹിക്കുന്ന ഒരു വർഗ്ഗീകരണം തിരഞ്ഞെടുത്തു
മൂല്യം; നിങ്ങൾ അത് എങ്ങനെ പരിശോധിക്കും? ആദ്യം ചെയ്യേണ്ടത് ഒരു "സ്വാധീനം" റിപ്പോർട്ട് ഉണ്ടാക്കുക എന്നതാണ്
രേഖപ്പെടുത്തിയിരിക്കുന്ന റിപ്പോർട്ട് ജനറേഷൻ സൗകര്യങ്ങൾ ഉപയോഗിച്ചുള്ള വർഗ്ഗീകരണത്തെക്കുറിച്ച്
/usr/share/doc/autoclass/reports-c.text. ഒരു സ്വാധീന റിപ്പോർട്ട് സംഗ്രഹിക്കാൻ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു
അതിൽ കുഴിച്ചിട്ടിരിക്കുന്ന പ്രധാന വിവരങ്ങൾ ഓട്ടോക്ലാസ് ഡാറ്റ ഘടനകൾ.

ഈ റിപ്പോർട്ടിന്റെ ആദ്യഭാഗം ഹ്യൂറിസ്റ്റിക് ക്ലാസിന് "ശക്തികൾ" നൽകുന്നു. ക്ലാസ് "ബലം" ആണ്
ജ്യാമിതീയ ശരാശരി സംഭാവ്യതയായി ഇവിടെ നിർവചിച്ചിരിക്കുന്നത് ഏതെങ്കിലും ഉദാഹരണം "വർഗത്തിൽ പെട്ടതാണ്",
ക്ലാസ് പ്രോബബിലിറ്റി മോഡലിൽ നിന്ന് ജനറേറ്റ് ചെയ്യുമായിരുന്നു. അങ്ങനെ അത് ഒരു ഹ്യൂറിസ്റ്റിക് നൽകുന്നു
ഓരോ ക്ലാസും "അതിന്റെ" സംഭവങ്ങൾ എത്ര ശക്തമായി പ്രവചിക്കുന്നു എന്നതിന്റെ അളവ്.

ഉപയോഗിച്ചിരിക്കുന്ന ഓരോ ആട്രിബ്യൂട്ടുകളുടെയും മൊത്തത്തിലുള്ള "സ്വാധീനത്തിന്റെ" ഒരു പട്ടികയാണ് രണ്ടാം ഭാഗം
വർഗ്ഗീകരണം. ഇവയുടെ ആപേക്ഷിക പ്രാധാന്യത്തിന്റെ പരുക്കൻ ഹ്യൂറിസ്റ്റിക് അളവ് നൽകുന്നു
വർഗ്ഗീകരണത്തിലെ ഓരോ ആട്രിബ്യൂട്ടും. ആട്രിബ്യൂട്ട് "സ്വാധീന മൂല്യങ്ങൾ" ഒരു ക്ലാസ് ആണ്
ക്ലാസുകളിലെ ഓരോ ആട്രിബ്യൂട്ടിന്റെയും "സ്വാധീനത്തിന്റെ" പ്രോബബിലിറ്റി വെയ്റ്റഡ് ശരാശരി
താഴെ വിവരിച്ചിരിക്കുന്നു.

റിപ്പോർട്ടിന്റെ അടുത്ത ഭാഗം ഓരോ ക്ലാസുകളുടെയും സംഗ്രഹ വിവരണമാണ്. ക്ലാസുകൾ
ക്ലാസ് ഭാരത്തിന്റെ അവരോഹണക്രമത്തിൽ 0 മുതൽ n വരെ ഏകപക്ഷീയമായി അക്കമിട്ടിരിക്കുന്നു. ഒരു ക്ലാസ്
പറയുക 34.1 എന്നതിന്റെ ഭാരം അർത്ഥമാക്കുന്നത് ക്ലാസിലെ അംഗത്വ സാധ്യതകളുടെ തൂക്കമുള്ള തുക എന്നാണ്
34.1 34 എന്ന ക്ലാസ് ഭാരം 34 കേസുകൾ ഉൾപ്പെടുന്നതാണെന്ന് അർത്ഥമാക്കണമെന്നില്ല എന്നത് ശ്രദ്ധിക്കുക
ആ ക്ലാസ്, കാരണം പല കേസുകളിലും ആ ക്ലാസിൽ ഭാഗിക അംഗത്വം മാത്രമേ ഉണ്ടാകൂ. ഓരോന്നിനും ഉള്ളിൽ
ക്ലാസ്, ആട്രിബ്യൂട്ടുകൾ അല്ലെങ്കിൽ ആട്രിബ്യൂട്ട് സെറ്റുകൾ അവയുടെ മോഡൽ പദത്തിന്റെ "സ്വാധീനം" അനുസരിച്ച് ക്രമീകരിച്ചിരിക്കുന്നു.

കുരിശ് എൻട്രോപ്പി
രണ്ട് പ്രോബബിലിറ്റി ഡിസ്‌ട്രിബ്യൂഷനുകൾ തമ്മിലുള്ള വ്യതിചലനത്തിന്റെ ഒരു സാധാരണ അളവുകോലാണ്
ക്രോസ് എൻട്രോപ്പി: P(x|c...)*ലോഗ്[P(x|c...)/P(x|g...)], സാധ്യമായ എല്ലാ മൂല്യങ്ങളുടെയും ആകെത്തുക
ഇവിടെ c..., g... എന്നിവ വിതരണങ്ങളെ നിർവ്വചിക്കുന്നു. ഇത് പൂജ്യത്തിൽ നിന്ന് തുല്യമാണ്
ഡിസ്ട്രിബ്യൂഷനുകൾ, വിതരണങ്ങൾക്ക് അനന്തമായി, വ്യത്യസ്ത മൂല്യങ്ങളിൽ പ്രോബബിലിറ്റി 1 സ്ഥാപിക്കുന്നു
ഒരു ആട്രിബ്യൂട്ട്. പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷനുകളിൽ സോപാധികമായ സ്വതന്ത്ര നിബന്ധനകളോടെ, the
ക്രോസ് എൻട്രോപ്പിയെ ഈ നിബന്ധനകളേക്കാൾ ഒരു തുകയായി കണക്കാക്കാം. ഈ ഘടകങ്ങൾ ഒരു അളവ് നൽകുന്നു
രണ്ടിനെയും വേർതിരിക്കുന്നതിലെ അനുബന്ധ മാതൃകയിലുള്ള ആട്രിബ്യൂട്ടിന്റെ സ്വാധീനം
വിതരണങ്ങൾ.

ഒരു ക്ലാസിലെ മാതൃകാ പദത്തിന്റെ "സ്വാധീനം" ക്രോസ് എൻട്രോപ്പി പദമായി ഞങ്ങൾ നിർവ്വചിക്കുന്നു.
ക്ലാസ് ഡിസ്ട്രിബ്യൂഷൻ wrt ഒറ്റ ക്ലാസിന്റെ ആഗോള ക്ലാസ് ഡിസ്ട്രിബ്യൂഷൻ
വർഗ്ഗീകരണം. "സ്വാധീനം" എന്നത് മോഡൽ പദം എത്രത്തോളം ശക്തമായി സഹായിക്കുന്നു എന്നതിന്റെ അളവാണ്
മുഴുവൻ ഡാറ്റാ സെറ്റിൽ നിന്നും ക്ലാസ്സിനെ വേർതിരിക്കുക. സ്വതന്ത്രമായി മാതൃകാപരമായ ആട്രിബ്യൂട്ടുകളോടെ,
ആട്രിബ്യൂട്ടിലേക്ക് തന്നെ സ്വാധീനം നിയമപരമായി ആരോപിക്കാവുന്നതാണ്. പരസ്പരബന്ധിതമായ അല്ലെങ്കിൽ
കോവേരിയന്റ് ആട്രിബ്യൂട്ടുകൾ സെറ്റുകൾ, ക്രോസ് എൻട്രോപ്പി ഫാക്ടർ മുഴുവൻ സെറ്റിന്റെയും പ്രവർത്തനമാണ്, കൂടാതെ
മാതൃകാപരമായ ആട്രിബ്യൂട്ടുകളിൽ ഞങ്ങൾ സ്വാധീന മൂല്യം തുല്യമായി വിതരണം ചെയ്യുന്നു.

ആട്രിബ്യൂട്ട് ഇൻഫ്ലുവൻസ് മൂല്യങ്ങൾ
ഓരോ ക്ലാസിലെയും "സ്വാധീനം" റിപ്പോർട്ടിൽ, ആ ക്ലാസിനുള്ള ആട്രിബ്യൂട്ട് പാരാമീറ്ററുകൾ നൽകിയിരിക്കുന്നു
മോഡൽ ടേം ആട്രിബ്യൂട്ട് സെറ്റുകളുടെ ഏറ്റവും ഉയർന്ന സ്വാധീന മൂല്യത്തിന്റെ ക്രമത്തിൽ. ആദ്യത്തെ കുറച്ച് മാത്രം
ആട്രിബ്യൂട്ട് സെറ്റുകൾക്ക് സാധാരണയായി കാര്യമായ സ്വാധീന മൂല്യങ്ങളുണ്ട്. ഒരു സ്വാധീന മൂല്യം കുറയുകയാണെങ്കിൽ
ഏറ്റവും ഉയർന്ന മൂല്യത്തിന്റെ ഏകദേശം 20% ന് താഴെ, അത് ഒരുപക്ഷേ പ്രധാനമല്ല, പക്ഷേ എല്ലാം
പൂർണ്ണതയ്ക്കായി ആട്രിബ്യൂട്ട് സെറ്റുകൾ പട്ടികപ്പെടുത്തിയിരിക്കുന്നു. ഓരോന്നിനും സ്വാധീന മൂല്യം കൂടാതെ
ആട്രിബ്യൂട്ട് സെറ്റ്, ആ ക്ലാസിലെ ആട്രിബ്യൂട്ട് സെറ്റ് പാരാമീറ്ററുകളുടെ മൂല്യങ്ങൾ നൽകിയിരിക്കുന്നു
അനുബന്ധ "ആഗോള" മൂല്യങ്ങൾക്കൊപ്പം. ആഗോള മൂല്യങ്ങൾ നേരിട്ട് കണക്കാക്കുന്നു
വർഗ്ഗീകരണത്തിൽ നിന്ന് സ്വതന്ത്രമായ ഡാറ്റ. ഉദാഹരണത്തിന്, ആട്രിബ്യൂട്ടിന്റെ ക്ലാസ് ശരാശരി ആണെങ്കിൽ
"താപനില" 90 ആണ്, സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ 2.5 ആണ്, എന്നാൽ ആഗോള ശരാശരി 68 ആണ്.
16.3 ന്റെ സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ, തുടർന്ന് ഈ ക്ലാസ് കൂടുതൽ ഉയർന്ന കേസുകൾ തിരഞ്ഞെടുത്തു
ശരാശരി താപനില, ഈ ഉയർന്ന ശ്രേണിയിൽ ചെറിയ വ്യാപനം. അതുപോലെ, വേണ്ടി
വ്യതിരിക്ത ആട്രിബ്യൂട്ട് സെറ്റുകൾ, ആ ക്ലാസിലെ ഓരോ ഫലത്തിന്റെയും സംഭാവ്യത നൽകിയിരിക്കുന്നു
അനുബന്ധ ആഗോള സംഭാവ്യതയോടെ -- അതിന്റെ പ്രാധാന്യം അനുസരിച്ച് ക്രമീകരിച്ചിരിക്കുന്നു: കേവലം
മൂല്യം (ലോഗ് { / }). പ്രാധാന്യത്തിന്റെ അടയാളം
മൂല്യം ആഗോള ക്ലാസിൽ നിന്നുള്ള മാറ്റത്തിന്റെ ദിശ കാണിക്കുന്നു. ഈ വിവരം ഒരു നൽകുന്നു
ഓരോ ക്ലാസും എല്ലാ ഡാറ്റയുടെയും ശരാശരിയിൽ നിന്ന് ഏറ്റവും കൂടുതൽ ക്രമത്തിൽ എങ്ങനെ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു എന്നതിന്റെ അവലോകനം
കാര്യമായ വ്യത്യാസങ്ങൾ.

ക്ലാസ് ഒപ്പം കേസ് റിപ്പോർട്ടുകൾ
"സ്വാധീനം" റിപ്പോർട്ടിൽ നിന്ന് ക്ലാസുകളുടെ ഒരു വിവരണം നേടിയ ശേഷം, നിങ്ങൾ ആഗ്രഹിച്ചേക്കാം
നിങ്ങളുടെ പ്രിയപ്പെട്ട കേസുകൾ ഏത് ക്ലാസിലാണ് അവസാനിച്ചതെന്ന് കാണുന്നതിന് ഫോളോ-അപ്പ് ചെയ്യുക. നേരെമറിച്ച്, നിങ്ങൾ ആഗ്രഹിച്ചേക്കാം
ഏത് കേസുകൾ ഒരു പ്രത്യേക വിഭാഗത്തിൽ പെട്ടതാണെന്ന് കാണാൻ. ഇത്തരത്തിലുള്ള ക്രോസ് റഫറൻസിനായി
വിവരങ്ങൾക്ക് രണ്ട് പൂരക റിപ്പോർട്ടുകൾ സൃഷ്ടിക്കാൻ കഴിയും. ഇവ കൂടുതൽ പൂർണ്ണമായി രേഖപ്പെടുത്തപ്പെട്ടവയാണ്
in /usr/share/doc/autoclass/reports-c.text. "ക്ലാസ്" റിപ്പോർട്ട്, എല്ലാ കേസുകളും പട്ടികപ്പെടുത്തുന്നു
ഓരോ ക്ലാസിലും കാര്യമായ അംഗത്വവും അത്തരത്തിലുള്ള ഓരോ കേസും എത്രത്തോളം ഉൾപ്പെട്ടിരിക്കുന്നു
ആ ക്ലാസിലേക്ക്. നിലവിലെ ക്ലാസിലെ ക്ലാസ് അംഗത്വം 90% ൽ താഴെയുള്ള കേസുകൾ ഉണ്ട്
അവരുടെ മറ്റ് ക്ലാസ് അംഗത്വവും പട്ടികപ്പെടുത്തിയിട്ടുണ്ട്. ഒരു ക്ലാസിലെ കേസുകൾ ക്രമീകരിച്ചിരിക്കുന്നു
കേസുകളുടെ എണ്ണം വർദ്ധിക്കുന്നു. ഇതര "കേസുകൾ" റിപ്പോർട്ട് ഏത് ക്ലാസ് (അല്ലെങ്കിൽ ക്ലാസുകൾ) എ
കേസ് ഉൾപ്പെടുന്നതാണ്, ഏറ്റവും സാധ്യതയുള്ള ക്ലാസിലെ അംഗത്വ സാധ്യത. ഇവ രണ്ടും
ഏതൊക്കെ കേസുകൾ ഏതൊക്കെ ക്ലാസുകളുടേതാണ് അല്ലെങ്കിൽ മറ്റേത് വഴിയാണെന്ന് കണ്ടെത്താൻ റിപ്പോർട്ടുകൾ നിങ്ങളെ അനുവദിക്കുന്നു. എങ്കിൽ
മിക്കവാറും എല്ലാ കേസുകളിലും ഒരൊറ്റ ക്ലാസിൽ 99% അംഗത്വമുണ്ട്, അപ്പോൾ അതിനർത്ഥം
ക്ലാസുകൾ നന്നായി വേർതിരിക്കപ്പെടുന്നു, അതേസമയം ഉയർന്ന അളവിലുള്ള ക്രോസ്-മെമ്പർഷിപ്പ് സൂചിപ്പിക്കുന്നത്
ക്ലാസുകൾ വളരെയധികം ഓവർലാപ്പ് ചെയ്തിരിക്കുന്നു. വളരെ ഓവർലാപ്പ് ചെയ്ത ക്ലാസുകൾ ആശയത്തിന്റെ സൂചനയാണ്
വർഗ്ഗീകരണം തകരുന്നു, പരസ്പരം വളരെ ഓവർലാപ്പ് ചെയ്ത ക്ലാസുകളുടെ ഗ്രൂപ്പുകൾ,
ഒരുതരം മെറ്റാ ക്ലാസ്, ഒരുപക്ഷേ ഡാറ്റ മനസ്സിലാക്കുന്നതിനുള്ള മികച്ച മാർഗമാണ്.

താരതമ്യം ചെയ്യുന്നു ക്ലാസ് ഭാരം ഒപ്പം ക്ലാസ്/കേസ് റിപ്പോർട്ട് നിയമനങ്ങൾ
ക്ലാസ് പ്രോബബിലിറ്റി പാരാമീറ്ററായി നൽകിയിരിക്കുന്ന ക്ലാസ് വെയ്റ്റ് പ്രധാനമായും എല്ലാത്തിന്റേയും ആകെത്തുകയാണ്
ഡാറ്റാ സംഭവങ്ങൾ, ഉദാഹരണം ക്ലാസിലെ അംഗമാകാനുള്ള നോർമലൈസ്ഡ് പ്രോബബിലിറ്റി.
ഈ സംഖ്യയെ ഒരു പൂർണ്ണസംഖ്യയായി ഫോർമാറ്റ് ചെയ്യുന്നത് ഞങ്ങളുടെ ഭാഗത്തെ പിശകായിരിക്കാം
അതിന്റെ യഥാർത്ഥ സ്വഭാവം ഊന്നിപ്പറയുന്നതിനുപകരം റിപ്പോർട്ട് ചെയ്യുക. യഥാർത്ഥ മൂല്യം നിങ്ങൾ കണ്ടെത്തും
ഏതെങ്കിലും .results[-bin] ഫയലിൽ class_DS ഘടനകളിൽ w_j പാരാമീറ്ററായി രേഖപ്പെടുത്തിയിട്ടുണ്ട്.

.case, .class റിപ്പോർട്ടുകൾ കേസുകൾ ക്ലാസുകളിലെ അംഗങ്ങളാകാനുള്ള സാധ്യതകൾ നൽകുന്നു. ഏതെങ്കിലും
ക്ലാസുകളിലേക്ക് കേസുകൾ നൽകുന്നതിന് ചില തീരുമാന നിയമം ആവശ്യമാണ്. പരമാവധി സാധ്യത
അസൈൻമെന്റ് റൂൾ പലപ്പോഴും പരോക്ഷമായി അനുമാനിക്കപ്പെടുന്നു, പക്ഷേ ഫലമുണ്ടാകുമെന്ന് പ്രതീക്ഷിക്കാനാവില്ല
മിക്കവാറും എല്ലാ ക്ലാസ് അംഗത്വവും ഒഴികെ പാർട്ടീഷൻ വലുപ്പങ്ങൾ ക്ലാസ് ഭാരത്തിന് തുല്യമായിരിക്കും
സാധ്യതകൾ ഫലത്തിൽ ഒന്നോ പൂജ്യമോ ആണ്. 1/0 അല്ലാത്ത അംഗത്വ സാധ്യതകളോടെ,
ക്ലാസ് വെയ്റ്റുകളുമായി പൊരുത്തപ്പെടുന്നതിന് സാധ്യതകൾ സംഗ്രഹിക്കേണ്ടതുണ്ട്.

കൂടാതെ, EM ന്റെ പൂർണ്ണതയെക്കുറിച്ചുള്ള ചോദ്യമുണ്ട് (പ്രതീക്ഷ പരമാവധിയാക്കൽ)
ഒത്തുചേരൽ. ക്ലാസ് പാരാമീറ്ററുകൾ കണക്കാക്കുന്നതിനും ക്ലാസ് കണക്കാക്കുന്നതിനും ഇടയിൽ EM മാറിമാറി വരുന്നു
അംഗത്വ സാധ്യതകൾ. ഈ കണക്കുകൾ പരസ്പരം ഒത്തുചേരുന്നു, പക്ഷേ യഥാർത്ഥത്തിൽ ഒരിക്കലും
കണ്ടുമുട്ടുക. ഓട്ടോക്ലാസ് ഇതര സ്റ്റോപ്പിംഗ് ഉപയോഗിച്ച് നിരവധി കൺവെർജൻസ് അൽഗോരിതങ്ങൾ നടപ്പിലാക്കുന്നു
.s-params ഫയലിൽ ഉചിതമായ പരാമീറ്ററുകൾ ഉപയോഗിക്കുന്ന മാനദണ്ഡം. ഇവയുടെ ശരിയായ ക്രമീകരണം
പാരാമീറ്ററുകൾ, ന്യായമായ പൂർണ്ണവും കാര്യക്ഷമവുമായ ഒത്തുചേരൽ ആവശ്യമായി വന്നേക്കാം
പരീക്ഷണം.

ബദൽ ക്ലാസിഫിക്കേഷനുകൾ
ചുരുക്കത്തിൽ, സൃഷ്ടിക്കാൻ കഴിയുന്ന വിവിധ റിപ്പോർട്ടുകൾ നിങ്ങൾക്ക് കാണാനുള്ള ഒരു മാർഗം നൽകുന്നു
നിലവിലെ വർഗ്ഗീകരണം. ഇതര വർഗ്ഗീകരണങ്ങൾ നോക്കുന്നത് സാധാരണയായി നല്ലതാണ്
അവർക്ക് ഏറ്റവും കുറഞ്ഞ ലോഗ് പ്രോബബിലിറ്റി മൂല്യങ്ങൾ ഇല്ലെങ്കിലും. ഈ മറ്റുള്ളവ
ക്ലാസിഫിക്കേഷനുകൾക്ക് സാധാരണയായി മറ്റുള്ളവയിലെ ശക്തമായ ക്ലാസുകളുമായി പൊരുത്തപ്പെടുന്ന ക്ലാസുകൾ ഉണ്ട്
വർഗ്ഗീകരണങ്ങൾ, എന്നാൽ ദുർബലമായ വിഭാഗങ്ങളിൽ വ്യത്യാസമുണ്ടാകാം. a ഉള്ളിലെ ഒരു ക്ലാസ്സിന്റെ "ശക്തി"
വർഗ്ഗീകരണം സാധാരണയായി എത്ര നാടകീയമായി ഏറ്റവും ഉയർന്ന സ്വാധീന മൂല്യത്തെ അടിസ്ഥാനമാക്കി വിലയിരുത്താം
ക്ലാസിലെ ആട്രിബ്യൂട്ടുകൾ അനുബന്ധ ആഗോള ആട്രിബ്യൂട്ടുകളിൽ നിന്ന് വ്യത്യസ്തമാണ്. ഒന്നുമില്ലെങ്കിൽ
വർഗ്ഗീകരണങ്ങൾ തികച്ചും തൃപ്തികരമാണെന്ന് തോന്നുന്നു, അത് പ്രവർത്തിപ്പിക്കാൻ എപ്പോഴും സാധ്യമാണ് ഓട്ടോക്ലാസ് വീണ്ടും
പുതിയ വർഗ്ഗീകരണങ്ങൾ സൃഷ്ടിക്കുക.

എന്ത് അടുത്തത്?
അവസാനമായി, നിങ്ങൾ ഉൾക്കാഴ്ചയുള്ള ഒരു വർഗ്ഗീകരണം കണ്ടെത്തിയതിന് ശേഷം എന്തുചെയ്യണം എന്ന ചോദ്യം
ഉദിക്കുന്നു. സാധാരണയായി, ഒരു സെറ്റ് പരിശോധിക്കുന്നതിനുള്ള പ്രാഥമിക ഡാറ്റ വിശകലന ഘട്ടമാണ് വർഗ്ഗീകരണം
കേസുകളുടെ (കാര്യങ്ങൾ, ഉദാഹരണങ്ങൾ മുതലായവ) അവ ഗ്രൂപ്പുചെയ്യാനാകുമോ എന്ന് നോക്കാൻ, അങ്ങനെ അംഗങ്ങൾ
ഗ്രൂപ്പ് പരസ്പരം "സമാനമാണ്". ഓട്ടോക്ലാസ് ഉപയോക്താവില്ലാതെ അത്തരമൊരു ഗ്രൂപ്പിംഗ് നൽകുന്നു
ഒരു സാമ്യത നിർവചിക്കേണ്ടതുണ്ട്. അന്തർനിർമ്മിത "സാമ്യത" അളവ് പരസ്പരമാണ്
കേസുകളുടെ പ്രവചനം. ചില വസ്തുക്കൾ എന്തിനാണെന്ന് "വിശദീകരിക്കാൻ" ശ്രമിക്കുക എന്നതാണ് അടുത്ത ഘട്ടം
വ്യത്യസ്ത ഗ്രൂപ്പിലുള്ളവരെക്കാൾ മറ്റുള്ളവരെപ്പോലെ. സാധാരണയായി, ഡൊമെയ്ൻ അറിവ് ഒരു നിർദ്ദേശിക്കുന്നു
ഉത്തരം. ഉദാഹരണത്തിന്, വരുമാനം, വാങ്ങൽ ശീലങ്ങൾ, സ്ഥാനം എന്നിവയെ അടിസ്ഥാനമാക്കിയുള്ള ആളുകളുടെ വർഗ്ഗീകരണം,
പ്രായം മുതലായവ, മുമ്പ് വ്യക്തമല്ലാത്ത പ്രത്യേക സാമൂഹിക വിഭാഗങ്ങൾ വെളിപ്പെടുത്തിയേക്കാം
വർഗ്ഗീകരണ വിശകലനം. അത്തരം ക്ലാസുകളെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾ ലഭിക്കുന്നതിന്, കൂടുതൽ
കാറുകളുടെ എണ്ണം, ടിവി ഷോകൾ എന്തൊക്കെയാണ് കാണുന്നത് തുടങ്ങിയ വിവരങ്ങൾ പോലും വെളിപ്പെടുത്തും
കൂടുതൽ വിവരങ്ങൾ. രേഖാംശ പഠനങ്ങൾ എങ്ങനെ സാമൂഹിക ക്ലാസുകളെക്കുറിച്ചുള്ള വിവരങ്ങൾ നൽകും
ഉദയം, അവരുടെ മനോഭാവങ്ങളെ സ്വാധീനിക്കുന്നവ -- ഇവയെല്ലാം പ്രാരംഭത്തിന് അപ്പുറത്തേക്ക് പോകുന്നു
വർഗ്ഗീകരണം.

പ്രവചനങ്ങൾ


പുതിയ കേസുകൾക്ക് ക്ലാസ് അംഗത്വം പ്രവചിക്കാൻ ക്ലാസിഫിക്കേഷനുകൾ ഉപയോഗിക്കാം. അങ്ങനെ പുറമേ
നിങ്ങളുടെ ഡാറ്റയ്ക്ക് പിന്നിലെ ഘടനയെക്കുറിച്ച് നിങ്ങൾക്ക് ചില ഉൾക്കാഴ്‌ച നൽകിയേക്കാം, നിങ്ങൾക്ക് ഇപ്പോൾ ഉപയോഗിക്കാം
ഓട്ടോക്ലാസ് നേരിട്ട് പ്രവചനങ്ങൾ നടത്താനും താരതമ്യം ചെയ്യാനും ഓട്ടോക്ലാസ് മറ്റ് പഠന സംവിധാനങ്ങളിലേക്ക്.

ക്ലാസ് സാധ്യതകൾ പ്രവചിക്കുന്നതിനുള്ള ഈ സാങ്കേതികത എല്ലാ ആട്രിബ്യൂട്ടുകൾക്കും ബാധകമാണ്,
ഡാറ്റ തരം/ഉപ_തരം അല്ലെങ്കിൽ സാധ്യതാ മോഡൽ ടേം തരം പരിഗണിക്കാതെ.

ഏതെങ്കിലും ഒരു ഡാറ്റാ കേസിന്റെ ക്ലാസ് അംഗത്വം 0.0099999 കവിയാത്ത സാഹചര്യത്തിൽ
"പരിശീലന" ക്ലാസുകളിൽ, ഓരോന്നിന്റെയും സ്ക്രീൻ ഔട്ട്പുട്ടിൽ ഇനിപ്പറയുന്ന സന്ദേശം ദൃശ്യമാകും
കേസ്:

xref_get_data: case_num xxx => ക്ലാസ് 9999

ക്ലാസ് 9999 അംഗങ്ങൾ "കേസ്", "ക്ലാസ്" ക്രോസ്-റഫറൻസ് റിപ്പോർട്ടുകളിൽ ദൃശ്യമാകും
ക്ലാസ് അംഗത്വം 1.0.

മുൻകരുതൽ പോയിന്റുകൾ:

ഉപയോഗിക്കുന്ന സാധാരണ രീതി ഓട്ടോക്ലാസ് നിങ്ങളുടെ എല്ലാ ഡാറ്റയും ഒരു data_file-ൽ ഇടുക എന്നതാണ്, അത് വിവരിക്കുക
മോഡൽ, ഹെഡർ ഫയലുകൾ ഉള്ള ഡാറ്റ, "ഓട്ടോക്ലാസ് -സെർച്ച്" പ്രവർത്തിപ്പിക്കുക. ഇപ്പോൾ, ഒന്നിന് പകരം
data_file നിങ്ങൾക്ക് ഒരു ട്രെയിനിംഗ്_ഡാറ്റ_ഫയലും ടെസ്റ്റ്_ഡാറ്റ_ഫയലും രണ്ട് ഉണ്ടായിരിക്കും.

രണ്ട് ഡാറ്റാബേസുകളും ഒരേപോലെയാണെന്നത് ഏറ്റവും പ്രധാനമാണ് ഓട്ടോക്ലാസ് ആന്തരിക പ്രാതിനിധ്യം.
ഇത് സത്യമായിരിക്കരുത്, ഓട്ടോക്ലാസ് പുറത്തുകടക്കും, അല്ലെങ്കിൽ ചില സാഹചര്യങ്ങളിൽ, തകരും.
പ്രവചന മോഡ് രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നത് ഉപയോക്താവിനെ ഇതുമായി പൊരുത്തപ്പെടുത്താൻ പ്രതീക്ഷിക്കുന്നതിനാണ്
ആവശ്യകത.

തയാറാക്കുന്ന വിധം:

പ്രവചനത്തിന് പരിശീലന വർഗ്ഗീകരണവും ഒരു ടെസ്റ്റ് ഡാറ്റാബേസും ആവശ്യമാണ്. പരിശീലനം
പരിശീലനത്തിൽ "ഓട്ടോക്ലാസ്-സെർച്ച്" പ്രവർത്തിപ്പിച്ചാണ് വർഗ്ഗീകരണം സൃഷ്ടിക്കുന്നത്
data_file ("data/soybean/soyc.db2"), ഉദാഹരണത്തിന്:

autoclass -search data/soybean/soyc.db2 data/soybean/soyc.hd2
data/soybean/soyc.model data/soybean/soyc.s-params

ഇത് "soyc.results-bin", "soyc.search" എന്നിവ നിർമ്മിക്കും. തുടർന്ന് ഒരു "റിപ്പോർട്ട്" പാരാമീറ്റർ സൃഷ്ടിക്കുക
"soyc.r-params" പോലുള്ള ഫയൽ (കാണുക /usr/share/doc/autoclass/reports-c.text), ഓടിക്കുക
ഓട്ടോക്ലാസ് "റിപ്പോർട്ട്" മോഡിൽ:

autoclass -reports data/soybean/soyc.results-bin
data/soybean/soyc.search data/soybean/soyc.r-params

ഇത് ക്ലാസ്, കേസ് ക്രോസ്-റഫറൻസ് ഫയലുകളും ഒരു സ്വാധീന മൂല്യ ഫയലുകളും സൃഷ്ടിക്കും.
ഫയലിന്റെ പേരുകൾ ".r-params" ഫയൽ നാമത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്:

data/soybean/soyc.class-text-1
data/soybean/soyc.case-text-1
data/soybean/soyc.influ-text-1

ട്രെയിനിംഗ്_ഡാറ്റ_ഫയലിൽ കാണുന്ന ക്ലാസുകൾ ഇവ വിവരിക്കും. ഇപ്പോൾ ഈ വർഗ്ഗീകരണം
test_data_file കേസുകളുടെ പ്രോബബിലിസ്റ്റിക് ക്ലാസ് അംഗത്വം പ്രവചിക്കാൻ ഉപയോഗിക്കാം
("data/soybean/soyc-predict.db2") പരിശീലന_ഡാറ്റ_ഫയൽ ക്ലാസുകളിൽ.

autoclass -predict data/soybean/soyc-predict.db2
data/soybean/soyc.results-bin data/soybean/soyc.search
ഡാറ്റ/സോയാബീൻ/soyc.r-params

ഇത് test_data_file കേസുകൾക്കായി ക്ലാസ്, കേസ് ക്രോസ്-റഫറൻസ് ഫയലുകൾ സൃഷ്ടിക്കും
ട്രെയിനിംഗ്_ഡാറ്റ_ഫയൽ ക്ലാസുകളിലെ അവരുടെ പ്രോബബിലിസ്റ്റിക് ക്ലാസ് അംഗത്വങ്ങൾ പ്രവചിക്കുന്നു. ദി
ഫയലിന്റെ പേരുകൾ ".db2" ഫയൽ നാമത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്:

data/soybean/soyc-predict.class-text-1
data/soybean/soyc-predict.case-text-1

onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് ഓൺലൈൻ ഓട്ടോക്ലാസ് ഉപയോഗിക്കുക


സൗജന്യ സെർവറുകളും വർക്ക്സ്റ്റേഷനുകളും

Windows & Linux ആപ്പുകൾ ഡൗൺലോഡ് ചെയ്യുക

  • 1
    VBA-M (ആർക്കൈവ് ചെയ്തത് - ഇപ്പോൾ Github-ൽ)
    VBA-M (ആർക്കൈവ് ചെയ്തത് - ഇപ്പോൾ Github-ൽ)
    പദ്ധതിയിലേക്ക് നീങ്ങി
    https://github.com/visualboyadvance-m/visualboyadvance-m
    ഫീച്ചറുകൾ: ചീറ്റ് ക്രിയേഷൻസ് സേവ് സ്റ്റേറ്റ്സ് മൾട്ടി
    സിസ്റ്റം, gba, gbc, gb, sgb, പിന്തുണയ്ക്കുന്നു
    sgb2Tu...
    VBA-M ഡൗൺലോഡ് ചെയ്യുക (ആർക്കൈവ് ചെയ്തത് - ഇപ്പോൾ Github-ൽ)
  • 2
    സ്റ്റേസർ
    സ്റ്റേസർ
    ലിനക്സ് സിസ്റ്റം ഒപ്റ്റിമൈസറും മോണിറ്ററിംഗും
    ഗിത്തബ് ശേഖരം:
    https://github.com/oguzhaninan/Stacer.
    പ്രേക്ഷകർ: അന്തിമ ഉപയോക്താക്കൾ/ഡെസ്ക്ടോപ്പ്. ഉപയോക്താവ്
    ഇന്റർഫേസ്: Qt. പ്രോഗ്രാമിംഗ് ലാ...
    സ്റ്റേസർ ഡൗൺലോഡ് ചെയ്യുക
  • 3
    ഓറഞ്ച് ഫോക്സ്
    ഓറഞ്ച് ഫോക്സ്
    TeamWinRecoveryProject (TWRP) ഫോർക്ക്
    നിരവധി അധിക ഫംഗ്ഷനുകൾക്കൊപ്പം, പുനർരൂപകൽപ്പന
    കൂടാതെ കൂടുതൽ സവിശേഷതകൾ: ട്രിബിളിനെ പിന്തുണയ്ക്കുന്നു ഒപ്പം
    നോൺ-ട്രിബിൾ റോമുകൾ അപ്-ടു-ഡേറ്റ് ഓറിയോ കേർണൽ,
    പണിത...
    OrangeFox ഡൗൺലോഡ് ചെയ്യുക
  • 4
    itop - ITSM CMDB ഓപ്പൺ സോഴ്സ്
    itop - ITSM CMDB ഓപ്പൺ സോഴ്സ്
    ഐടി ഓപ്പറേഷൻസ് പോർട്ടൽ: പൂർണ്ണമായി തുറന്നിരിക്കുന്നു
    ഉറവിടം, ITIL, വെബ് അധിഷ്ഠിത സേവനം
    ഒരു പൂർണ്ണമായ ഉൾപ്പെടെ മാനേജ്മെന്റ് ഉപകരണം
    ഇഷ്‌ടാനുസൃതമാക്കാവുന്ന CMDB, ഒരു ഹെൽപ്പ്‌ഡെസ്‌ക് സിസ്റ്റം കൂടാതെ
    ഒരു പ്രമാണം മനുഷ്യൻ...
    ഐടോപ്പ് ഡൗൺലോഡ് ചെയ്യുക - ITSM CMDB ഓപ്പൺ സോഴ്സ്
  • 5
    ക്ലെമെൻറൈൻ
    ക്ലെമെൻറൈൻ
    ക്ലെമന്റൈൻ ഒരു മൾട്ടി-പ്ലാറ്റ്ഫോം സംഗീതമാണ്
    കളിക്കാരനും ലൈബ്രറി സംഘാടകനും പ്രചോദനം നൽകി
    അമറോക്ക് 1.4. ഇതിന് ഒരു ഉപവാസവും ഉണ്ട്
    ഉപയോഗിക്കാൻ എളുപ്പമുള്ള ഇന്റർഫേസ്, ഒപ്പം നിങ്ങളെ അനുവദിക്കുന്നു
    തിരയുകയും...
    ക്ലെമന്റൈൻ ഡൗൺലോഡ് ചെയ്യുക
  • 6
    XISMuS
    XISMuS
    ശ്രദ്ധിക്കുക: 2.4.3 ക്യുമുലേറ്റീവ് അപ്‌ഡേറ്റ് ഉണ്ട്
    വിട്ടയച്ചു!! അപ്‌ഡേറ്റ് എല്ലാവർക്കുമായി പ്രവർത്തിക്കുന്നു
    മുമ്പത്തെ 2.xx പതിപ്പ്. നവീകരിക്കുകയാണെങ്കിൽ
    പതിപ്പ് v1.xx-ൽ നിന്ന്, ദയവായി ഡൗൺലോഡ് ചെയ്യുക
    ൽ ...
    XISMuS ഡൗൺലോഡ് ചെയ്യുക
  • കൂടുതൽ "

ലിനക്സ് കമാൻഡുകൾ

Ad