این فایل دستوری است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
ifile - هسته قابل اجرا برای سیستم فیلتر ایمیل ifile
خلاصه
فایل [-b پرونده] [-q|-Q] [-g] [-k] [-o] [-v تعداد] [حرف زدن گزینه های] پرونده ...
فایل -c -q|-Q [-T آستانه] [-b پرونده] [-g] [-k] [-o] [حرف زدن گزینه های] پرونده ...
فایل [-b پرونده] [-d پوشه] [-i پوشه|-u پوشه] [-g] [-k] [-o] [-v تعداد] [حرف زدن گزینه های]
پرونده ...
فایل -r [-b پرونده]
شرح
فایل یک سرویس گیرنده فیلتر ایمیل است که از یادگیری ماشینی برای طبقه بندی ایمیل ها استفاده می کند
پوشه ها / صندوق های پستی الگوریتمی که از آن استفاده می کند Naive Bayes نام دارد. اساساً ساده لوحانه
bayes هر سند را مجموعه ای نامرتب از کلمات در نظر می گیرد و با تطبیق طبقه بندی می کند
توزیع سند با نزدیکترین توزیع پوشه/صندوق پستی.
OPTIONS
-b, --db-فایل=پرونده
مکان برای خواندن/ذخیره پایگاه داده ifile. پیش فرض است ~/.idata
-c, --مختصر
معادل "ifil -v 0 | سر -1 | قطع كردن -f1 -d". باید با استفاده شود -q or -Q.
-d, --حذف=پوشه
آمار هر کدام را حذف کنید فایل ها از رده پوشه
-f, --folder-calcs=پوشه
نمایش محاسبات احتمال کلمه برای پوشه
-g, --ورود به سیستم فایل
ایجاد و ذخیره اطلاعات اشکال زدایی در ~/.ifile.log
-i, --درج=پوشه
آمار هر یک از فایل ها را به دسته اضافه کنید پوشه
-k, -- نگه داشتن - نادر
کلماتی که به ندرت اتفاق میافتند را در پایگاه داده بگذارید (معمولاً پرتاب میشوند)
-l, --query-loocv=پوشه
برای هر یک از فایل ها، فایل را به طور موقت حذف می کند پوشه، پرس و جو را انجام می دهد و
سپس فایل را دوباره وارد می کند پوشه. پایگاه داده اصلاح نشده است.
-o, --روی دادن
از نمایش بیت بردار سند استفاده می کند. هر کلمه را یک بار در هر سند بشمارید.
-q, --پرس و جو
امتیازات رتبه بندی خروجی برای هر یک از فایل ها
-Q, --query-insert
برای هر یک از فایلها، امتیازات رتبهبندی خروجی و اضافه کردن آمار برای پوشه با
بالاترین امتیاز
-T, --آستانه=آستانه
هنگامی که با هر دو استفاده می شود -c و -q، خروجی دو دسته بالاترین رتبه در صورت وجود آنها
امتیاز حداکثر متفاوت است آستانه / 1000، که می تواند برای تشخیص مرز استفاده شود
موارد هنگام استفاده با -q فقط و هر آستانه > 0، خروجی تفاوت امتیاز
درصد مثلا،
فایل -T1 -q foo.txt
ممکن است منجر شود
هرزنامه -15570.48640776
غیر هرزنامه -18728.00272369
تفاوت[هرزنامه، غیر هرزنامه](%) 9.21
اگر چنین است ، پس
فایل -T93 -q -c foo.txt
در نتیجه
foo.txt هرزنامه، غیر هرزنامه
در حالیکه
فایل -T92 -q -c foo.txt
در نتیجه
هرزنامه foo.txt
-r, --تنظیم مجدد داده ها
تمام اطلاعات ذخیره شده فعلی را پاک می کند
-u, --به روز رسانی=پوشه
همان "درج" به جز اینکه فقط آمار را اضافه می کند پوشه همین الان هم وجود داره
-v, -- پرحرفی=تعداد
مقدار خروجی در حین اجرا: 0=بی صدا، 1=آرام، 2=پیشرفت، 3=کلام، 4=اشکال زدایی
گزینه های لکسینگ:
-a, --آلفا لکسر
کلمات Lex به عنوان دنباله نویسه های الفبایی (پیش فرض)
-A, --alpha-only-lexer
فقط دنبالههای کاراکتر جدا شده با فاصله lex که کاملاً از آنها تشکیل شدهاند
حروف الفبا
-h, نوار-سربرگ
از تمام خطوط سرصفحه بجز موضوع:، از: و به:
-m, --بیشترین طول=ارابه
قسمتی از پیام را بعد از اول نادیده بگیرید ارابه شخصیت ها. اگر از کل پیام استفاده کنید ارابه
روی 0 تنظیم کنید. پیش فرض 50,000 است.
-p, --چاپ توکن ها
فقط نشانه گذاری و چاپ کنید، هیچ پردازش دیگری انجام ندهید. اسناد به عنوان بازگردانده می شوند
لیستی از جفت کلمات، فرکانس.
-s, --بدون توقف
هنگام لکس کردن کلمات بسیار پرتکرار (stoplist) را بیرون نریزید
-S, --ساقه دار شدن
از الگوریتم ریشه «پورتر» هنگام واژگان اسناد استفاده کنید
-w, --سفید-لکسر
کلمات Lex به عنوان دنباله ای از کاراکترهای جدا شده از فضا
اگر هیچ فایلی در خط فرمان مشخص نشده باشد، ifile از ورودی استاندارد به عنوان ورودی خود استفاده می کند
پیام برای پردازش
-?, --کمک
این لیست راهنما را بدهید
--استفاده
یک پیام استفاده کوتاه بدهید
-V, - نسخه
نسخه برنامه را چاپ کنید
آرگومان های اجباری یا اختیاری برای گزینه های طولانی نیز برای هر کدام اجباری یا اختیاری هستند
گزینه های کوتاه مربوطه
از ifile به صورت آنلاین با استفاده از خدمات onworks.net استفاده کنید