אנגליתצרפתיתספרדי

Ad


סמל OnWorks

bogofilter - מקוון בענן

הפעל bogofilter בספק אירוח בחינם של OnWorks על אובונטו מקוון, פדורה מקוון, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זהו הפקודה bogofilter שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


bogofilter - מסנן דואר זבל בייסיאני מהיר

תַקצִיר


בוגופילטר [אפשרויות עזרה | אפשרויות סיווג | אפשרויות רישום |
אפשרויות פרמטר | אפשרויות מידע] [אפשרויות כלליות] [אפשרויות קובץ תצורה]

איפה

לעזור אפשרויות הם:

[-h] [--עזרה] [-V] [-ש]

מיון אפשרויות הם:

[-p] [-e] [-t] [-T] [-u] [-H] [-M] [-b] [-B אובייקט ...] [-R] [אפשרויות כלליות]
[אפשרויות פרמטר] [אפשרויות קובץ תצורה]

הרשמה אפשרויות הם:

[-s | -n] [-S | -N] [אפשרויות כלליות]

כללי אפשרויות הם:

[-ג שם הקובץ] [-ג] [-ד dir] [-ק גודל המטמון] [-ל] [-ל תג] [-אני שם הקובץ] [-O שם הקובץ]

פרמטר אפשרויות הם:

[-ה ערך[,ערך]] [-M ערך[,ערך][,ערך]] [-O ערך[,ערך]]

מידע אפשרויות הם:

[-v] [-y נתונים] [-D] [-x דגלים]

config פילה אפשרויות הם:

[--אפשרות=ערך]

הערה: השתמש בוגופילטר - עזרה כדי להציג את רשימת האפשרויות המלאה.

תיאור


Bogofilter הוא מסנן דואר זבל בייסיאני. במצב הפעולה הרגיל שלו, זה לוקח אימייל
הודעה או טקסט אחר בקלט רגיל, עושה בדיקה סטטיסטית מול רשימות של "טוב"
ומילים "גרועות", ומחזירה קוד סטטוס המציין אם ההודעה היא דואר זבל או לא.
Bogofilter תוכנן עם אלגוריתם מהיר, משתמש ב-Berkeley DB להפעלה מהירה ו
חיפושים, מקודדים ישירות ב-C, ומכוונים למהירות, כך שניתן להשתמש בו לייצור על ידי
אתרים שמעבדים הרבה דואר.

תֵאוֹרִיָה OF פעולה


Bogofilter מתייחס לקלט שלו כשקית אסימונים. כל אסימון נבדק מול רשימת מילים,
ששומרת ספירות של מספר הפעמים שזה התרחש במיילים שאינם דואר זבל וספאם.
מספרים אלה משמשים לחישוב אומדן של ההסתברות להודעה שבה
האסימון מתרחש הוא ספאם. אלה משולבים כדי לציין אם ההודעה היא ספאם או
חזיר.

אמנם השיטה הזו נשמעת גסה בהשוואה לגישה הרגילה יותר של התאמת דפוסים, אבל היא
מתברר כיעיל ביותר. העיתון של פול גרהם A תכנית פעולה בעד ספאם[1] מומלץ
קריאה.

תוכנית זו משפרת באופן מהותי את הצעתו של פול על ידי ניתוח מילוני חכם יותר.
Bogofilter עושה פענוח MIME תקין וניתוח HTML סביר. סוגים מיוחדים של
אסימונים כמו שמות מארחים וכתובות IP נשמרים כתכונות זיהוי במקום
שבור. מתעלמים מסוגים שונים של חומרי MTA כגון תאריכים ומזהי הודעות כדי שלא
לנפח את רשימת המילים. אסימונים שנמצאו בשדות כותרות שונים מסומנים כראוי.

שיפור נוסף הוא שתוכנית זו מציעה את השינויים המוצעים של גארי רובינסון
החישובים (ראה את הפרמטרים robx ו-robs להלן). שינויים אלה הם
מתואר במאמרו של רובינסון ספאם איתור[2].

מאז, רובינסון (ראה את המאמר שלו ב-Linux Journal A סטטיסטי גישה ל מה היא ספאם
בעיה[3]) ואחרים הבינו שניתן לבצע אופטימיזציה נוספת של החישוב באמצעות
שיטת פישר. אחר השבחה[4] מפצה על יתירות סמלית באמצעות יישום
הפרד בין גורמי גודל אפקטיביים (ESF) לחישובי הסתברות ספאם ובלתי ספאם.

בקיצור, כך זה עובד: ההערכות להסתברויות הספאם של הפרט
אסימונים משולבים באמצעות "פונקציית צ'י ריבוע הפוכה". ערכו מעיד עד כמה גרוע
השערת האפס שהמסר הוא רק אוסף אקראי של מילים עצמאיות עם
ההסתברויות שניתנו על ידי ההערכות הקודמות שלנו נכשלות. פונקציה זו רגישה מאוד ל
הסתברויות קטנות (מילים חמיש), אך הסתברויות לא גבוהות (מילים ספאם); לכן
הערך מציין רק סימני חמיש חזקים בהודעה. כעת משתמשים בהיפוך
הסתברויות עבור האסימונים, אותו חישוב נעשה שוב, נותן אינדיקטור לכך
הודעה נראית דואר זבל מאוד. לבסוף, שני האינדיקטורים הללו מופחתים (ו
קנה מידה למרווח של 0-1). מחוון משולב זה (בוגוזיות) קרוב ל-0 אם הסימנים
עבור הודעת חמיש חזקות יותר מאשר עבור הודעת דואר זבל וקרובות ל-1 אם
המצב הוא הפוך. אם הסימנים עבור שניהם חזקים באותה מידה, הערך יהיה
קרוב ל-0.5. מכיוון שההודעות הללו אינן נותנות אינדיקציה ברורה שיש מצב טריסטטי
bogofilter כדי לסמן את ההודעות האלה כלא בטוחות, בעוד שההודעות הברורות מסומנות כדואר זבל
או חזיר, בהתאמה. במצב שני מצבים, כל הודעה מסומנת כספאם או כ-ham.

פרמטרים שונים משפיעים על חישובים אלו, החשובים ביותר הם:

robx: הציון שניתן לאסימון שלא ראה בעבר. robx היא ההסתברות לכך
האסימון הוא דואר זבל.

robs: משקל על robx שמזיז את ההסתברות של אסימון קטן שנראה לעבר robx.

min-dev: מרחק מינימלי מ-5 לשימוש באסימונים בחישוב. רק אסימונים
נעשה שימוש רחוק יותר מ-0.5 מהערך הזה.

חיתוך דואר זבל: הודעות עם ציונים גבוהים או שווה ל-יסומנו כדואר זבל.

ham-cutoff: אם אפס או ספאם-cutoff, כל ההודעות עם ערכים מתחת ל-spam cutoff
מסומנים כ-ham, כל השאר כדואר זבל (שני מדינות). ערכים אחרים קטנים או שווים ל
ham-cutoff מסומנים כמו ham, הודעות עם ערכים אך ורק בין ham-cutoff ו
חיתוך ספאם מסומן כלא בטוח; השאר כדואר זבל (טריסטייט)

sp-esf: מקדם הגודל האפקטיבי (ESF) עבור דואר זבל.

ns-esf: ה-ESF לאי ספאם. ברירת המחדל של ערכי ה-ESF האלה הוא 1.0, וזהו לא
באמצעות ESF בחישוב. יכולים להיות ערכים המתאימים לאוכלוסיית האימייל של המשתמש
נקבע בעזרת תוכנית בוגוטון.

אפשרויות


אפשרויות עזרה

השמיים -h אפשרות מדפיסה את הודעת העזרה ויוצאת.

השמיים -V אפשרות מדפיסה את מספר הגרסה ויוצאת.

השמיים -Q אפשרות (שאילתה) מדפיסה את התצורה של bogofilter, כלומר פרמטרי רישום,
אפשרויות ניתוח, ספריית bogofilter וכו'.

אפשרויות סיווג

השמיים -p אפשרות (מעבר) מוציאה את ההודעה עם קו X-Bogosity בסוף ה-
כותרת ההודעה. זה מחייב לשמור את כל ההודעה בזיכרון כאשר היא נקראת
stdin (או מצינור או שקע). אם ההודעה נקראת מקובץ שניתן להחזרה,
bogofilter יקרא אותו פעם שנייה.

השמיים -e אפשרות (הטבעה) אומרת ל-bogofilter לצאת עם קוד 0 אם ההודעה יכולה להיות
מסווג, כלומר אם אין שגיאה. בדרך כלל bogofilter משתמש בקודים שונים עבור
ספאם, חזיר וסיווגים לא בטוחים, אבל זה מפשט את השימוש ב-bogofilter עם procmail
או דואר דרופ.

השמיים -t אפשרות (term) אומרת ל-bogofilter להדפיס הודעת דואר זבל מקוצרת
מכיל אות אחת והניקוד. דואר זבל מסומן ב-"Y", ham ב-"N", ולא בטוח ב-
"יו". הערה: ניתן להתאים את העיצוב באמצעות קובץ התצורה.

השמיים -T מספק מצב תמצית בלתי משתנה לשימוש בסקריפטים. bogofilter ידפיס an
הודעת ספאמיות מקוצרת המכילה אות אחת והניקוד. דואר זבל מסומן עם
"S", שינקן ב-"H", ולא בטוח ב-"U".

השמיים -TT מספק מצב תמצית בלתי משתנה לשימוש בסקריפטים. Bogofilter מדפיס רק את
ציון ומציג אותו ל-16 ספרות משמעותיות.

השמיים -u option אומר ל-bogofilter לרשום את הטקסט של ההודעה לאחר סיווגה כדואר זבל
או לא ספאם. הודעת ספאם תירשם ברשימת הספאם והודעה שאינה ספאם תירשם
הרשימה הטובה. אם הסיווג "לא בטוח", ההודעה לא תירשם.
ביעילות אפשרות זו מפעילה bogofilter עם -s or -n דגל, לפי הצורך. זהירות היא
דחוף בשימוש ביכולת זו, שכן כל שגיאות סיווג שעלול לעשות בוגופילטר יהיו
יישמר ויצטבר עד לתיקון ידני עם -Sn ו -Ns אוֹפְּצִיָה
שילובים. שים לב אפשרות זו גורמת לפתיחת מסד הנתונים עבור גישת כתיבה, אשר
יכול לגרור האטות מסיביות באמצעות מחלוקת נעילה ופעולות קלט/פלט סינכרוניות.

השמיים -H option אומר ל-bogofilter לא לתייג אסימונים מהכותרת. אפשרות זו מיועדת ל
בדיקה, אתה לא צריך להשתמש בו בפעולה רגילה.

השמיים -M option אומר ל-bogofilter לעבד את הקלט שלו כקובץ בפורמט mbox. אם ה -v or
-t ניתנת גם אפשרות, תודפס שורת ספאם עבור כל הודעה.

השמיים -b אפשרות (מצב זרימה בתפזורת) אומרת ל-bogofilter לסווג מספר אובייקטים שלהם
קוראים את השמות מתוך stdin. אם ה -v or -t ניתנת גם אפשרות, bogofilter ידפיס א
שורה המציגה את שם הקובץ ומידע סיווג עבור כל קובץ. זוהי אלטרנטיבה
ל -B שמפרטת אובייקטים בשורת הפקודה.

אובייקט בהקשר זה יהיה maildir (זיהוי אוטומטי), או אם הוא לא maildir, א
דואר בודד אלא אם כן -M נתון - במקרה זה הוא מעובד כ-mbox. (אורך התוכן:
הכותרת אינה נלקחת בחשבון כרגע.)

בעת קריאת פורמט mbox, bogofilter מסתמך על השורה הריקה לאחר דואר. במידת צורך,
formail יבטיח שזה המצב.

השמיים -B אובייקט ... אפשרות (מצב בכמות גדולה) אומרת ל-bogofilter לסווג מספר אובייקטים בשמות
בשורת הפקודה. האובייקטים עשויים להיות שמות קבצים (עבור הודעות בודדות), תיבות דואר (קבצים
עם מספר הודעות), או ספריות (בפורמט maildir ו-MH). אם ה -v or -t אוֹפְּצִיָה
נתון גם, bogofilter ידפיס שורה עם שם קובץ וסיווג
מידע עבור כל קובץ. זוהי אלטרנטיבה ל -b שמפרטת אובייקטים ב-stdin.

השמיים -R option אומר ל-bogofilter להוציא מסגרת נתונים R בצורת טקסט בתקן
תְפוּקָה. עיין בסעיף על אינטגרציה עם R, להלן, לפרטים נוספים.

אפשרויות הרשמה

השמיים -s option אומר ל-bogofilter לרשום את הטקסט המוצג כדואר זבל. מסד הנתונים הוא
נוצר אם נעדר.

השמיים -n option אומר ל-bogofilter לרשום את הטקסט המוצג כלא דואר זבל.

Bogofilter לא מזהה אם הודעה נרשמה פעמיים. אם אתה עושה זאת בטעות, ה
ספירת האסימונים תפחת ב-1 ממה שאתה באמת רוצה ומציוני הספאם המתאימים
יהיה מעט כבוי. בהינתן מספר רב של אסימונים והודעות ברשימת המילים, זה
לא משנה. הבעיה יכול לתקן באמצעות ה -S אופציה או -N אוֹפְּצִיָה.

השמיים -S option אומר ל-bogofilter לבטל רישום מוקדם של אותה הודעה כמו דואר זבל.
אם הודעה הוזנה בצורה שגויה כדואר זבל על ידי -s or -u ואתה רוצה להסיר אותו ו
הזן את זה בתור לא דואר זבל, השתמש -Sn. אם -S משמש להודעה שלא נרשמה כספאם,
הספירות עדיין יופחתו.

השמיים -N option אומר ל-bogofilter לבטל רישום קודם של אותה הודעה כמו
ללא דואר זבל. אם הודעה הוזנה בצורה שגויה כלא דואר זבל על ידי -n or -u ואתה רוצה
הסר אותו והזן אותו כדואר זבל, ולאחר מכן השתמש -Ns. אם -N משמש להודעה שלא הייתה
נרשם כלא דואר זבל, הספירה עדיין תפחת.

אפשרויות כלליות

השמיים -c שם הקובץ option אומר ל-bogofilter לקרוא את קובץ התצורה בשם.

השמיים -C אפשרות מונעת מ-bogofilter לקרוא קובצי תצורה.

השמיים -d dir האפשרות מאפשרת לך להגדיר את הספרייה עבור מסד הנתונים. ראה את הסביבה
סעיף לאפשרויות הגדרות אחרות של ספרייה.

השמיים -k גודל המטמון אפשרות מגדירה את גודל המטמון עבור תת-המערכת של BerkeleyDB, ביחידות של 1
MiB (1,048,576 בתים). גודל נכון של המטמון משפר את הביצועים של bogofilter. ה
הגודל המומלץ הוא שליש מגודל קובץ מסד הנתונים. אתה יכול להפעיל את הבוגוטון
סקריפט (בספריית הכוונון) כדי לקבוע את הגודל המומלץ.

השמיים -l option כותב שורת מידע ליומן המערכת בכל פעם ש-bogofilter מופעל.
המידע שנרשם תלוי באופן שבו מתנהל bogofilter.

השמיים -L תג אפשרות מגדירה תג שניתן לכלול במידע שנרשם
על ידי -l אפשרות, אבל זה דורש פורמט מותאם אישית הכולל את המחרוזת %l לעת עתה.
מרמז על אפשרות זו -l.

השמיים -I שם הקובץ option אומר ל-bogofilter לקרוא את הקלט שלו מהקובץ שצוין, במקום זאת
מאשר מ סטדין.

השמיים -O שם הקובץ option אומר ל-bogofilter היכן לכתוב את הפלט שלו במצב מעבר.
שימו לב שזה עובד רק כאשר -p ניתן במפורש.

אפשרויות פרמטר

השמיים -E ערך[,ערך] האפשרות מאפשרת להגדיר את ערך sp-esf ואת ערך ns-esf. עם שתיים
ערכים, הן sp-esf והן ns-esf מוגדרים. אם ניתן רק ערך אחד, הפרמטרים מוגדרים כ
המתואר בהערה למטה.

השמיים -m ערך[,ערך][,ערך] האפשרות מאפשרת להגדיר את ערך ה-min-dev, ולחלופין, את
שוד וערכי robx. עם שלושה ערכים, min-dev, robs ו-robx מוגדרים כולם. אם פחות
הערכים ניתנים, הפרמטרים מוגדרים כמתואר בהערה למטה.

השמיים -o ערך[,ערך] האפשרות מאפשרת להגדיר את ערכי ה-spam-cutoff ham-cutoff. עם שתיים
ערכים, הן חיתוך דואר זבל והן חיתוך ham מוגדרים. אם ניתן רק ערך אחד, פרמטרים
מוגדרים כמתואר בהערה להלן.

הערה: כל האפשרויות הללו מאפשרות לספק פחות ערכים. ניתן לדלג על ערכים
רק באמצעות המפריד בפסיק, ובמקרה זה הפרמטרים המתאימים לא יהיו
השתנה. אם רק הערך הראשון מסופק, אז רק הפרמטר הראשון מוגדר.
ניתן לדלג על ערכים נגררים, ובמקרה זה לא יהיו הפרמטרים המתאימים
השתנה. בתוך רשימת הפרמטרים, רווחים אינם מותרים אחרי פסיקים.

אפשרויות מידע

השמיים -v option מייצרת דוח לפלט סטנדרטי על ניתוח הקלט של bogofilter.
כל אחד נוסף v יגדיל את מילוליות הפלט, עד למקסימום של 4. עם
-vv, הדוח מפרט את האסימונים עם הסטייה הגבוהה ביותר מממוצע של 0.5 שיוך
עם ספאם.

אפשרות -y נתונים ניתן להשתמש כדי לעקוף את התאריך הנוכחי בעת חותמת זמן. ערך
של אפס (0) מכבה את חותמת הזמן.

השמיים -D option מפנה מחדש את פלט ניפוי באגים ל-stdout.

השמיים -x דגלים האפשרות מאפשרת הגדרה של דגלי ניפוי באגים להדפסת מידע באגים. לִרְאוֹת
קובץ header debug.h עבור רשימת הדגלים הניתנים לשימוש.

הגדרות קובץ אפשרויות

שימוש ב-GNU longopt -- תחביר, של קובץ תצורה שם = ערך המשפט הופך לשורת פקודה
--אפשרות=ערך. השתמש בפקודה בוגופילטר - עזרה לרשימת אפשרויות וראה
bogofilter.cf.example למידע נוסף עליהם. למשל כדי לשנות את הכותרת X-Bogosity
ל-"X-Spam-Header", השתמש ב:

--spam-header-name=X-Spam-Header

הסביבה


Bogofilter משתמש בספריית מסד נתונים, אותה ניתן להגדיר בקובץ התצורה. אם לא מוגדר
שם, bogofilter ישתמש בערך של BOGOFILTER_DIR. ניתן לעקוף את שניהם על ידי ה -d
dir אוֹפְּצִיָה. אם שום דבר מזה לא זמין, bogofilter ישתמש בספרייה $HOME/.bogofilter.

תְצוּרָה


שורת הפקודה bogofilter מאפשרת הגדרה של אפשרויות רבות שקובעות כיצד bogofilter
פועל. ניתן להשתמש בקובץ /etc/bogofilter.cf כדי להגדיר פרמטרים נוספים המשפיעים עליו
פעולה. לקובץ /etc/bogofilter.cf.example יש דוגמאות של כל הפרמטרים. סטָטוּס
וניתן להתאים הודעות רישום עבור כל אתר.

לַחֲזוֹר ערכים


0 עבור דואר זבל; 1 ללא דואר זבל; 2 לא בטוחים; 3 עבור I/O או שגיאות אחרות.

אם שניהם -p ו -e בשימוש, ערכי ההחזרה הם: 0 עבור דואר זבל או שאינו דואר זבל; 3 עבור I/O או
שגיאות אחרות.

שגיאה 3 אומרת בדרך כלל שקובץ רשימת המילים בוגופילטר רוצה לקרוא בעת ההפעלה הוא
חסר או שהדיסק הקשיח התמלא -p מצב.

שילוב עִם אחר כלי עבודה


השתמש עם procmail

המתכון הבא (א) מאחסן ספאם כל מה שבוגופילטר מדרג כדואר זבל, (ב) רושם
המילים בהודעות שדורגו כדואר זבל ככאלה, ו-(ג) רושם את המילים בהודעות שדורגו
ככזה שאינו דואר זבל. עם זה במקום, זה בדרך כלל יהיה הכרחי רק עבור המשתמש
להתערב (עם -Ns or -Sn) כאשר bogofilter מחלק משהו לא נכון.

# סינון דואר באמצעות bogofilter, תיוג אותו כ- Ham, Spam, או לא בטוח,
# ועדכון רשימת המילים

:0fw
| bogofilter -u -e -p

# אם bogofilter נכשל, החזר את הדואר לתור;
# ה-MTA ינסה שוב לספק אותו מאוחר יותר
# 75 הוא הערך עבור EX_TEMPFAIL ב-/usr/include/sysexits.h

:0ה
{ EXITCODE=75 מארח }

# שלח את הדואר ל-spam-bogofilter אם זה דואר זבל.

: 0:
* ^X-Bogosity: ספאם, tests=bogofilter
ספאם-bogofilter

# שלח את הדואר ל-unsure-bogofilter
# אם זה לא שינקן ולא ספאם.

: 0:
* ^X-Bogosity: לא בטוח, tests=bogofilter
לא בטוח-בוגופילטר

# עם המתכון הזה, אתה יכול לאמן bogofilter החל מריק
# רשימת מילים. הקפד לבדוק את התיקייה הלא בטוחה שלך באופן קבוע, קח את
# הודעות מתוכו, סווגו אותן כ-ham (או ספאם), והשתמשו בהן כדי
# בוגופילטר רכבת.

כלל ה-procmail הבא ייקח דואר ב-stdin וישמור אותו לקובץ דואר זבל אם bogofilter
חושב שזה ספאם:

:0HB:
* ? בוגופילטר
דואר זבל

וכלל דומה זה ירשום גם את האסימונים בדואר לפי ה
סיווג בוגופילטר:

:0HB:
* ? bogofilter -u
דואר זבל

אם bogofilter נכשל (מחזיר 3) ההודעה תטופל כלא דואר זבל.

זה מיועד ל-maildrop, הוא דוחה אוטומטית את הדואר ומנסה שוב מאוחר יותר כאשר
פקודת xfilter נכשלת, השתמש בזה בקובץ שלך ~/.mailfilter:

xfilter "bogofilter -u -e -p"
if (/^X-Bogosity: ספאם, tests=bogofilter/)
{
ל-"ספאם-bogofilter"
}

שורות .muttrc הבאות ייצרו פקודות מאקרו mutt לשליחת דואר ל-bogofilter.

מאקרו index d " unset wait_key\n\
בוגופילטר -n\n\
הגדר wait_key\n\
" "מחק הודעה כלא ספאם"
אינדקס מאקרו \ed " unset wait_key\n\
bogofilter -s\n\
הגדר wait_key\n\
" "מחק הודעה כדואר זבל"

אינטגרציה עם סוכן תעבורת דואר (MTA)

1. ניתן לשלב bogofilter גם ב-MTA כדי לסנן את כל הדואר הנכנס. בזמן ש
יישום ספציפי תלוי ב-MTA, השלבים הכלליים הם כדלקמן:

2. התקן bogofilter על שרת הדואר

3. התחל את מסדי הנתונים של bogofilter עם קורפוס דואר זבל ולא דואר זבל. מאז bogofilter יהיה
לשרת קהילה גדולה יותר, חשוב לקדם אותה עם מערך מייצג
של הודעות.

4. הגדר את ה-MTA כדי להפעיל bogofilter בכל הודעה. אמנם זה MTA ספציפי
שלב, כנראה שתצטרך להשתמש ב- -p, -u, ו -e אפשרויות.

5. הגדר מנגנון למשתמשים לרשום הודעות דואר זבל/לא דואר זבל, וכן לתקן
סיווגים שגויים. הפתרון הגנרי ביותר הוא להגדיר כתובות דוא"ל כינוי ל
אילו משתמשים מקפיצים הודעות.

6. עיין בספריות המסמכים והתרומות למידע נוסף.

שימוש ב-R לאימות חישובי בוגופילטר

האפשרות -R אומרת ל-bogofilter ליצור מסגרת נתונים R. מסגרת הנתונים מכילה אחת
שורה לכל אסימון מנותח. כל שורה כזו מכילה את האסימון, סכום מסד הנתונים שלה "טוב"
וספירת "ספאם", ספירת ה"טוב" חלקי מספר ההודעות שאינן דואר זבל המשמשות
צור את מסד הנתונים של ההדרכה, ספירת ה"ספאם" חלקי ספירת הודעות הספאם,
ה-f(w) של רובינסון עבור האסימון, הלוגים הטבעיים של (1 - f(w)) ו-f(w), ואינדיקטור
תו (+ אם ערך f(w) של האסימון עלה על הסטייה המינימלית מ-0.5, - אם הוא
לא). יש שורה נוספת אחת בסוף הטבלה המכילה תווית ב-
שדה אסימון, ואחריו מספר המילים בשימוש בפועל (אלה עם + מחוונים),
ערכי P, Q, S, s ו-x של רובינסון והסטייה המינימלית.

ניתן לשמור את מסגרת הנתונים R בקובץ ולאחר מכן לקרוא אותה לתוך הפעלה R (ראה מה היא R
פּרוֹיֶקט אתר אינטרנט[5] למידע על חבילת המתמטיקה R). מסופק עם
הפצת bogofilter היא סקריפט R פשוט (קובץ bogo.R) שניתן להשתמש בו כדי לאמת
החישובים של bogofilter. הוראות לשימוש בו כלולות בתסריט בטופס
של הערות.

LOG הודעות


Bogofilter כותב הודעות ליומן המערכת כאשר -l נעשה שימוש באופציה. מה כתוב
תלוי באילו דגלים אחרים משתמשים.

תיצור ריצת סיווג (אנחנו לא מציגים את התאריך והחלק של המארח כאן):

bogofilter[1412]: X-Bogosity: Ham, spamicity=0.000227
bogofilter[1415]: X-Bogosity: דואר זבל, spamicity=0.998918

שימוש -u כדי לסווג הודעה ולעדכן רשימת מילים תפיק (אחת בשורה בודדת):

bogofilter[1426]: X-Bogosity: ספאם, spamicity=0.998918,
הרשמה -s, 329 מילים, 1 הודעות

רישום מילים (-l ו -s, -n, -S, או -N) יפיקו:

bogofilter[1440]: register-n, 255 מילים, 1 הודעות

הפעלת רישום (באמצעות -s, -n, -N, או -S) יפיק הודעות כמו:

bogofilter[17330]: register-n, 574 מילים, 3 הודעות
bogofilter[6244]: register-s, 1273 מילים, 4 הודעות

השתמש ב-bogofilter באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

  • 1
    ניקוי עמוק
    ניקוי עמוק
    תסריט קוטלין שכולו בנוי גרעינים
    מטמונים מפרויקטים של Gradle/Android.
    שימושי כאשר Gradle או ה-IDE מאפשרים לך
    מטה. התסריט נבדק על
    macOS, אבל...
    הורד ניקוי עמוק
  • 2
    Eclipse Checkstyle Plug-in
    Eclipse Checkstyle Plug-in
    הפלאגין Eclipse Checkstyle
    משלב את קוד ה-Java Checkstyle
    אודיטור לתוך Eclipse IDE. ה
    תוסף מספק משוב בזמן אמת ל
    המשתמש על הפרה...
    הורד את הפלאגין Eclipse Checkstyle
  • 3
    AstrOrzPlayer
    AstrOrzPlayer
    AstrOrz Player הוא נגן מדיה חינמי
    תוכנה, חלקה מבוססת על WMP ו-VLC. ה
    שחקן הוא בסגנון מינימליסטי, עם
    יותר מעשרה צבעי נושא, ויכולים גם
    ב ...
    הורד את AstrOrzPlayer
  • 4
    movistartv
    movistartv
    Kodi Movistar+ TV es un ADDON עבור XBMC/
    Kodi que permite disponer de un
    decodificador de los servicios IPTV de
    Movistar integrado en uno de los
    mediacenters מא...
    הורד את movistartv
  • 5
    קוד :: חסימות
    קוד :: חסימות
    Code::Blocks הוא קוד פתוח בחינם,
    חוצה פלטפורמות C, C++ ו-Fortran IDE
    נבנה כדי לענות על הצרכים התובעניים ביותר
    של המשתמשים שלה. זה נועד להיות מאוד
    מרחיב ...
    קוד הורדה::בלוקים
  • 6
    בין
    בין
    בין ממשק Minecraft או מתקדם
    ומעקב אחר נתונים/מבנה הוא כלי ל
    להציג סקירה כללית של מיינקראפט
    העולם, מבלי ליצור אותו בפועל. זה
    פחית ...
    הורד בין
  • עוד »

פקודות לינוקס

Ad