นี่คือคำสั่ง mailfoot ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
mailfoot - โปรแกรมจำลองการฝึกอบรมสั่งออนไลน์เต็มรูปแบบสำหรับใช้กับ dbacl
เรื่องย่อ
เมลฟุต คำสั่ง [ command_arguments ]
DESCRIPTION
เมลฟุต ทำงานอัตโนมัติของการทดสอบการกรองอีเมลและโปรแกรมการจัดหมวดหมู่เช่น
ดีแบค(1). จากชุดของเอกสารที่จัดหมวดหมู่ Mailfoot จะเริ่มการทดสอบเพื่อประเมิน
ข้อผิดพลาดในการจำแนกประเภทและดังนั้นจึงอนุญาตให้ปรับพารามิเตอร์ของ
ลักษณนาม
การฝึกอบรมการสั่งซื้อออนไลน์แบบเต็มเป็นวิธีการเรียนรู้สำหรับตัวแยกประเภทอีเมลที่แต่ละคน
อีเมลขาเข้าจะเรียนรู้ทันทีที่มาถึง จึงเก็บหมวดหมู่ไว้เสมอ
คำอธิบายถึงวันที่สำหรับการจำแนกประเภทต่อไป นี้โดยตรงจำลองวิธีการที่
ตัวแยกประเภทอีเมลบางตัวถูกนำมาใช้ในทางปฏิบัติ
อัตราความผิดพลาดของ FOOT ขึ้นอยู่กับลำดับการดูอีเมลโดยตรง การเปลี่ยนแปลงเล็กน้อย
ในการสั่งซื้อตามที่อาจเกิดขึ้นเนื่องจากความล่าช้าของเครือข่ายอาจมีผลกระทบต่อจำนวน
การจัดประเภทผิด เพราะเหตุนี้, เมลฟุต ไม่ได้ให้ผลลัพธ์ที่มีความหมาย เว้นแต่
อีเมลตัวอย่างจะถูกเลือกอย่างระมัดระวัง อย่างไรก็ตาม เนื่องจากวิธีนี้มักใช้โดยสแปม
ตัวกรองก็ยังคุ้มค่าที่จะใช้คอมพิวเตอร์เพื่อเปรียบเทียบ วิธีอื่นๆ (ดู
จดหมายข้าม(1)จดหมาย(1)) พยายามจับพฤติกรรมของข้อผิดพลาดในการจำแนกประเภทใน
ทางอื่น.
เพื่อปรับปรุงและทำให้การคำนวณอัตราข้อผิดพลาดมีเสถียรภาพ เมลฟุต ดำเนินการ FOOT
จำลองหลายครั้งในสตรีมอีเมลที่เรียงลำดับใหม่เล็กน้อย และหาค่าเฉลี่ยผลลัพธ์
การจัดลำดับใหม่เกิดขึ้นจากการมัลติเพล็กซ์อีเมลจากกล่องจดหมายแต่ละหมวดหมู่แบบสุ่ม
คำสั่ง. ดังนั้นหากมีสามประเภท อีเมลแรกจะถูกเลือกแบบสุ่ม
จากด้านหน้าของสตรีมอีเมลตัวอย่างแต่ละประเภท อีเมลที่สองก็ถูกเลือกเช่นกัน
สุ่มสามประเภทจากด้านหน้าของ
สตรีมหลังจากลบอีเมลฉบับแรก การจำลองจะหยุดเมื่อสตรีมตัวอย่างทั้งหมดอยู่
เหนื่อย.
เมลฟุต ใช้ตัวแปรสภาพแวดล้อม MAILFOOT_FILTER เมื่อดำเนินการ ซึ่งอนุญาตให้
การจำลองตัวกรองโดยพลการ โดยให้สิ่งเหล่านี้เป็นไปตามเงื่อนไขความเข้ากันได้
ระบุไว้ในส่วนสิ่งแวดล้อมด้านล่าง
เพื่อความสะดวก, เมลฟุต ดำเนินการ ห้องทดลอง เฟรมเวิร์กพร้อม wrappers ที่กำหนดไว้ล่วงหน้าสำหรับ
ตัวแยกประเภทโอเพ่นซอร์สหลายตัว อนุญาตให้เปรียบเทียบโดยตรงของ ดีแบค(1) ด้วย
ตัวแยกประเภทที่แข่งขันกันในกลุ่มตัวอย่างอีเมลชุดเดียวกัน ดูส่วนการใช้งานด้านล่าง
ในระหว่างการเตรียมการ เมลฟุต สร้างไดเร็กทอรีย่อยชื่อ mailfoot.d ในการทำงานปัจจุบัน
ไดเร็กทอรี การคำนวณที่จำเป็นทั้งหมดจะดำเนินการภายในไดเรกทอรีย่อยนี้
EXIT สถานภาพ
เมลฟุต คืนค่า 0 เมื่อสำเร็จ 1 หากเกิดปัญหาขึ้น
คำสั่ง
เตรียมการ ขนาด
เตรียมไดเร็กทอรีย่อยชื่อ mailfoot.d ในไดเร็กทอรีการทำงานปัจจุบัน และ
เติมด้วยไดเร็กทอรีย่อยที่ว่างเปล่าอย่างแน่นอน ขนาด ชุดย่อย
เพิ่ม หมวดหมู่ [ ไฟล์ ] ...
รับชุดอีเมลจาก FILE หากระบุไว้ หรือ STDIN และเชื่อมโยงเข้าด้วยกัน
กับ หมวดหมู่. ลำดับของอีเมลภายใน ไฟล์ ถูกสงวนไว้และต่อมา
ไฟล์ถูกผนวกเข้ากับรายการแรกในแต่ละหมวดหมู่ คำสั่งนี้สามารถทำซ้ำได้
หลายครั้ง แต่ควรดำเนินการอย่างน้อยหนึ่งครั้ง
ปลาเดยส์ ลบไดเร็กทอรี mailfoot.d และเนื้อหาทั้งหมด
วิ่ง มัลติเพล็กซ์แบบสุ่มจากสตรีมอีเมลที่เพิ่มไว้ก่อนหน้านี้ และเรียนรู้หมวดหมู่ใหม่
เฉพาะเมื่อมีการจำแนกผิดประเภทเท่านั้น การจำลองซ้ำ ขนาด ครั้ง
สรุป
พิมพ์อัตราความผิดพลาดโดยเฉลี่ยสำหรับการจำลอง
พล็อต [ ps | ล็อกสเกล ] ...
วางแผนจำนวนข้อผิดพลาดในช่วงเวลาการจำลอง ตัวเลือก "ps" หากมี
เขียนพล็อตไปยังไฟล์ postscript ในไดเร็กทอรี mailfoot/plots แทน
กำลังแสดงบนหน้าจอ ตัวเลือก "logscale" หากมี จะทำให้พล็อตเปิดอยู่
มาตราส่วนบันทึกสำหรับทั้งสองพิกัด
ทบทวน ทรูแคท นักล่า
สแกนสถิติการทำงานล่าสุดและแยกข้อความทั้งหมดที่เป็นของ
หมวดหมู่ ทรูแคท แต่ได้จัดอยู่ในประเภท นักล่า. สารสกัด
ข้อความจะถูกคัดลอกไปยังไดเร็กทอรี mailfoot.d/ทบทวน สำหรับการตรวจ
ห้องทดลอง รายการ
แสดงรายการตัวกรอง/สคริปต์ตัวตัดที่สามารถเลือกได้
ห้องทดลอง เลือก [ FILTER ] ...
เตรียมตัวกรองชื่อ FILTER เพื่อใช้จำลอง ชื่อตัวกรองคือ
ชื่อของสคริปต์ตัวตัดทอนที่อยู่ในไดเร็กทอรี /usr/share/dbacl/testsuite.
ตัวกรองแต่ละตัวมีส่วนต่อประสานที่เข้มงวดซึ่งระบุไว้ด้านล่างและการเลือกตัวกรอง
คัดลอกไปที่ mailfoot.d/ตัวกรอง ไดเร็กทอรี ใช้เฉพาะตัวกรองที่มีอยู่เท่านั้น
ในการจำลอง
ห้องทดลอง ยกเลิกการเลือก [ FILTER ] ...
ลบตัวกรองที่มีชื่อออกจากไดเร็กทอรี mailfoot.d/ตัวกรอง เพื่อให้พวกเขาเป็น
ไม่ได้ใช้ในการจำลอง
ห้องทดลอง วิ่ง [ แปลง ]
เรียกใช้ทุกตัวกรองที่เลือกในชุดข้อมูลที่เพิ่มไว้ก่อนหน้านี้ และคำนวณ
อัตราการจำแนกประเภท หากมีตัวเลือก "แปลง" ตัวกรองแต่ละตัวจำลอง
ถูกพล็อตเป็นไฟล์ postscript ในไดเร็กทอรี mailfoot.d/plots.
ห้องทดลอง สถานะ
อธิบายการจำลองตามกำหนดการ
ห้องทดลอง สรุป
แสดงผลการตรวจสอบข้ามสำหรับตัวกรองทั้งหมด มีเหตุผลหลังจาก .เท่านั้น วิ่ง
คำสั่ง
การใช้
รูปแบบการใช้งานปกติมีดังนี้: ก่อนอื่น คุณควรแยกอีเมลของคุณ
รวบรวมเป็นหลายประเภท (ด้วยตนเองหรืออย่างอื่น) แต่ละหมวดควรเป็น
เชื่อมโยงกับหนึ่งโฟลเดอร์ขึ้นไป แต่แต่ละโฟลเดอร์ไม่ควรมีมากกว่าหนึ่ง
หมวดหมู่. ต่อไป คุณควรตัดสินใจว่าจะใช้กี่รัน เช่น 10 ยิ่งคุณใช้รันมากเท่าไร
อัตราข้อผิดพลาดที่คาดการณ์ไว้ดีขึ้น อย่างไรก็ตาม การวิ่งมากขึ้นต้องใช้เวลามากขึ้น ตอนนี้คุณสามารถพิมพ์
% mailfoot เตรียม 10
ถัดไป สำหรับทุกหมวดหมู่ คุณต้องเพิ่มทุกโฟลเดอร์ที่เกี่ยวข้องกับหมวดหมู่นี้ สมมติ
คุณมีสามประเภทชื่อ สแปม, งานและ เล่นซึ่งเกี่ยวข้องกับ mbox
ไฟล์ สแปม.mbox, งาน.mboxและ เล่น.mbox ตามลำดับ คุณจะพิมพ์
% mailfoot เพิ่มสแปม spam.mbox
% mailfoot เพิ่มงาน work.mbox
% mailfoot เพิ่ม play play.mbox
คุณควรตั้งเป้าไปที่จำนวนอีเมลที่ใกล้เคียงกันในแต่ละหมวดหมู่ เช่น มัลติเพล็กซ์แบบสุ่ม
จะไม่สมดุลเป็นอย่างอื่น การเรียงลำดับข้อความอีเมลในแต่ละฉบับ *.เอ็มบ็อกซ์ ไฟล์คือ
สำคัญและถูกเก็บรักษาไว้ในระหว่างการจำลองแต่ละครั้ง หากซ้ำเติมกันเหมือนเดิม
หมวดหมู่กล่องจดหมายในภายหลังจะถูกผนวกเข้ากับรายการแรกโดยปริยาย
การสั่งซื้อ
ตอนนี้คุณสามารถทำการจำลอง FOOT ได้มากเท่าที่ต้องการ อีเมลแบบมัลติเพล็กซ์คือ
จำแนกและเรียนรู้ทีละครั้งโดยดำเนินการคำสั่งที่กำหนดในสิ่งแวดล้อม
ตัวแปร MAILFOOT_FILTER หากไม่ได้ตั้งค่าไว้ ระบบจะใช้ค่าเริ่มต้น
% การวิ่งของ mailfoot
สรุป % mailfoot
คำสั่ง testsuite ได้รับการออกแบบมาเพื่อลดความซับซ้อนของขั้นตอนข้างต้นและช่วยให้เปรียบเทียบ a
ตัวแยกประเภทอีเมลที่หลากหลาย ซึ่งรวมถึงแต่ไม่จำกัดเพียง ดีแบค. ลักษณนามคือ
รองรับผ่านสคริปต์ตัวตัดซึ่งอยู่ใน /usr/share/dbacl/testsuite
ไดเรกทอรี
ขั้นตอนแรกเมื่อใช้ชุดทดสอบคือการตัดสินใจว่าจะเปรียบเทียบตัวแยกประเภทใด คุณ
สามารถดูรายการ Wrapper ที่ใช้งานได้โดยพิมพ์:
% รายการชุดทดสอบ mailfoot
โปรดทราบว่าสคริปต์แรปเปอร์ไม่ใช่ตัวแยกประเภทอีเมลจริง ซึ่งต้องเป็น
ติดตั้งแยกต่างหากโดยผู้ดูแลระบบของคุณหรืออย่างอื่น เมื่อเสร็จแล้วคุณ
สามารถเลือก wrappers หนึ่งตัวหรือมากกว่าสำหรับการจำลองโดยการพิมพ์ ตัวอย่างเช่น:
% mailfoot testsuite เลือก dbaclA ifile
หากไม่พบตัวแยกประเภทที่เลือกบางตัวในระบบ ตัวแยกประเภทจะไม่ถูกเลือก
โปรดทราบด้วยว่า wrappers บางตัวสามารถมีชื่อหมวดหมู่ที่ฮาร์ดโค้ดได้ เช่น if the classifier
รองรับการจำแนกประเภทไบนารีเท่านั้น ฟังข้อความเตือน
มันยังคงอยู่เพียงเพื่อเรียกใช้การจำลอง ระวัง อาจใช้เวลานาน (หลายชั่วโมง
ขึ้นอยู่กับลักษณนาม)
% การรันชุดทดสอบ mailfoot
% สรุปชุดทดสอบ mailfoot
เมื่อเสร็จแล้ว คุณสามารถลบไฟล์การทำงาน ไฟล์บันทึก ฯลฯ โดยพิมพ์
% ทำความสะอาดเท้าเมล
สคริปต์ INTERFACE
เมลฟุต ห้องทดลอง ดูแลการเรียนรู้และจัดประเภท corpora อีเมลที่คุณเตรียมไว้สำหรับ
แต่ละลักษณนามที่เลือก เนื่องจากตัวแยกประเภทมีส่วนต่อประสานที่แตกต่างกันอย่างมาก นี่จึงเป็นเพียง
ทำได้โดยการห่อส่วนต่อประสานเหล่านั้นแต่ละส่วนให้อยู่ในรูปแบบมาตรฐานที่สามารถใช้ได้
by เมลฟุต ห้องทดลอง.
สคริปต์ตัวตัดแต่ละตัวเป็นเครื่องมือบรรทัดคำสั่งที่ยอมรับคำสั่งเดียวตามด้วยศูนย์
หรืออาร์กิวเมนต์ที่เป็นทางเลือกเพิ่มเติม ในรูปแบบมาตรฐาน:
คำสั่ง wrapper [อาร์กิวเมนต์]...
สคริปต์ตัวตัดทอนแต่ละตัวยังใช้ประโยชน์จาก STDIN และ STDOUT ด้วยวิธีที่กำหนดไว้อย่างดี ถ้าไม่
มีการอธิบายลักษณะการทำงานแล้ว ไม่ควรใช้เอาต์พุตหรืออินพุต คำสั่งที่เป็นไปได้คือ
อธิบายไว้ด้านล่าง:
ตัวกรอง ในกรณีนี้ คาดว่าจะมีอีเมลฉบับเดียวใน STDIN และรายการชื่อไฟล์หมวดหมู่
คาดว่าจะเป็น $2, $3 เป็นต้น สคริปต์จะเขียนชื่อหมวดหมู่ที่สอดคล้องกับ
อีเมลอินพุตบน STDOUT ไม่จำเป็นต้องขึ้นบรรทัดใหม่ต่อท้ายหรือคาดหวัง
ในกรณีนี้ คาดว่า mbox สตรีมมาตรฐานบน STDIN ในขณะที่เหมาะสม
ชื่อไฟล์หมวดหมู่คาดว่าจะเป็น $2 ไม่มีการเขียนเอาต์พุตไปยัง STDOUT
clean ในกรณีนี้ คาดว่าไดเร็กทอรีราคา $2 ซึ่งถูกตรวจสอบสำหรับฐานข้อมูลเก่า
ข้อมูล. หากพบฐานข้อมูลเก่า จะถูกล้างหรือรีเซ็ต ไม่มีผลลัพธ์คือ
เขียนถึง STDOUT
บรรยาย
ในกรณีนี้ จะมีการเขียนข้อความบรรทัดเดียวไปยัง STDOUT โดยอธิบายตัวกรองของ
ฟังก์ชั่น เส้นควรสั้นไว้เพื่อป้องกันการพันเส้นบน a
สถานีปลายทาง
บูต
ในกรณีนี้ ไดเร็กทอรีคาดว่าจะเป็น $2 สคริปต์ wrapper ตรวจสอบก่อน
การมีอยู่ของตัวแยกประเภทที่เกี่ยวข้อง และข้อกำหนดเบื้องต้นอื่นๆ ถ้าเช็ค
สำเร็จ จากนั้น wrapper จะถูกคัดลอกไปยังไดเร็กทอรีที่ให้มา มารยาท
ควรแจ้งใน STDOUT เพื่อแสดงความสำเร็จหรือความล้มเหลว ยังเป็น
อนุญาตให้ให้คำเตือนคำอธิบายที่ยาวขึ้น
นิ้วเท้า ใช้โดย จดหมาย(1)
เท้า ในกรณีนี้ รายการหมวดหมู่คาดว่าจะเป็น $3, $4 และอื่นๆ ทุกที่เป็นไปได้
หมวดหมู่จะต้องอยู่ในรายการ ก่อนหน้ารายการนี้ หมวดหมู่จริงจะได้รับเป็น $2
และพวกเรา
หลังจากโหลดเสร็จ เมลฟุต อ่านไฟล์ที่ซ่อนอยู่ .mailfootrc ในไดเร็กทอรี $HOME if
มีอยู่จริง ดังนั้นนี่จึงเป็นสถานที่ที่ดีในการกำหนดค่าแบบกำหนดเองสำหรับสภาพแวดล้อม
ตัวแปร
MAILFOOT_FILTER
ตัวแปรนี้มีคำสั่งเชลล์ที่ต้องดำเนินการซ้ำๆ ในระหว่างการรัน
เวที. คำสั่งควรยอมรับข้อความอีเมลบน STDIN และส่งออกผลลัพธ์
ชื่อหมวดหมู่. บนบรรทัดคำสั่งก็ควรยอมรับหมวดหมู่ที่แท้จริงก่อน
ชื่อ ตามด้วยรายชื่อไฟล์หมวดหมู่ที่เป็นไปได้ทั้งหมด หากหมวดหมู่ผลลัพธ์ไม่
ไม่ตรงกับหมวดจริง ให้ถือว่าหมวดที่เกี่ยวข้องเป็น
อัปเดต / เรียนรู้ใหม่อย่างเงียบ ๆ หากไม่ได้กำหนด MAILFOOT_FILTER เมลฟุต ใช้ a
ค่าเริ่มต้น
เทมพีเดียร์
ไดเร็กทอรีนี้ถูกส่งออกเพื่อประโยชน์ของสคริปต์ตัวตัดทอน สคริปที่ต้องการ
ในการสร้างไฟล์ชั่วคราวควรวางตำแหน่งที่ระบุใน TEMPDIR
หมายเหตุ
ไดเรกทอรีย่อย mailfoot.d สามารถเติบโตได้ค่อนข้างใหญ่ ประกอบด้วยสำเนาการฝึกอบรมฉบับเต็ม
corpora เช่นเดียวกับการเรียนรู้ไฟล์สำหรับ ขนาด คูณหมวดหมู่ที่เพิ่มทั้งหมดและหลากหลาย
ไฟล์บันทึก
การจำลองเท้าสำหรับ ดีแบค(1) ช้ามาก (สั่ง n กำลังสอง) และจะใช้ทั้งหมด
คืนที่จะดำเนินการ นี้ไม่ง่ายที่จะปรับปรุง
คำเตือน
เนื่องจากลำดับของอีเมลภายในกล่องจดหมายที่เพิ่มเข้ามามีความสำคัญ ข้อผิดพลาดโดยประมาณ
อัตราไม่ได้กำหนดไว้อย่างดีหรือมีความหมายในแง่วัตถุประสงค์ อย่างไรก็ตาม หาก
อีเมลตัวอย่างแสดงถึงภาพรวมที่แท้จริงของอีเมลขาเข้าของผู้ใช้ ตามด้วยข้อผิดพลาด
อัตราค่อนข้างมีความหมาย การจำลองสามารถตีความได้ว่าเป็นทางเลือก
ความเป็นจริงที่ลักษณนามที่กำหนดจะสกัดกั้นจดหมายขาเข้า
แหล่งที่มา
ซอร์สโค้ดสำหรับเวอร์ชันล่าสุดของโปรแกรมนี้มีอยู่ที่ต่อไปนี้
สถานที่:
http://www.lbreyer.com/gpl.html
http://dbacl.sourceforge.net
ใช้ mailfoot ออนไลน์โดยใช้บริการ onworks.net