Это команда bmf, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
bmf - эффективный байесовский почтовый фильтр
СИНТАКСИС
БМФ [-t] [-n] [-s] [-N] [-S] [-f fmt] [-d db] [-i файл] [-kn] [-m тип] [-p]
[-в] [-в] [-ч]
ОПИСАНИЕ
bmf - это байесовский почтовый фильтр. В нормальном режиме работы он принимает сообщение электронной почты.
или другой текст в стандартном вводе, выполняет статистическую проверку по спискам "хороших" и
"спам", регистрирует новые данные и возвращает код состояния, указывающий,
сообщение является спамом. BMF написан с помощью быстрых алгоритмов с нулевым копированием, закодирован непосредственно на C,
и настроен на скорость. Он нацелен на то, чтобы быть быстрее, меньше и универсальнее, чем аналогичный
приложений.
bmf поддерживает форматы хранения почты mbox и maildir. Он автоматически обработает
несколько сообщений в файле MBOX по отдельности.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Без параметров командной строки bmf обрабатывает ввод, регистрирует его как "хороший" или
«спам» и возвращает соответствующий код ошибки. Каталог словаря и несуществующий
Word-файлы создаются, если они отсутствуют.
-t Проверьте, не является ли ввод спамом. Списки слов не обновляются. Отчет написан
в стандартный вывод, показывающий окончательный результат, а жетоны с наибольшим отклонением образуют среднее значение
0.5. Воспользуйтесь функционалом
-n Зарегистрируйте ввод как не спам.
-s Зарегистрируйте ввод как спам.
-N Зарегистрируйте ввод как не спам и отмените предыдущую регистрацию как спам.
-S Зарегистрируйте ввод как спам и отмените предыдущую регистрацию как не-спам.
-f FMT Укажите формат базы данных. Допустимые форматы: text, db и mysql. Текст всегда
действительный. Остальные могут быть недоступны, если соответствующая опция не была включена в
время компиляции. По умолчанию это db, если доступно, иначе текст.
-d db Укажите базу данных или каталог для загрузки и сохранения списков слов. По умолчанию
~ / .bmf в текстовом режиме.
-i файл Используйте для ввода файл вместо стандартного ввода.
-k n Укажите количество экстремумов (хранителей) для использования в вычислении Байеса. По умолчанию
это 15.
-m FMT Укажите формат хранения почты. Допустимые форматы: mbox и maildir. По умолчанию
автоматически определять формат хранения почты. Эта опция устарела.
-p Скопируйте ввод в вывод (сквозной) и вставьте заголовки спама в стиле
SpamAssassin. Заголовок X-Spam-Status всегда вставляется с подробностями обработки. В
содержимое этого заголовка всегда начинается с «Да» или «Нет». Если вход оценивается как
быть спамом, также вставляется заголовок «X-Spam-Flag: YES».
-v Будьте более многословны. Эта опция пока плохо поддерживается.
-V Показать информацию о версии.
-h Отображение информации об использовании.
ТЕОРИЯ OF РАБОТА
bmf рассматривает свой ввод как мешок токенов. Каждый токен проверяется на «хороший» и «плохой».
списки слов, в которых ведется подсчет количества раз, когда это произошло в не-спаме и
спам-письма. Эти числа используются для вычисления вероятности того, что письмо, в котором
токен является спамом. После вычисления вероятностей для всех входных токенов фиксированный
число вероятностей, которые больше всего отклоняются от среднего, объединяются с использованием байесовского
Теорема об условных вероятностях.
Хотя этот метод звучит грубо по сравнению с более обычным подходом сопоставления с образцом, он
оказывается чрезвычайно эффективным. Статья Пола Грэма План борьбы со спамом:
http://www.paulgraham.com/spam.html рекомендуется к прочтению.
bmf улучшает предложение Пола, проводя более умный лексический анализ. Особенно,
имена хостов и IP-адреса не отбрасываются, а некоторые типы информации MTA
отброшены (например, идентификаторы сообщений и даты).
MIME и другие вложения не декодируются. Опыт просмотра токен-стримов
предполагает, что спам с вложениями неизменно выдает себя через сигналы в
заголовки и незакрытые детали. Тем не менее, хотелось бы добавить возможность декодирования
quoted-printable и, возможно, base64 для текстовых вложений.
ИНТЕГРАЦИЯ ДРУГИЕ ИНСТРУМЕНТЫ
Примеры и предложения см. На странице /usr/share/doc/bmf/README.gz.
ВЕРНУТЬ ЦЕННОСТИ:
В режиме сквозной передачи: ноль в случае успеха, ненулевое значение в случае неудачи.
В режиме без сквозной передачи: 0 для спама; 1 за отсутствие спама; 2 для ввода / вывода или других ошибок.
Используйте bmf онлайн с помощью сервисов onworks.net