هذا هو الأمر الشاذ الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
شذوذ - اكتشاف بيانات شاذة
موجز
شذوذ [-h | - مساعدة] [-v | - الإصدار] [-د|--التفاصيل]
[-t|--العتبة] [--الحد الأدنى N] [--الحد الأقصى N]
[-s|--stddev] [-n|--العينة N] [-c|--المعامل N]
[-q | - هادئ]
[-e|--تنفيذ البرنامج]
[-p|--pid معرف العملية]
الوصف
يمكن لـ Anomaly اكتشاف البيانات الشاذة في تدفق رقمي. للقيام بذلك، تحتاج Anomaly إلى:
لرؤية تدفق البيانات الرقمية، وتطبيق إحدى طرق الكشف الخاصة بها. إذا تم اكتشاف شذوذ
عند اكتشاف ذلك، يتم إجراء استجابة يتم اختيارها من إحدى الطرق المضمنة أو أكثر.
NUMERIC مجرى
يعمل الشذوذ بشكل أفضل في الأنبوب، وسيقرأ فقط البيانات الرقمية من مدخلاته. كمثال بسيط
على سبيل المثال، افترض أنك ترغب في مراقبة متوسط الحمل والبحث عن أي ارتفاعات غير عادية.
يمكن الحصول على المتوسط من الأمر 'uptime':
وقت التشغيل
11:40 منذ 15 يومًا، 4:04، 6 مستخدمين، متوسط الحمل: 0.38 0.32 0.32
يمكننا استخراج الحمل لمدة 5 دقائق (الثاني من الأرقام الثلاثة) باستخدام هذا:
$ uptime | cut -f 13 -d ' '
0.29
يمكن استخراج هذا الرقم مرة واحدة في الدقيقة باستخدام هذا:
$ while [ 1 ]; do uptime | cut -f 13 -d ' '; sleep 60; تم
0.29
0.26
0.19
هذا هو نوع تدفق البيانات الذي تراقبه الشذوذات. المساحات البيضاء (المسافات، علامات التبويب،
يتم تجاهل الأسطر الجديدة (newlines) بين الأرقام، وبالتالي يمكننا محاكاة التدفق أعلاه على النحو التالي:
$ صدى 0.29 0.26 0.19
هذه طريقة ملائمة لإظهار الشذوذ، كما هو موضح أدناه.
كشف - العتبة
الطريقة الأبسط للكشف هي العتبة، والتي تقارن البيانات بقيمة مطلقة.
يمكن لهذه الطريقة استخدام قيمة دنيا وقيمة قصوى للمقارنة. هذه البدائل هي
كلها صالحة، واستخدام --min، أو --max أو كليهما:
الشذوذ --العتبة --الحد الأدنى 1.22 --الحد الأقصى 9.75
الشذوذ --العتبة --الحد الأدنى 1.22
الشذوذ --العتبة --الحد الأقصى 9.75
في المثال التالي، سيتم اكتشاف القيمتين '1' و'10' على أنهما شذوذ:
$ echo 2 1 3 6 10 5 | anomaly --threshold --min 1.5 --max 8
تم اكتشاف بيانات شاذة. القيمة ١ أقل من الحد الأدنى ١.٥.
تم اكتشاف بيانات شاذة. القيمة ١٠ أعلى من الحد الأقصى وهو ٨.
كشف - نظامي انحراف
يقيس الانحراف المعياري الاختلافات عن القيمة المتوسطة لعينة من البيانات، وهو
مفيد للكشف عن القيم غير العادية. يمكن اختيار حجم العينة بحيث يكون هناك
هناك بيانات كافية لتحديد متوسط قيمة جيد، ولكن القيمة الافتراضية هي 10. العينة المحدودة
يعني الحجم أنه يتم استخدام نافذة متجددة للبيانات، وبالتالي المتوسط والمعيار
تم تحديث الانحراف للنافذة الحالية. هذا يجعل المراقبة أكثر تكيفًا.
هنا مثال:
الشذوذ --stddev --العينة 20
يستخدم هذا حجم عينة من أحدث 20 قيمة، وسيكتشف أي قيم
+/- انحراف معياري واحد عن المتوسط. مثال:
$ echo 1 2 3 4 5 6 | anomaly --stddev --sample 5
تم اكتشاف بيانات شاذة. القيمة 6 أعلى من متوسط القيمة بأكثر من سيجما واحد.
3، مع حجم عينة 5.
مع حجم عينة يبلغ 5، تتم المقارنات فقط بعد رؤية القيمة السادسة. في
على سبيل المثال، متوسط قيمة [1 2 3 4 5] هو 3، والانحراف المعياري هو 1.58. هذا
يعني أن القيمة السادسة تعتبر شاذة إذا كانت ضمن النطاق (6 +/- 3)،
وهو ما بين 1.42 و 4.58.
لجعل هذا الأمر أقل حساسية، تم تقديم معامل، والذي يكون افتراضيًا 1.0 (كما هو مذكور أعلاه)
ولكن يمكن تجاوزها:
$ echo 1 2 3 4 5 6 | anomaly --stddev --sample 5 --coefficient 1.9
$
في هذا المثال، لا تعتبر القيمة السادسة شذوذًا لأنها تقع ضمن النطاق
(3 +/- (1.9 * 1.58))، وهو ما بين -0.002 و6.002.
RESPONSE - رسالة
استجابة الرسالة هي الإعداد الافتراضي، وتتكون من سطر واحد من النص المطبوع.
وصفٌ لسبب اعتبار قيمة البيانات شذوذًا. إليك مثال:
$ echo 1 2 3 | anomaly --threshold --max 2.5
تم اكتشاف بيانات شاذة. القيمة ١٠ أعلى من الحد الأقصى وهو ٨.
يمكن قمع الرسالة، ولكن يجب تحديد استجابة أخرى، بحيث يكون هناك
نوع من الاستجابة:
$ echo 1 2 3 | anomaly --threshold --max 2.5 --quiet ...
RESPONSE - نفذ - اعدم
يمكن للشذوذ تنفيذ برنامج استجابةً للكشف. هنا مثال يستخدم "التاريخ".
الأمر، ولكن يمكن استخدام أي برنامج:
$ echo 1 2 3 | anomaly --threshold --max 2.5 --quiet --execute '/ بن / التاريخ +%s'
1361727327
RESPONSE - إشارة
يمكن للشذوذ أن يرسل إشارة USR1 إلى برنامج استجابةً للكشف:
$ echo 1 2 3 | anomaly --threshold --max 2.5 --quiet --pid 12345
يؤدي هذا إلى إرسال إشارة USR1 إلى العملية ذات معرف العملية 12345. وسيقوم البرنامج المستقبل
يجب الرد وفقًا لذلك.
CREDITS & حقوق النسخ
حقوق الطبع والنشر (C) 2013 لشركة Göteborg Bit Factory.
يتم توزيع Anomaly بموجب ترخيص MIT. انظر http://www.opensource.org/licenses/mit-
License.php لمزيد من المعلومات.
استخدم الشذوذ عبر الإنترنت باستخدام خدمات onworks.net