هذا هو الأمر simhash الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
simhash - أداة تجزئة تشابه الملفات
موجز
سمهاش [ -s القوباء المنطقية ] [ -f ميزات ] [ ملف ]
سمهاش [ -s القوباء المنطقية ] [ -f ميزات ] -w ملف
سمهاش [ -s القوباء المنطقية ] [ -f ميزات ] -m ملف
سمهاش -c hashfile hashfile
الوصف
يستخدم هذا البرنامج لحساب تجزئات تشابه الملفات ومقارنتها. تجزئة التشابه
هي مجموعة من البيانات لها خاصية قياس المسافة بين الملفات
يتناسب مع بعض مقياس المسافة بين التجزئة. عادة تجزئة التشابه
سيكون أصغر بكثير من الملف نفسه.
الخوارزمية المستخدمة من قبل سمهاش هي خوارزمية "shingleprinting" الخاصة بـ Manassas (انظر قائمة المراجع
أدناه): خذ تجزئة لكل m-البايت التي تلي الملف ، والاحتفاظ بالملحق n من هذه
التجزئة الأصغر عددًا. حجم تقاطع مجموعات التجزئة من
يعطي ملفان تقديراً جيداً إحصائياً للتشابه بين الملفات ككل.
في وضعه الافتراضي ، سمهاش سيحسب تجزئة التشابه في وسيطة الملف (أو
stdin) واكتب هذه التجزئة إلى إخراجها القياسي. عند الاحتجاج بامتداد -w حجة (انظر
أدناه)، سمهاش سيحسب تجزئات التشابه لجميع وسائط الملف في "الدفعة
الوضع ". عند الاستدعاء بامتداد -m حجة (انظر أدناه) ، سمهاش سيقارن كل ما هو معطى
الملفات التي تستخدم تجزئات التشابه في "وضع المطابقة". أخيرًا ، عند الاستدعاء بامتداد -c حجة
(انظر أدناه)، سمهاش سيبلغ عن درجة التشابه بين اثنين من التجزئة.
OPTIONS
-f ميزة العد
عند حساب تجزئة التشابه ، احتفظ بها على الأكثر ميزة العد تجزئات كبيرة
من الملف الهدف. الافتراضي هو 128 ميزة. أكبر ميزة التهم سوف
يعطي دقة أعلى في الاختلافات بين الملفات ، سيزيد من حجم
تجزئة التشابه تتناسب مع عدد الميزات ، وستزيد من التشابه
وقت حساب التجزئة بشكل طفيف.
-s حجم لوح خشبي
عند حساب تجزئة التشابه ، استخدم تجزئات العينات التي تتكون من حجم لوح خشبي
بايتات متتالية مأخوذة من الملف الهدف. الافتراضي هو 8 بايت ، الحد الأدنى
4 بايت. ستؤكد أحجام الألواح الخشبية الأكبر على الاختلافات بين الملفات بشكل أكبر
وسيبطئ حساب تجزئة التشابه بالتناسب مع حجم الألواح الخشبية.
-c التجزئة 1 التجزئة 2
اعرض المسافة (المقيسة إلى النطاق 0..1) بين تجزئة التشابه
مخزن في التجزئة 1 وتجزئة التشابه المخزنة في التجزئة 2.
-w ملف
اكتب تجزئة التشابه لكل ملف ملف الحجج ل file.sim.
-m ملف
احسب تجزئة التشابه لكل من ملف الحجج ، وإخراج التشابه
مصفوفة لتلك الملفات.
استخدم سمهاش على الإنترنت باستخدام خدمات onworks.net