این دستور simhash است که می تواند در ارائه دهنده میزبانی رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
simhash - ابزار هش تشابه فایل
خلاصه
سیم هاش [ -s nshingles ] [ -f ویژگی های ] [ پرونده ]
سیم هاش [ -s nshingles ] [ -f ویژگی های ] -w پرونده ...
سیم هاش [ -s nshingles ] [ -f ویژگی های ] -m پرونده ...
سیم هاش -c فایل هش فایل هش
شرح
این برنامه برای محاسبه و مقایسه هش های مشابه فایل ها استفاده می شود. هش شباهت
تکهای از دادهها است که دارای خاصیت اندازهگیری فاصله بین فایلها است
متناسب با برخی متریک های فاصله بین هش ها. به طور معمول هش شباهت
بسیار کوچکتر از خود فایل خواهد بود.
الگوریتم مورد استفاده توسط سیم هاش الگوریتم "shingprinting" Manassas است (به کتابشناسی مراجعه کنید
زیر): از هر هش بردارید mدنباله بایت فایل، و حفظ کنید n از اینها
هش هایی که از نظر عددی کوچکترین هستند. اندازه تقاطع مجموعه هش از
دو فایل تخمین آماری خوبی از شباهت فایل ها در کل ارائه می دهد.
در حالت پیش فرض خود، سیم هاش هش شباهت آرگومان فایل خود را محاسبه خواهد کرد (یا
stdin) و این هش را در خروجی استاندارد آن بنویسید. هنگام فراخوانی با -w استدلال (نگاه کنید به
زیر) سیم هاش هشهای شباهت همه آرگومانهای فایل خود را به صورت دستهای محاسبه میکند
حالت". هنگام فراخوانی با -m استدلال (به زیر مراجعه کنید)، سیم هاش تمام موارد داده شده را با هم مقایسه خواهد کرد
فایل ها با استفاده از هش های مشابه در "حالت تطبیق". در نهایت، هنگامی که با فراخوانی -c استدلال
(زیر را ببینید) ، سیم هاش میزان شباهت بین دو هش را گزارش خواهد کرد.
OPTIONS
-f شمارش ویژگی
هنگام محاسبه هش شباهت، حداکثر آن را حفظ کنید شمارش ویژگی هش های قابل توجه
از فایل هدف پیش فرض 128 ویژگی است. تعداد ویژگی های بزرگتر خواهد شد
با دادن وضوح بالاتر در تفاوت بین فایل ها، اندازه فایل ها افزایش می یابد
شباهت متناسب با تعداد ویژگی ها هش می شود و شباهت را افزایش می دهد
زمان محاسبه هش کمی
-s سایز زونا
هنگام محاسبه هش شباهت، از هش های نمونه های متشکل از سایز زونا
بایت های متوالی گرفته شده از فایل هدف. پیش فرض 8 بایت است، حداقل
4 بایت است. اندازه های زونا بزرگتر بر تفاوت بین فایل ها بیشتر تأکید می کند
و محاسبه هش شباهت را متناسب با اندازه شینگل کند می کند.
-c hashfile1 hashfile2
فاصله (نرمال شده تا محدوده 0..1) بین هش شباهت را نمایش دهید
ذخیره شده در hashfile1 و هش شباهت ذخیره شده در hashfile2.
-w پرونده ...
هش شباهت هر یک را بنویسید پرونده استدلال به file.sim.
-m پرونده ...
هش شباهت هر یک را محاسبه کنید پرونده آرگومان ها، و خروجی شباهت
ماتریس برای آن فایل ها
با استفاده از خدمات onworks.net از simhash آنلاین استفاده کنید