GoGPT Best VPN GoSearch

OnWorks favicon

sim_m2 - ອອນລາຍໃນຄລາວ

ແລ່ນ sim_m2 ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຄໍາສັ່ງ sim_m2 ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍສະຖານີເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


sim - ຊອກຫາຄວາມຄ້າຍຄືກັນໃນ C, Java, Pascal, Modula-2, Lisp, Miranda, ຫຼືໄຟລ໌ຂໍ້ຄວາມ

ສະຫຼຸບສັງລວມ


sim_c [ -[defFiMnpPRsSTv] -r N -t N -w N -o F ] ໄຟລ໌ ... [ [ / | ] ໄຟລ໌ ... ]
sim_c ...
sim_java ...
sim_pasc ...
sim_m2 ...
sim_lisp ...
sim_mira ...
sim_text ...

ລາຍລະອຽດ


ຊິມ_ຄ ອ່ານໄຟລ໌ C ເອກະສານ ... ແລະຊອກຫາພາກສ່ວນຂອງຂໍ້ຄວາມທີ່ຄ້າຍຄືກັນ; ສອງ
ສ່ວນ​ຂອງ​ຂໍ້​ຄວາມ​ຂອງ​ໂຄງ​ການ​ແມ່ນ​ຄ້າຍ​ຄື​ກັນ​ຖ້າ​ຫາກ​ວ່າ​ພວກ​ເຂົາ​ພຽງ​ແຕ່​ແຕກ​ຕ່າງ​ກັນ​ໃນ​ຮູບ​ແບບ​, ຄໍາ​ຄິດ​ເຫັນ​, ຕົວ​ລະ​ບຸ​,
ແລະເນື້ອໃນຂອງຕົວເລກ, ສະຕຣິງແລະຕົວອັກສອນ. ຖ້າແລ່ນໃດທີ່ມີຄວາມຍາວພຽງພໍ
ພົບເຫັນ, ພວກເຂົາເຈົ້າໄດ້ຖືກລາຍງານກ່ຽວກັບຜົນຜະລິດມາດຕະຖານ; ຈໍານວນຂອງ tokens ທີ່ສໍາຄັນໃນການດໍາເນີນງານ
ແມ່ນໃຫ້ລະຫວ່າງວົງເລັບສີ່ຫຼ່ຽມ.

Sim_java ບໍ່ຄືກັນສໍາລັບ Java, sim_pasc ສໍາລັບ Pascal, sim_m2 ສໍາລັບ Modula-2, sim_mira ສໍາລັບການ
Miranda, ແລະ sim_lisp ສໍາລັບ Lisp. Sim_text ເຮັດວຽກຢູ່ໃນຂໍ້ຄວາມທີ່ມັກແລະມັນເປັນບາງໂອກາດ
ທີ່ເປັນປະໂຫຍດໃນ Shell scripts.

ໂປລແກລມສາມາດຖືກນໍາໃຊ້ເພື່ອຄົ້ນຫາຊິ້ນສ່ວນຂອງລະຫັດທີ່ຖືກຄັດລອກໂດຍລາຍງານທີ່ບໍ່ກ່ຽວຂ້ອງ
ໂຄງ​ການ (ມີ -s or -S), ຫຼືສໍາລັບການຊອກຫາລະຫັດທີ່ຊ້ໍາກັນໂດຍບັງເອີນໃນໂຄງການຂະຫນາດໃຫຍ່
(ມີ -f or -F).

ຖ້າຕົວແຍກ / or | ມີຢູ່ໃນບັນຊີລາຍຊື່ຂອງໄຟລ໌ປ້ອນຂໍ້ມູນ, ໄຟລ໌ໄດ້ຖືກແບ່ງອອກເປັນ
ກຸ່ມຂອງໄຟລ໌ "ໃຫມ່" (ກ່ອນ / or |) ແລະກຸ່ມຂອງໄຟລ໌ "ເກົ່າ"; ຖ້າບໍ່ມີ / or
|, ໄຟລ໌ທັງຫມົດແມ່ນ "ໃຫມ່". ໄຟລ໌ເກົ່າບໍ່ເຄີຍປຽບທຽບກັບກັນແລະກັນ. ເບິ່ງຍັງ
ລາຍ​ລະ​ອຽດ​ຂອງ​ -s ແລະ -S ທາງເລືອກຂ້າງລຸ່ມນີ້.

ເນື່ອງຈາກຜູ້ທົດສອບຄວາມຄ້າຍຄືກັນຕ້ອງການຊື່ໄຟລ໌ເພື່ອຊີ້ໃຫ້ເຫັນຄວາມຄ້າຍຄືກັນ, ມັນບໍ່ສາມາດອ່ານໄດ້
ຈາກການປ້ອນຂໍ້ມູນມາດຕະຖານ.

ມີທາງເລືອກຕໍ່ໄປນີ້:

-d ຜົນຜະລິດແມ່ນຢູ່ໃນ a diff(1) ຮູບແບບທີ່ຄ້າຍຄື ແທນຮູບແບບ 2 ຖັນເລີ່ມຕົ້ນ.

-e ແຕ່ລະໄຟລ໌ຖືກປຽບທຽບກັບແຕ່ລະໄຟລ໌ໃນການໂດດດ່ຽວ; ນີ້ຈະພົບເຫັນຄວາມຄ້າຍຄືກັນທັງຫມົດ
ລະຫວ່າງທຸກບົດເລື່ອງທີ່ກ່ຽວຂ້ອງ, ໂດຍບໍ່ຄໍານຶງເຖິງຂໍ້ຄວາມທີ່ຊ້ໍາກັນ (ເບິ່ງ `ການຄິດໄລ່
ເປີເຊັນ' ຂ້າງລຸ່ມນີ້).

-f ການແລ່ນຖືກຈຳກັດໃຫ້ຢູ່ໃນພາກສ່ວນທີ່ມີວົງເລັບດຸ່ນດ່ຽງ, ເພື່ອແຍກທ່າແຮງ
ອົງການຈັດຕັ້ງປົກກະຕິ (ບໍ່ຢູ່ໃນ sim_text).

-F ຊື່ຂອງກິດຈະວັດໃນການໂທແມ່ນຕ້ອງກົງກັນແທ້ (ບໍ່ແມ່ນຢູ່ໃນ sim_text).

-i ຊື່ຂອງໄຟລ໌ທີ່ຈະປຽບທຽບແມ່ນອ່ານຈາກວັດສະດຸປ້ອນມາດຕະຖານ, ລວມທັງ a
ຕົວແຍກທີ່ເປັນໄປໄດ້ / or |; ຊື່ໄຟລ໌ຕ້ອງເປັນແຖວຕໍ່ແຖວ. ທາງເລືອກນີ້
ອະນຸຍາດໃຫ້ມີການລະບຸຊື່ໄຟລ໌ຈໍານວນຫລາຍ; ມັນແຕກຕ່າງຈາກ @
ສິ່ງອໍານວຍຄວາມສະດວກທີ່ສະຫນອງໂດຍບາງ compilers ໃນທີ່ມັນຈັດການກັບຊື່ໄຟລ໌ເທົ່ານັ້ນ, ແລະເຮັດ
ບໍ່ຮັບຮູ້ການໂຕ້ຖຽງທາງເລືອກ.

-M ຂໍ້​ມູນ​ການ​ນໍາ​ໃຊ້​ຫນ່ວຍ​ຄວາມ​ຈໍາ​ແມ່ນ​ສະ​ແດງ​ຢູ່​ໃນ​ຜົນ​ຜະ​ລິດ​ຄວາມ​ຜິດ​ພາດ​ມາດ​ຕະ​ຖານ​.

-n ຄວາມຄ້າຍຄືກັນທີ່ພົບເຫັນແມ່ນສະຫຼຸບໂດຍຊື່ໄຟລ໌, ຕໍາແຫນ່ງແລະຂະຫນາດ, ແທນທີ່ຈະ
ສະ​ແດງ​ໃຫ້​ເຫັນ​ຢ່າງ​ເຕັມ​ທີ່​.

-o F ຜົນໄດ້ຮັບແມ່ນຂຽນໃສ່ໄຟລ໌ທີ່ມີຊື່ F.

-p ຜົນຜະລິດແມ່ນໃຫ້ຢູ່ໃນອັດຕາສ່ວນທີ່ຄ້າຍຄືກັນ; ເບິ່ງ 'ການຄິດໄລ່ເປີເຊັນ' ຂ້າງລຸ່ມນີ້;
implies -e ແລະ -s.

-P As -p ແຕ່ພຽງແຕ່ຜູ້ປະກອບສ່ວນຕົ້ນຕໍແມ່ນສະແດງໃຫ້ເຫັນ; ໝາຍເຖິງ -e ແລະ -s.

-r N ໄລຍະເວລາແລ່ນຕໍາ່ສຸດທີ່ຖືກກໍານົດເປັນ N ຫົວໜ່ວຍ; ຄ່າເລີ່ມຕົ້ນແມ່ນ 24 tokens, ຍົກເວັ້ນໃນ
sim_text, ບ່ອນທີ່ມັນແມ່ນ 8 ຄໍາ.

-R ໄດເລກະທໍລີໃນລາຍການປ້ອນຂໍ້ມູນຖືກໃສ່ recursively, ແລະໄຟລ໌ທັງຫມົດທີ່ເຂົາເຈົ້າມີ
ມີສ່ວນຮ່ວມໃນການປຽບທຽບ.

-s ເນື້ອໃນຂອງໄຟລ໌ບໍ່ໄດ້ຖືກປຽບທຽບກັບຕົວມັນເອງ (-s ສໍາລັບ "ບໍ່ແມ່ນຕົນເອງ").

-S ເນື້ອໃນຂອງໄຟລ໌ໃຫມ່ແມ່ນປຽບທຽບກັບໄຟລ໌ເກົ່າເທົ່ານັ້ນ - ບໍ່ແມ່ນລະຫວ່າງ
ຕົວເອງ

-t N ໃນການປະສົມປະສານກັບ -p or -P ທາງເລືອກ, ກໍານົດຂອບເຂດ (ເປັນເປີເຊັນ) ຂ້າງລຸ່ມນີ້
ເຊິ່ງຄວາມຄ້າຍຄືກັນຈະບໍ່ຖືກລາຍງານ; ຄ່າເລີ່ມຕົ້ນແມ່ນ 1, ຍົກເວັ້ນໃນ sim_text,
ບ່ອນທີ່ມັນແມ່ນ 20.

-T ຮູບ​ແບບ​ການ​ຜະ​ລິດ terse ແລະ​ເປັນ​ເອ​ກະ​ພາບ​ຫຼາຍ​ແມ່ນ​ຜະ​ລິດ​, ຊຶ່ງ​ອາດ​ຈະ​ເຫມາະ​ສົມ​ຫຼາຍ​ສໍາ​ລັບ​ການ​
ຫຼັງ​ການ​ປຸງ​ແຕ່ງ​.

-v ພິມໝາຍເລກເວີຊັນ ແລະວັນທີການລວບລວມຢູ່ໃນຜົນຜະລິດມາດຕະຖານ, ຈາກນັ້ນຢຸດ.

-w N ຄວາມກວ້າງຂອງໜ້າເວັບທີ່ໃຊ້ແມ່ນຕັ້ງເປັນ N ຖັນ; ຄ່າເລີ່ມຕົ້ນແມ່ນ 80.

-- (ເປັນທາງເລືອກລັບ, ເຊິ່ງພິມການປ້ອນຂໍ້ມູນດັ່ງທີ່ຕົວກວດສອບຄວາມຄ້າຍຄືກັນເຫັນມັນ, ແລະ
ແລ້ວຢຸດ.)

ໄດ້ -p ທາງເລືອກຜົນໄດ້ຮັບໃນແຖວຂອງແບບຟອມ
F ປະກອບດ້ວຍ x % ຂອງວັດສະດຸ G
ຊຶ່ງຫມາຍຄວາມວ່າ x % ຂອງຂໍ້ຄວາມຂອງ F ຍັງສາມາດພົບເຫັນຢູ່ໃນ G. ໃຫ້ສັງເກດວ່າຄວາມສໍາພັນນີ້ບໍ່ແມ່ນ
ສົມມາດ; ໃນ​ຄວາມ​ເປັນ​ຈິງ​ມັນ​ເປັນ​ໄປ​ໄດ້​ຫຼາຍ​ສໍາ​ລັບ​ໄຟລ​໌​ຫນຶ່ງ​ທີ່​ຈະ​ປະ​ກອບ​ດ້ວຍ 100​% ຂອງ​ຂໍ້​ຄວາມ​ຈາກ​
ໄຟລ໌ອື່ນ, ໃນຂະນະທີ່ໄຟລ໌ອື່ນໆປະກອບດ້ວຍພຽງແຕ່ 1% ຂອງຂໍ້ຄວາມຂອງໄຟລ໌ທໍາອິດ, ຖ້າ
ຄວາມຍາວຂອງພວກມັນແຕກຕ່າງກັນພຽງພໍ. ໄດ້ -P (ນະຄອນຫຼວງ P) ທາງເລືອກສະແດງໃຫ້ເຫັນຜູ້ປະກອບສ່ວນຕົ້ນຕໍສໍາລັບ
ແຕ່ລະໄຟລ໌ເທົ່ານັ້ນ. ນີ້ເຮັດໃຫ້ການກໍານົດຊຸດຂອງໄຟລ໌ A[1] ... A[n], ບ່ອນທີ່
concatenation ຂອງໄຟລ໌ເຫຼົ່ານີ້ຍັງມີຢູ່. A threshold ສາມາດຖືກກໍານົດໂດຍໃຊ້ -t
ທາງເລືອກ; ໃຫ້ສັງເກດວ່າ granularity ຂອງຂໍ້ຄວາມທີ່ຮັບຮູ້ແມ່ນຍັງຖືກຄວບຄຸມໂດຍ -r
ທາງເລືອກຫຼືຄ່າເລີ່ມຕົ້ນຂອງມັນ.

ໄດ້ -r ທາງເລືອກຄວບຄຸມຈໍານວນຂອງ "ຫນ່ວຍງານ" ທີ່ປະກອບເປັນການແລ່ນ. ສໍາ​ລັບ​ໂຄງ​ການ​ທີ່​
ປຽບທຽບລະຫັດພາສາການຂຽນໂປລແກລມ, ຫົວໜ່ວຍເປັນ token lexical ໃນພາສາທີ່ກ່ຽວຂ້ອງ;
ຄໍາຄິດຄໍາເຫັນແລະເອກະສານ preamble ມາດຕະຖານ (ການລວມເອົາໄຟລ໌, ແລະອື່ນໆ) ແມ່ນຖືກລະເລີຍແລະສາຍທັງຫມົດ
ຖືວ່າເປັນອັນດຽວກັນ. ສໍາລັບ sim_text ຫນ່ວຍແມ່ນ "ຄໍາ" ທີ່ຖືກກໍານົດເປັນລໍາດັບໃດກໍ່ຕາມ
ຂອງຕົວອັກສອນ, ຕົວເລກ, ຫຼືຕົວອັກສອນທີ່ເກີນ 127 (177 ເລກແປດ), (ເພື່ອຮອງຮັບ
ຕົວອັກສອນເຊັ່ນ ä, ø, ແລະອື່ນໆ).
Sim_text ຍອມຮັບຂໍ້ຄວາມ spaced ເປັນຂໍ້ຄວາມປົກກະຕິ.

ໄດ້ -s ແລະ -S ຕົວເລືອກຄວບຄຸມວ່າຈະປຽບທຽບໄຟລ໌ໃດ. ໄຟລ໌ປ້ອນຂໍ້ມູນຖືກແບ່ງອອກເປັນສອງ
ກຸ່ມ, ໃຫມ່ແລະເກົ່າ. ໃນເມື່ອບໍ່ມີທາງເລືອກໃນການຄວບຄຸມເຫຼົ່ານີ້, ໂຄງການປຽບທຽບ
ດັ່ງນັ້ນໄຟລ໌ (ສໍາລັບ 4 ໄຟລ໌ໃຫມ່ແລະ 6 ໄຟລ໌ເກົ່າ):
ໃຫມ່ / ເກົ່າ <- ໄຟລ໌ທໍາອິດ
1 2 3 4 / 5 6 7 8 9 10
|-----------------/-----------
n 1 | ຄ/
e 2 | cc /
w 3 | ccc /
4 | cccc /
ທີສອງ / / / / / / / / / / / / / / /
ໄຟລ໌ -> 5 | cccc /
o 6 | cccc /
l 7 | cccc /
ງ 8 | cccc /
9 | cccc /
10 | cccc /
ບ່ອນທີ່ cs ເປັນຕົວແທນການປຽບທຽບໄຟລ໌, ແລະ / ການແບ່ງເຂດລະຫວ່າງໃຫມ່ແລະເກົ່າ
ໄຟລ໌.
ການນໍາໃຊ້ -s ທາງ​ເລືອກ​ຫຼຸດ​ຜ່ອນ​ການ​ນີ້​:
ໃຫມ່ / ເກົ່າ <- ໄຟລ໌ທໍາອິດ
1 2 3 4 / 5 6 7 8 9 10
|-----------------/-----------
n 1 | /
e 2 | ຄ/
w 3 | cc /
4 | ccc /
ທີສອງ / / / / / / / / / / / / / / /
ໄຟລ໌ -> 5 | cccc /
o 6 | cccc /
l 7 | cccc /
ງ 8 | cccc /
9 | cccc /
10 | cccc /
ໄດ້ -S ທາງ​ເລືອກ​ຈະ​ຫຼຸດ​ຜ່ອນ​ອັນ​ນີ້​ຕື່ມ​ອີກ​ເປັນ​:
ໃຫມ່ / ເກົ່າ <- ໄຟລ໌ທໍາອິດ
1 2 3 4 / 5 6 7 8 9 10
|-----------------/-----------
n 1 | /
e 2 | /
w 3 | /
4 | /
ທີສອງ / / / / / / / / / / / / / / /
ໄຟລ໌ -> 5 | cccc /
o 6 | cccc /
l 7 | cccc /
ງ 8 | cccc /
9 | cccc /
10 | cccc /

ບັນດາໂຄງການສາມາດຈັດການຊື່ໄຟລ໌ UNICODE ພາຍໃຕ້ Windows. ນີ້ແມ່ນກ່ຽວຂ້ອງພຽງແຕ່ພາຍໃຕ້ການ
-R ທາງເລືອກ, ເນື່ອງຈາກວ່າບໍ່ມີວິທີທີ່ຈະໃຫ້ຊື່ໄຟລ໌ UNICODE ຈາກເສັ້ນຄໍາສັ່ງ.

ຂອບເຂດ ຈຳ ກັດ


ການປ້ອນຂໍ້ມູນຊໍ້າຊ້ອນແມ່ນຂໍ້ຫ້າມຂອງການກວດສອບຄວາມຄ້າຍຄືກັນ. ຖ້າ​ຫາກ​ວ່າ​ພວກ​ເຮົາ​ມີ​ໄຟລ​໌​ທີ່​ມີ 4​
ສຳເນົາຂໍ້ຄວາມທີ່ຄືກັນ,
A1 A2 A3 A4
ບ່ອນທີ່ຕົວເລກຮັບໃຊ້ພຽງແຕ່ຈໍາແນກສໍາເນົາດຽວກັນ, ມີ 8 ຕົວຕົນ:
A1=A2, A1=A3, A1=A4, A2=A3, A2=A4, A3=A4, A1A2=A3A4, ແລະ A1A2A3=A2A3A4. ໃນນັ້ນ, ມີພຽງ 3 ເທົ່ານັ້ນ
ມີຄວາມໝາຍ: A1=A2, A2=A3, ແລະ A3=A4. ແລະສໍາລັບຕາຕະລາງທີ່ມີ 20 ແຖວທີ່ຄືກັນ
ອື່ນ, ບໍ່ຜິດປົກກະຕິໃນໂຄງການ, ມີ 715 ຕົວຕົນ, ຊຶ່ງໃນນັ້ນມີ 19 ຫຼາຍທີ່ສຸດ
ມີຄວາມໝາຍ. ການລາຍງານທັງຫມົດ 715 ຂອງພວກເຂົາແມ່ນບໍ່ສາມາດຍອມຮັບໄດ້ຢ່າງຊັດເຈນ.

ເພື່ອແກ້ໄຂນີ້, ການຊອກຫາຕົວຕົນແມ່ນປະຕິບັດດັ່ງຕໍ່ໄປນີ້: ສໍາລັບແຕ່ລະຕໍາແຫນ່ງໃນ
ຂໍ້ຄວາມ, ສ່ວນທີ່ໃຫຍ່ທີ່ສຸດແມ່ນພົບເຫັນ, ຊຶ່ງການສໍາເນົາທີ່ບໍ່ຊ້ໍາກັນເກີດຂື້ນໃນຂໍ້ຄວາມ
ຕິດຕາມມັນ. ພາກສ່ວນນັ້ນແລະສໍາເນົາຂອງມັນຖືກລາຍງານແລະສະແກນຊີວະປະຫວັດຢູ່ທີ່ຕໍາແຫນ່ງ
ພຽງແຕ່ຫຼັງຈາກສ່ວນ. ຕົວຢ່າງຂ້າງເທິງນີ້ສົ່ງຜົນໃຫ້ຕົວຕົນ A1A2=A3A4
ແລະ A3=A4, ເຊິ່ງຂ້ອນຂ້າງເປັນທີ່ພໍໃຈ, ແລະສໍາລັບ N ພາກສ່ວນທີ່ຄືກັນໂດຍປະມານ 2 log N
ຂໍ້ຄວາມແມ່ນໃຫ້.

ອັນນີ້ຍັງເຮັດວຽກໄດ້ດີເມື່ອສີ່ພາກສ່ວນທີ່ຄືກັນຢູ່ໃນໄຟລ໌ທີ່ແຕກຕ່າງກັນ:
ໄຟລ໌ 1: A1
ໄຟລ໌ 2: A2
ໄຟລ໌ 3: A3
ໄຟລ໌ 4: A4
ໃນປັດຈຸບັນສ່ວນປະສົມເຊັ່ນ A1A2 ບໍ່ໄດ້ເກີດຂຶ້ນ, ແລະສູດການຄິດໄລ່ຊອກຫາການແລ່ນ A1 = A2,
A2=A3, ແລະ A3=A4, ສໍາລັບຈໍານວນທັງໝົດ N-1 ແລ່ນ, ຂໍ້ມູນທັງຫມົດ.

ການຄິດໄລ່ ເປີເຊັນ
ວິທີການຂ້າງເທິງນີ້ແມ່ນບໍ່ເຫມາະສົມສໍາລັບການໄດ້ຮັບອັດຕາສ່ວນຂອງເນື້ອໃນຂອງໄຟລ໌ທີ່
ສາມາດພົບໄດ້ໃນໄຟລ໌ອື່ນ. ນີ້ຮຽກຮ້ອງໃຫ້ມີການປຽບທຽບໃນການໂດດດ່ຽວແຕ່ລະຄູ່ໄຟລ໌
ເປັນຕົວແທນໂດຍ ac ໃນ matrixes ຂ້າງເທິງ; ນີ້ແມ່ນສິ່ງທີ່ -e ທາງເລືອກບໍ່. ພາຍ​ໃຕ້​ການ -e
ທາງເລືອກສ່ວນ File1:A1, ຖືກຮັບຮູ້ໃນ File2, ອີກເທື່ອຫນຶ່ງຈະຖືກຮັບຮູ້ໃນ File3 ແລະ
ໄຟລ໌ 4. ໃນຕົວຢ່າງຂ້າງເທິງ, ມັນຜະລິດການແລ່ນ
File1:A1=File2:A2
File1:A1=File3:A3
File1:A1=File4:A4
File2:A2=File3:A3
File2:A2=File4:A4
File3:A3=File4:A4
ສຳ ລັບທັງ ໝົດ ½N(N-1) ແລ່ນ.

ເວລາ ແລະ SPACE ສິ່ງທີ່ຕ້ອງມີ


ການດູແລໄດ້ຖືກປະຕິບັດເພື່ອຮັກສາຄວາມຕ້ອງການເວລາຂອງຂະບວນການພາຍໃນທັງຫມົດ (ເກືອບ)
linear ໃນຄວາມຍາວຂອງໄຟລ໌ປ້ອນຂໍ້ມູນ, ໂດຍໃຊ້ຕາຕະລາງຕ່າງໆ. ຖ້າຫາກວ່າ, ຢ່າງໃດກໍຕາມ, ມີ
ຫນ່ວຍຄວາມຈໍາບໍ່ພຽງພໍສໍາລັບຕາຕະລາງ, ພວກເຂົາເຈົ້າໄດ້ຖືກຍົກເລີກໃນຄໍາສັ່ງທີ່ບໍ່ສໍາຄັນ, ພາຍໃຕ້ການນັ້ນ
ເງື່ອນໄຂທີ່ສູດການຄິດໄລ່ກັບຄືນສູ່ລັກສະນະສີ່ຫລ່ຽມຂອງພວກມັນ.

ຄວາມຕ້ອງການເວລາແມ່ນສີ່ຫລ່ຽມໃນຈໍານວນຂອງໄຟລ໌. ນີ້ຫມາຍຄວາມວ່າ, ສໍາລັບການຍົກຕົວຢ່າງ,
ໄຟລ໌ຫນຶ່ງ 64 MB ປະມວນຜົນໄວກ່ວາໄຟລ໌ 8000 8 kB.

ໂຄງການຕ້ອງການ 6 bytes ຂອງຫນ່ວຍຄວາມຈໍາສໍາລັບແຕ່ລະ token ໃນການປ້ອນຂໍ້ມູນ; 2 bytes ຕໍ່ແຖວໃໝ່
(ບໍ່ແມ່ນໃນເວລາທີ່ເຮັດອັດຕາສ່ວນ); ແລະປະມານ 76 bytes ສໍາລັບແຕ່ລະແລ່ນພົບ.

ຕົວຢ່າງ


ໂທ
sim_c *.c
ເນັ້ນໃສ່ລະຫັດຊໍ້າກັນໃນໄດເລກະທໍລີ. (ມັນເປັນປະໂຫຍດທີ່ຈະເອົາໄຟລ໌ທີ່ສ້າງຂຶ້ນ
ທໍາອິດ.) ໂທ
sim_c -f -F *.c
ສາມາດຊີ້ໃຫ້ເຂົາເຈົ້າຕື່ມອີກ.

ໂທ
sim_text -e -p -s ໃຫມ່/* / old/*
ປຽບທຽບແຕ່ລະໄຟລ໌ໃນໃຫມ່ /* ກັບແຕ່ລະໄຟລ໌ໃນໃຫມ່ /* ແລະເກົ່າ /*, ແລະຖ້າຫາກວ່າຄູ່ໃດມີຫຼາຍກວ່ານັ້ນ
20% ໂດຍທົ່ວໄປ, ຄວາມຈິງນັ້ນໄດ້ຖືກລາຍງານ. ປົກກະຕິແລ້ວຄວາມຄ້າຍຄືກັນຂອງ 30% ຫຼືຫຼາຍກວ່ານັ້ນແມ່ນມີຄວາມສໍາຄັນ;
ຕ່ໍາກວ່າ 20% ອາດຈະເປັນເລື່ອງບັງເອີນ; ແລະໃນລະຫວ່າງແມ່ນສົງໃສ.

ໂທ
sim_text -e -n -s -r100 ໃຫມ່/* "|" ເກົ່າ/*
ປຽບທຽບໄຟລ໌ດຽວກັນ, ແລະລາຍງານສ່ວນທົ່ວໄປຂະຫນາດໃຫຍ່. (ໄດ້ | ສາມາດຖືກນໍາໃຊ້ເປັນ
ຕົວແຍກແທນ / ກ່ຽວກັບລະບົບທີ່ / ເປັນຕົວກໍານົດການເສັ້ນຄໍາສັ່ງໄດ້ຮັບການ mangled ໂດຍ
ນາຍພາສາຄໍາສັ່ງ.)

ທັງສອງວິທີການແມ່ນດີສໍາລັບການກວດພົບ plagiarism.

ໃຊ້ sim_m2 ອອນລາຍໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

Linux ຄຳ ສັ່ງ

Ad




×
ການ​ໂຄ​ສະ​ນາ
?ຊື້ເຄື່ອງ, ຈອງ, ຫຼືຊື້ທີ່ນີ້ — ບໍ່ມີຄ່າໃຊ້ຈ່າຍ, ຊ່ວຍໃຫ້ການບໍລິການຟຣີ.