เวิร์กสเตชันออนไลน์ของ OnWorks Linux และ Windows

โลโก้

ฟรีโฮสติ้งออนไลน์สำหรับเวิร์กสเตชัน

<ก่อนหน้านี้ | เนื้อหา | ถัดไป>

บีบอัดไฟล์

ตลอดประวัติศาสตร์ของการคำนวณ มีการดิ้นรนเพื่อให้ได้ข้อมูลส่วนใหญ่ลงในพื้นที่ที่เล็กที่สุดที่มีอยู่ ไม่ว่าจะเป็นพื้นที่หน่วยความจำ อุปกรณ์จัดเก็บข้อมูล หรือแบนด์วิดท์เครือข่าย บริการข้อมูลหลายอย่างที่เรามองข้ามไปในปัจจุบัน เช่น เครื่องเล่นเพลงแบบพกพา โทรทัศน์ความละเอียดสูง หรืออินเทอร์เน็ตบรอดแบนด์ การบีบอัดข้อมูล เทคนิค

การบีบอัดข้อมูลเป็นกระบวนการของการลบออก ความฟุ่มเฟือย จากข้อมูล ลองพิจารณาตัวอย่างจินตภาพ สมมติว่าเรามีไฟล์รูปภาพสีดำสนิทที่มีขนาด 100 พิกเซลคูณ 100 พิกเซล ในแง่ของการจัดเก็บข้อมูล (สมมติว่าเป็น 24 บิตหรือ 3 ไบต์ต่อพิกเซล) รูปภาพจะใช้พื้นที่จัดเก็บ 30,000 ไบต์:

100 * 100 * 3 = 30,000

รูปภาพที่เป็นสีเดียวมีข้อมูลซ้ำซ้อนทั้งหมด ถ้าเราฉลาด เราสามารถเข้ารหัสข้อมูลในลักษณะที่เราอธิบายง่ายๆ ว่าเรามีบล็อก


จำนวนพิกเซลสีดำ 10,000 พิกเซล ดังนั้น แทนที่จะจัดเก็บบล็อกข้อมูลที่มีศูนย์ 30,000 ตัว (โดยปกติสีดำจะแสดงในไฟล์รูปภาพเป็นศูนย์) เราสามารถบีบอัดข้อมูลให้เป็นตัวเลข 10,000 ตามด้วยศูนย์เพื่อแทนข้อมูลของเรา รูปแบบการบีบอัดข้อมูลดังกล่าวเรียกว่า การเข้ารหัสระยะยาว และเป็นหนึ่งในเทคนิคการบีบอัดพื้นฐานที่สุดวิธีหนึ่ง เทคนิคของวันนี้ก้าวหน้าและซับซ้อนกว่ามาก แต่เป้าหมายพื้นฐานยังคงเหมือนเดิม-กำจัดข้อมูลที่ซ้ำซ้อน

อัลกอริธึมการบีบอัด (เทคนิคทางคณิตศาสตร์ที่ใช้ในการบีบอัด) แบ่งออกเป็นสองประเภททั่วไปคือแบบไม่สูญเสียและการสูญเสีย การบีบอัดแบบไม่สูญเสียข้อมูลจะรักษาข้อมูลทั้งหมดที่มีอยู่ในต้นฉบับ ซึ่งหมายความว่าเมื่อไฟล์ถูกกู้คืนจากเวอร์ชันที่บีบอัด ไฟล์ที่กู้คืนจะเหมือนกับเวอร์ชันดั้งเดิมที่ไม่มีการบีบอัดทุกประการ ในทางกลับกันการบีบอัดแบบสูญเสียข้อมูลจะลบข้อมูลในขณะที่ทำการบีบอัดเพื่อให้สามารถใช้การบีบอัดได้มากขึ้น เมื่อกู้คืนไฟล์ที่สูญเสียไป ไฟล์นั้นจะไม่ตรงกับเวอร์ชันดั้งเดิม ค่อนข้างจะเป็นการประมาณที่ใกล้เคียงกัน ตัวอย่างของการบีบอัดข้อมูลแบบสูญเสียข้อมูล ได้แก่ JPEG (สำหรับรูปภาพ) และ MP3 (สำหรับเพลง) ในการสนทนาของเรา เราจะพิจารณาเฉพาะการบีบอัดแบบไม่สูญเสียข้อมูล เนื่องจากข้อมูลส่วนใหญ่ในคอมพิวเตอร์ไม่สามารถทนต่อการสูญหายของข้อมูลได้


 

ระบบปฏิบัติการคลาวด์คอมพิวติ้งยอดนิยมที่ OnWorks: