OnWorks Linux và Windows Online WorkStations

Logo

Lưu trữ trực tuyến miễn phí cho máy trạm

<Trước | Nội dung | Tiếp theo>

Nén tệp

Trong suốt lịch sử của máy tính, đã có một cuộc đấu tranh để đưa được nhiều dữ liệu nhất vào không gian nhỏ nhất có sẵn, cho dù không gian đó là bộ nhớ, thiết bị lưu trữ hay băng thông mạng. Nhiều dịch vụ dữ liệu mà chúng ta coi là đương nhiên ngày nay, chẳng hạn như máy nghe nhạc di động, truyền hình độ nét cao hoặc Internet băng thông rộng, nợ sự tồn tại của chúng để hoạt động hiệu quả nén dữ liệu kỹ thuật.

Nén dữ liệu là quá trình loại bỏ từ dữ liệu. Hãy xem xét một ví dụ tưởng tượng. Giả sử chúng ta có một tệp hình ảnh hoàn toàn màu đen với kích thước 100 pixel x 100 pixel. Về mặt lưu trữ dữ liệu (giả sử 24 bit, hoặc 3 byte trên mỗi pixel), hình ảnh sẽ chiếm 30,000 byte dung lượng lưu trữ:

100 * 100 * 3 = 30,000

Hình ảnh chỉ có một màu chứa dữ liệu hoàn toàn dư thừa. Nếu chúng tôi khéo léo, chúng tôi có thể mã hóa dữ liệu theo cách mà chúng tôi chỉ đơn giản mô tả thực tế là chúng tôi có một khối


10,000 pixel đen. Vì vậy, thay vì lưu trữ một khối dữ liệu chứa 30,000 số không (màu đen thường được biểu thị trong các tệp hình ảnh là số 10,000), chúng tôi có thể nén dữ liệu thành số XNUMX, theo sau là số XNUMX để đại diện cho dữ liệu của chúng tôi. Một lược đồ nén dữ liệu như vậy được gọi là mã hóa thời lượng chạy và là một trong những kỹ thuật nén thô sơ nhất. Các kỹ thuật ngày nay tiên tiến và phức tạp hơn nhiều nhưng mục tiêu cơ bản vẫn không đổi-loại bỏ dữ liệu thừa.

Các thuật toán nén (các kỹ thuật toán học được sử dụng để thực hiện nén) được chia thành hai loại chung, không mất dữ liệu và mất dữ liệu. Nén không mất dữ liệu sẽ bảo toàn tất cả dữ liệu có trong bản gốc. Điều này có nghĩa là khi một tệp được khôi phục từ phiên bản nén, thì tệp được khôi phục hoàn toàn giống với phiên bản gốc, không được nén. Mặt khác, nén mất dữ liệu sẽ loại bỏ dữ liệu khi quá trình nén được thực hiện, để cho phép áp dụng nhiều nén hơn. Khi một tệp bị mất được khôi phục, nó không khớp với phiên bản gốc; đúng hơn, nó là một ước tính gần đúng. Ví dụ về nén mất dữ liệu là JPEG (đối với hình ảnh) và MP3 (đối với nhạc). Trong phần thảo luận của chúng ta, chúng ta sẽ chỉ xem xét tính năng nén không mất dữ liệu, vì hầu hết dữ liệu trên máy tính không thể chịu được bất kỳ sự mất mát dữ liệu nào.


 

Điện toán đám mây hệ điều hành hàng đầu tại OnWorks: