<Anterior | Contenido | Siguiente>
Comprimir archivos
A lo largo de la historia de la informática, ha habido una lucha para obtener la mayor cantidad de datos en el espacio más pequeño disponible, ya sea en memoria, dispositivos de almacenamiento o ancho de banda de red. Muchos de los servicios de datos que damos por sentados hoy en día, como los reproductores de música portátiles, la televisión de alta definición o Internet de banda ancha, deben su existencia a compresión de datos técnicas.
La compresión de datos es el proceso de eliminación redundancia a partir de datos. Consideremos un ejemplo imaginario. Digamos que tenemos un archivo de imagen completamente negro con las dimensiones de 100 píxeles por 100 píxeles. En términos de almacenamiento de datos (asumiendo 24 bits o 3 bytes por píxel), la imagen ocupará 30,000 bytes de almacenamiento:
100 * 100 * 3 = 30,000
Una imagen de un solo color contiene datos completamente redundantes. Si fuéramos inteligentes, podríamos codificar los datos de tal manera que simplemente describiéramos el hecho de que tenemos un bloque
de 10,000 píxeles negros. Entonces, en lugar de almacenar un bloque de datos que contenga 30,000 ceros (el negro generalmente se representa en archivos de imagen como cero), podríamos comprimir los datos en el número 10,000, seguido de un cero para representar nuestros datos. Este esquema de compresión de datos se llama codificación de longitud de ejecución y es una de las técnicas de compresión más rudimentarias. Las técnicas actuales son mucho más avanzadas y complejas, pero el objetivo básico sigue siendo el mismo. - deshacerse de los datos redundantes.
Los algoritmos de compresión (las técnicas matemáticas utilizadas para llevar a cabo la compresión) se dividen en dos categorías generales, sin pérdidas y con pérdidas. La compresión sin pérdida conserva todos los datos contenidos en el original. Esto significa que cuando se restaura un archivo desde una versión comprimida, el archivo restaurado es exactamente igual que la versión original sin comprimir. La compresión con pérdida, por otro lado, elimina los datos a medida que se realiza la compresión, para permitir que se aplique más compresión. Cuando se restaura un archivo con pérdida, no coincide con la versión original; más bien, es una aproximación cercana. Ejemplos de compresión con pérdida son JPEG (para imágenes) y MP3 (para música). En nuestra discusión, analizaremos exclusivamente la compresión sin pérdidas, ya que la mayoría de los datos en las computadoras no pueden tolerar ninguna pérdida de datos.