Compresión de datos

De Wikipedia
Saltar a navegación Saltar a la gueta

En ciencies de la computación, la compresión de datos ye l'amenorgamientu del volume de datos tratables pa representar una determinada información emplegando una menor cantidá d'espaciu. Al actu de compresión de datos denominar compresión», y al contrariu «descompresión».

L'espaciu qu'ocupa una información codificada (datos, señal dixital, etc.) ensin compresión ye'l cociente ente la frecuencia de muestreo y la resolvimientu. Poro, cuantos más bits empléguense mayor va ser el tamañu del archivu. Sicasí, el resolvimientu vien impuesta pol sistema dixital con que se trabaya y non puede alteriase el númberu de bits a voluntá; por ello, utilízase la compresión, pa tresmitir la mesma cantidá d'información qu'ocuparía un gran resolvimientu nun númberu inferior de bits.

La compresión ye un casu particular de la codificación, que la so característica principal ye que'l códigu resultante tien menor tamañu que l'orixinal.

La compresión de datos básase fundamentalmente en buscar repeticiones en series de datos pa dempués almacenar solo'l datu xuntu al númberu de vegaes que se repite. Asina, por casu, si nun ficheru apaez una secuencia como "AAAAAA", ocupando 6 bytes podría almacenase a cencielles "6A" qu'ocupa solo 2 bytes, en algoritmu RLE.

En realidá, el procesu ye muncho más complexu, yá que raramente consíguese atopar patrones de repetición tan esactos (salvu en delles imáxenes). Utilícense algoritmos de compresión:

  • Per un sitiu, dalgunos busquen series llargues que depués codifican en formes más curties.
  • Per otru llau, dellos algoritmos, como'l algoritmu de Huffman, esaminen los calteres más repitíos pa depués codificar de forma más curtia los que más se repiten.
  • Otros, como'l LZW, constrúin un diccionariu con el patrones atopaos, a los cualos faise referencia de manera posterior.
  • La codificación de bytes pares ye otru senciellu algoritmu de compresión bien fácil d'entender.

A la de falar de compresión hai que tener presentes dos conceutos:

  1. Redundancia: Datos que son repetitivos o previsibles.
  2. Entropía: La información nueva o esencial que se define como la diferencia ente la cantidá total de datos d'un mensaxe y la so redundancia.

La información que tresmiten los datos puede ser de tres tipos:

  • Redundante: información repetitiva o predecible.
  • Irrelevante: información que nun podemos apreciar y que la so eliminación por tantu nun afecta al conteníu del mensaxe. Por casu, si les frecuencies que ye capaz de captar l'oyíu humanu tán ente 16/20 Hz y 16 000/20 000 Hz, seríen irrelevantes aquelles frecuencies que tuvieren per debaxo o percima d'estos valores.
  • Básica: la relevante. La que nun ye nin redundante nin irrelevante. La que tien de ser tresmitida por que pueda reconstruyise la señal.

Teniendo en cuenta estos trés tipos d'información, establécense tres tipología de compresión de la información:

  • Ensin perdes reales: esto ye, tresmitiendo tola entropía del mensaxe (tola información básica ya irrelevante, pero esaniciando la redundante).
  • Subjetivamente ensin perdes: esto ye, amás d'esaniciar la información redundante esaníciase tamién la irrelevante.
  • Subjetivamente con perdes: esaníciase cierta cantidá d'información básica, polo que'l mensaxe va reconstruyir con erros perceptibles pero tolerables (por casu: la videoconferencia).

Diferencies ente compresión con y ensin perda[editar | editar la fonte]

L'oxetivu de la compresión ye siempres amenorgar el tamañu de la información, intentando qu'esti amenorgamientu de tamañu nun afecte al conteníu. Sicasí, l'amenorgamientu de datos puede afectar o non a la calidá de la información:

  • Compresión ensin perda: los datos antes y dempués d'estruyilos son esactos na compresión ensin perda. Nel casu de la compresión ensin perda una mayor compresión solo implica más tiempu de procesu. La tasa de bits siempres ye variable na compresión ensin perda. Utilízase principalmente na compresión de testu.
  • Un algoritmu de compresión con perda puede esaniciar datos pa menguar entá más el tamañu, colo qu'amenorga la calidá. Na compresión con perda, la tasa de bits puede ser constante o variable. Una vegada realizada la compresión, non puede llograse la señal orixinal, anque sí un aproximamientu que la so semeyanza cola orixinal va depender del tipu de compresión. Esti tipu de compresión dase principalmente n'imáxenes, vídeos y soníos. Amás d'estes funciones la compresión dexa que los algoritmos usaos p'amenorgar les cadenes del códigu refuguen información redundante de la imaxe. Unu de los formatos que dexa compensar esta perdida ye'l JPG, qu'emplega técniques qu'anidien los cantos y árees que tienen un color similar dexando que la falta d'información sía invisible a güeyu. Esti métodu dexa un altu grau de compresión con perdes na imaxe que, munches vegaes, solo ye visible por aciu el zoom.

Ver tamién[editar | editar la fonte]

Enllaces esternos[editar | editar la fonte]


Compresión de datos