Joint Photographic Experts Group

De Wikipedia
Saltar a navegación Saltar a la gueta

Plantía:Ficha de formatu d'archivu

Joint Photographic Experts Group (JPEG), traducíu al español como Grupu Conxuntu d'Espertos en Fotografía, ye'l nome d'un comité d'espertos que creó un estándar de compresión y codificación d'archivos y imagen fixes. Esti comité foi integráu dende los sos entamos pola fusión de delles agrupaciones nun intentu de compartir y desenvolver la so esperiencia na digitalización d'imáxenes. La ISO, trés años antes (abril de 1983), empecipiara les sos investigaciones na área.

Amás de ser un métodu de compresión, ye de cutiu consideráu como un formatu d'archivu. JPEG/Exif ye'l formatu d'imaxe más común, utilizáu poles cámares fotográfiques dixitales y otros dispositivos de captura d'imaxe, xuntu con JPG/JFIF, que tamién ye otru formatu pal almacenamientu y la tresmisión d'imáxenes fotográfiques na World Wide Web. Estes variaciones de formatos de cutiu nun s'estremen, y llámense “JPEG”. Los archivos d'esti tipu suélense nomar cola extensión .jpg.

Compresión del JPEG[editar | editar la fonte]

Comparativa calidable ente la imaxe orixinal, estruyida en JPG (con perda) y estruyida en WebP (con perda).

El formatu JPEG utiliza davezu un algoritmu de compresión con perda p'amenorgar el tamañu de los archivos d'imáxenes, esto significa que al descomprimir o visualizar la imaxe nun se llogra esactamente la mesma imaxe de la que se partía antes de la compresión. Esisten tamién trés variantes del estándar JPEG qu'estrúin la imaxe ensin perda de datos: JPEG 2000, JPEG-LS y Lossless JPEG.

L'algoritmu de compresión JPEG basar en dos fenómenos visuales del güeyu humanu: unu ye'l fechu de que ye muncho más sensible al cambéu na luminancia que na crominancia; esto ye, capta más claramente los cambeos de rellumo que de color. L'otru ye que nota con más facilidá pequeños cambeos de rellumu en zones homoxénees qu'en zones onde la variación ye grande; por casu nos cantos de los cuerpos de los oxetos.

Una de les carauterístiques del JPEG ye la flexibilidá a la d'afaer el grau de compresión. Un grau de compresión bien alto va xenerar un archivu de pequeñu tamañu, a cuenta de una perda significativa calidable. Con una tasa de compresión baxa llógrase una calidá d'imaxe bien paecida a la del orixinal, pero con un tamañu d'archivu mayor.

La perda calidable cuando se realicen socesives compresiones ye acumulativa. Esto significa que si s'estrúi una imaxe y se descomprime, va perdese calidá d'imaxe, pero si vuelve estruyise una imaxe yá estruyida va llograse una perda inda mayor. Cada socesiva compresión va causar perdes adicionales calidable. La compresión con perda nun ye conveniente n'imáxenes o gráficos que tengan testos, llinies o cantos bien definíos, pero sí p'archivos que contengan grandes árees de colores sólidos.

Codificación[editar | editar la fonte]

Munches de les opciones del estándar JPEG úsense pocu. Esto ye una descripción curtia d'unu de los munchos métodos usaos comúnmente pa estruyir imáxenes cuando s'apliquen a una imaxe d'entrada con 24 bits por pixel (ocho por cada colloráu, verde, y azul, o tamién dichu "8 bits por canal"). Esta opción particular ye un métodu de compresión con perda.

Tresformamientu del espaciu de color[editar | editar la fonte]

Esquema del modelu RGB.
Esquema del modelu YUV.

Empieza convirtiendo la imaxe dende la so modelu de color RGB a otru llamáu YUV o YCbCr. Esti espaciu de color ye similar al qu'usen los sistemes de color pa televisión PAL y NTSC, pero ye muncho más paecíu al sistema de televisión MAC (Componentes Analóxiques Multiplexadas).

Esti espaciu de color (YUV) tien trés componentes:

  • La componente Y, o luminancia (información de rellumu); esto ye, la imaxe en escala de grises.
  • Les componentes O o Cb y V o Cr, respeutivamente diferencia del azul (relativiza la imaxe ente azul y colloráu) y diferencia del colloráu (relativiza la imaxe ente verde y colloráu); dambes señales son conocíes como crominancia (información de color).

Les ecuaciones que realicen esti cambéu de base de RGB a YUV son les siguientes:

Y = 0,257 * R + 0,504 * G + 0,098 * B + 16
Cb = O = -0,148 * R - 0,291 * G + 0,439 * B + 128
Cr = V = 0,439 * R - 0,368 * G - 0,071 * B + 128

Les ecuaciones pal cambéu inversu pueden llograse estenando de les anteriores y llógrense les siguientes:

B = 1,164 * (Y - 16) + 2,018 * (O - 128)
G = 1,164 * (Y - 16) - 0,813 * (V - 128) - 0,391 * (O - 128)
R = 1,164 * (Y - 16) + 1,596 * (V - 128)

NOTA: Estes ecuaciones tán en continua investigación, polo que pueden atopase en llibros y na rede otres ecuaciones distintes pero con coeficientes bien paecíos.

Si analiza'l primer tríu d'ecuaciones vamos ver que los trés componentes tomen como valor mínimu'l 16. La canal de luminancia (canal Y) tien como valor máximu'l 235, ente que les canales de crominancia el 240. Toos estos valores caben nun byte faciendo arredondio al enteru más próximu. Mientres esta fase nun hai perda significativa d'información, anque l'arredondio introduz un pequeñu marxe d'error imperceptible pal güeyu humanu.

Submuestreo[editar | editar la fonte]

Llixera esplicación visual sobre'l submuestreo. La imaxe de riba a la izquierda ye la orixinal; les otres sufren unos submuestreos de color selvaxes que dan idea de los efectos d'esta técnica. Ampliar pa meyor visualización.
L'algoritmu JPEG tresforma la imaxe en cuadraos de 8×8 y depués almacena cada unu d'estos como una combinación llineal o suma de los 64 recuadros que formen esta imaxe; esto dexa esaniciar detalles de forma selectiva. Por casu, si un caxellu tien un valor bien próximu a 0, pue ser esaniciada ensin qu'afecte enforma a la calidá.

Una opción que puede aplicase al guardar la imaxe ye amenorgar la información del color al respective de la de rellumu (debíu al fénomeno visual nel güeyu humanu comentáu enantes). Hai dellos métodos: si esti pasu nun s'aplica, la imaxe sigue nel so espaciu de color YUV (esti submuestreo entiéndese como 4:4:4), colo que la imaxe nun sufre perdes. Puede amenorgase la información cromática a la metá, 4:2:2 (amenorgar nun factor de 2 en direición horizontal), colo qu'el color tien la metá de resolvimientu (n'horizontal) y el rellumu sigue intactu. Otru métodu, bien usáu, ye amenorgar el color a la cuarta parte, 4:2:0, nel qu'el color amenorgar nun factor de 2 en dambes direiciones, horizontal y vertical. Si la imaxe de partida taba n'escala de grises (blancu y negru), puede esaniciase por completu la información de color, quedando como 4:0:0.

Dellos programes que dexen el guardáu d'imáxenes en JPEG (como'l qu'usa GIMP) referir a estos métodos con 1×1,1×1,1×1 pa YUV 4:4:4 (nun perder color), 2×1,1×2,1×1 pa YUV 4:2:2 y 2×2,1×1,1×1 pal últimu métodu, YUV 4:2:0.

Les técniques algorítmicas usaes pa esti pasu (pa la so reconstrucción esactamente) suelen ser interpolación bilineal, vecín más próximu, convolución cúbica, Bezier, b-spline y Catmun-Roll.rh

Tresformamientu discretu de cosenu (DCT)[editar | editar la fonte]

Cada componente de la imaxe estremar en pequeños bloques de 8×8 píxelye, que se procesen de forma casi independiente, lo que mengua notablemente'l tiempu de cálculu. D'esto resulta la típica formación cuadriculada, que se vuelve visible nes imáxenes guardaes con alta compresión. Si la imaxe sufrió un submuestreo d'el color, el colores quedaríen na imaxe final en bloques de 8×16 y 16×16 píxeles, según fora 4:2:2 o 4:2:0.

Dempués, cada pequeñu bloque convertir al dominiu de la frecuencia al traviés de la tresformamientu discretu de cosenu, abreviadamente llamada DCT.

Un exemplu d'unu d'esos pequeños bloques de 8×8 inicial ye este:

El siguiente procesu ye resta-yos 128 por que queden númberos entorno al 0, ente -128 y 127.

Dar# en el tresformamientu por DCT de la matriz, y l'arredondio de cada elementu al númberu enteru más cercanu.

Nótese que l'elementu más grande de tola matriz apaez na esquina cimera esquierda; este ye'l coeficiente DC.

Cuantificación dixital[editar | editar la fonte]

Artículu principal: Cuantificación dixital
"Antes de", nun bloquecillo 8×8 (ampliación ×16).
"Dempués de", nun bloquecillo 8×8, nótense errores al respective de la primer imaxe, como na esquina inferior esquierda, que ta más clara.

El güeyu humanu ye bien bonu detectando pequeños cambeos de rellumo n'árees relativamente grandes, pero non cuando'l rellumu camuda rápido en pequeñes árees (variación d'alta frecuencia). Por cuenta de esta condición, puede esaniciase les altes frecuencias, ensin perda escesiva calidable visual. Esto realízase estremando cada componente nel dominiu de la frecuencia por una constante pa esi componente, y arredondiándolo al so númberu enteru más cercanu. Este ye'l procesu nel que se pierde la mayor parte de la información (y calidá) cuando una imaxe ye procesada por esti algoritmu. La resultancia d'esto ye que los componentes de les altes frecuencies, tienden a igualase a cero, ente que munchos de los demás, convertir en númberos positivos y negativos pequeños.

Una matriz de cuantificación típica ye la matriz de Losheller que s'usa opcionalmente nel estándar JPEG:

Estremando cada coeficiente de la matriz de la imaxe tresformada ente cada coeficiente de la matriz de cuantificación, llógrase esta matriz, yá cuantificada:

Por casu, cuantificando el primer elementu, el coeficiente DC, sería asina:

Codificación entrópica[editar | editar la fonte]

La codificación entrópica ye una forma especial de la compresión ensin perda de datos. Pa ello tomen los elementos de la matriz siguiendo una forma de zig-zag, poniendo grupos con frecuencies similares xuntos, y ensertando ceros de codificación, y usando la codificación Huffman para lo que queda. Tamién puede usase la codificación aritmética, superior a la de Huffman, pero qu'escasamente s'usa, yá que ta cubierta por patentes, esta compresión produz archivos un 5% menores, pero a cuenta de un mayor tiempu de codificación y decodificación, esta pequeña ganancia, puede emplegase tamién n'aplicar un menor grau de compresión a la imaxe, y llograr más calidá pa un tamañu asemeyáu.

Na matriz anterior, la secuencia en zig-zag, ye esta:
−26, −3, 0, −3, −2, −6, 2, −4, 1 −4, 1, 1, 5, 1, 2, −1, 1, −1, 2, 0, 0, 0, 0, 0, −1, −1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

JPEG tien un códigu Huffman pa cortar la cadena anterior nel puntu nel que'l restu de coeficientes sían ceros, y asina, aforrar espaciu:
−26, −3, 0, −3, −2, −6, 2, −4, 1 −4, 1, 1, 5, 1, 2, −1, 1, −1, 2, 0, 0, 0, 0, 0, −1, −1, EOB

Ruiu producíu pola compresión[editar | editar la fonte]

Artículu principal: Ruiu de cuantificación
Tres la compresión, suelen quedar dacuando bloques como estos, nesti casu nun cachu d'una imaxe ampliáu.

La resultancia tres la compresión, puede variar, en función de l'agresividá de los divisores de la matriz de cuantización, a mayor valor d'esos divisores, más coeficientes convertir en ceros, y más s'estrúi la imaxe. Pero mayores compresiones producen mayor ruiu na imaxe, empiorando la so calidá. Una imaxe con una fuerte compresión (1%-15%) puede tener un tamañu d'archivu enforma menor, pero va tener tantes imperfecciones que nun va ser interesante, una compresión bien baxa (98%-100%) va producir una imaxe de bien alta calidá, pero, va tener un tamañu tan grande que quiciabes interese más un formatu ensin perda como PNG.

La mayoría de persones que saleen por Internet van tar familiarizaes con estes imperfecciones, que son la resultancia de llograr una bona compresión. Pa evitales, va tenese qu'amenorgar el nivel de compresión o aplicar compresión ensin perda, produciendo mayores ficheros dempués.

Decodificación[editar | editar la fonte]

El procesu de decodificación ye similar al siguíu hasta agora, namái que de forma inversa. Nesti casu, al perder información, los valores finales nun van coincidir colos iniciales.

Tómase la información de la matriz, se decodifica, y ponse cada valor nel so caxellu correspondiente. Dempués multiplícase cada unu d'estos valores pol valor correspondiente de la matriz de cuantización usada, como munchos valores son ceros, namái se recuperen ( y de forma averada) los valores de la esquina cimera esquierda.

Dempués desfaise'l tresformamientu DCT:

Errores producíos por una compresión escesiva: Antes de y dempués de.

Y finalmente súmase 128 a cada entrada:

Pa comparar les diferencies ente'l bloque orixinal y l'estruyíu, tópase la diferencia ente dambes matrices, la media de los sos valores absolutos, da una llixera idea de la calidá perdida:

Puede reparase que les mayores diferencies tán cerca del llurdiu, y per la parte inferior, ente la esquina esquierda y el centru, notándose más esta postrera, yá que cuerre un llurdiu claru qu'antes taba más escontra la esquina. La media de los valores absolutos de restar ye 4.8125, anque en delles zones ye mayor.

Ver tamién[editar | editar la fonte]

Enllaces esternos[editar | editar la fonte]




Joint Photographic Experts Group